From c3af2af0b8be65ecd1a8538bcfb9622e873e6b3c Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Thu, 4 Sep 2025 07:25:57 -0700
Subject: [PATCH 001/183] Split PR. Second part. Compile ranges

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 tests/compile/test_compile_ranges.py     |  86 ++++++++++++++
 vllm/compilation/backends.py             | 104 +++++++---------
 vllm/compilation/collective_fusion.py    | 144 +++++++++--------------
 vllm/compilation/compiler_interface.py   |  40 ++++---
 vllm/compilation/inductor_pass.py        |  11 +-
 vllm/compilation/pass_manager.py         |   4 +-
 vllm/compilation/piecewise_backend.py    |  57 +++++----
 vllm/compilation/sequence_parallelism.py |   6 +-
 vllm/config/compilation.py               |  33 ++++++
 9 files changed, 288 insertions(+), 197 deletions(-)
 create mode 100644 tests/compile/test_compile_ranges.py

diff --git a/tests/compile/test_compile_ranges.py b/tests/compile/test_compile_ranges.py
new file mode 100644
index 000000000000..6759da199f4b
--- /dev/null
+++ b/tests/compile/test_compile_ranges.py
@@ -0,0 +1,86 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import torch
+from torch import nn
+from torch.library import Library
+
+from vllm.compilation.counter import compilation_counter
+from vllm.compilation.decorators import support_torch_compile
+from vllm.config import (CompilationConfig, CompilationLevel, VllmConfig,
+                         set_current_vllm_config)
+from vllm.forward_context import set_forward_context
+from vllm.utils import direct_register_custom_op
+
+# create a library to hold the custom op
+silly_lib = Library("silly", "FRAGMENT")  # noqa
+
+BATCH_SIZE = 64
+MLP_SIZE = 128
+
+
+def silly_attention(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
+                    out: torch.Tensor) -> None:
+    out.copy_(q)
+    out += k
+    out += v
+
+
+def silly_attention_fake(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
+                         out: torch.Tensor) -> None:
+    return
+
+
+direct_register_custom_op(
+    op_name="attention",
+    op_func=silly_attention,
+    mutates_args=["out"],
+    fake_impl=silly_attention_fake,
+    target_lib=silly_lib,
+)
+
+
+@support_torch_compile
+class TestModel(nn.Module):
+
+    def __init__(self,
+                 *,
+                 vllm_config: VllmConfig,
+                 prefix: str = '',
+                 **kwargs) -> None:
+        super().__init__()
+
+    def forward(self, x: torch.Tensor) -> torch.Tensor:
+        x = x + x
+        attn_output = torch.empty_like(x)
+        torch.ops.silly.attention(x, x, x, attn_output)
+        x = attn_output
+        x = x * 3
+        return x
+
+
+@torch.inference_mode
+def run_model(vllm_config: VllmConfig, model: nn.Module,
+              batch_sizes: list[int]):
+    with set_forward_context({}, vllm_config=vllm_config):
+        model(torch.randn(BATCH_SIZE, MLP_SIZE).cuda())
+        for batch_size in batch_sizes:
+            model(torch.randn(batch_size, MLP_SIZE).cuda())
+
+
+def test_compile_ranges():
+    vllm_config = VllmConfig(compilation_config=CompilationConfig(
+        level=CompilationLevel.PIECEWISE,
+        compile_ranges_split_points=[8, 32],
+    ))
+
+    with set_current_vllm_config(vllm_config):
+        model = TestModel(vllm_config=vllm_config, prefix='').eval().cuda()
+    batch_sizes = [1, 16, 48]
+    # A has support_torch_compile
+    with compilation_counter.expect(
+            num_graphs_seen=1,
+            num_piecewise_graphs_seen=1,
+            num_backend_compilations=4,
+            # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+    ):
+        run_model(vllm_config, model, batch_sizes)
diff --git a/vllm/compilation/backends.py b/vllm/compilation/backends.py
index 53fd5e74dc0a..686c415f7ac3 100644
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -80,7 +80,8 @@ class CompilerManager:
     """
 
     def __init__(self, compilation_config: CompilationConfig):
-        self.cache: dict[tuple[int | None, int, str], Any] = dict()
+        self.cache: dict[tuple[tuple[int, int] | None, int, str],
+                         Any] = (dict())
         self.is_cache_updated = False
         self.compilation_config = compilation_config
         self.compiler = make_compiler(compilation_config)
@@ -89,11 +90,11 @@ def compute_hash(self, vllm_config: VllmConfig) -> str:
         return self.compiler.compute_hash(vllm_config)
 
     @contextmanager
-    def compile_context(self, runtime_shape: int | None = None):
+    def compile_context(self, compile_range: tuple[int, int] | None = None):
         """Provide compilation context for the duration of compilation to set
         any torch global properties we want to scope to a single Inductor
         compilation (e.g. partition rules, pass context)."""
-        with pass_context(runtime_shape):
+        with pass_context(compile_range):
             if self.compilation_config.use_inductor_graph_partition:
                 inductor_partition_ops = resolve_defined_ops(
                     self.compilation_config.splitting_ops
@@ -150,29 +151,25 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        runtime_shape: int | None = None,
+        compile_range: tuple[int, int] | None = None,
     ) -> Callable | None:
-        if (runtime_shape, graph_index, self.compiler.name) not in self.cache:
+        if (compile_range, graph_index, self.compiler.name) not in self.cache:
             return None
-        handle = self.cache[(runtime_shape, graph_index, self.compiler.name)]
-        compiled_graph = self.compiler.load(
-            handle, graph, example_inputs, graph_index, runtime_shape
-        )
-        if runtime_shape is None:
+        handle = self.cache[(compile_range, graph_index, self.compiler.name)]
+        compiled_graph = self.compiler.load(handle, graph, example_inputs,
+                                            graph_index, compile_range)
+        if compile_range is None:
             logger.debug(
-                "Directly load the %s-th graph for dynamic shape from %s via handle %s",
+                "Directly load the %s-th graph for dynamic compile range from %s via handle %s",
                 graph_index,
                 self.compiler.name,
                 handle,
             )
         else:
             logger.debug(
-                "Directly load the %s-th graph for shape %s from %s via handle %s",
-                graph_index,
-                str(runtime_shape),
-                self.compiler.name,
-                handle,
-            )
+                "Directly load the %s-th graph for compile range %s from %s via "
+                "handle %s", graph_index, str(compile_range),
+                self.compiler.name, handle)
         return compiled_graph
 
     def compile(
@@ -183,7 +180,7 @@ def compile(
         compilation_config: CompilationConfig,
         graph_index: int = 0,
         num_graphs: int = 1,
-        runtime_shape: int | None = None,
+        compile_range: tuple[int, int] | None = None,
     ) -> Any:
         if graph_index == 0:
             # before compiling the first graph, record the start time
@@ -195,15 +192,15 @@ def compile(
         compiled_graph = None
 
         # try to load from the cache
-        compiled_graph = self.load(graph, example_inputs, graph_index, runtime_shape)
+        compiled_graph = self.load(graph, example_inputs, graph_index,
+                                   compile_range)
         if compiled_graph is not None:
             if graph_index == num_graphs - 1:
                 # after loading the last graph for this shape, record the time.
                 # there can be multiple graphs due to piecewise compilation.
                 now = time.time()
                 elapsed = now - compilation_start_time
-                compilation_config.compilation_time += elapsed
-                if runtime_shape is None:
+                if compile_range is None:
                     logger.info(
                         "Directly load the compiled graph(s) for dynamic shape "
                         "from the cache, took %.3f s",
@@ -211,11 +208,9 @@ def compile(
                     )
                 else:
                     logger.info(
-                        "Directly load the compiled graph(s) for shape %s "
-                        "from the cache, took %.3f s",
-                        str(runtime_shape),
-                        elapsed,
-                    )
+                        "Directly load the compiled graph(s) for compile range %s "
+                        "from the cache, took %.3f s", str(compile_range),
+                        elapsed)
             return compiled_graph
 
         # no compiler cached the graph, or the cache is disabled,
@@ -224,48 +219,40 @@ def compile(
             # Let compile_fx generate a key for us
             maybe_key = None
         else:
-            maybe_key = f"artifact_shape_{runtime_shape}_subgraph_{graph_index}"
-
-        with self.compile_context(runtime_shape):
-            compiled_graph, handle = self.compiler.compile(
-                graph,
-                example_inputs,
-                additional_inductor_config,
-                runtime_shape,
-                maybe_key,
-            )
+            maybe_key = \
+                f"artifact_compile_range_{compile_range}_subgraph_{graph_index}"
+        compiled_graph, handle = self.compiler.compile(
+            graph, example_inputs, additional_inductor_config, compile_range,
+            maybe_key)
 
         assert compiled_graph is not None, "Failed to compile the graph"
 
         # store the artifact in the cache
         if not envs.VLLM_DISABLE_COMPILE_CACHE and handle is not None:
-            self.cache[(runtime_shape, graph_index, self.compiler.name)] = handle
+            self.cache[(compile_range, graph_index,
+                        self.compiler.name)] = handle
             compilation_counter.num_cache_entries_updated += 1
             self.is_cache_updated = True
             if graph_index == 0:
                 # adds some info logging for the first graph
-                if runtime_shape is None:
+                if compile_range is None:
                     logger.info_once(
-                        "Cache the graph for dynamic shape for later use", scope="local"
-                    )
+                        "Cache the graph for dynamic shape for later use")
                 else:
-                    logger.info_once(
-                        "Cache the graph of shape %s for later use",
-                        str(runtime_shape),
-                        scope="local",
-                    )
-            if runtime_shape is None:
+                    logger.info_once("Cache the graph of compile range %s for later use",
+                                str(compile_range))
+            if compile_range is None:
                 logger.debug(
-                    "Store the %s-th graph for dynamic shape from %s via handle %s",
+                    "Store the %s-th graph for dynamic compile range from %s via handle %s",
                     graph_index,
                     self.compiler.name,
                     handle,
                 )
             else:
                 logger.debug(
-                    "Store the %s-th graph for shape %s from %s via handle %s",
+                    "Store the %s-th graph for compile range %s from %s via handle %s",
                     graph_index,
-                    str(runtime_shape),
+                    str(compile_range),
                     self.compiler.name,
                     handle,
                 )
@@ -275,19 +262,16 @@ def compile(
             now = time.time()
             elapsed = now - compilation_start_time
             compilation_config.compilation_time += elapsed
-            if runtime_shape is None:
+            if compile_range is None:
                 logger.info_once(
-                    "Compiling a graph for dynamic shape takes %.2f s",
+                    "Compiling a graph for dynamic compile range takes %.2f s",
+                           
                     elapsed,
                     scope="local",
                 )
             else:
-                logger.info_once(
-                    "Compiling a graph for shape %s takes %.2f s",
-                    runtime_shape,
-                    elapsed,
-                    scope="local",
-                )
+                logger.info_once("Compiling a graph for compile range %s takes %.2f s",
+                            str(compile_range), elapsed, scope="local")
 
         return compiled_graph
 
@@ -408,7 +392,6 @@ def call_module(
                 i for i, x in enumerate(args) if isinstance(x, torch.SymInt)
             ]
             global compilation_start_time
-
             compiled_graph_for_dynamic_shape = (
                 self.vllm_backend.compiler_manager.compile(
                     submod,
@@ -417,9 +400,8 @@ def call_module(
                     self.compilation_config,
                     graph_index=index,
                     num_graphs=len(self.compile_submod_names),
-                    runtime_shape=None,
-                )
-            )
+                    compile_range=None,
+                ))
             # Lazy import here to avoid circular import
             from .piecewise_backend import PiecewiseBackend
 
diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index cf89182357f2..a4758c971611 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -504,93 +504,59 @@ def call_trtllm_fused_allreduce_norm(
         num_tokens, hidden_size = allreduce_in.shape
         element_size = allreduce_in.element_size()
         current_tensor_size = num_tokens * hidden_size * element_size
-
-        if num_tokens <= max_token_num:
-            device_capability = (
-                current_platform.get_device_capability().as_version_str()
-            )
-            # Get one shot input size limit for the current world size
-            # for the current device capability
-            max_one_shot_size_mb = _FI_ALLREDUCE_ONE_SHOT_MAX_SIZES_MB.get(
-                device_capability, {}
-            ).get(world_size, None)
-            # Use one shot if no max size for one shot is specified
-            use_oneshot = (
-                max_one_shot_size_mb is None
-                or current_tensor_size <= max_one_shot_size_mb * MiB
-            )
-
-            assert _FI_WORKSPACE_TENSOR is not None, (
-                "Flashinfer must be enabled when using flashinfer"
-            )
-            if norm_out is None:
-                norm_out = allreduce_in
-                residual_out = residual
-            else:
-                # return residual_out as allreduce_out with zeroed residual_in
-                # as flashinfer does not support rms_norm
-                # and allreduce_out together
-                residual_out = allreduce_in
-            # For the sizes that are smaller than the max size,
-            # we only use flashinfer one shot allreduce
-            flashinfer_comm.trtllm_allreduce_fusion(
-                allreduce_in=allreduce_in,
-                token_num=allreduce_in.shape[0],
-                residual_in=residual,
-                residual_out=residual_out,
-                norm_out=norm_out,
-                rms_gamma=rms_gamma,
-                rms_eps=rms_eps,
-                world_rank=world_rank,
-                world_size=world_size,
-                hidden_dim=allreduce_in.shape[-1],
-                workspace_ptrs=_FI_WORKSPACE_TENSOR,
-                launch_with_pdl=launch_with_pdl,
-                use_oneshot=use_oneshot,
-                trigger_completion_at_end=trigger_completion_at_end,
-                fp32_acc=fp32_acc,
-                pattern_code=pattern_code,
-                allreduce_out=None,
-                quant_out=quant_out,
-                scale_out=scale_out,
-                # in vllm we only support swizzled layout
-                layout_code=flashinfer_comm.QuantizationSFLayout.SWIZZLED_128x4,
-                scale_factor=scale_factor,
-            )
+        max_tensor_size = max_token_num * hidden_size * element_size
+        assert current_tensor_size <= max_tensor_size, \
+            f"Current tensor size {current_tensor_size} is larger than " \
+            f"max token num {max_token_num} * hidden size {hidden_size} * " \
+            f"element size {element_size}"
+        device_capability = current_platform.get_device_capability(
+        ).as_version_str()
+        # Get one shot input size limit for the current world size
+        # for the current device capability
+        max_one_shot_size = _FI_ALLREDUCE_ONE_SHOT_MAX_SIZES_MB. \
+                        get(device_capability, {}). \
+                        get(world_size, None)
+        # Use one shot if no max size is specified
+        use_oneshot = max_one_shot_size is None or \
+            current_tensor_size <= max_one_shot_size * MiB
+
+        assert (
+            _FI_WORKSPACE_TENSOR
+            is not None), "Flashinfer must be enabled when using flashinfer"
+        if norm_out is None:
+            norm_out = allreduce_in
+            residual_out = residual
         else:
-            allreduce_out = tensor_model_parallel_all_reduce(allreduce_in)
-            if scale_factor is not None and scale_out is None:
-                # Do fused rms norm static fp8 quant fused op
-                if norm_out is None:
-                    torch.ops._C.fused_add_rms_norm_static_fp8_quant(
-                        quant_out,
-                        allreduce_out,
-                        residual,
-                        rms_gamma,
-                        scale_factor,
-                        rms_eps,
-                    )
-                else:
-                    torch.ops._C.rms_norm_static_fp8_quant(
-                        quant_out, allreduce_out, rms_gamma, scale_factor, rms_eps
-                    )
-            else:
-                if norm_out is None:
-                    torch.ops._C.fused_add_rms_norm(
-                        allreduce_out, residual, rms_gamma, rms_eps
-                    )
-                    norm_out = allreduce_out
-                else:
-                    torch.ops._C.rms_norm(norm_out, allreduce_out, rms_gamma, rms_eps)
-                if scale_factor is not None and scale_out is not None:
-                    torch.ops._C.scaled_fp4_quant(
-                        quant_out, norm_out, scale_out, scale_factor
-                    )
-            if scale_factor is None or norm_out is not None:
-                # we need to return allreduce output
-                # in cases of non quant fused AR + RMS norm
-                # and fused AR + RMS norm + quant without fused add
-                allreduce_in.copy_(allreduce_out)
+            # return residual_out as allreduce_out with zeroed residual_in
+            # as flashinfer does not support rms_norm
+            # and allreduce_out together
+            residual_out = allreduce_in
+        # For the sizes that are smaller than the max size,
+        # we only use flashinfer one shot allreduce
+        flashinfer_comm.trtllm_allreduce_fusion(
+            allreduce_in=allreduce_in,
+            token_num=allreduce_in.shape[0],
+            residual_in=residual,
+            residual_out=residual_out,
+            norm_out=norm_out,
+            rms_gamma=rms_gamma,
+            rms_eps=rms_eps,
+            world_rank=world_rank,
+            world_size=world_size,
+            hidden_dim=allreduce_in.shape[-1],
+            workspace_ptrs=_FI_WORKSPACE_TENSOR,
+            launch_with_pdl=launch_with_pdl,
+            use_oneshot=use_oneshot,
+            trigger_completion_at_end=trigger_completion_at_end,
+            fp32_acc=fp32_acc,
+            pattern_code=pattern_code,
+            allreduce_out=None,
+            quant_out=quant_out,
+            scale_out=scale_out,
+            # in vllm we only support swizzled layout
+            layout_code=flashinfer_comm.QuantizationSFLayout.SWIZZLED_128x4,
+            scale_factor=scale_factor,
+        )
 
     def call_trtllm_fused_allreduce_norm_fake(
         allreduce_in: torch.Tensor,
@@ -1212,6 +1178,12 @@ def register_patterns(self):
         self.disabled = False
 
     @VllmInductorPass.time_and_log
+    def is_applicable_for_range(
+            self, compile_range: tuple[int, int] | None) -> bool:
+        if compile_range is None:
+            return False
+        return compile_range[1] - 1 <= self.max_token_num
+
     def __call__(self, graph: fx.Graph):
         if self.disabled:
             logger.debug("AllReduceFusionPass disabled")
diff --git a/vllm/compilation/compiler_interface.py b/vllm/compilation/compiler_interface.py
index 0a3f0769db94..3861bfed11d5 100644
--- a/vllm/compilation/compiler_interface.py
+++ b/vllm/compilation/compiler_interface.py
@@ -63,16 +63,17 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        runtime_shape: int | None = None,
+        compile_range: tuple[int, int | None] = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         """
         Compile the graph with the given example inputs and compiler config,
-        with a runtime shape. If the `runtime_shape` is None, it means
+        with a range. If the `compile_range` is None, it means
         the `example_inputs` have a dynamic shape. Otherwise, the
-        `runtime_shape` specifies the shape of the inputs. Right now we only
-        support one variable shape for all inputs, which is the batchsize
-        (number of tokens) during inference.
+        `compile_range` specifies the range of the inputs, 
+        it could be concrete size, e.g. (4, 4).
+        Right now we only support one variable range of shapes for all inputs,
+         which is the batchsize (number of tokens) during inference.
 
         Dynamo will make sure `graph(*example_inputs)` is valid.
 
@@ -98,7 +99,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        runtime_shape: int | None = None,
+        compile_range: tuple[int, int | None] = None,
     ) -> Callable:
         """
         Load the compiled function from the handle.
@@ -192,18 +193,21 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        runtime_shape: int | None = None,
+        compile_range: tuple[int, int | None] = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_inductor_compiles += 1
         current_config = {}
         if compiler_config is not None:
             current_config.update(compiler_config)
-        set_inductor_config(current_config, runtime_shape)
+        set_inductor_config(current_config, compile_range)
         set_functorch_config()
 
-        if isinstance(runtime_shape, int):
-            dynamic_shapes = "from_example_inputs"
+        if isinstance(compile_range, tuple):
+            if compile_range[0] == compile_range[1]:
+                dynamic_shapes = "from_example_inputs"
+            else:
+                dynamic_shapes = "from_graph"
         else:
             dynamic_shapes = "from_tracing_context"
 
@@ -230,7 +234,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        runtime_shape: int | None = None,
+        compile_range: tuple[int, int | None] = None,
     ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
@@ -294,7 +298,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        runtime_shape: int | None = None,
+        compile_range: tuple[int, int | None] = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_inductor_compiles += 1
@@ -308,7 +312,7 @@ def compile(
         current_config["fx_graph_cache"] = True
         current_config["fx_graph_remote_cache"] = False
 
-        set_inductor_config(current_config, runtime_shape)
+        set_inductor_config(current_config, compile_range)
         set_functorch_config()
 
         # inductor can inplace modify the graph, so we need to copy it
@@ -493,7 +497,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        runtime_shape: int | None = None,
+        compile_range: tuple[int, int | None] = None,
     ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
@@ -589,9 +593,9 @@ def metrics_context(self) -> contextlib.AbstractContextManager:
             return contextlib.nullcontext()
 
 
-def set_inductor_config(config, runtime_shape):
-    if isinstance(runtime_shape, int):
-        # for a specific batchsize, tuning triton kernel parameters
+def set_inductor_config(config, compile_range):
+    if isinstance(compile_range, tuple):
+        # for a specific range of batchsizes, tuning triton kernel parameters
         # can be beneficial
         config["max_autotune"] = envs.VLLM_ENABLE_INDUCTOR_MAX_AUTOTUNE
         config["coordinate_descent_tuning"] = (
@@ -611,7 +615,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        runtime_shape: int | None = None,
+        compile_range: tuple[int, int | None] = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_eager_compiles += 1
diff --git a/vllm/compilation/inductor_pass.py b/vllm/compilation/inductor_pass.py
index 9af635a929b4..1b4430c82b2d 100644
--- a/vllm/compilation/inductor_pass.py
+++ b/vllm/compilation/inductor_pass.py
@@ -28,8 +28,8 @@
 
 
 class PassContext:
-    def __init__(self, runtime_shape: int | None):
-        self.runtime_shape = runtime_shape
+    def __init__(self, compile_range: tuple[int, int] | None):
+        self.compile_range = compile_range
 
 
 def get_pass_context() -> PassContext:
@@ -39,13 +39,13 @@ def get_pass_context() -> PassContext:
 
 
 @contextmanager
-def pass_context(runtime_shape: int | None):
+def pass_context(compile_range: tuple[int, int] | None):
     """A context manager that stores the current pass context,
     usually it is a list of sizes to specialize.
     """
     global _pass_context
     prev_context = _pass_context
-    _pass_context = PassContext(runtime_shape)
+    _pass_context = PassContext(compile_range)
     try:
         yield
     finally:
@@ -96,7 +96,8 @@ def hash_dict(dict_: dict[Any, Any]):
         encoded = json.dumps(dict_, sort_keys=True).encode("utf-8")
         return hashlib.sha256(encoded).hexdigest()
 
-    def is_applicable(self, shape: int | None):
+    def is_applicable_for_range(self, compile_range: tuple[int,
+                                                                    int] | None):
         return True
 
 
diff --git a/vllm/compilation/pass_manager.py b/vllm/compilation/pass_manager.py
index 3bc35a8f7198..82bca8f1fe1b 100644
--- a/vllm/compilation/pass_manager.py
+++ b/vllm/compilation/pass_manager.py
@@ -69,9 +69,9 @@ def __init__(self):
     def __call__(self, graph: fx.Graph):
         VllmInductorPass.dump_prefix = 0  # reset dump index
 
-        shape = get_pass_context().runtime_shape
+        compile_range = get_pass_context().compile_range
         for pass_ in self.passes:
-            if pass_.is_applicable(shape):
+            if pass_.is_applicable_for_range(compile_range):
                 pass_(graph)
                 VllmInductorPass.dump_prefix += 1
             else:
diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index 2931580afbbb..87b0121f43cb 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -7,7 +7,6 @@
 
 import torch.fx as fx
 
-import vllm.envs as envs
 from vllm.compilation.backends import VllmBackend
 from vllm.compilation.monitor import end_monitoring_torch_compile
 from vllm.config import VllmConfig
@@ -17,8 +16,8 @@
 
 
 @dataclasses.dataclass
-class ConcreteSizeEntry:
-    runtime_shape: int
+class RangeEntry:
+    compile_range: tuple[int, int]
     compiled: bool = False
     runnable: Callable = None  # type: ignore
 
@@ -55,7 +54,12 @@ def __init__(
 
         self.is_full_graph = total_piecewise_compiles == 1
 
-        self.compile_sizes: set[int] = set(self.compilation_config.compile_sizes)
+        self.compile_ranges = self.compilation_config.get_compile_ranges()
+        log_string = f"PiecewiseBackend: compile_ranges: {self.compile_ranges}"
+        logger.debug_once(log_string)
+
+        self.is_in_range = lambda x, range: range[0] <= x < range[1] if range[
+            0] < range[1] else x == range[0]
 
         self.first_run_finished = False
 
@@ -63,24 +67,27 @@ def __init__(
 
         self.sym_shape_indices = sym_shape_indices
 
-        self.is_debugging_mode = envs.VLLM_LOGGING_LEVEL == "DEBUG"
-
         # the entries for different shapes that we need to compile
-        self.concrete_size_entries: dict[int, ConcreteSizeEntry] = {}
+        # self.concrete_size_entries: dict[int, RangeEntry] = {}
+
+        # the entries for ranges that we need to either
+        # TODO: we should merge with concrete_size_entries
+        self.range_entries: dict[tuple[int, int], RangeEntry] = {}
 
-        # to_be_compiled_sizes tracks the remaining sizes to compile,
+        # to_be_compiled_ranges tracks the remaining ranges to compile,
         # and updates during the compilation process, so we need to copy it
-        self.to_be_compiled_sizes: set[int] = self.compile_sizes.copy()
+        self.to_be_compiled_ranges: set[tuple[int,
+                                              int]] = set(self.compile_ranges)
 
         # We only keep compilation management inside this class directly.
-        for shape in self.compile_sizes:
-            self.concrete_size_entries[shape] = ConcreteSizeEntry(
-                runtime_shape=shape,
+        for range in self.compile_ranges:
+            self.range_entries[range] = RangeEntry(
+                compile_range=range,
                 runnable=self.compiled_graph_for_general_shape,
             )
 
     def check_for_ending_compilation(self):
-        if self.is_last_graph and not self.to_be_compiled_sizes:
+        if (self.is_last_graph and not self.to_be_compiled_ranges):
             # no specific sizes to compile
             # save the hash of the inductor graph for the next run
             self.vllm_backend.compiler_manager.save_to_file()
@@ -94,28 +101,32 @@ def __call__(self, *args) -> Any:
 
         runtime_shape = args[self.sym_shape_indices[0]]
 
-        if runtime_shape not in self.concrete_size_entries:
+        range_entry = None
+        for range in self.compile_ranges:
+            if self.is_in_range(runtime_shape, range):
+                range_entry = self.range_entries[range]
+                break
+
+        if (range_entry is None):
             # we don't need to do anything for this shape
             return self.compiled_graph_for_general_shape(*args)
 
-        entry = self.concrete_size_entries[runtime_shape]
+        if not range_entry.compiled:
+            range_entry.compiled = True
+            self.to_be_compiled_ranges.remove(range_entry.compile_range)
 
-        if not entry.compiled:
-            entry.compiled = True
-            self.to_be_compiled_sizes.remove(runtime_shape)
             # args are real arguments
-            entry.runnable = self.vllm_backend.compiler_manager.compile(
+            range_entry.runnable = self.vllm_backend.compiler_manager.compile(
                 self.graph,
                 args,
                 self.compilation_config.inductor_compile_config,
                 self.compilation_config,
                 graph_index=self.piecewise_compile_index,
                 num_graphs=self.total_piecewise_compiles,
-                runtime_shape=runtime_shape,
-            )
+                compile_range=range_entry.compile_range)
 
             # finished compilations for all required shapes
-            if self.is_last_graph and not self.to_be_compiled_sizes:
+            if (self.is_last_graph and not self.to_be_compiled_ranges):
                 self.check_for_ending_compilation()
 
-        return entry.runnable(*args)
+        return range_entry.runnable(*args)
diff --git a/vllm/compilation/sequence_parallelism.py b/vllm/compilation/sequence_parallelism.py
index 31624a8fdcc0..78fd8386f56e 100644
--- a/vllm/compilation/sequence_parallelism.py
+++ b/vllm/compilation/sequence_parallelism.py
@@ -482,7 +482,7 @@ def __init__(self, config: VllmConfig):
             ).register(self.patterns)
         self.dump_patterns(config, self.patterns)
 
-    def is_applicable(self, shape: int | None) -> bool:
+    def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool:
         # When sequence parallelism is enabled, the residual tensor from RMSNorm
         # needs to be split along the sequence dimension. However, this dimension
         # is symbolic during piecewise compilation, and splitting symbolic shapes
@@ -502,7 +502,9 @@ def is_applicable(self, shape: int | None) -> bool:
         ):
             return True
         tp_size = get_tensor_model_parallel_world_size()
-        return shape is not None and shape % tp_size == 0
+        return compile_range is not None and (
+            compile_range[0]
+            == compile_range[1]) and (compile_range[1] % tp_size == 0)
 
     @VllmInductorPass.time_and_log
     def __call__(self, graph: fx.Graph):
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 72418762773c..374e1c99fea0 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -214,6 +214,8 @@ class CompilationConfig:
     - Inductor compilation:
         - [`use_inductor`][vllm.config.CompilationConfig.use_inductor]
         - [`compile_sizes`][vllm.config.CompilationConfig.compile_sizes]
+        - [`compile_ranges_split_points`]
+            [vllm.config.CompilationConfig.compile_ranges_split_points]
         - [`inductor_compile_config`]
         [vllm.config.CompilationConfig.inductor_compile_config]
         - [`inductor_passes`][vllm.config.CompilationConfig.inductor_passes]
@@ -331,6 +333,16 @@ class CompilationConfig:
     """Sizes to compile for inductor. In addition
     to integers, it also supports "cudagraph_capture_sizes" to
     specify the sizes for cudagraph capture."""
+    compile_ranges_split_points: Optional[list[int]] = None
+    """Split points that represent compile ranges for inductor.
+    The compile ranges are 
+    [1, split_points[0]), 
+    [split_points[0], split_points[1]), ..., 
+    [split_points[-1], max_num_batched_tokens + 1).
+    Compile sizes are also used single element ranges:
+    [compile_sizes[i], compile_sizes[i] + 1).
+    """
+
     inductor_compile_config: dict = field(default_factory=dict)
     """Additional configurations for inductor.
     - None: use default configurations."""
@@ -914,3 +926,24 @@ def custom_op_log_check(self):
                     enable_str,
                     op,
                 )
+
+    def get_compile_ranges(self) -> list[tuple[int, int]]:
+        """Get the compile ranges for the compilation config."""
+        compile_ranges_split_points = self.compile_ranges_split_points
+        compile_ranges = []
+        # max_num_batched_tokens + 1
+        max_split_point = max(compile_ranges_split_points)
+        compile_sizes = set(self.compile_sizes)
+        split_points = sorted(
+            compile_sizes.union(set(self.compile_ranges_split_points)))
+        # filter out split points that are greater
+        # than max_num_batched_tokens + 1
+        split_points = [x for x in split_points if x <= max_split_point]
+        for i, s in enumerate(split_points):
+            if i == 0:
+                compile_ranges.append((1, s))
+            else:
+                compile_ranges.append((split_points[i - 1], s))
+            if s in compile_sizes and s != 1:
+                compile_ranges.append((s, s))
+        return sorted(compile_ranges)

From 0cbb0656ac01d60fb3286e63550d215e95caed81 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Thu, 4 Sep 2025 10:00:52 -0700
Subject: [PATCH 002/183] Remove general shape graph

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/compilation/backends.py          | 14 +------
 vllm/compilation/piecewise_backend.py | 53 +++++++++++++--------------
 vllm/config/compilation.py            |  2 +
 3 files changed, 30 insertions(+), 39 deletions(-)

diff --git a/vllm/compilation/backends.py b/vllm/compilation/backends.py
index 686c415f7ac3..45a1a8c2f267 100644
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -391,17 +391,7 @@ def call_module(
             sym_shape_indices = [
                 i for i, x in enumerate(args) if isinstance(x, torch.SymInt)
             ]
-            global compilation_start_time
-            compiled_graph_for_dynamic_shape = (
-                self.vllm_backend.compiler_manager.compile(
-                    submod,
-                    args,
-                    self.compilation_config.inductor_compile_config,
-                    self.compilation_config,
-                    graph_index=index,
-                    num_graphs=len(self.compile_submod_names),
-                    compile_range=None,
-                ))
+
             # Lazy import here to avoid circular import
             from .piecewise_backend import PiecewiseBackend
 
@@ -411,7 +401,7 @@ def call_module(
                 index,
                 len(self.compile_submod_names),
                 sym_shape_indices,
-                compiled_graph_for_dynamic_shape,
+                # compiled_graph_for_dynamic_shape,
                 self.vllm_backend,
             )
 
diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index 87b0121f43cb..d280b85fc82a 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -63,15 +63,12 @@ def __init__(
 
         self.first_run_finished = False
 
-        self.compiled_graph_for_general_shape = compiled_graph_for_general_shape  # noqa
-
         self.sym_shape_indices = sym_shape_indices
 
         # the entries for different shapes that we need to compile
         # self.concrete_size_entries: dict[int, RangeEntry] = {}
 
         # the entries for ranges that we need to either
-        # TODO: we should merge with concrete_size_entries
         self.range_entries: dict[tuple[int, int], RangeEntry] = {}
 
         # to_be_compiled_ranges tracks the remaining ranges to compile,
@@ -81,10 +78,7 @@ def __init__(
 
         # We only keep compilation management inside this class directly.
         for range in self.compile_ranges:
-            self.range_entries[range] = RangeEntry(
-                compile_range=range,
-                runnable=self.compiled_graph_for_general_shape,
-            )
+            self.range_entries[range] = RangeEntry(compile_range=range, )
 
     def check_for_ending_compilation(self):
         if (self.is_last_graph and not self.to_be_compiled_ranges):
@@ -93,24 +87,8 @@ def check_for_ending_compilation(self):
             self.vllm_backend.compiler_manager.save_to_file()
             end_monitoring_torch_compile(self.vllm_config)
 
-    def __call__(self, *args) -> Any:
-        if not self.first_run_finished:
-            self.first_run_finished = True
-            self.check_for_ending_compilation()
-            return self.compiled_graph_for_general_shape(*args)
-
-        runtime_shape = args[self.sym_shape_indices[0]]
-
-        range_entry = None
-        for range in self.compile_ranges:
-            if self.is_in_range(runtime_shape, range):
-                range_entry = self.range_entries[range]
-                break
-
-        if (range_entry is None):
-            # we don't need to do anything for this shape
-            return self.compiled_graph_for_general_shape(*args)
-
+    def _maybe_compile_for_range_entry(self, range_entry: RangeEntry,
+                                       args) -> Any:
         if not range_entry.compiled:
             range_entry.compiled = True
             self.to_be_compiled_ranges.remove(range_entry.compile_range)
@@ -126,7 +104,28 @@ def __call__(self, *args) -> Any:
                 compile_range=range_entry.compile_range)
 
             # finished compilations for all required shapes
-            if (self.is_last_graph and not self.to_be_compiled_ranges):
-                self.check_for_ending_compilation()
+            self.check_for_ending_compilation()
+
+    def __call__(self, *args) -> Any:
+        if not self.first_run_finished:
+            self.first_run_finished = True
+
+            # Role of the general is taken by the last range
+            range_entry = self.range_entries[self.compile_ranges[-1]]
+            self._maybe_compile_for_range_entry(range_entry, args)
+            return range_entry.runnable(*args)
+
+        runtime_shape = args[self.sym_shape_indices[0]]
+
+        range_entry = None
+        for range in self.compile_ranges:
+            if self.is_in_range(runtime_shape, range):
+                range_entry = self.range_entries[range]
+                break
+        assert range_entry is not None, \
+        f"Shape out of considered range: {runtime_shape} " \
+        "[1, max_num_batched_tokens]"
+
+        self._maybe_compile_for_range_entry(range_entry, args)
 
         return range_entry.runnable(*args)
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 374e1c99fea0..2aab5cb5f295 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -946,4 +946,6 @@ def get_compile_ranges(self) -> list[tuple[int, int]]:
                 compile_ranges.append((split_points[i - 1], s))
             if s in compile_sizes and s != 1:
                 compile_ranges.append((s, s))
+        assert compile_ranges[-1][1] == max_split_point, \
+            "Last compile range end should be max_split_point"
         return sorted(compile_ranges)

From d5392f54cb6e8f15926f1d89642ad08cda44a99c Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Fri, 5 Sep 2025 06:00:15 -0700
Subject: [PATCH 003/183] Add test to test pipeline

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 .buildkite/test-pipeline.yaml | 1 +
 1 file changed, 1 insertion(+)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 6cbc25b4b3bf..105eca371ff3 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -412,6 +412,7 @@ steps:
     - pytest -v -s compile/test_decorator.py
     - pytest -v -s compile/test_noop_elimination.py
     - pytest -v -s compile/test_aot_compile.py
+    - pytest -v -s compile/test_compile_ranges.py
 
 - label: PyTorch Fullgraph Smoke Test # 15min
   timeout_in_minutes: 30

From 027c9eb348808e1a37c9dbc86fbfcd020e2166a8 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Tue, 9 Sep 2025 05:32:05 -0700
Subject: [PATCH 004/183] Fix pre-commit

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/compilation/piecewise_backend.py | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index d280b85fc82a..cec8aca63d80 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -117,12 +117,13 @@ def __call__(self, *args) -> Any:
 
         runtime_shape = args[self.sym_shape_indices[0]]
 
-        range_entry = None
+        range_found = False
         for range in self.compile_ranges:
             if self.is_in_range(runtime_shape, range):
                 range_entry = self.range_entries[range]
+                range_found = True
                 break
-        assert range_entry is not None, \
+        assert range_found, \
         f"Shape out of considered range: {runtime_shape} " \
         "[1, max_num_batched_tokens]"
 

From b2992d3b9afa19156df1453fa504df87ecbc30d9 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Thu, 16 Oct 2025 20:12:17 +0000
Subject: [PATCH 005/183] Upd

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 tests/compile/test_compile_ranges.py     | 48 ++++++++--------
 vllm/compilation/backends.py             | 73 ++++++++++++++----------
 vllm/compilation/collective_fusion.py    | 19 +++---
 vllm/compilation/compiler_interface.py   | 16 +++---
 vllm/compilation/inductor_pass.py        |  3 +-
 vllm/compilation/pass_manager.py         |  2 +-
 vllm/compilation/piecewise_backend.py    | 30 +++++-----
 vllm/compilation/sequence_parallelism.py |  8 ++-
 vllm/config/compilation.py               |  8 ++-
 9 files changed, 114 insertions(+), 93 deletions(-)

diff --git a/tests/compile/test_compile_ranges.py b/tests/compile/test_compile_ranges.py
index 6759da199f4b..68389ccfbe14 100644
--- a/tests/compile/test_compile_ranges.py
+++ b/tests/compile/test_compile_ranges.py
@@ -6,8 +6,12 @@
 
 from vllm.compilation.counter import compilation_counter
 from vllm.compilation.decorators import support_torch_compile
-from vllm.config import (CompilationConfig, CompilationLevel, VllmConfig,
-                         set_current_vllm_config)
+from vllm.config import (
+    CompilationConfig,
+    CompilationLevel,
+    VllmConfig,
+    set_current_vllm_config,
+)
 from vllm.forward_context import set_forward_context
 from vllm.utils import direct_register_custom_op
 
@@ -18,15 +22,17 @@
 MLP_SIZE = 128
 
 
-def silly_attention(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
-                    out: torch.Tensor) -> None:
+def silly_attention(
+    q: torch.Tensor, k: torch.Tensor, v: torch.Tensor, out: torch.Tensor
+) -> None:
     out.copy_(q)
     out += k
     out += v
 
 
-def silly_attention_fake(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
-                         out: torch.Tensor) -> None:
+def silly_attention_fake(
+    q: torch.Tensor, k: torch.Tensor, v: torch.Tensor, out: torch.Tensor
+) -> None:
     return
 
 
@@ -41,12 +47,7 @@ def silly_attention_fake(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
 
 @support_torch_compile
 class TestModel(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = '',
-                 **kwargs) -> None:
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs) -> None:
         super().__init__()
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -59,8 +60,7 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 @torch.inference_mode
-def run_model(vllm_config: VllmConfig, model: nn.Module,
-              batch_sizes: list[int]):
+def run_model(vllm_config: VllmConfig, model: nn.Module, batch_sizes: list[int]):
     with set_forward_context({}, vllm_config=vllm_config):
         model(torch.randn(BATCH_SIZE, MLP_SIZE).cuda())
         for batch_size in batch_sizes:
@@ -68,19 +68,21 @@ def run_model(vllm_config: VllmConfig, model: nn.Module,
 
 
 def test_compile_ranges():
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.PIECEWISE,
-        compile_ranges_split_points=[8, 32],
-    ))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            compile_ranges_split_points=[8, 32],
+        )
+    )
 
     with set_current_vllm_config(vllm_config):
-        model = TestModel(vllm_config=vllm_config, prefix='').eval().cuda()
+        model = TestModel(vllm_config=vllm_config, prefix="").eval().cuda()
     batch_sizes = [1, 16, 48]
     # A has support_torch_compile
     with compilation_counter.expect(
-            num_graphs_seen=1,
-            num_piecewise_graphs_seen=1,
-            num_backend_compilations=4,
-            # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        num_graphs_seen=1,
+        num_piecewise_graphs_seen=1,
+        num_backend_compilations=4,
+        # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
     ):
         run_model(vllm_config, model, batch_sizes)
diff --git a/vllm/compilation/backends.py b/vllm/compilation/backends.py
index 45a1a8c2f267..beda9b36f686 100644
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -80,8 +80,7 @@ class CompilerManager:
     """
 
     def __init__(self, compilation_config: CompilationConfig):
-        self.cache: dict[tuple[tuple[int, int] | None, int, str],
-                         Any] = (dict())
+        self.cache: dict[tuple[tuple[int, int] | None, int, str], Any] = dict()
         self.is_cache_updated = False
         self.compilation_config = compilation_config
         self.compiler = make_compiler(compilation_config)
@@ -156,20 +155,26 @@ def load(
         if (compile_range, graph_index, self.compiler.name) not in self.cache:
             return None
         handle = self.cache[(compile_range, graph_index, self.compiler.name)]
-        compiled_graph = self.compiler.load(handle, graph, example_inputs,
-                                            graph_index, compile_range)
+        compiled_graph = self.compiler.load(
+            handle, graph, example_inputs, graph_index, compile_range
+        )
         if compile_range is None:
             logger.debug(
-                "Directly load the %s-th graph for dynamic compile range from %s via handle %s",
+                "Directly load the %s-th graph for dynamic compile range"
+                "from %s via handle %s",
                 graph_index,
                 self.compiler.name,
                 handle,
             )
         else:
             logger.debug(
-                "Directly load the %s-th graph for compile range %s from %s via "
-                "handle %s", graph_index, str(compile_range),
-                self.compiler.name, handle)
+                "Directly load the %s-th graph for compile range %s"
+                "from %s via handle %s",
+                graph_index,
+                str(compile_range),
+                self.compiler.name,
+                handle,
+            )
         return compiled_graph
 
     def compile(
@@ -192,8 +197,7 @@ def compile(
         compiled_graph = None
 
         # try to load from the cache
-        compiled_graph = self.load(graph, example_inputs, graph_index,
-                                   compile_range)
+        compiled_graph = self.load(graph, example_inputs, graph_index, compile_range)
         if compiled_graph is not None:
             if graph_index == num_graphs - 1:
                 # after loading the last graph for this shape, record the time.
@@ -209,8 +213,10 @@ def compile(
                 else:
                     logger.info(
                         "Directly load the compiled graph(s) for compile range %s "
-                        "from the cache, took %.3f s", str(compile_range),
-                        elapsed)
+                        "from the cache, took %.3f s",
+                        str(compile_range),
+                        elapsed,
+                    )
             return compiled_graph
 
         # no compiler cached the graph, or the cache is disabled,
@@ -219,38 +225,43 @@ def compile(
             # Let compile_fx generate a key for us
             maybe_key = None
         else:
-            maybe_key = \
-                f"artifact_compile_range_{compile_range}_subgraph_{graph_index}"
-        compiled_graph, handle = self.compiler.compile(
-            graph, example_inputs, additional_inductor_config, compile_range,
-            maybe_key)
+            maybe_key = f"artifact_compile_range_{compile_range}_subgraph_{graph_index}"
+        with self.compile_context(compile_range):
+            compiled_graph, handle = self.compiler.compile(
+                graph,
+                example_inputs,
+                additional_inductor_config,
+                compile_range,
+                maybe_key,
+            )
 
         assert compiled_graph is not None, "Failed to compile the graph"
 
         # store the artifact in the cache
         if not envs.VLLM_DISABLE_COMPILE_CACHE and handle is not None:
-            self.cache[(compile_range, graph_index,
-                        self.compiler.name)] = handle
+            self.cache[(compile_range, graph_index, self.compiler.name)] = handle
             compilation_counter.num_cache_entries_updated += 1
             self.is_cache_updated = True
             if graph_index == 0:
                 # adds some info logging for the first graph
                 if compile_range is None:
-                    logger.info_once(
-                        "Cache the graph for dynamic shape for later use")
+                    logger.info_once("Cache the graph for dynamic shape for later use", scope="local")
                 else:
-                    logger.info_once("Cache the graph of compile range %s for later use",
-                                str(compile_range))
+                    logger.info_once(
+                        "Cache the graph of compile range %s for later use",
+                        str(compile_range),
+                    )
             if compile_range is None:
                 logger.debug(
-                    "Store the %s-th graph for dynamic compile range from %s via handle %s",
+                    "Store the %s-th graph for dynamic compile range"
+                    "from %s via handle %s",
                     graph_index,
                     self.compiler.name,
                     handle,
                 )
             else:
                 logger.debug(
-                    "Store the %s-th graph for compile range %s from %s via handle %s",
+                    "Store the %s-th graph for compile range%s from %s via handle %s",
                     graph_index,
                     str(compile_range),
                     self.compiler.name,
@@ -264,14 +275,17 @@ def compile(
             compilation_config.compilation_time += elapsed
             if compile_range is None:
                 logger.info_once(
-                    "Compiling a graph for dynamic compile range takes %.2f s",
-                           
+                    "Compiling a graph for dynamic compile range takes %.2f s", 
                     elapsed,
                     scope="local",
                 )
             else:
-                logger.info_once("Compiling a graph for compile range %s takes %.2f s",
-                            str(compile_range), elapsed, scope="local")
+                logger.info_once(
+                    "Compiling a graph for compile range %s takes %.2f s",
+                    str(compile_range),
+                    elapsed,
+                    scope="local",
+                )
 
         return compiled_graph
 
@@ -401,7 +415,6 @@ def call_module(
                 index,
                 len(self.compile_submod_names),
                 sym_shape_indices,
-                # compiled_graph_for_dynamic_shape,
                 self.vllm_backend,
             )
 
diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index a4758c971611..3d970ac2964b 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -505,12 +505,12 @@ def call_trtllm_fused_allreduce_norm(
         element_size = allreduce_in.element_size()
         current_tensor_size = num_tokens * hidden_size * element_size
         max_tensor_size = max_token_num * hidden_size * element_size
-        assert current_tensor_size <= max_tensor_size, \
-            f"Current tensor size {current_tensor_size} is larger than " \
-            f"max token num {max_token_num} * hidden size {hidden_size} * " \
+        assert current_tensor_size <= max_tensor_size, (
+            f"Current tensor size {current_tensor_size} is larger than "
+            f"max token num {max_token_num} * hidden size {hidden_size} * "
             f"element size {element_size}"
-        device_capability = current_platform.get_device_capability(
-        ).as_version_str()
+        )
+        device_capability = current_platform.get_device_capability().as_version_str()
         # Get one shot input size limit for the current world size
         # for the current device capability
         max_one_shot_size = _FI_ALLREDUCE_ONE_SHOT_MAX_SIZES_MB. \
@@ -520,9 +520,9 @@ def call_trtllm_fused_allreduce_norm(
         use_oneshot = max_one_shot_size is None or \
             current_tensor_size <= max_one_shot_size * MiB
 
-        assert (
-            _FI_WORKSPACE_TENSOR
-            is not None), "Flashinfer must be enabled when using flashinfer"
+        assert _FI_WORKSPACE_TENSOR is not None, (
+            "Flashinfer must be enabled when using flashinfer"
+        )
         if norm_out is None:
             norm_out = allreduce_in
             residual_out = residual
@@ -1178,8 +1178,7 @@ def register_patterns(self):
         self.disabled = False
 
     @VllmInductorPass.time_and_log
-    def is_applicable_for_range(
-            self, compile_range: tuple[int, int] | None) -> bool:
+    def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool:
         if compile_range is None:
             return False
         return compile_range[1] - 1 <= self.max_token_num
diff --git a/vllm/compilation/compiler_interface.py b/vllm/compilation/compiler_interface.py
index 3861bfed11d5..4e5aa077ddae 100644
--- a/vllm/compilation/compiler_interface.py
+++ b/vllm/compilation/compiler_interface.py
@@ -63,14 +63,14 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: tuple[int, int | None] = None,
+        compile_range: tuple[int, int] | None = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         """
         Compile the graph with the given example inputs and compiler config,
         with a range. If the `compile_range` is None, it means
         the `example_inputs` have a dynamic shape. Otherwise, the
-        `compile_range` specifies the range of the inputs, 
+        `compile_range` specifies the range of the inputs,
         it could be concrete size, e.g. (4, 4).
         Right now we only support one variable range of shapes for all inputs,
          which is the batchsize (number of tokens) during inference.
@@ -99,7 +99,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: tuple[int, int | None] = None,
+        compile_range: tuple[int, int] | None = None,
     ) -> Callable:
         """
         Load the compiled function from the handle.
@@ -193,7 +193,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: tuple[int, int | None] = None,
+        compile_range: tuple[int, int] | None = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_inductor_compiles += 1
@@ -234,7 +234,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: tuple[int, int | None] = None,
+        compile_range: tuple[int, int] | None = None,
     ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
@@ -298,7 +298,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: tuple[int, int | None] = None,
+        compile_range: tuple[int, int] | None = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_inductor_compiles += 1
@@ -497,7 +497,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: tuple[int, int | None] = None,
+        compile_range: tuple[int, int] | None = None,
     ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
@@ -615,7 +615,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: tuple[int, int | None] = None,
+        compile_range: tuple[int, int] | None = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_eager_compiles += 1
diff --git a/vllm/compilation/inductor_pass.py b/vllm/compilation/inductor_pass.py
index 1b4430c82b2d..599fa776b6c0 100644
--- a/vllm/compilation/inductor_pass.py
+++ b/vllm/compilation/inductor_pass.py
@@ -96,8 +96,7 @@ def hash_dict(dict_: dict[Any, Any]):
         encoded = json.dumps(dict_, sort_keys=True).encode("utf-8")
         return hashlib.sha256(encoded).hexdigest()
 
-    def is_applicable_for_range(self, compile_range: tuple[int,
-                                                                    int] | None):
+    def is_applicable_for_range(self, compile_range: tuple[int, int] | None):
         return True
 
 
diff --git a/vllm/compilation/pass_manager.py b/vllm/compilation/pass_manager.py
index 82bca8f1fe1b..08002dc862f6 100644
--- a/vllm/compilation/pass_manager.py
+++ b/vllm/compilation/pass_manager.py
@@ -75,7 +75,7 @@ def __call__(self, graph: fx.Graph):
                 pass_(graph)
                 VllmInductorPass.dump_prefix += 1
             else:
-                logger.debug("Skipping %s with shape %s", pass_, shape)
+                logger.debug("Skipping %s with compile range %s", pass_, compile_range)
 
         # post-cleanup goes before fix_functionalization
         # because it requires a functional graph
diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index cec8aca63d80..607d6a80f5cf 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -30,7 +30,6 @@ def __init__(
         piecewise_compile_index: int,
         total_piecewise_compiles: int,
         sym_shape_indices: list[int],
-        compiled_graph_for_general_shape: Callable,
         vllm_backend: VllmBackend,
     ):
         """
@@ -58,8 +57,11 @@ def __init__(
         log_string = f"PiecewiseBackend: compile_ranges: {self.compile_ranges}"
         logger.debug_once(log_string)
 
-        self.is_in_range = lambda x, range: range[0] <= x < range[1] if range[
-            0] < range[1] else x == range[0]
+        self.is_in_range = (
+            lambda x, range: range[0] <= x < range[1]
+            if range[0] < range[1]
+            else x == range[0]
+        )
 
         self.first_run_finished = False
 
@@ -73,22 +75,22 @@ def __init__(
 
         # to_be_compiled_ranges tracks the remaining ranges to compile,
         # and updates during the compilation process, so we need to copy it
-        self.to_be_compiled_ranges: set[tuple[int,
-                                              int]] = set(self.compile_ranges)
+        self.to_be_compiled_ranges: set[tuple[int, int]] = set(self.compile_ranges)
 
         # We only keep compilation management inside this class directly.
         for range in self.compile_ranges:
-            self.range_entries[range] = RangeEntry(compile_range=range, )
+            self.range_entries[range] = RangeEntry(
+                compile_range=range,
+            )
 
     def check_for_ending_compilation(self):
-        if (self.is_last_graph and not self.to_be_compiled_ranges):
+        if self.is_last_graph and not self.to_be_compiled_ranges:
             # no specific sizes to compile
             # save the hash of the inductor graph for the next run
             self.vllm_backend.compiler_manager.save_to_file()
             end_monitoring_torch_compile(self.vllm_config)
 
-    def _maybe_compile_for_range_entry(self, range_entry: RangeEntry,
-                                       args) -> Any:
+    def _maybe_compile_for_range_entry(self, range_entry: RangeEntry, args) -> Any:
         if not range_entry.compiled:
             range_entry.compiled = True
             self.to_be_compiled_ranges.remove(range_entry.compile_range)
@@ -101,7 +103,8 @@ def _maybe_compile_for_range_entry(self, range_entry: RangeEntry,
                 self.compilation_config,
                 graph_index=self.piecewise_compile_index,
                 num_graphs=self.total_piecewise_compiles,
-                compile_range=range_entry.compile_range)
+                compile_range=range_entry.compile_range,
+            )
 
             # finished compilations for all required shapes
             self.check_for_ending_compilation()
@@ -123,9 +126,10 @@ def __call__(self, *args) -> Any:
                 range_entry = self.range_entries[range]
                 range_found = True
                 break
-        assert range_found, \
-        f"Shape out of considered range: {runtime_shape} " \
-        "[1, max_num_batched_tokens]"
+        assert range_found, (
+            f"Shape out of considered range: {runtime_shape} "
+            "[1, max_num_batched_tokens]"
+        )
 
         self._maybe_compile_for_range_entry(range_entry, args)
 
diff --git a/vllm/compilation/sequence_parallelism.py b/vllm/compilation/sequence_parallelism.py
index 78fd8386f56e..cf47adb4670a 100644
--- a/vllm/compilation/sequence_parallelism.py
+++ b/vllm/compilation/sequence_parallelism.py
@@ -502,9 +502,11 @@ def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool
         ):
             return True
         tp_size = get_tensor_model_parallel_world_size()
-        return compile_range is not None and (
-            compile_range[0]
-            == compile_range[1]) and (compile_range[1] % tp_size == 0)
+        return (
+            compile_range is not None
+            and (compile_range[0] == compile_range[1])
+            and (compile_range[1] % tp_size == 0)
+        )
 
     @VllmInductorPass.time_and_log
     def __call__(self, graph: fx.Graph):
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 2aab5cb5f295..278fe5801323 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -333,7 +333,7 @@ class CompilationConfig:
     """Sizes to compile for inductor. In addition
     to integers, it also supports "cudagraph_capture_sizes" to
     specify the sizes for cudagraph capture."""
-    compile_ranges_split_points: Optional[list[int]] = None
+    compile_ranges_split_points: list[int] | None = None
     """Split points that represent compile ranges for inductor.
     The compile ranges are 
     [1, split_points[0]), 
@@ -935,7 +935,8 @@ def get_compile_ranges(self) -> list[tuple[int, int]]:
         max_split_point = max(compile_ranges_split_points)
         compile_sizes = set(self.compile_sizes)
         split_points = sorted(
-            compile_sizes.union(set(self.compile_ranges_split_points)))
+            compile_sizes.union(set(self.compile_ranges_split_points))
+        )
         # filter out split points that are greater
         # than max_num_batched_tokens + 1
         split_points = [x for x in split_points if x <= max_split_point]
@@ -946,6 +947,7 @@ def get_compile_ranges(self) -> list[tuple[int, int]]:
                 compile_ranges.append((split_points[i - 1], s))
             if s in compile_sizes and s != 1:
                 compile_ranges.append((s, s))
-        assert compile_ranges[-1][1] == max_split_point, \
+        assert compile_ranges[-1][1] == max_split_point, (
             "Last compile range end should be max_split_point"
+        )
         return sorted(compile_ranges)

From 3499384c1e183cd851c93d12ea7d77c08de03ed2 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Thu, 16 Oct 2025 20:32:36 +0000
Subject: [PATCH 006/183] Upd config

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/config/vllm.py | 45 +++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 45 insertions(+)

diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 916f258d6586..fd38992e374b 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -426,6 +426,8 @@ def __post_init__(self):
                 "correctness and to realize prefill savings. "
             )
 
+        self._set_compile_ranges()
+
         disable_chunked_prefill_reasons: list[str] = []
 
         if self.model_config:
@@ -796,6 +798,49 @@ def _set_cudagraph_sizes(self):
         # complete the remaining process.
         self.compilation_config.post_init_cudagraph_sizes()
 
+    def _set_compile_ranges(self):
+        """
+        Set the compile ranges for the compilation config.
+        """
+        compilation_config = self.compilation_config
+        computed_compile_ranges_split_points = []
+
+        # The upper bound of the compile ranges is the max_num_batched_tokens
+        max_num_batched_tokens = self.scheduler_config.max_num_batched_tokens
+        if max_num_batched_tokens is not None:
+            # We add 1 because the bounds checks in the compiler are exclusive
+            # and we want to include the max_num_batched_tokens
+            # in the compile range
+            computed_compile_ranges_split_points.append(max_num_batched_tokens + 1)
+
+        # Add the compile ranges for flashinfer
+        if compilation_config.pass_config.enable_fi_allreduce_fusion:
+            tp_size = self.parallel_config.tensor_parallel_size
+            max_size = compilation_config.pass_config.flashinfer_max_size(tp_size)
+            if max_size is not None:
+                max_token_num = max_size // (
+                    self.model_config.get_hidden_size()
+                    * self.model_config.dtype.itemsize
+                )
+                # We add 1 because the bounds checks in the compiler are
+                # exclusive and we want to include the max_token_num in the
+                # compile range
+                computed_compile_ranges_split_points.append(max_token_num + 1)
+
+        if compilation_config.compile_ranges_split_points is not None:
+            for x in compilation_config.compile_ranges_split_points:
+                assert isinstance(x, int)
+                assert x > 0, f"Invalid compile range split point: {x}"
+                if (
+                    max_num_batched_tokens is not None
+                    and x < max_num_batched_tokens
+                    and x > 1
+                ):
+                    computed_compile_ranges_split_points.append(x)
+        compilation_config.compile_ranges_split_points = sorted(
+            computed_compile_ranges_split_points
+        )  # type: ignore
+
     def recalculate_max_model_len(self, max_model_len: int):
         # Can only be called in try_verify_and_update_config
         model_config = self.model_config

From 5336ee6ffe1d5b03b69b23f4b346ba10a549c6cd Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Thu, 16 Oct 2025 20:51:01 +0000
Subject: [PATCH 007/183] Fix

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/compilation/collective_fusion.py | 18 ++++++++++--------
 vllm/v1/worker/utils.py               |  2 +-
 2 files changed, 11 insertions(+), 9 deletions(-)

diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index 3d970ac2964b..7c0a1208d870 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -431,7 +431,7 @@ def __init__(self, config: VllmConfig):
 
         self.dump_patterns(config, self.patterns)
 
-    def is_applicable(self, shape: int | None) -> bool:
+    def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool:
         # This pass is applied on top of the sequence parallelism pass.
         # It inherits the same applicability condition as `SequenceParallelismPass`.
         # See `SequenceParallelismPass.is_applicable` for more details.
@@ -441,7 +441,9 @@ def is_applicable(self, shape: int | None) -> bool:
         ):
             return True
         tp_size = get_tensor_model_parallel_world_size()
-        return shape is not None and shape % tp_size == 0
+        return compile_range is not None and (
+            compile_range[0] == compile_range[1] and compile_range[1] % tp_size == 0
+        )
 
     @VllmInductorPass.time_and_log
     def __call__(self, graph: fx.Graph):
@@ -1100,18 +1102,18 @@ def __init__(self, config: VllmConfig):
             )
             return
         element_size = 4 if use_fp32_lamport else 2
-        max_token_num = max_size // (self.hidden_dim * element_size)
+        self.max_token_num = max_size // (self.hidden_dim * element_size)
         # take the min to save workspace size and we'll never use more
         # than max_num_batched_tokens anyways
-        max_token_num = min(
-            max_token_num, config.scheduler_config.max_num_batched_tokens
+        self.max_token_num = min(
+            self.max_token_num, config.scheduler_config.max_num_batched_tokens
         )
 
         self.ipc_handles, workspace_tensor = (
             flashinfer_comm.trtllm_create_ipc_workspace_for_all_reduce_fusion(
                 tp_rank=rank,
                 tp_size=self.tp_size,
-                max_token_num=max_token_num,
+                max_token_num=self.max_token_num,
                 hidden_dim=self.hidden_dim,
                 group=self.group,
                 use_fp32_lamport=use_fp32_lamport,
@@ -1124,7 +1126,7 @@ def __init__(self, config: VllmConfig):
             rank=rank,
             world_size=self.tp_size,
             use_fp32_lamport=use_fp32_lamport,
-            max_token_num=max_token_num,
+            max_token_num=self.max_token_num,
         )
 
         self.register_patterns()
@@ -1177,12 +1179,12 @@ def register_patterns(self):
 
         self.disabled = False
 
-    @VllmInductorPass.time_and_log
     def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool:
         if compile_range is None:
             return False
         return compile_range[1] - 1 <= self.max_token_num
 
+    @VllmInductorPass.time_and_log
     def __call__(self, graph: fx.Graph):
         if self.disabled:
             logger.debug("AllReduceFusionPass disabled")
diff --git a/vllm/v1/worker/utils.py b/vllm/v1/worker/utils.py
index 92baf0cb7136..ef953dd2051e 100644
--- a/vllm/v1/worker/utils.py
+++ b/vllm/v1/worker/utils.py
@@ -330,7 +330,7 @@ def is_residual_scattered_for_sp(
     The residual tensor is scattered across tensor parallel ranks when sequence
     parallelism and tensor parallelism is enabled.
 
-    This follows the same logic as SequenceParallelismPass.is_applicable():
+    This follows the same logic as SequenceParallelismPass.is_applicable_for_range():
     - In full-graph compilation mode (no splitting ops or using inductor graph
       partition), SP is always applied
     - Otherwise, SP is only applied for specific shapes in compile_sizes

From 4958474f77a930f532730a9ec7a395339ea32138 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Fri, 17 Oct 2025 11:30:21 +0000
Subject: [PATCH 008/183] Priotitize compile_sizes

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/compilation/piecewise_backend.py | 28 ++++++++++++++++++++-------
 vllm/config/compilation.py            | 18 ++---------------
 2 files changed, 23 insertions(+), 23 deletions(-)

diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index 607d6a80f5cf..7a10fed1d237 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -57,6 +57,10 @@ def __init__(
         log_string = f"PiecewiseBackend: compile_ranges: {self.compile_ranges}"
         logger.debug_once(log_string)
 
+        self.compile_sizes = self.compilation_config.compile_sizes
+        log_string = f"PiecewiseBackend: compile_sizes: {self.compile_sizes}"
+        logger.debug_once(log_string)
+
         self.is_in_range = (
             lambda x, range: range[0] <= x < range[1]
             if range[0] < range[1]
@@ -78,6 +82,12 @@ def __init__(
         self.to_be_compiled_ranges: set[tuple[int, int]] = set(self.compile_ranges)
 
         # We only keep compilation management inside this class directly.
+        for size in self.compile_sizes:
+            range = (size, size)
+            self.range_entries[range] = RangeEntry(
+                compile_range=range,
+            )
+
         for range in self.compile_ranges:
             self.range_entries[range] = RangeEntry(
                 compile_range=range,
@@ -112,20 +122,24 @@ def _maybe_compile_for_range_entry(self, range_entry: RangeEntry, args) -> Any:
     def __call__(self, *args) -> Any:
         if not self.first_run_finished:
             self.first_run_finished = True
+            self.check_for_ending_compilation()
 
-            # Role of the general is taken by the last range
+            # Role of the general graph is taken by the last range graph
             range_entry = self.range_entries[self.compile_ranges[-1]]
             self._maybe_compile_for_range_entry(range_entry, args)
             return range_entry.runnable(*args)
-
         runtime_shape = args[self.sym_shape_indices[0]]
 
         range_found = False
-        for range in self.compile_ranges:
-            if self.is_in_range(runtime_shape, range):
-                range_entry = self.range_entries[range]
-                range_found = True
-                break
+        if runtime_shape in self.compile_sizes:
+            range_entry = self.range_entries[(runtime_shape, runtime_shape)]
+            range_found = True
+        else:
+            for range in self.compile_ranges:
+                if self.is_in_range(runtime_shape, range):
+                    range_entry = self.range_entries[range]
+                    range_found = True
+                    break
         assert range_found, (
             f"Shape out of considered range: {runtime_shape} "
             "[1, max_num_batched_tokens]"
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 278fe5801323..c2a6d6d783b9 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -929,25 +929,11 @@ def custom_op_log_check(self):
 
     def get_compile_ranges(self) -> list[tuple[int, int]]:
         """Get the compile ranges for the compilation config."""
-        compile_ranges_split_points = self.compile_ranges_split_points
+        split_points = self.compile_ranges_split_points
         compile_ranges = []
-        # max_num_batched_tokens + 1
-        max_split_point = max(compile_ranges_split_points)
-        compile_sizes = set(self.compile_sizes)
-        split_points = sorted(
-            compile_sizes.union(set(self.compile_ranges_split_points))
-        )
-        # filter out split points that are greater
-        # than max_num_batched_tokens + 1
-        split_points = [x for x in split_points if x <= max_split_point]
         for i, s in enumerate(split_points):
             if i == 0:
                 compile_ranges.append((1, s))
             else:
                 compile_ranges.append((split_points[i - 1], s))
-            if s in compile_sizes and s != 1:
-                compile_ranges.append((s, s))
-        assert compile_ranges[-1][1] == max_split_point, (
-            "Last compile range end should be max_split_point"
-        )
-        return sorted(compile_ranges)
+        return compile_ranges

From 04306ed0dacf3fc11bcfb5ae993095d8d5a506bb Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Tue, 28 Oct 2025 13:26:59 +0000
Subject: [PATCH 009/183] Fix inductor config

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/compilation/backends.py           | 7 ++++++-
 vllm/compilation/compiler_interface.py | 4 ++--
 2 files changed, 8 insertions(+), 3 deletions(-)

diff --git a/vllm/compilation/backends.py b/vllm/compilation/backends.py
index beda9b36f686..30ab91e4ab82 100644
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -225,7 +225,12 @@ def compile(
             # Let compile_fx generate a key for us
             maybe_key = None
         else:
-            maybe_key = f"artifact_compile_range_{compile_range}_subgraph_{graph_index}"
+            maybe_key = "artifact_compile_range_"
+            if compile_range is None:
+                maybe_key += "dynamic_shape"
+            else:
+                maybe_key += f"{compile_range[0]}_{compile_range[1]}"
+            maybe_key += f"_subgraph_{graph_index}"
         with self.compile_context(compile_range):
             compiled_graph, handle = self.compiler.compile(
                 graph,
diff --git a/vllm/compilation/compiler_interface.py b/vllm/compilation/compiler_interface.py
index 4e5aa077ddae..d069769fe76f 100644
--- a/vllm/compilation/compiler_interface.py
+++ b/vllm/compilation/compiler_interface.py
@@ -594,8 +594,8 @@ def metrics_context(self) -> contextlib.AbstractContextManager:
 
 
 def set_inductor_config(config, compile_range):
-    if isinstance(compile_range, tuple):
-        # for a specific range of batchsizes, tuning triton kernel parameters
+    if isinstance(compile_range, tuple) and compile_range[0] == compile_range[1]:
+        # for a specific batch size, tuning triton kernel parameters
         # can be beneficial
         config["max_autotune"] = envs.VLLM_ENABLE_INDUCTOR_MAX_AUTOTUNE
         config["coordinate_descent_tuning"] = (

From 9dc4eea25b0ec2520d920616002a6f148a1c3801 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Mon, 3 Nov 2025 10:53:49 +0000
Subject: [PATCH 010/183] Laith's fix

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/compilation/compiler_interface.py | 38 +++++++++++++++++++++-----
 1 file changed, 31 insertions(+), 7 deletions(-)

diff --git a/vllm/compilation/compiler_interface.py b/vllm/compilation/compiler_interface.py
index d069769fe76f..3453b8f676e8 100644
--- a/vllm/compilation/compiler_interface.py
+++ b/vllm/compilation/compiler_interface.py
@@ -213,13 +213,37 @@ def compile(
 
         from torch._inductor import standalone_compile
 
-        compiled_graph = standalone_compile(
-            graph,
-            example_inputs,
-            dynamic_shapes=dynamic_shapes,
-            options={"config_patches": current_config},
-        )
-
+        if dynamic_shapes == "from_graph":
+            # We need to pass fake example_inputs, otherwise torch.compile
+            # will fakify the example_inputs potentially causing some non dynamic
+            # dimension to be be duck shaped to other existing shapes that have hints
+            # matching their values.
+            # This is problem because it can lead to unintended specializations!
+            # if the new wrongly dynamic dim is specialized
+            # it will force specializing the whole shape
+            # standalone_compile probably should not accept
+            # non fake tensors as example inputs!
+            fake_example_inputs = []
+            for node in graph.graph.nodes:
+                # All place holders come first
+                if node.op == "placeholder":
+                    fake_example_inputs.append(node.meta["example_value"])
+                else:
+                    break
+            assert len(fake_example_inputs) == len(example_inputs)
+            compiled_graph = standalone_compile(
+                graph,
+                fake_example_inputs,
+                dynamic_shapes=dynamic_shapes,
+                options={"config_patches": current_config},
+            )
+        else:
+            compiled_graph = standalone_compile(
+                graph,
+                example_inputs,
+                dynamic_shapes=dynamic_shapes,
+                options={"config_patches": current_config},
+            )
         # Save the compiled artifact to disk in the specified path
         assert key is not None
         path = os.path.join(self.cache_dir, key)

From 2c63f0b05c02ce4d93e23093b3838af775d92614 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Tue, 4 Nov 2025 10:22:17 +0000
Subject: [PATCH 011/183] Upd

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/compilation/backends.py          |  6 ++++--
 vllm/compilation/collective_fusion.py | 11 ++++++-----
 vllm/config/compilation.py            |  3 +++
 3 files changed, 13 insertions(+), 7 deletions(-)

diff --git a/vllm/compilation/backends.py b/vllm/compilation/backends.py
index 30ab91e4ab82..7cda5d0dee96 100644
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -250,7 +250,9 @@ def compile(
             if graph_index == 0:
                 # adds some info logging for the first graph
                 if compile_range is None:
-                    logger.info_once("Cache the graph for dynamic shape for later use", scope="local")
+                    logger.info_once(
+                        "Cache the graph for dynamic shape for later use", scope="local"
+                    )
                 else:
                     logger.info_once(
                         "Cache the graph of compile range %s for later use",
@@ -280,7 +282,7 @@ def compile(
             compilation_config.compilation_time += elapsed
             if compile_range is None:
                 logger.info_once(
-                    "Compiling a graph for dynamic compile range takes %.2f s", 
+                    "Compiling a graph for dynamic compile range takes %.2f s",
                     elapsed,
                     scope="local",
                 )
diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index 7c0a1208d870..9c20db07c267 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -515,12 +515,13 @@ def call_trtllm_fused_allreduce_norm(
         device_capability = current_platform.get_device_capability().as_version_str()
         # Get one shot input size limit for the current world size
         # for the current device capability
-        max_one_shot_size = _FI_ALLREDUCE_ONE_SHOT_MAX_SIZES_MB. \
-                        get(device_capability, {}). \
-                        get(world_size, None)
+        max_one_shot_size = _FI_ALLREDUCE_ONE_SHOT_MAX_SIZES_MB.get(
+            device_capability, {}
+        ).get(world_size, None)
         # Use one shot if no max size is specified
-        use_oneshot = max_one_shot_size is None or \
-            current_tensor_size <= max_one_shot_size * MiB
+        use_oneshot = (
+            max_one_shot_size is None or current_tensor_size <= max_one_shot_size * MiB
+        )
 
         assert _FI_WORKSPACE_TENSOR is not None, (
             "Flashinfer must be enabled when using flashinfer"
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index c2a6d6d783b9..e469c8e25a43 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -142,6 +142,9 @@ def flashinfer_max_size(self, world_size: int) -> int | None:
         max_sizes = {
             k: int(v * MiB) for k, v in self.fi_allreduce_fusion_max_size_mb.items()
         }
+        logger.debug_once(
+            f"flashinfer_max_size: {max_sizes.get(world_size)}", scope="global"
+        )
 
         # return None if world size is not supported by flashinfer
         return max_sizes.get(world_size)

From fcebc21fb1708abbfc2622cfeee517aef801c622 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Tue, 4 Nov 2025 14:30:18 +0000
Subject: [PATCH 012/183] Add caching

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/compilation/compiler_interface.py | 37 +++++---------------------
 vllm/compilation/pass_manager.py       |  1 +
 vllm/compilation/piecewise_backend.py  | 23 +++++++++++++++-
 vllm/config/compilation.py             |  8 +++---
 4 files changed, 32 insertions(+), 37 deletions(-)

diff --git a/vllm/compilation/compiler_interface.py b/vllm/compilation/compiler_interface.py
index 3453b8f676e8..6a57cd4bc578 100644
--- a/vllm/compilation/compiler_interface.py
+++ b/vllm/compilation/compiler_interface.py
@@ -213,37 +213,12 @@ def compile(
 
         from torch._inductor import standalone_compile
 
-        if dynamic_shapes == "from_graph":
-            # We need to pass fake example_inputs, otherwise torch.compile
-            # will fakify the example_inputs potentially causing some non dynamic
-            # dimension to be be duck shaped to other existing shapes that have hints
-            # matching their values.
-            # This is problem because it can lead to unintended specializations!
-            # if the new wrongly dynamic dim is specialized
-            # it will force specializing the whole shape
-            # standalone_compile probably should not accept
-            # non fake tensors as example inputs!
-            fake_example_inputs = []
-            for node in graph.graph.nodes:
-                # All place holders come first
-                if node.op == "placeholder":
-                    fake_example_inputs.append(node.meta["example_value"])
-                else:
-                    break
-            assert len(fake_example_inputs) == len(example_inputs)
-            compiled_graph = standalone_compile(
-                graph,
-                fake_example_inputs,
-                dynamic_shapes=dynamic_shapes,
-                options={"config_patches": current_config},
-            )
-        else:
-            compiled_graph = standalone_compile(
-                graph,
-                example_inputs,
-                dynamic_shapes=dynamic_shapes,
-                options={"config_patches": current_config},
-            )
+        compiled_graph = standalone_compile(
+            graph,
+            example_inputs,
+            dynamic_shapes=dynamic_shapes,
+            options={"config_patches": current_config},
+        )
         # Save the compiled artifact to disk in the specified path
         assert key is not None
         path = os.path.join(self.cache_dir, key)
diff --git a/vllm/compilation/pass_manager.py b/vllm/compilation/pass_manager.py
index 08002dc862f6..3e0c9bc99a24 100644
--- a/vllm/compilation/pass_manager.py
+++ b/vllm/compilation/pass_manager.py
@@ -155,5 +155,6 @@ def uuid(self):
 
         # See [HACK: Bug with Inductor graph partition and torch.compile cache]
         state["inductor_splitting_ops"].extend(self.inductor_splitting_ops)
+        state["compile_range"] = get_pass_context().compile_range
 
         return InductorPass.hash_dict(state)
diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index 7a10fed1d237..ad5b49f28550 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -87,6 +87,7 @@ def __init__(
             self.range_entries[range] = RangeEntry(
                 compile_range=range,
             )
+            self.to_be_compiled_ranges.add(range)
 
         for range in self.compile_ranges:
             self.range_entries[range] = RangeEntry(
@@ -100,6 +101,26 @@ def check_for_ending_compilation(self):
             self.vllm_backend.compiler_manager.save_to_file()
             end_monitoring_torch_compile(self.vllm_config)
 
+    def fakify_args(self, args: list[Any]) -> list[Any]:
+        # We need to pass fake example_inputs, otherwise torch.compile
+        # will fakify the example_inputs potentially causing some non dynamic
+        # dimension to be be duck shaped to other existing shapes that have hints
+        # matching their values.
+        # This is problem because it can lead to unintended specializations!
+        # if the new wrongly dynamic dim is specialized
+        # it will force specializing the whole shape
+        # torch.compile probably should not accept
+        # non fake tensors as example inputs!
+        fake_example_inputs = []
+        for node in self.graph.graph.nodes:
+            # All place holders come first
+            if node.op == "placeholder":
+                fake_example_inputs.append(node.meta["example_value"])
+            else:
+                break
+        assert len(fake_example_inputs) == len(args)
+        return fake_example_inputs
+
     def _maybe_compile_for_range_entry(self, range_entry: RangeEntry, args) -> Any:
         if not range_entry.compiled:
             range_entry.compiled = True
@@ -108,7 +129,7 @@ def _maybe_compile_for_range_entry(self, range_entry: RangeEntry, args) -> Any:
             # args are real arguments
             range_entry.runnable = self.vllm_backend.compiler_manager.compile(
                 self.graph,
-                args,
+                self.fakify_args(args),
                 self.compilation_config.inductor_compile_config,
                 self.compilation_config,
                 graph_index=self.piecewise_compile_index,
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 475f4c15afef..fa728c23d145 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -142,11 +142,9 @@ def flashinfer_max_size(self, world_size: int) -> int | None:
         max_size_mb = self.fi_allreduce_fusion_max_size_mb
         if max_size_mb is None:
             max_size_mb = self.default_fi_allreduce_fusion_max_size_mb().get(world_size)
-            logger.debug_once(
-                f"flashinfer_max_size: {int(max_size_mb * MiB)}", scope="global"
-            )
-            return int(max_size_mb * MiB)
-        return None
+        max_size_bytes = int(max_size_mb * MiB) if max_size_mb is not None else None
+        logger.debug_once(f"flashinfer_max_size: {max_size_bytes}", scope="global")
+        return max_size_bytes
 
     @staticmethod
     def default_fi_allreduce_fusion_max_size_mb() -> dict[int, float]:

From 65151bcecf8429890f4fa191e7988aedfb2c9aa5 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Wed, 5 Nov 2025 12:58:20 +0000
Subject: [PATCH 013/183] Address comments

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 tests/compile/test_compile_ranges.py  | 65 +++++++++++++++------------
 vllm/compilation/collective_fusion.py |  5 +++
 vllm/config/compilation.py            |  1 -
 3 files changed, 41 insertions(+), 30 deletions(-)

diff --git a/tests/compile/test_compile_ranges.py b/tests/compile/test_compile_ranges.py
index 68389ccfbe14..03f31df1ece7 100644
--- a/tests/compile/test_compile_ranges.py
+++ b/tests/compile/test_compile_ranges.py
@@ -1,19 +1,24 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import torch
+from torch import fx as fx
 from torch import nn
 from torch.library import Library
 
 from vllm.compilation.counter import compilation_counter
 from vllm.compilation.decorators import support_torch_compile
+from vllm.compilation.inductor_pass import (
+    CustomGraphPass,
+    InductorPass,
+    get_pass_context,
+)
 from vllm.config import (
-    CompilationConfig,
-    CompilationLevel,
     VllmConfig,
     set_current_vllm_config,
 )
+from vllm.config.compilation import CompilationConfig, CompilationMode
+from vllm.config.scheduler import SchedulerConfig
 from vllm.forward_context import set_forward_context
-from vllm.utils import direct_register_custom_op
 
 # create a library to hold the custom op
 silly_lib = Library("silly", "FRAGMENT")  # noqa
@@ -22,29 +27,6 @@
 MLP_SIZE = 128
 
 
-def silly_attention(
-    q: torch.Tensor, k: torch.Tensor, v: torch.Tensor, out: torch.Tensor
-) -> None:
-    out.copy_(q)
-    out += k
-    out += v
-
-
-def silly_attention_fake(
-    q: torch.Tensor, k: torch.Tensor, v: torch.Tensor, out: torch.Tensor
-) -> None:
-    return
-
-
-direct_register_custom_op(
-    op_name="attention",
-    op_func=silly_attention,
-    mutates_args=["out"],
-    fake_impl=silly_attention_fake,
-    target_lib=silly_lib,
-)
-
-
 @support_torch_compile
 class TestModel(nn.Module):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs) -> None:
@@ -67,12 +49,37 @@ def run_model(vllm_config: VllmConfig, model: nn.Module, batch_sizes: list[int])
             model(torch.randn(batch_size, MLP_SIZE).cuda())
 
 
+class PostGradPassManagerCheckRanges(CustomGraphPass):
+    def __init__(self, ranges: list[tuple[int, int]]):
+        self.ranges = ranges
+
+    def __call__(self, graph: fx.Graph):
+        compile_range = get_pass_context().compile_range
+        assert compile_range in self.ranges, (
+            f"Compile range {compile_range} not in {self.ranges}"
+        )
+
+    def uuid(self) -> str:
+        state = {
+            "ranges": self.ranges,
+        }
+        return InductorPass.hash_dict(state)
+
+
 def test_compile_ranges():
     vllm_config = VllmConfig(
+        scheduler_config=SchedulerConfig(
+            max_num_batched_tokens=8192,
+        ),
         compilation_config=CompilationConfig(
-            level=CompilationLevel.PIECEWISE,
+            mode=CompilationMode.VLLM_COMPILE,
             compile_ranges_split_points=[8, 32],
-        )
+        ),
+        inductor_compile_config={
+            "post_grad_custom_post_pass": PostGradPassManagerCheckRanges(
+                [(1, 8), (8, 32), (32, 2049)]
+            )
+        },
     )
 
     with set_current_vllm_config(vllm_config):
@@ -82,7 +89,7 @@ def test_compile_ranges():
     with compilation_counter.expect(
         num_graphs_seen=1,
         num_piecewise_graphs_seen=1,
-        num_backend_compilations=4,
+        num_backend_compilations=3,
         # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
     ):
         run_model(vllm_config, model, batch_sizes)
diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index 9c20db07c267..aaf53c6e5768 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -1109,6 +1109,11 @@ def __init__(self, config: VllmConfig):
         self.max_token_num = min(
             self.max_token_num, config.scheduler_config.max_num_batched_tokens
         )
+        logger.debug_once(
+            f"Flashinfer max size: {max_size // (1024 * 1024)} MB"
+            f", Maximal number of tokens: {self.max_token_num}",
+            scope="global",
+        )
 
         self.ipc_handles, workspace_tensor = (
             flashinfer_comm.trtllm_create_ipc_workspace_for_all_reduce_fusion(
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index fa728c23d145..6e50493a770c 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -143,7 +143,6 @@ def flashinfer_max_size(self, world_size: int) -> int | None:
         if max_size_mb is None:
             max_size_mb = self.default_fi_allreduce_fusion_max_size_mb().get(world_size)
         max_size_bytes = int(max_size_mb * MiB) if max_size_mb is not None else None
-        logger.debug_once(f"flashinfer_max_size: {max_size_bytes}", scope="global")
         return max_size_bytes
 
     @staticmethod

From df22202272995c4a9c99f1ae7c562416d9620e53 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Wed, 5 Nov 2025 11:25:17 -0500
Subject: [PATCH 014/183] Update benchmark

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 benchmarks/kernels/benchmark_fused_collective.py | 16 ++++++++++++----
 vllm/config/compilation.py                       |  2 +-
 2 files changed, 13 insertions(+), 5 deletions(-)

diff --git a/benchmarks/kernels/benchmark_fused_collective.py b/benchmarks/kernels/benchmark_fused_collective.py
index cec134ff9138..d7fa0580a3e7 100644
--- a/benchmarks/kernels/benchmark_fused_collective.py
+++ b/benchmarks/kernels/benchmark_fused_collective.py
@@ -410,6 +410,7 @@ def run_benchmarks(
     use_residual: bool,
     allreduce_params: FlashInferFusedAllReduceParams | None,
     quant_modes: set[str],
+    no_oneshot: bool,
 ):
     """Run all benchmarks for given configuration.
 
@@ -431,6 +432,7 @@ def run_benchmarks(
     rms_eps = 1e-6
     results = {}
     vllm_fused_allreduce = VllmFusedAllreduce(hidden_dim, dtype)
+    use_oneshot_options = [False] if no_oneshot else [True, False]
 
     # Create RMSNorm and QuantFP8 layers once for native benchmarks
 
@@ -476,7 +478,7 @@ def run_benchmarks(
 
         # FlashInfer Fused AllReduce + RMSNorm Oneshot/Twoshot
         if flashinfer_comm is not None and allreduce_params is not None:
-            for use_oneshot in [True, False]:
+            for use_oneshot in use_oneshot_options:
                 suffix = "_oneshot" if use_oneshot else "_twoshot"
                 try:
                     time_ms = benchmark_operation(
@@ -560,7 +562,7 @@ def run_benchmarks(
 
         # FlashInfer Fused AllReduce + RMSNorm + FP8 Quant Oneshot
         if flashinfer_comm is not None and allreduce_params is not None:
-            for use_oneshot in [True, False]:
+            for use_oneshot in use_oneshot_options:
                 suffix = "_oneshot" if use_oneshot else "_twoshot"
                 try:
                     time_ms = benchmark_operation(
@@ -645,7 +647,7 @@ def run_benchmarks(
 
         # FlashInfer Fused AllReduce + RMSNorm + FP4 Quant Oneshot
         if flashinfer_comm is not None and allreduce_params is not None:
-            for use_oneshot in [True, False]:
+            for use_oneshot in use_oneshot_options:
                 suffix = "_oneshot" if use_oneshot else "_twoshot"
                 try:
                     time_ms = benchmark_operation(
@@ -901,7 +903,7 @@ def save_results_to_file(
     try:
         markdown_content = format_results_markdown(all_results, world_size, args)
 
-        with open(output_path, "w") as f:
+        with open(output_path, "a") as f:
             f.write(markdown_content)
 
     except Exception as e:
@@ -960,6 +962,12 @@ def main():
         """,
     )
 
+    parser.add_argument(
+        "--no-oneshot",
+        action="store_true",
+        help="Skip oneshot benchmarks",
+    )
+
     args = parser.parse_args()
 
     # Check if running with torchrun (required for collective operations)
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 6e50493a770c..6f35673856df 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -923,7 +923,7 @@ def custom_op_log_check(self):
 
     def get_compile_ranges(self) -> list[tuple[int, int]]:
         """Get the compile ranges for the compilation config."""
-        split_points = self.compile_ranges_split_points
+        split_points = set(self.compile_ranges_split_points)
         compile_ranges = []
         for i, s in enumerate(split_points):
             if i == 0:

From a21de2baef2202f2610788027c904f9b377752e9 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Wed, 5 Nov 2025 16:32:59 +0000
Subject: [PATCH 015/183] Fix

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 benchmarks/kernels/benchmark_fused_collective.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/benchmarks/kernels/benchmark_fused_collective.py b/benchmarks/kernels/benchmark_fused_collective.py
index d7fa0580a3e7..99213d0c7cc2 100644
--- a/benchmarks/kernels/benchmark_fused_collective.py
+++ b/benchmarks/kernels/benchmark_fused_collective.py
@@ -1076,6 +1076,7 @@ def main():
                 use_residual,
                 allreduce_params,
                 quant_modes=quant_modes,
+                no_oneshot=args.no_oneshot,
             )
 
             # Store results for markdown export

From 6766e4f7da7914d7b1a24e6d760f56e181d5fbaa Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Wed, 5 Nov 2025 17:15:46 -0500
Subject: [PATCH 016/183] Update fakify for compile sizes

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/compilation/piecewise_backend.py | 9 ++++++++-
 vllm/config/compilation.py            | 2 +-
 2 files changed, 9 insertions(+), 2 deletions(-)

diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index ad5b49f28550..fe35aaa9e4ae 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -122,14 +122,21 @@ def fakify_args(self, args: list[Any]) -> list[Any]:
         return fake_example_inputs
 
     def _maybe_compile_for_range_entry(self, range_entry: RangeEntry, args) -> Any:
+        is_compile_size = lambda range: range[0] == range[1]
         if not range_entry.compiled:
             range_entry.compiled = True
             self.to_be_compiled_ranges.remove(range_entry.compile_range)
 
             # args are real arguments
+            # fakify for range, real args for concrete size
+            args = (
+                self.fakify_args(args)
+                if not is_compile_size(range_entry.compile_range)
+                else args
+            )
             range_entry.runnable = self.vllm_backend.compiler_manager.compile(
                 self.graph,
-                self.fakify_args(args),
+                args,
                 self.compilation_config.inductor_compile_config,
                 self.compilation_config,
                 graph_index=self.piecewise_compile_index,
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 740b970669ed..67cd974a13e7 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -947,7 +947,7 @@ def custom_op_log_check(self):
 
     def get_compile_ranges(self) -> list[tuple[int, int]]:
         """Get the compile ranges for the compilation config."""
-        split_points = set(self.compile_ranges_split_points)
+        split_points = sorted(set(self.compile_ranges_split_points))
         compile_ranges = []
         for i, s in enumerate(split_points):
             if i == 0:

From af87d7a7996dc857933ce38b8be3badbed95a935 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Thu, 6 Nov 2025 09:59:37 -0500
Subject: [PATCH 017/183] Linter fix

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 vllm/config/compilation.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 67cd974a13e7..3a3fdd7f295d 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -947,6 +947,8 @@ def custom_op_log_check(self):
 
     def get_compile_ranges(self) -> list[tuple[int, int]]:
         """Get the compile ranges for the compilation config."""
+        if self.compile_ranges_split_points is None:
+            return []
         split_points = sorted(set(self.compile_ranges_split_points))
         compile_ranges = []
         for i, s in enumerate(split_points):

From b4c1b1d66d6ce3288c65c57251d0492f2e9f475b Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Mon, 10 Nov 2025 12:31:48 +0000
Subject: [PATCH 018/183] Address the review

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 tests/compile/test_compile_ranges.py     | 50 +++++++++++++-----------
 vllm/compilation/backends.py             | 12 +++---
 vllm/compilation/collective_fusion.py    |  9 +++--
 vllm/compilation/compiler_interface.py   | 21 +++++-----
 vllm/compilation/inductor_pass.py        |  9 +++--
 vllm/compilation/pass_manager.py         |  4 +-
 vllm/compilation/piecewise_backend.py    | 27 ++++++-------
 vllm/compilation/sequence_parallelism.py |  7 ++--
 vllm/config/compilation.py               |  8 ++--
 vllm/config/utils.py                     | 36 ++++++++++++++++-
 vllm/config/vllm.py                      |  6 ++-
 vllm/v1/worker/gpu_worker.py             | 19 ++++++++-
 12 files changed, 137 insertions(+), 71 deletions(-)

diff --git a/tests/compile/test_compile_ranges.py b/tests/compile/test_compile_ranges.py
index 03f31df1ece7..564690f18192 100644
--- a/tests/compile/test_compile_ranges.py
+++ b/tests/compile/test_compile_ranges.py
@@ -3,12 +3,11 @@
 import torch
 from torch import fx as fx
 from torch import nn
-from torch.library import Library
 
+import tests.compile.silly_attention  # noqa
 from vllm.compilation.counter import compilation_counter
 from vllm.compilation.decorators import support_torch_compile
 from vllm.compilation.inductor_pass import (
-    CustomGraphPass,
     InductorPass,
     get_pass_context,
 )
@@ -18,11 +17,9 @@
 )
 from vllm.config.compilation import CompilationConfig, CompilationMode
 from vllm.config.scheduler import SchedulerConfig
+from vllm.config.utils import Range
 from vllm.forward_context import set_forward_context
 
-# create a library to hold the custom op
-silly_lib = Library("silly", "FRAGMENT")  # noqa
-
 BATCH_SIZE = 64
 MLP_SIZE = 128
 
@@ -49,24 +46,34 @@ def run_model(vllm_config: VllmConfig, model: nn.Module, batch_sizes: list[int])
             model(torch.randn(batch_size, MLP_SIZE).cuda())
 
 
-class PostGradPassManagerCheckRanges(CustomGraphPass):
-    def __init__(self, ranges: list[tuple[int, int]]):
+class PostGradPassManagerCheckRanges(InductorPass):
+    def __init__(self, ranges: list[Range]):
         self.ranges = ranges
+        self.num_calls = 0
 
     def __call__(self, graph: fx.Graph):
         compile_range = get_pass_context().compile_range
         assert compile_range in self.ranges, (
             f"Compile range {compile_range} not in {self.ranges}"
         )
+        self.num_calls += 1
 
     def uuid(self) -> str:
         state = {
-            "ranges": self.ranges,
+            "ranges": [str(range) for range in self.ranges],
+            "current_compile_range": str(get_pass_context().compile_range),
         }
         return InductorPass.hash_dict(state)
 
 
 def test_compile_ranges():
+    post_grad_pass_manager = PostGradPassManagerCheckRanges(
+        [
+            Range(start=1, end=8),
+            Range(start=8, end=32),
+            Range(start=32, end=8193),
+        ]
+    )
     vllm_config = VllmConfig(
         scheduler_config=SchedulerConfig(
             max_num_batched_tokens=8192,
@@ -74,22 +81,21 @@ def test_compile_ranges():
         compilation_config=CompilationConfig(
             mode=CompilationMode.VLLM_COMPILE,
             compile_ranges_split_points=[8, 32],
+            inductor_compile_config={
+                "post_grad_custom_post_pass": post_grad_pass_manager
+            },
         ),
-        inductor_compile_config={
-            "post_grad_custom_post_pass": PostGradPassManagerCheckRanges(
-                [(1, 8), (8, 32), (32, 2049)]
-            )
-        },
     )
 
     with set_current_vllm_config(vllm_config):
         model = TestModel(vllm_config=vllm_config, prefix="").eval().cuda()
-    batch_sizes = [1, 16, 48]
-    # A has support_torch_compile
-    with compilation_counter.expect(
-        num_graphs_seen=1,
-        num_piecewise_graphs_seen=1,
-        num_backend_compilations=3,
-        # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
-    ):
-        run_model(vllm_config, model, batch_sizes)
+        batch_sizes = [1, 16, 48]
+        # A has support_torch_compile
+        with compilation_counter.expect(
+            num_graphs_seen=1,
+            num_piecewise_graphs_seen=1,
+            num_backend_compilations=3,
+            # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        ):
+            run_model(vllm_config, model, batch_sizes)
+        assert post_grad_pass_manager.num_calls == 3
diff --git a/vllm/compilation/backends.py b/vllm/compilation/backends.py
index 7a1d851ebe42..0d7ef88c8e6a 100644
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -22,6 +22,7 @@
     resolve_defined_ops,
 )
 from vllm.config import CompilationConfig, CUDAGraphMode, VllmConfig
+from vllm.config.utils import Range
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.utils.import_utils import resolve_obj_by_qualname
@@ -83,7 +84,7 @@ class CompilerManager:
     """
 
     def __init__(self, compilation_config: CompilationConfig):
-        self.cache: dict[tuple[tuple[int, int] | None, int, str], Any] = dict()
+        self.cache: dict[tuple[Range | None, int, str], Any] = dict()
         self.is_cache_updated = False
         self.compilation_config = compilation_config
         self.compiler = make_compiler(compilation_config)
@@ -92,7 +93,7 @@ def compute_hash(self, vllm_config: VllmConfig) -> str:
         return self.compiler.compute_hash(vllm_config)
 
     @contextmanager
-    def compile_context(self, compile_range: tuple[int, int] | None = None):
+    def compile_context(self, compile_range: Range | None = None):
         """Provide compilation context for the duration of compilation to set
         any torch global properties we want to scope to a single Inductor
         compilation (e.g. partition rules, pass context)."""
@@ -152,7 +153,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: tuple[int, int] | None = None,
+        compile_range: Range | None = None,
     ) -> Callable | None:
         if (compile_range, graph_index, self.compiler.name) not in self.cache:
             return None
@@ -187,7 +188,7 @@ def compile(
         compilation_config: CompilationConfig,
         graph_index: int = 0,
         num_graphs: int = 1,
-        compile_range: tuple[int, int] | None = None,
+        compile_range: Range | None = None,
     ) -> Any:
         if graph_index == 0:
             # before compiling the first graph, record the start time
@@ -206,6 +207,7 @@ def compile(
                 # there can be multiple graphs due to piecewise compilation.
                 now = time.time()
                 elapsed = now - compilation_start_time
+                compilation_config.compilation_time += elapsed
                 if compile_range is None:
                     logger.info(
                         "Directly load the compiled graph(s) for dynamic shape "
@@ -231,7 +233,7 @@ def compile(
             if compile_range is None:
                 maybe_key += "dynamic_shape"
             else:
-                maybe_key += f"{compile_range[0]}_{compile_range[1]}"
+                maybe_key += f"{compile_range.start}_{compile_range.end}"
             maybe_key += f"_subgraph_{graph_index}"
         with self.compile_context(compile_range):
             compiled_graph, handle = self.compiler.compile(
diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index dbe17f984808..81e881373e45 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -10,6 +10,7 @@
 from torch.distributed._symmetric_memory import enable_symm_mem_for_group
 
 from vllm.config import VllmConfig
+from vllm.config.utils import Range
 from vllm.distributed import get_tp_group, tensor_model_parallel_all_reduce
 from vllm.distributed.parallel_state import (
     get_tensor_model_parallel_rank,
@@ -431,7 +432,7 @@ def __init__(self, config: VllmConfig):
 
         self.dump_patterns(config, self.patterns)
 
-    def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool:
+    def is_applicable_for_range(self, compile_range: Range | None) -> bool:
         # This pass is applied on top of the sequence parallelism pass.
         # It inherits the same applicability condition as `SequenceParallelismPass`.
         # See `SequenceParallelismPass.is_applicable` for more details.
@@ -442,7 +443,7 @@ def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool
             return True
         tp_size = get_tensor_model_parallel_world_size()
         return compile_range is not None and (
-            compile_range[0] == compile_range[1] and compile_range[1] % tp_size == 0
+            compile_range.is_single_size() and compile_range.end % tp_size == 0
         )
 
     @VllmInductorPass.time_and_log
@@ -1188,10 +1189,10 @@ def register_patterns(self):
 
         self.disabled = False
 
-    def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool:
+    def is_applicable_for_range(self, compile_range: Range | None) -> bool:
         if compile_range is None:
             return False
-        return compile_range[1] - 1 <= self.max_token_num
+        return compile_range.end - 1 <= self.max_token_num
 
     @VllmInductorPass.time_and_log
     def __call__(self, graph: fx.Graph):
diff --git a/vllm/compilation/compiler_interface.py b/vllm/compilation/compiler_interface.py
index 6124a5428f6c..b95067aba191 100644
--- a/vllm/compilation/compiler_interface.py
+++ b/vllm/compilation/compiler_interface.py
@@ -16,6 +16,7 @@
 import vllm.envs as envs
 from vllm.compilation.counter import compilation_counter
 from vllm.config import VllmConfig
+from vllm.config.utils import Range
 from vllm.utils.torch_utils import is_torch_equal_or_newer
 
 
@@ -63,7 +64,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: tuple[int, int] | None = None,
+        compile_range: Range | None = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         """
@@ -99,7 +100,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: tuple[int, int] | None = None,
+        compile_range: Range | None = None,
     ) -> Callable:
         """
         Load the compiled function from the handle.
@@ -213,7 +214,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: tuple[int, int] | None = None,
+        compile_range: Range | None = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_inductor_compiles += 1
@@ -223,8 +224,8 @@ def compile(
         set_inductor_config(current_config, compile_range)
         set_functorch_config()
 
-        if isinstance(compile_range, tuple):
-            if compile_range[0] == compile_range[1]:
+        if compile_range is not None:
+            if compile_range.is_single_size():
                 dynamic_shapes = "from_example_inputs"
             else:
                 dynamic_shapes = "from_graph"
@@ -254,7 +255,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: tuple[int, int] | None = None,
+        compile_range: Range | None = None,
     ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
@@ -318,7 +319,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: tuple[int, int] | None = None,
+        compile_range: Range | None = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_inductor_compiles += 1
@@ -515,7 +516,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: tuple[int, int] | None = None,
+        compile_range: Range | None = None,
     ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
@@ -612,7 +613,7 @@ def metrics_context(self) -> contextlib.AbstractContextManager:
 
 
 def set_inductor_config(config, compile_range):
-    if isinstance(compile_range, tuple) and compile_range[0] == compile_range[1]:
+    if compile_range is not None and compile_range.is_single_size():
         # for a specific batch size, tuning triton kernel parameters
         # can be beneficial
         config["max_autotune"] = envs.VLLM_ENABLE_INDUCTOR_MAX_AUTOTUNE
@@ -633,7 +634,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: tuple[int, int] | None = None,
+        compile_range: Range | None = None,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_eager_compiles += 1
diff --git a/vllm/compilation/inductor_pass.py b/vllm/compilation/inductor_pass.py
index 599fa776b6c0..008eba4629a3 100644
--- a/vllm/compilation/inductor_pass.py
+++ b/vllm/compilation/inductor_pass.py
@@ -14,6 +14,7 @@
 from torch import fx
 from torch._subclasses.fake_tensor import FakeTensorMode, unset_fake_temporarily
 
+from vllm.config.utils import Range
 from vllm.utils.torch_utils import is_torch_equal_or_newer
 
 if is_torch_equal_or_newer("2.6"):
@@ -28,8 +29,8 @@
 
 
 class PassContext:
-    def __init__(self, compile_range: tuple[int, int] | None):
-        self.compile_range = compile_range
+    def __init__(self, compile_range: Range | None):
+        self.compile_range: Range | None = compile_range
 
 
 def get_pass_context() -> PassContext:
@@ -39,7 +40,7 @@ def get_pass_context() -> PassContext:
 
 
 @contextmanager
-def pass_context(compile_range: tuple[int, int] | None):
+def pass_context(compile_range: Range | None):
     """A context manager that stores the current pass context,
     usually it is a list of sizes to specialize.
     """
@@ -96,7 +97,7 @@ def hash_dict(dict_: dict[Any, Any]):
         encoded = json.dumps(dict_, sort_keys=True).encode("utf-8")
         return hashlib.sha256(encoded).hexdigest()
 
-    def is_applicable_for_range(self, compile_range: tuple[int, int] | None):
+    def is_applicable_for_range(self, compile_range: Range | None):
         return True
 
 
diff --git a/vllm/compilation/pass_manager.py b/vllm/compilation/pass_manager.py
index 5984f968da35..4664d0d9aefd 100644
--- a/vllm/compilation/pass_manager.py
+++ b/vllm/compilation/pass_manager.py
@@ -127,6 +127,8 @@ def uuid(self):
         for pass_ in self.passes:
             state["passes"].append(pass_.uuid())
         state["passes"].append(self.fix_functionalization.uuid())
-        state["compile_range"] = get_pass_context().compile_range
+        compile_range = get_pass_context().compile_range
+        if compile_range is not None:
+            state["compile_range"] = str(compile_range)
 
         return InductorPass.hash_dict(state)
diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index fe35aaa9e4ae..10844b69c455 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -10,6 +10,7 @@
 from vllm.compilation.backends import VllmBackend
 from vllm.compilation.monitor import end_monitoring_torch_compile
 from vllm.config import VllmConfig
+from vllm.config.compilation import Range
 from vllm.logger import init_logger
 
 logger = init_logger(__name__)
@@ -17,7 +18,7 @@
 
 @dataclasses.dataclass
 class RangeEntry:
-    compile_range: tuple[int, int]
+    compile_range: Range
     compiled: bool = False
     runnable: Callable = None  # type: ignore
 
@@ -61,12 +62,6 @@ def __init__(
         log_string = f"PiecewiseBackend: compile_sizes: {self.compile_sizes}"
         logger.debug_once(log_string)
 
-        self.is_in_range = (
-            lambda x, range: range[0] <= x < range[1]
-            if range[0] < range[1]
-            else x == range[0]
-        )
-
         self.first_run_finished = False
 
         self.sym_shape_indices = sym_shape_indices
@@ -75,15 +70,15 @@ def __init__(
         # self.concrete_size_entries: dict[int, RangeEntry] = {}
 
         # the entries for ranges that we need to either
-        self.range_entries: dict[tuple[int, int], RangeEntry] = {}
+        self.range_entries: dict[Range, RangeEntry] = {}
 
         # to_be_compiled_ranges tracks the remaining ranges to compile,
         # and updates during the compilation process, so we need to copy it
-        self.to_be_compiled_ranges: set[tuple[int, int]] = set(self.compile_ranges)
+        self.to_be_compiled_ranges: set[Range] = set(self.compile_ranges)
 
         # We only keep compilation management inside this class directly.
         for size in self.compile_sizes:
-            range = (size, size)
+            range = Range(start=size, end=size)
             self.range_entries[range] = RangeEntry(
                 compile_range=range,
             )
@@ -122,7 +117,6 @@ def fakify_args(self, args: list[Any]) -> list[Any]:
         return fake_example_inputs
 
     def _maybe_compile_for_range_entry(self, range_entry: RangeEntry, args) -> Any:
-        is_compile_size = lambda range: range[0] == range[1]
         if not range_entry.compiled:
             range_entry.compiled = True
             self.to_be_compiled_ranges.remove(range_entry.compile_range)
@@ -131,7 +125,7 @@ def _maybe_compile_for_range_entry(self, range_entry: RangeEntry, args) -> Any:
             # fakify for range, real args for concrete size
             args = (
                 self.fakify_args(args)
-                if not is_compile_size(range_entry.compile_range)
+                if not range_entry.compile_range.is_single_size()
                 else args
             )
             range_entry.runnable = self.vllm_backend.compiler_manager.compile(
@@ -158,13 +152,18 @@ def __call__(self, *args) -> Any:
             return range_entry.runnable(*args)
         runtime_shape = args[self.sym_shape_indices[0]]
 
+        # First we try to find the range entry for the concrete compile size
+        # If not found, we search for the range entry
+        # that contains the runtime shape.
         range_found = False
         if runtime_shape in self.compile_sizes:
-            range_entry = self.range_entries[(runtime_shape, runtime_shape)]
+            range_entry = self.range_entries[
+                Range(start=runtime_shape, end=runtime_shape)
+            ]
             range_found = True
         else:
             for range in self.compile_ranges:
-                if self.is_in_range(runtime_shape, range):
+                if range.contains(runtime_shape):
                     range_entry = self.range_entries[range]
                     range_found = True
                     break
diff --git a/vllm/compilation/sequence_parallelism.py b/vllm/compilation/sequence_parallelism.py
index cf47adb4670a..6a5ee5a0efb7 100644
--- a/vllm/compilation/sequence_parallelism.py
+++ b/vllm/compilation/sequence_parallelism.py
@@ -7,6 +7,7 @@
 from torch._inductor.pattern_matcher import PatternMatcherPass
 
 from vllm.config import VllmConfig
+from vllm.config.compilation import Range
 from vllm.distributed import get_tp_group, tensor_model_parallel_all_reduce
 from vllm.distributed.parallel_state import get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
@@ -482,7 +483,7 @@ def __init__(self, config: VllmConfig):
             ).register(self.patterns)
         self.dump_patterns(config, self.patterns)
 
-    def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool:
+    def is_applicable_for_range(self, compile_range: Range | None) -> bool:
         # When sequence parallelism is enabled, the residual tensor from RMSNorm
         # needs to be split along the sequence dimension. However, this dimension
         # is symbolic during piecewise compilation, and splitting symbolic shapes
@@ -504,8 +505,8 @@ def is_applicable_for_range(self, compile_range: tuple[int, int] | None) -> bool
         tp_size = get_tensor_model_parallel_world_size()
         return (
             compile_range is not None
-            and (compile_range[0] == compile_range[1])
-            and (compile_range[1] % tp_size == 0)
+            and (compile_range.is_single_size())
+            and (compile_range.end % tp_size == 0)
         )
 
     @VllmInductorPass.time_and_log
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 2ae93c59ddfb..298fe4242a83 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -14,7 +14,7 @@
 
 import vllm.envs as envs
 from vllm.compilation.inductor_pass import CallableInductorPass, InductorPass
-from vllm.config.utils import config
+from vllm.config.utils import Range, config
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.utils.import_utils import resolve_obj_by_qualname
@@ -945,7 +945,7 @@ def custom_op_log_check(self):
                     op,
                 )
 
-    def get_compile_ranges(self) -> list[tuple[int, int]]:
+    def get_compile_ranges(self) -> list[Range]:
         """Get the compile ranges for the compilation config."""
         if self.compile_ranges_split_points is None:
             return []
@@ -953,7 +953,7 @@ def get_compile_ranges(self) -> list[tuple[int, int]]:
         compile_ranges = []
         for i, s in enumerate(split_points):
             if i == 0:
-                compile_ranges.append((1, s))
+                compile_ranges.append(Range(start=1, end=s))
             else:
-                compile_ranges.append((split_points[i - 1], s))
+                compile_ranges.append(Range(start=split_points[i - 1], end=s))
         return compile_ranges
diff --git a/vllm/config/utils.py b/vllm/config/utils.py
index 7e0878d96bbd..7270caf02740 100644
--- a/vllm/config/utils.py
+++ b/vllm/config/utils.py
@@ -6,7 +6,7 @@
 import inspect
 import textwrap
 from collections.abc import Iterable
-from dataclasses import MISSING, Field, field, fields, is_dataclass, replace
+from dataclasses import MISSING, Field, dataclass, field, fields, is_dataclass, replace
 from itertools import pairwise
 from typing import TYPE_CHECKING, Any, Protocol, TypeVar
 
@@ -176,3 +176,37 @@ def update_config(config: ConfigT, overrides: dict[str, Any]) -> ConfigT:
             )
         processed_overrides[field_name] = value
     return replace(config, **processed_overrides)
+
+
+@dataclass
+class Range:
+    """
+    A range of numbers.
+    Inclusive of start, exclusive of end.
+    """
+
+    start: int
+    end: int
+
+    def is_single_size(self) -> bool:
+        return self.start == self.end
+
+    def contains(self, size: int) -> bool:
+        # Inclusive of start, exclusive of end
+        if self.is_single_size():
+            return size == self.start
+        return self.start <= size < self.end
+
+    def __eq__(self, other: object) -> bool:
+        if not isinstance(other, Range):
+            return False
+        return self.start == other.start and self.end == other.end
+
+    def __hash__(self) -> int:
+        return hash((self.start, self.end))
+
+    def __str__(self) -> str:
+        return f"(start={self.start}, end={self.end})"
+
+    def __repr__(self) -> str:
+        return self.__str__()
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 43a3b51b3a0a..a217b3c48f81 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -889,7 +889,11 @@ def _set_compile_ranges(self):
                 # We add 1 because the bounds checks in the compiler are
                 # exclusive and we want to include the max_token_num in the
                 # compile range
-                computed_compile_ranges_split_points.append(max_token_num + 1)
+                if (
+                    max_num_batched_tokens is not None
+                    and max_token_num < max_num_batched_tokens
+                ):
+                    computed_compile_ranges_split_points.append(max_token_num + 1)
 
         if compilation_config.compile_ranges_split_points is not None:
             for x in compilation_config.compile_ranges_split_points:
diff --git a/vllm/v1/worker/gpu_worker.py b/vllm/v1/worker/gpu_worker.py
index f13ff4e726bd..42f9bdeab97e 100644
--- a/vllm/v1/worker/gpu_worker.py
+++ b/vllm/v1/worker/gpu_worker.py
@@ -14,7 +14,7 @@
 import torch.nn as nn
 
 import vllm.envs as envs
-from vllm.config import VllmConfig
+from vllm.config import CUDAGraphMode, VllmConfig
 from vllm.distributed import (
     ensure_model_parallel_initialized,
     init_distributed_environment,
@@ -398,12 +398,27 @@ def compile_or_warm_up_model(self) -> None:
         # but users still want to compile for better performance,
         # e.g. for the max-num-batched token size in chunked prefill.
         warmup_sizes = self.vllm_config.compilation_config.compile_sizes.copy()
-        if not self.model_config.enforce_eager:
+
+        if (
+            not self.model_config.enforce_eager
+            or self.compilation_config.cudagraph_mode == CUDAGraphMode.NONE
+        ):
             warmup_sizes = [
                 x
                 for x in warmup_sizes
                 if x not in self.vllm_config.compilation_config.cudagraph_capture_sizes
             ]
+        compile_ranges = self.vllm_config.compilation_config.get_compile_ranges()
+
+        # For each compile_range, if none of the batch sizes
+        # in warmup_sizes or cudagraph_capture_sizes are in the range,
+        # add the start of the range to ensure compilation/warmup.
+        all_sizes = set(self.vllm_config.compilation_config.cudagraph_capture_sizes)
+        all_sizes.update(warmup_sizes)
+        for compile_range in compile_ranges:
+            if not any(compile_range.contains(x) for x in all_sizes):
+                warmup_sizes.append(compile_range.start)
+
         # We skip EPLB here since we don't want to record dummy metrics
         for size in sorted(warmup_sizes, reverse=True):
             logger.info("Compile and warming up model for size %d", size)

From f080a83511511a9c0a222451a752a1623aec095d Mon Sep 17 00:00:00 2001
From: vllmellm <vllm.ellm@embeddedllm.com>
Date: Mon, 10 Nov 2025 17:20:53 +0100
Subject: [PATCH 019/183] [RFC][ROCm][AITER] Keep all AITER kernels in
 `_aiter_ops` class like `_custom_ops` and `_ipex_ops` (#24490)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Signed-off-by: vllmellm <vllm.ellm@embeddedllm.com>
Co-authored-by: Luka Govedič <ProExpertProg@users.noreply.github.com>
---
 docs/design/moe_kernel_features.md            |   2 +-
 tests/kernels/moe/test_moe.py                 |  11 +-
 .../model_executor/test_enabled_custom_ops.py |  41 +-
 vllm/_aiter_ops.py                            | 941 ++++++++++++++++++
 vllm/attention/ops/rocm_aiter_mla.py          | 105 --
 vllm/envs.py                                  |   8 +-
 .../layers/fused_moe/fused_moe.py             |  15 +-
 vllm/model_executor/layers/fused_moe/layer.py |  83 +-
 .../layers/fused_moe/rocm_aiter_fused_moe.py  | 329 +-----
 vllm/model_executor/layers/layernorm.py       |  90 +-
 .../compressed_tensors_moe.py                 |  12 +-
 .../schemes/compressed_tensors_w8a8_fp8.py    |   4 +-
 .../model_executor/layers/quantization/fp8.py |  16 +-
 .../quantization/kernels/scaled_mm/aiter.py   |  48 +-
 .../layers/quantization/quark/quark_moe.py    |  47 +-
 .../quark/schemes/quark_ocp_mx.py             |   7 +
 .../layers/quantization/utils/fp8_utils.py    | 124 +--
 .../layers/quantization/utils/w8a8_utils.py   |   2 +-
 .../layers/rotary_embedding/base.py           |  13 +-
 .../rotary_embedding/deepseek_scaling_rope.py |   9 +
 .../rotary_embedding/rocm_aiter_rope_ops.py   |  94 --
 vllm/model_executor/models/deepseek_v2.py     |  27 +-
 vllm/platforms/rocm.py                        |  27 +-
 vllm/v1/attention/backends/mla/common.py      |  55 +-
 .../attention/backends/mla/rocm_aiter_mla.py  |   9 +-
 25 files changed, 1194 insertions(+), 925 deletions(-)
 create mode 100644 vllm/_aiter_ops.py
 delete mode 100644 vllm/attention/ops/rocm_aiter_mla.py
 delete mode 100644 vllm/model_executor/layers/rotary_embedding/rocm_aiter_rope_ops.py

diff --git a/docs/design/moe_kernel_features.md b/docs/design/moe_kernel_features.md
index 633e23eea33e..ee224e6922fb 100644
--- a/docs/design/moe_kernel_features.md
+++ b/docs/design/moe_kernel_features.md
@@ -97,7 +97,7 @@ To be used with a particular `FusedMoEPrepareAndFinalize` sub-class, MoE kernels
 | trtllm                       | standard              | mxfp4,</br>nvfp4 | G(16),G(32)   | <sup>5</sup>                                                | N                     | Y       | [`TrtLlmGenExperts`][vllm.model_executor.layers.fused_moe.trtllm_moe.TrtLlmGenExperts]                                                                                                                                                                                                                      |
 | pallas                       | standard              | N/A              | N/A           | silu                                                        | N                     | N       | [`fused_moe`][vllm.model_executor.layers.fused_moe.moe_pallas.fused_moe]                                                                                                                                                                                                                                    |
 | iterative                    | standard              | N/A              | N/A           | silu                                                        | N                     | N       | [`fused_moe`][vllm.model_executor.layers.fused_moe.moe_torch_iterative.fused_moe]                                                                                                                                                                                                                           |
-| rocm aiter moe               | standard              | fp8              | G(128),A,T    | silu, gelu                                                  | Y                     | N       | [`rocm_aiter_fused_experts`][vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe.rocm_aiter_fused_moe_impl]                                                                                                                                                                                           |
+| rocm aiter moe               | standard              | fp8              | G(128),A,T    | silu, gelu                                                  | Y                     | N       | [`rocm_aiter_fused_experts`][vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe.rocm_aiter_fused_experts]                                                                                                                                                                                           |
 | cpu_fused_moe                | standard              | N/A              | N/A           | silu                                                        | N                     | N       | [`CPUFusedMOE`][vllm.model_executor.layers.fused_moe.cpu_fused_moe.CPUFusedMOE]                                                                                                                                                                                                                             |
 | naive batched<sup>4</sup>    | batched               | int8,</br>fp8    | G,A,T         | silu, gelu                                                  | <sup>6</sup>          | Y       | [`NaiveBatchedExperts`][vllm.model_executor.layers.fused_moe.fused_batched_moe.NaiveBatchedExperts]                                                                                                                                                                                                         |
 
diff --git a/tests/kernels/moe/test_moe.py b/tests/kernels/moe/test_moe.py
index 014df1fa111f..c27cf2468ede 100644
--- a/tests/kernels/moe/test_moe.py
+++ b/tests/kernels/moe/test_moe.py
@@ -6,6 +6,8 @@
 """
 
 import functools
+import importlib
+import sys
 from collections.abc import Callable
 from dataclasses import dataclass
 from typing import Any
@@ -20,6 +22,7 @@
 import vllm.model_executor.layers.fused_moe  # noqa
 from tests.kernels.moe.utils import fused_moe
 from tests.kernels.utils import opcheck, stack_and_dev, torch_moe
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.config import VllmConfig, set_current_vllm_config
 from vllm.distributed.parallel_state import init_distributed_environment
 from vllm.forward_context import set_forward_context
@@ -412,14 +415,12 @@ def test_mixtral_moe(
     huggingface."""
 
     # clear the cache before every test
-    from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-        is_rocm_aiter_moe_enabled,
-    )
+    # Force reload aiter_ops to pick up the new environment variables.
+    if "rocm_aiter_ops" in sys.modules:
+        importlib.reload(rocm_aiter_ops)
 
-    is_rocm_aiter_moe_enabled.cache_clear()
     if use_rocm_aiter:
         monkeypatch.setenv("VLLM_ROCM_USE_AITER", "1")
-
         if dtype == torch.float32:
             pytest.skip("AITER ROCm test skip for float32")
 
diff --git a/tests/model_executor/test_enabled_custom_ops.py b/tests/model_executor/test_enabled_custom_ops.py
index 41419553aa83..9121284de85b 100644
--- a/tests/model_executor/test_enabled_custom_ops.py
+++ b/tests/model_executor/test_enabled_custom_ops.py
@@ -4,6 +4,7 @@
 import pytest
 import torch
 
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.config import CompilationConfig, VllmConfig, set_current_vllm_config
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.layers.activation import (
@@ -15,9 +16,6 @@
     dispatch_topk_func,
     vllm_topk_softmax,
 )
-from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-    is_rocm_aiter_moe_enabled,
-)
 from vllm.model_executor.layers.layernorm import (
     RMSNorm,
     dispatch_rocm_rmsnorm_func,
@@ -126,50 +124,39 @@ def test_enabled_ops_invalid(env: str):
             RMSNorm(1024).enabled()
 
 
-@pytest.mark.parametrize("use_rocm_aiter", ["0", "1"])
-def test_topk_dispatch(use_rocm_aiter: str, monkeypatch):
-    monkeypatch.setenv("VLLM_ROCM_USE_AITER", use_rocm_aiter)
-    topk_func = dispatch_topk_func()
-    is_rocm_aiter_moe_enabled.cache_clear()
-    if current_platform.is_rocm() and int(use_rocm_aiter):
-        from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-            rocm_aiter_topk_softmax,
-        )
+@pytest.mark.parametrize(
+    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False]
+)
+def test_topk_dispatch(use_rocm_aiter: bool):
+    topk_func = dispatch_topk_func(use_rocm_aiter)
 
-        assert topk_func == rocm_aiter_topk_softmax
+    if current_platform.is_rocm() and use_rocm_aiter:
+        assert topk_func == rocm_aiter_ops.topk_softmax
     else:
         assert topk_func == vllm_topk_softmax
 
 
 @pytest.mark.parametrize("add_residual", [True, False])
 @pytest.mark.parametrize("dtype", [torch.float32, torch.float16, torch.bfloat16])
-@pytest.mark.parametrize("use_rocm_aiter", ["0", "1"])
-@pytest.mark.parametrize("use_rocm_aiter_norm", ["0", "1"])
+@pytest.mark.parametrize("use_rocm_aiter", [True, False])
 @pytest.mark.skipif(
     not current_platform.is_rocm(), reason="AITER is a feature exclusive for ROCm"
 )
 def test_rms_norm_dispatch(
-    add_residual: bool,
-    dtype: torch.dtype,
-    use_rocm_aiter: str,
-    use_rocm_aiter_norm: str,
-    monkeypatch,
+    add_residual: bool, dtype: torch.dtype, use_rocm_aiter: bool
 ):
-    monkeypatch.setenv("VLLM_ROCM_USE_AITER", use_rocm_aiter)
-    monkeypatch.setenv("VLLM_ROCM_USE_AITER_RMSNORM", use_rocm_aiter_norm)
-    rms_norm_func = dispatch_rocm_rmsnorm_func(add_residual, dtype)
+    rms_norm_func = dispatch_rocm_rmsnorm_func(add_residual, dtype, use_rocm_aiter)
 
     should_use_rocm_aiter = (
         current_platform.is_rocm()
-        and int(use_rocm_aiter)
-        and int(use_rocm_aiter_norm)
+        and use_rocm_aiter
         and dtype in RMS_NORM_SUPPORTED_DTYPES
     )
 
     if add_residual and should_use_rocm_aiter:
-        assert rms_norm_func == torch.ops.vllm.rocm_aiter_rmsnorm2d_fwd_with_add
+        assert rms_norm_func == rocm_aiter_ops.rms_norm2d_with_add
     elif should_use_rocm_aiter:
-        assert rms_norm_func == torch.ops.vllm.rocm_aiter_rms_norm
+        assert rms_norm_func == rocm_aiter_ops.rms_norm
     elif add_residual:
         assert rms_norm_func == fused_add_rms_norm
     else:
diff --git a/vllm/_aiter_ops.py b/vllm/_aiter_ops.py
new file mode 100644
index 000000000000..9a4b5f3399be
--- /dev/null
+++ b/vllm/_aiter_ops.py
@@ -0,0 +1,941 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import functools
+from collections.abc import Callable
+
+import torch
+
+import vllm.envs as envs
+from vllm.platforms import current_platform
+from vllm.utils.torch_utils import direct_register_custom_op, is_torch_equal_or_newer
+
+
+def is_aiter_found() -> bool:
+    from importlib.util import find_spec
+
+    return find_spec("aiter") is not None
+
+
+# `find_spec` is not torch.compile compatible.
+# In cases where aiter availability might have
+# been checked in forward passes that are torch compiled.
+# we keep this global outside to not cause torch compile breaks.
+IS_AITER_FOUND = is_aiter_found()
+
+
+def if_aiter_supported(func: Callable) -> Callable:
+    """Decorator that only executes the function if
+    ROCm AITER package is supported on gfx9 archs.
+    """
+
+    @functools.wraps(func)
+    def wrapper(*args, **kwargs):
+        # checks the platform, device arch and aiter library existance.
+
+        from vllm.platforms.rocm import on_gfx9
+
+        if current_platform.is_rocm() and on_gfx9() and IS_AITER_FOUND:
+            return func(*args, **kwargs)
+        else:
+            # Return None or do nothing if not supported
+            return None
+
+    return wrapper
+
+
+def _rocm_aiter_fused_moe_impl(
+    hidden_states: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    topk_weight: torch.Tensor,
+    topk_ids: torch.Tensor,
+    expert_mask: torch.Tensor | None = None,
+    activation_method: int = 0,
+    quant_method: int = 0,
+    doweight_stage1: bool = False,
+    w1_scale: torch.Tensor | None = None,
+    w2_scale: torch.Tensor | None = None,
+    a1_scale: torch.Tensor | None = None,
+    a2_scale: torch.Tensor | None = None,
+) -> torch.Tensor:
+    from aiter import ActivationType, QuantType
+    from aiter.fused_moe import fused_moe
+
+    activation = ActivationType(activation_method)
+    quant_type = QuantType(quant_method)
+
+    return fused_moe(
+        hidden_states,
+        w1,
+        w2,
+        topk_weight,
+        topk_ids,
+        expert_mask,
+        activation,
+        quant_type,
+        doweight_stage1,
+        w1_scale,
+        w2_scale,
+        a1_scale,
+        a2_scale,
+    )
+
+
+def _rocm_aiter_fused_moe_fake(
+    hidden_states: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    topk_weight: torch.Tensor,
+    topk_ids: torch.Tensor,
+    expert_mask: torch.Tensor | None = None,
+    activation_method: int = 0,
+    quant_method: int = 0,
+    doweight_stage1: bool = False,
+    w1_scale: torch.Tensor | None = None,
+    w2_scale: torch.Tensor | None = None,
+    a1_scale: torch.Tensor | None = None,
+    a2_scale: torch.Tensor | None = None,
+) -> torch.Tensor:
+    return torch.empty_like(hidden_states)
+
+
+def _rocm_aiter_asm_moe_tkw1_impl(
+    hidden_states: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    fc1_scale: torch.Tensor | None = None,
+    fc2_scale: torch.Tensor | None = None,
+    fc1_smooth_scale: torch.Tensor | None = None,
+    fc2_smooth_scale: torch.Tensor | None = None,
+    a16: bool = False,
+    per_tensor_quant_scale: torch.Tensor | None = None,
+    expert_mask: torch.Tensor | None = None,
+    activation_method: int = 0,
+) -> torch.Tensor:
+    from aiter import ActivationType
+    from aiter.fused_moe_bf16_asm import asm_moe_tkw1
+
+    activation = ActivationType(activation_method)
+
+    return asm_moe_tkw1(
+        hidden_states,
+        w1,
+        w2,
+        topk_weights,
+        topk_ids,
+        fc1_scale=fc1_scale,
+        fc2_scale=fc2_scale,
+        fc1_smooth_scale=fc1_smooth_scale,
+        fc2_smooth_scale=fc2_smooth_scale,
+        a16=a16,
+        per_tensor_quant_scale=per_tensor_quant_scale,
+        expert_mask=expert_mask,
+        activation=activation,
+    )
+
+
+def _rocm_aiter_asm_moe_tkw1_fake(
+    hidden_states: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    fc1_scale: torch.Tensor | None = None,
+    fc2_scale: torch.Tensor | None = None,
+    fc1_smooth_scale: torch.Tensor | None = None,
+    fc2_smooth_scale: torch.Tensor | None = None,
+    a16: bool = False,
+    per_tensor_quant_scale: torch.Tensor | None = None,
+    expert_mask: torch.Tensor | None = None,
+    activation_method: int = 0,
+) -> torch.Tensor:
+    return torch.empty_like(hidden_states)
+
+
+def _rocm_aiter_topk_softmax_impl(
+    topk_weights: torch.Tensor,
+    topk_indices: torch.Tensor,
+    token_expert_indices: torch.Tensor,
+    gating_output: torch.Tensor,
+    renormalize: bool,
+) -> None:
+    from aiter import topk_softmax
+
+    topk_softmax(
+        topk_weights, topk_indices, token_expert_indices, gating_output, renormalize
+    )
+
+
+def _rocm_aiter_topk_softmax_fake(
+    topk_weights: torch.Tensor,
+    topk_indices: torch.Tensor,
+    token_expert_indices: torch.Tensor,
+    gating_output: torch.Tensor,
+    renormalize: bool,
+) -> None:
+    pass
+
+
+def _rocm_aiter_biased_grouped_topk_impl(
+    gating_output: torch.Tensor,
+    correction_bias: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    num_expert_group: int,
+    topk_group: int,
+    need_renorm: bool,
+    routed_scaling_factor: float = 1.0,  # mul to topk_weights
+) -> None:
+    from aiter import biased_grouped_topk
+
+    biased_grouped_topk(
+        gating_output,
+        correction_bias,
+        topk_weights,
+        topk_ids,
+        num_expert_group,
+        topk_group,
+        need_renorm,
+        routed_scaling_factor,
+    )
+
+
+def _rocm_aiter_biased_grouped_topk_fake(
+    gating_output: torch.Tensor,
+    correction_bias: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    num_expert_group: int,
+    topk_group: int,
+    need_renorm: bool,
+    routed_scaling_factor: float = 1.0,  # mul to topk_weights
+) -> None:
+    pass
+
+
+def _rocm_aiter_grouped_topk_impl(
+    gating_output: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    num_expert_group: int,
+    topk_group: int,
+    need_renorm: bool,
+    scoring_func: str = "softmax",
+    routed_scaling_factor: float = 1.0,  # mul to topk_weights
+) -> None:
+    is_softmax = scoring_func == "softmax"
+    from aiter import grouped_topk
+
+    grouped_topk(
+        gating_output,
+        topk_weights,
+        topk_ids,
+        num_expert_group,
+        topk_group,
+        need_renorm,
+        is_softmax,
+        routed_scaling_factor,
+    )
+
+
+def _rocm_aiter_grouped_topk_fake(
+    gating_output: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    num_expert_group: int,
+    topk_group: int,
+    need_renorm: bool,
+    scoring_func: str = "softmax",
+    routed_scaling_factor: float = 1.0,  # mul to topk_weights
+) -> None:
+    pass
+
+
+def _rocm_aiter_mla_decode_fwd_impl(
+    q: torch.Tensor,
+    kv_buffer: torch.Tensor,
+    o: torch.Tensor,
+    qo_indptr: torch.Tensor,
+    max_seqlen_qo: int,
+    kv_indptr: torch.Tensor | None = None,
+    kv_indices: torch.Tensor | None = None,
+    kv_last_page_lens: torch.Tensor | None = None,
+    sm_scale: float = 1.0,
+    logit_cap: float = 0.0,
+) -> None:
+    from aiter.mla import mla_decode_fwd
+
+    mla_decode_fwd(
+        q,
+        kv_buffer.view(-1, 1, 1, q.shape[-1]),
+        o,
+        qo_indptr,
+        kv_indptr,
+        kv_indices,
+        kv_last_page_lens,
+        max_seqlen_qo,
+        sm_scale=sm_scale,
+        logit_cap=logit_cap,
+    )
+
+
+def _rocm_aiter_mla_decode_fwd_fake(
+    q: torch.Tensor,
+    kv_buffer: torch.Tensor,
+    o: torch.Tensor,
+    qo_indptr: torch.Tensor,
+    max_seqlen_qo: int,
+    kv_indptr: torch.Tensor | None = None,
+    kv_indices: torch.Tensor | None = None,
+    kv_last_page_lens: torch.Tensor | None = None,
+    sm_scale: float = 1.0,
+    logit_cap: float = 0.0,
+) -> None:
+    pass
+
+
+def _rocm_aiter_gemm_w8a8_impl(
+    A: torch.Tensor,
+    B: torch.Tensor,
+    As: torch.Tensor,
+    Bs: torch.Tensor,
+    bias: torch.Tensor | None = None,
+    output_dtype: torch.dtype = torch.float16,
+) -> torch.Tensor:
+    from aiter import gemm_a8w8_CK
+
+    # gemm_a8w8_CK(a, b, scale_a, scale_b, bias) expects
+    # a to be [M, K]
+    # b to be [N, K]
+    # CutlassScaledMMLinearKernel prepare weight `w_q` in [K, N] format
+    return gemm_a8w8_CK(A, B, As, Bs, bias, output_dtype)
+
+
+def _rocm_aiter_gemm_w8a8_fake(
+    A: torch.Tensor,
+    B: torch.Tensor,
+    As: torch.Tensor,
+    Bs: torch.Tensor,
+    bias: torch.Tensor | None = None,
+    output_dtype: torch.dtype = torch.float16,
+) -> torch.Tensor:
+    m = A.shape[0]
+    n = B.shape[0]
+    Y = torch.empty(m, n, dtype=output_dtype, device=A.device)
+    return Y
+
+
+def _rocm_aiter_gemm_w8a8_blockscale_impl(
+    A: torch.Tensor,
+    B: torch.Tensor,
+    As: torch.Tensor,
+    Bs: torch.Tensor,
+    output_dtype: torch.dtype = torch.float16,
+) -> torch.Tensor:
+    from aiter import gemm_a8w8_blockscale
+
+    return gemm_a8w8_blockscale(A, B, As, Bs, dtype=output_dtype)
+
+
+def _rocm_aiter_gemm_w8a8_blockscale_fake(
+    A: torch.Tensor,
+    B: torch.Tensor,
+    As: torch.Tensor,
+    Bs: torch.Tensor,
+    output_dtype: torch.dtype = torch.float16,
+) -> torch.Tensor:
+    m = A.shape[0]
+    n = B.shape[0]
+    Y = torch.empty(m, n, dtype=output_dtype, device=A.device)
+    return Y
+
+
+def _rocm_aiter_rms_norm_impl(
+    x: torch.Tensor, weight: torch.Tensor, variance_epsilon: float
+) -> torch.Tensor:
+    from aiter import rms_norm
+
+    if x.dim() > 2:
+        x_original_shape = x.shape
+        x = x.reshape(-1, x_original_shape[-1])
+        x = rms_norm(x, weight, variance_epsilon)
+        return x.reshape(x_original_shape)
+
+    return rms_norm(x, weight, variance_epsilon)
+
+
+def _rocm_aiter_rms_norm_fake(
+    x: torch.Tensor, weight: torch.Tensor, variance_epsilon: float
+) -> torch.Tensor:
+    return torch.empty_like(x)
+
+
+def _rocm_aiter_rmsnorm2d_fwd_with_add_impl(
+    x: torch.Tensor,
+    residual: torch.Tensor,
+    weight: torch.Tensor,
+    variance_epsilon: float,
+) -> tuple[torch.Tensor, torch.Tensor]:
+    from aiter import rmsnorm2d_fwd_with_add
+
+    residual_out = torch.empty_like(residual)
+    output = torch.empty_like(x)
+    rmsnorm2d_fwd_with_add(
+        output,  # output
+        x,  # input
+        residual,  # residual input
+        residual_out,  # residual output
+        weight,
+        variance_epsilon,
+    )
+    return output, residual_out
+
+
+def _rocm_aiter_rmsnorm2d_fwd_with_add_fake(
+    x: torch.Tensor,
+    residual: torch.Tensor,
+    weight: torch.Tensor,
+    variance_epsilon: float,
+) -> tuple[torch.Tensor, torch.Tensor]:
+    return torch.empty_like(x), torch.empty_like(residual)
+
+
+# Global flag to ensure ops are registered only once
+_OPS_REGISTERED = False
+
+
+class rocm_aiter_ops:
+    _AITER_ENABLED = envs.VLLM_ROCM_USE_AITER
+    _LINEAR_ENABLED = envs.VLLM_ROCM_USE_AITER_LINEAR
+    _RMSNORM_ENABLED = envs.VLLM_ROCM_USE_AITER_RMSNORM
+    _FMOE_ENABLED = envs.VLLM_ROCM_USE_AITER_MOE
+    _MLA_ENABLED = envs.VLLM_ROCM_USE_AITER_MLA
+    _PG_ATTN_ENABLED = envs.VLLM_ROCM_USE_AITER_PAGED_ATTN
+    _MHA_ENABLED = envs.VLLM_ROCM_USE_AITER_MHA
+    _TRITON_UNIFIED_ATTN_ENABLED = envs.VLLM_ROCM_USE_AITER_UNIFIED_ATTENTION
+    _FP8BMM_ENABLED = envs.VLLM_ROCM_USE_AITER_FP8BMM
+    _FP4_GEMM_DYNAMIC_QUANT_ASM = envs.VLLM_ROCM_USE_AITER_FP4_ASM_GEMM
+    _TRITON_ROTARY_EMBED = envs.VLLM_ROCM_USE_AITER_TRITON_ROPE
+    _MOE_SHARED_EXPERTS_ENABLED = envs.VLLM_ROCM_USE_AITER_FUSION_SHARED_EXPERTS
+
+    @classmethod
+    @if_aiter_supported
+    def is_enabled(cls) -> bool:
+        """Verifies device specs and availability of aiter main env variable."""
+        return cls._AITER_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_linear_enabled(cls) -> bool:
+        """ "Verifies device specs and availability of env variable."""
+        return cls._AITER_ENABLED and cls._LINEAR_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_linear_fp8_enaled(cls) -> bool:
+        """ "Verifies device specs and availability of env variable."""
+        return cls.is_linear_enabled() and current_platform.is_fp8_fnuz()
+
+    @classmethod
+    @if_aiter_supported
+    def is_rmsnorm_enabled(cls) -> bool:
+        """ "Verifies device specs and availability of env variable."""
+        return cls._AITER_ENABLED and cls._RMSNORM_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_fused_moe_enabled(cls) -> bool:
+        """ "Verifies device specs and availability of env variable."""
+        return cls._AITER_ENABLED and cls._FMOE_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_fusion_moe_shared_experts_enabled(cls) -> bool:
+        return cls.is_fused_moe_enabled() and cls._MOE_SHARED_EXPERTS_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_mla_enabled(cls) -> bool:
+        """ "Verifies device specs and availability of env variable."""
+        return cls._AITER_ENABLED and cls._MLA_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_mha_enabled(cls) -> bool:
+        """ "Verifies device specs and availability of env variable."""
+        return cls._AITER_ENABLED and cls._MHA_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_pa_attn_enabled(cls) -> bool:
+        """ "Verifies device specs and availability of env variable."""
+        return cls._AITER_ENABLED and cls._PG_ATTN_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_triton_unified_attn_enabled(cls) -> bool:
+        """ "Verifies device specs and availability of env variable."""
+        return cls._AITER_ENABLED and cls._TRITON_UNIFIED_ATTN_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_fp8bmm_enabled(cls) -> bool:
+        return cls._AITER_ENABLED and cls._FP8BMM_ENABLED
+
+    @classmethod
+    @if_aiter_supported
+    def is_asm_fp4_gemm_dynamic_quant_enabled(cls) -> bool:
+        return cls._AITER_ENABLED and cls._FP4_GEMM_DYNAMIC_QUANT_ASM
+
+    @classmethod
+    @if_aiter_supported
+    def is_triton_rotary_embed_enabled(cls) -> bool:
+        return cls._AITER_ENABLED and cls._TRITON_ROTARY_EMBED
+
+    @staticmethod
+    @if_aiter_supported
+    def register_ops_once() -> None:
+        global _OPS_REGISTERED
+        if not _OPS_REGISTERED:
+            tags = (
+                tuple()
+                if is_torch_equal_or_newer("2.7.0")
+                else (torch.Tag.needs_fixed_stride_order,)
+            )
+
+            # register all the custom ops here
+            direct_register_custom_op(
+                op_name="rocm_aiter_asm_moe_tkw1",
+                op_func=_rocm_aiter_asm_moe_tkw1_impl,
+                mutates_args=[],
+                fake_impl=_rocm_aiter_asm_moe_tkw1_fake,
+                dispatch_key=current_platform.dispatch_key,
+            )
+
+            direct_register_custom_op(
+                op_name="rocm_aiter_fused_moe",
+                op_func=_rocm_aiter_fused_moe_impl,
+                mutates_args=[],
+                fake_impl=_rocm_aiter_fused_moe_fake,
+                dispatch_key=current_platform.dispatch_key,
+            )
+
+            direct_register_custom_op(
+                op_name="rocm_aiter_topk_softmax",
+                op_func=_rocm_aiter_topk_softmax_impl,
+                mutates_args=["topk_weights", "topk_indices", "token_expert_indices"],
+                fake_impl=_rocm_aiter_topk_softmax_fake,
+                dispatch_key=current_platform.dispatch_key,
+            )
+
+            direct_register_custom_op(
+                op_name="rocm_aiter_biased_grouped_topk",
+                op_func=_rocm_aiter_biased_grouped_topk_impl,
+                mutates_args=["topk_weights", "topk_ids"],
+                fake_impl=_rocm_aiter_biased_grouped_topk_fake,
+                dispatch_key=current_platform.dispatch_key,
+            )
+
+            direct_register_custom_op(
+                op_name="rocm_aiter_grouped_topk",
+                op_func=_rocm_aiter_grouped_topk_impl,
+                mutates_args=["topk_weights", "topk_ids"],
+                fake_impl=_rocm_aiter_grouped_topk_fake,
+                dispatch_key=current_platform.dispatch_key,
+            )
+
+            direct_register_custom_op(
+                op_name="rocm_aiter_mla_decode_fwd",
+                op_func=_rocm_aiter_mla_decode_fwd_impl,
+                mutates_args=["o"],
+                fake_impl=_rocm_aiter_mla_decode_fwd_fake,
+                tags=tags,
+            )
+
+            direct_register_custom_op(
+                op_name="rocm_aiter_gemm_w8a8",
+                op_func=_rocm_aiter_gemm_w8a8_impl,
+                mutates_args=[],
+                fake_impl=_rocm_aiter_gemm_w8a8_fake,
+                dispatch_key=current_platform.dispatch_key,
+            )
+
+            direct_register_custom_op(
+                op_name="rocm_aiter_gemm_w8a8_blockscale",
+                op_func=_rocm_aiter_gemm_w8a8_blockscale_impl,
+                mutates_args=[],
+                fake_impl=_rocm_aiter_gemm_w8a8_blockscale_fake,
+                dispatch_key=current_platform.dispatch_key,
+            )
+
+            direct_register_custom_op(
+                op_name="rocm_aiter_rms_norm",
+                op_func=_rocm_aiter_rms_norm_impl,
+                mutates_args=[],
+                fake_impl=_rocm_aiter_rms_norm_fake,
+                dispatch_key=current_platform.dispatch_key,
+            )
+
+            direct_register_custom_op(
+                op_name="rocm_aiter_rmsnorm2d_fwd_with_add",
+                op_func=_rocm_aiter_rmsnorm2d_fwd_with_add_impl,
+                mutates_args=[],
+                fake_impl=_rocm_aiter_rmsnorm2d_fwd_with_add_fake,
+                dispatch_key=current_platform.dispatch_key,
+            )
+
+            _OPS_REGISTERED = True
+
+    @staticmethod
+    def rms_norm2d_with_add(
+        x: torch.Tensor,
+        residual: torch.Tensor,
+        weight: torch.Tensor,
+        variance_epsilon: float,
+    ) -> tuple[torch.Tensor, torch.Tensor]:
+        return torch.ops.vllm.rocm_aiter_rmsnorm2d_fwd_with_add(
+            x, residual, weight, variance_epsilon
+        )
+
+    @staticmethod
+    def rms_norm(
+        x: torch.Tensor, weight: torch.Tensor, variance_epsilon: float
+    ) -> torch.Tensor:
+        return torch.ops.vllm.rocm_aiter_rms_norm(x, weight, variance_epsilon)
+
+    @staticmethod
+    def gemm_w8a8(
+        A: torch.Tensor,
+        B: torch.Tensor,
+        As: torch.Tensor,
+        Bs: torch.Tensor,
+        bias: torch.Tensor | None = None,
+        output_dtype: torch.dtype = torch.float16,
+    ) -> torch.Tensor:
+        return torch.ops.vllm.rocm_aiter_gemm_w8a8(A, B, As, Bs, bias, output_dtype)
+
+    @staticmethod
+    def gemm_w8a8_blockscale(
+        A: torch.Tensor,
+        B: torch.Tensor,
+        As: torch.Tensor,
+        Bs: torch.Tensor,
+        block_size: list[int],
+        output_dtype: torch.dtype = torch.float16,
+    ) -> torch.Tensor:
+        return torch.ops.vllm.rocm_aiter_gemm_w8a8_blockscale(
+            A, B, As, Bs, output_dtype
+        )
+
+    @staticmethod
+    def fused_moe(
+        hidden_states: torch.Tensor,
+        w1: torch.Tensor,
+        w2: torch.Tensor,
+        topk_weight: torch.Tensor,
+        topk_ids: torch.Tensor,
+        expert_mask: torch.Tensor | None = None,
+        activation_method: int = 0,
+        quant_method: int = 0,
+        doweight_stage1: bool = False,
+        w1_scale: torch.Tensor | None = None,
+        w2_scale: torch.Tensor | None = None,
+        a1_scale: torch.Tensor | None = None,
+        a2_scale: torch.Tensor | None = None,
+    ) -> torch.Tensor:
+        return torch.ops.vllm.rocm_aiter_fused_moe(
+            hidden_states,
+            w1,
+            w2,
+            topk_weight,
+            topk_ids,
+            expert_mask,
+            activation_method,
+            quant_method,
+            doweight_stage1,
+            w1_scale,
+            w2_scale,
+            a1_scale,
+            a2_scale,
+        )
+
+    @staticmethod
+    def asm_moe_tkw1(
+        hidden_states: torch.Tensor,
+        w1: torch.Tensor,
+        w2: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        fc1_scale: torch.Tensor | None = None,
+        fc2_scale: torch.Tensor | None = None,
+        fc1_smooth_scale: torch.Tensor | None = None,
+        fc2_smooth_scale: torch.Tensor | None = None,
+        a16: bool = False,
+        per_tensor_quant_scale: torch.Tensor | None = None,
+        expert_mask: torch.Tensor | None = None,
+        activation_method: int = 0,
+    ) -> torch.Tensor:
+        return torch.ops.vllm.rocm_aiter_asm_moe_tkw1(
+            hidden_states,
+            w1,
+            w2,
+            topk_weights,
+            topk_ids,
+            fc1_scale,
+            fc2_scale,
+            fc1_smooth_scale,
+            fc2_smooth_scale,
+            a16,
+            per_tensor_quant_scale,
+            expert_mask,
+            activation_method,
+        )
+
+    @staticmethod
+    def topk_softmax(
+        topk_weights: torch.Tensor,
+        topk_indices: torch.Tensor,
+        token_expert_indices: torch.Tensor,
+        gating_output: torch.Tensor,
+        renormalize: bool,
+    ) -> tuple[torch.Tensor, ...]:
+        torch.ops.vllm.rocm_aiter_topk_softmax(
+            topk_weights, topk_indices, token_expert_indices, gating_output, renormalize
+        )
+        return topk_weights, topk_indices
+
+    @staticmethod
+    def biased_grouped_topk(
+        gating_output: torch.Tensor,
+        correction_bias: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        num_expert_group: int,
+        topk_group: int,
+        need_renorm: bool,
+        routed_scaling_factor: float = 1.0,
+    ) -> None:
+        torch.ops.vllm.rocm_aiter_biased_grouped_topk(
+            gating_output,
+            correction_bias,
+            topk_weights,
+            topk_ids,
+            num_expert_group,
+            topk_group,
+            need_renorm,
+            routed_scaling_factor,
+        )
+
+    @staticmethod
+    def grouped_topk(
+        gating_output: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        num_expert_group: int,
+        topk_group: int,
+        need_renorm: bool,
+        scoring_func: str = "softmax",
+        routed_scaling_factor: float = 1.0,
+    ) -> None:
+        torch.ops.vllm.rocm_aiter_grouped_topk(
+            gating_output,
+            topk_weights,
+            topk_ids,
+            num_expert_group,
+            topk_group,
+            need_renorm,
+            scoring_func,
+            routed_scaling_factor,
+        )
+
+    @staticmethod
+    def mla_decode_fwd(
+        q: torch.Tensor,
+        kv_buffer: torch.Tensor,
+        o: torch.Tensor,
+        sm_scale: float,
+        qo_indptr: torch.Tensor,
+        max_seqlen_qo: int,
+        kv_indptr: torch.Tensor | None = None,
+        kv_indices: torch.Tensor | None = None,
+        kv_last_page_lens: torch.Tensor | None = None,
+        logit_cap: float = 0.0,
+    ):
+        torch.ops.vllm.rocm_aiter_mla_decode_fwd(
+            q,
+            kv_buffer.view(-1, 1, 1, q.shape[-1]),
+            o,
+            qo_indptr,
+            max_seqlen_qo,
+            kv_indptr,
+            kv_indices,
+            kv_last_page_lens,
+            sm_scale=sm_scale,
+            logit_cap=logit_cap,
+        )
+
+    @staticmethod
+    def triton_fp4_gemm_dynamic_qaunt(
+        x: torch.Tensor,
+        weight: torch.Tensor,
+        weight_scale: torch.Tensor,
+        out_dtype: torch.dtype | None = torch.bfloat16,
+        x_scales: torch.Tensor | None = None,
+    ) -> torch.Tensor:
+        from aiter.ops.triton.gemm_afp4wfp4 import gemm_afp4wfp4
+        from aiter.ops.triton.quant import dynamic_mxfp4_quant
+
+        if x_scales is None:
+            x_q, x_s = dynamic_mxfp4_quant(x)
+        else:
+            x_q = x
+            x_s = x_scales
+
+        y = torch.empty(
+            x_q.shape[0], weight.shape[0], device=x_q.device, dtype=out_dtype
+        )
+
+        gemm_afp4wfp4(x_q, weight, x_s, weight_scale.T, out_dtype, y)
+        return y
+
+    @staticmethod
+    def triton_rotary_embed(
+        positions: torch.Tensor,
+        query: torch.Tensor,
+        key: torch.Tensor,
+        cos_sin_cache: torch.Tensor,
+        head_size: int,
+        rotary_dim: int,
+        is_neox_style: bool,
+    ):
+        from aiter.ops.triton.rope import rope_cached_thd_positions_2c_fwd_inplace
+
+        num_tokens = positions.numel()
+        cos, sin = cos_sin_cache.chunk(2, dim=-1)
+        query_shape = query.shape
+        key_shape = key.shape
+        rotate_style = 0 if is_neox_style else 1
+
+        query = query.view(num_tokens, -1, head_size)
+        key = key.view(num_tokens, -1, head_size)
+        query_ = query[..., :rotary_dim]
+        key_ = key[..., :rotary_dim]
+        positions = positions.view(*query.shape[:1])
+        rope_cached_thd_positions_2c_fwd_inplace(
+            positions,
+            sin,
+            cos,
+            query_,
+            key_,
+            rotate_style,
+            reuse_freqs_front_part=True,
+            is_nope_first=False,
+        )
+        query = query.view(query_shape)
+        key = key.view(key_shape)
+
+    @staticmethod
+    def triton_fp8_bmm(
+        X: torch.Tensor,
+        WQ: torch.Tensor,
+        w_scale: torch.Tensor,
+        group_size: int = 128,
+        bias: torch.Tensor | None = None,
+        dtype: torch.dtype | None = torch.bfloat16,
+        splitK: int | None = None,
+        YQ: torch.Tensor | None = None,
+        transpose_bm: bool | None = False,
+        config: dict | None = None,
+    ) -> torch.Tensor:
+        # ruff: noqa: E501 # isort: skip
+        from aiter.ops.triton.batched_gemm_a8w8_a_per_token_group_prequant_w_per_batched_tensor_quant import (
+            batched_gemm_a8w8_a_per_token_group_prequant_w_per_batched_tensor_quant as aiter_triton_fp8_bmm,
+        )
+
+        return aiter_triton_fp8_bmm(
+            X,
+            WQ,
+            w_scale,
+            group_size=group_size,
+            bias=bias,
+            dtype=dtype,
+            splitK=splitK,
+            YQ=YQ,
+            transpose_bm=transpose_bm,
+            config=config,
+        )
+
+    @staticmethod
+    def triton_gemm_a8w8_blockscale(
+        A: torch.Tensor,
+        B: torch.Tensor,
+        As: torch.Tensor,
+        Bs: torch.Tensor,
+        block_size: list[int],
+        output_dtype: torch.dtype = torch.float16,
+    ) -> torch.Tensor:
+        from aiter.ops.triton.gemm_a8w8_blockscale import gemm_a8w8_blockscale
+
+        return gemm_a8w8_blockscale(A, B, As, Bs, dtype=output_dtype)
+
+    @staticmethod
+    def per_1x128_fp8_quant(
+        input_2d: torch.Tensor,
+    ) -> tuple[torch.Tensor, ...]:
+        """Only applies quantization method for fp8 data type only."""
+        from aiter import QuantType, dtypes, get_hip_quant
+
+        aiter_per1x128_quant = get_hip_quant(QuantType.per_1x128)
+        return aiter_per1x128_quant(input_2d.contiguous(), quant_dtype=dtypes.fp8)
+
+    @staticmethod
+    def is_triton_gemm_w8a8_tuned(n: int, k: int) -> bool:
+        return (n, k) in [
+            (1024, 8192),
+            (2112, 7168),
+            (3072, 1536),
+            (32768, 8192),
+            (4096, 7168),
+            (4608, 7168),
+            (512, 7168),
+            (7168, 2048),
+            (7168, 256),
+            (8192, 1024),
+            (8192, 32768),
+        ]
+
+    @staticmethod
+    def shuffle_weight(
+        self, tensor: torch.Tensor, layout: tuple[int, int] = (16, 16)
+    ) -> torch.Tensor:
+        from aiter.ops.shuffle import shuffle_weight
+
+        return shuffle_weight(tensor, layout=layout)
+
+    @staticmethod
+    def shuffle_weights(
+        *tensors: torch.Tensor, layout: tuple[int, int] = (16, 16)
+    ) -> tuple[torch.Tensor, ...]:
+        """
+        Applies shuffle_weight function from AITER to each
+        input tensor and returns them.
+
+        Rearranges (shuffles) the input tensor/s
+        into a specified block layout for optimized computation.
+
+        Args:
+            *tensors: Variable number of torch.Tensor objects.
+            layout: A pair of integers specifying the block sizes used to divide
+                the tensors during shuffling. Default is (16, 16).
+
+        Returns:
+        A Tuple of shuffled tensors.
+        """
+        from aiter.ops.shuffle import shuffle_weight
+
+        return tuple(shuffle_weight(tensor, layout=layout) for tensor in tensors)
+
+
+rocm_aiter_ops.register_ops_once()
diff --git a/vllm/attention/ops/rocm_aiter_mla.py b/vllm/attention/ops/rocm_aiter_mla.py
deleted file mode 100644
index 6308f63cc4e7..000000000000
--- a/vllm/attention/ops/rocm_aiter_mla.py
+++ /dev/null
@@ -1,105 +0,0 @@
-# SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-
-
-import torch
-
-from vllm.platforms import current_platform
-from vllm.utils.torch_utils import direct_register_custom_op, is_torch_equal_or_newer
-
-
-def get_aiter_mla_metadata(
-    max_batch_size: int, block_size: int, max_block_per_batch: int, device: torch.device
-) -> tuple[torch.Tensor, ...]:
-    paged_kv_indices = torch.zeros(
-        max_batch_size * max_block_per_batch, dtype=torch.int32, device=device
-    )
-    paged_kv_indptr = torch.zeros(max_batch_size + 1, dtype=torch.int32, device=device)
-    paged_kv_last_page_lens = torch.full(
-        (max_batch_size,), block_size, dtype=torch.int32
-    )
-    qo_indptr = torch.zeros(max_batch_size + 1, dtype=torch.int, device=device)
-    return paged_kv_indices, paged_kv_indptr, paged_kv_last_page_lens, qo_indptr
-
-
-def aiter_mla_decode_fwd(
-    q: torch.Tensor,
-    kv_buffer: torch.Tensor,
-    o: torch.Tensor,
-    sm_scale: float,
-    qo_indptr: torch.Tensor,
-    max_seqlen_qo: int,
-    kv_indptr: torch.Tensor | None = None,
-    kv_indices: torch.Tensor | None = None,
-    kv_last_page_lens: torch.Tensor | None = None,
-    logit_cap: float = 0.0,
-):
-    torch.ops.vllm.rocm_aiter_mla_decode_fwd(
-        q,
-        kv_buffer.view(-1, 1, 1, q.shape[-1]),
-        o,
-        qo_indptr,
-        max_seqlen_qo,
-        kv_indptr,
-        kv_indices,
-        kv_last_page_lens,
-        sm_scale=sm_scale,
-        logit_cap=logit_cap,
-    )
-
-
-def mla_decode_fwd_impl(
-    q: torch.Tensor,
-    kv_buffer: torch.Tensor,
-    o: torch.Tensor,
-    qo_indptr: torch.Tensor,
-    max_seqlen_qo: int,
-    kv_indptr: torch.Tensor | None = None,
-    kv_indices: torch.Tensor | None = None,
-    kv_last_page_lens: torch.Tensor | None = None,
-    sm_scale: float = 1.0,
-    logit_cap: float = 0.0,
-) -> None:
-    from aiter.mla import mla_decode_fwd
-
-    mla_decode_fwd(
-        q,
-        kv_buffer.view(-1, 1, 1, q.shape[-1]),
-        o,
-        qo_indptr,
-        kv_indptr,
-        kv_indices,
-        kv_last_page_lens,
-        max_seqlen_qo,
-        sm_scale=sm_scale,
-        logit_cap=logit_cap,
-    )
-
-
-def mla_decode_fwd_fake(
-    q: torch.Tensor,
-    kv_buffer: torch.Tensor,
-    o: torch.Tensor,
-    qo_indptr: torch.Tensor,
-    max_seqlen_qo: int,
-    kv_indptr: torch.Tensor | None = None,
-    kv_indices: torch.Tensor | None = None,
-    kv_last_page_lens: torch.Tensor | None = None,
-    sm_scale: float = 1.0,
-    logit_cap: float = 0.0,
-) -> None:
-    pass
-
-
-if current_platform.is_rocm():
-    if is_torch_equal_or_newer("2.7.0"):
-        tags = ()
-    else:
-        tags = ((torch.Tag.needs_fixed_stride_order,),)
-    direct_register_custom_op(
-        op_name="rocm_aiter_mla_decode_fwd",
-        op_func=mla_decode_fwd_impl,
-        mutates_args=["o"],
-        fake_impl=mla_decode_fwd_fake,
-        tags=tags,
-    )
diff --git a/vllm/envs.py b/vllm/envs.py
index 078e5c38f0f4..30c62e90e9fb 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -109,7 +109,7 @@
     VLLM_ROCM_USE_AITER_MLA: bool = True
     VLLM_ROCM_USE_AITER_MHA: bool = True
     VLLM_ROCM_USE_AITER_FP4_ASM_GEMM: bool = False
-    VLLM_ROCM_USE_TRITON_ROPE: bool = False
+    VLLM_ROCM_USE_AITER_TRITON_ROPE: bool = False
     VLLM_ROCM_USE_AITER_FP8BMM: bool = True
     VLLM_ROCM_USE_AITER_UNIFIED_ATTENTION: bool = False
     VLLM_ROCM_USE_AITER_FUSION_SHARED_EXPERTS: bool = True
@@ -926,8 +926,8 @@ def get_vllm_port() -> int | None:
     ),
     # Whether to use aiter rope.
     # By default is disabled.
-    "VLLM_ROCM_USE_TRITON_ROPE": lambda: (
-        os.getenv("VLLM_ROCM_USE_TRITON_ROPE", "False").lower() in ("true", "1")
+    "VLLM_ROCM_USE_AITER_TRITON_ROPE": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER_TRITON_ROPE", "False").lower() in ("true", "1")
     ),
     # Whether to use aiter triton fp8 bmm kernel
     # By default is enabled.
@@ -1589,7 +1589,7 @@ def compute_hash() -> str:
         "VLLM_ROCM_USE_AITER_MLA",
         "VLLM_ROCM_USE_AITER_MHA",
         "VLLM_ROCM_USE_AITER_FP4_ASM_GEMM",
-        "VLLM_ROCM_USE_TRITON_ROPE",
+        "VLLM_ROCM_USE_AITER_TRITON_ROPE",
         "VLLM_ROCM_USE_AITER_FP8BMM",
         "VLLM_ROCM_USE_AITER_UNIFIED_ATTENTION",
         "VLLM_ROCM_USE_AITER_TRITON_GEMM",
diff --git a/vllm/model_executor/layers/fused_moe/fused_moe.py b/vllm/model_executor/layers/fused_moe/fused_moe.py
index 7ad3ce1397b3..2e042d85fcfc 100644
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -14,6 +14,7 @@
 import vllm.envs as envs
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm import _custom_ops as ops
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
     vllm_is_batch_invariant,
@@ -55,8 +56,6 @@
 from vllm.utils.deep_gemm import is_deep_gemm_e8m0_used
 from vllm.utils.torch_utils import direct_register_custom_op, is_torch_equal_or_newer
 
-from .rocm_aiter_fused_moe import is_rocm_aiter_moe_enabled
-
 logger = init_logger(__name__)
 
 
@@ -1089,11 +1088,11 @@ def vllm_topk_softmax(
     return topk_weights, topk_indices
 
 
-def dispatch_topk_func() -> Callable[..., tuple[torch.Tensor, ...]]:
-    if is_rocm_aiter_moe_enabled():
-        from .rocm_aiter_fused_moe import rocm_aiter_topk_softmax
-
-        return rocm_aiter_topk_softmax
+def dispatch_topk_func(
+    use_rocm_aiter: bool = False,
+) -> Callable[..., tuple[torch.Tensor, ...]]:
+    if use_rocm_aiter:
+        return rocm_aiter_ops.topk_softmax
     return vllm_topk_softmax
 
 
@@ -1121,7 +1120,7 @@ def fused_topk(
         M, topk, dtype=torch.int32, device=hidden_states.device
     )
 
-    topk_func = dispatch_topk_func()
+    topk_func = dispatch_topk_func(use_rocm_aiter=rocm_aiter_ops.is_fused_moe_enabled())
     topk_weights, topk_ids = topk_func(
         topk_weights, topk_ids, token_expert_indices, gating_output, renormalize
     )
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index e69ead074c50..45b0f50a7997 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -13,6 +13,7 @@
 from torch.nn.parameter import UninitializedParameter
 
 import vllm.envs as envs
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.config import VllmConfig, get_current_vllm_config
 from vllm.config.parallel import ExpertPlacementStrategy
 from vllm.distributed import (
@@ -41,8 +42,6 @@
 )
 from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
     init_aiter_topK_meta_data,
-    is_rocm_aiter_fusion_shared_expert_enabled,
-    is_rocm_aiter_moe_enabled,
 )
 from vllm.model_executor.layers.fused_moe.routing_simulator import RoutingSimulator
 from vllm.model_executor.layers.quantization.base_config import (
@@ -92,13 +91,11 @@ def _eplb_map_to_physical_and_record(
         return topk_ids
 
     eplb_map_to_physical_and_record = _eplb_map_to_physical_and_record
+from vllm.model_executor.layers.fused_moe.fused_moe import grouped_topk
+from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (  # noqa: E501
+    rocm_aiter_grouped_topk,
+)
 
-if is_rocm_aiter_moe_enabled():
-    from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (  # noqa: E501
-        rocm_aiter_grouped_topk as grouped_topk_aiter,
-    )
-else:
-    from vllm.model_executor.layers.fused_moe.fused_moe import grouped_topk
 if current_platform.is_tpu():
     from .moe_pallas import fused_moe as fused_moe_pallas
 else:
@@ -463,7 +460,8 @@ class UnquantizedFusedMoEMethod(FusedMoEMethodBase, CustomOp):
 
     def __init__(self, moe: FusedMoEConfig):
         super().__init__(moe)
-        self.rocm_aiter_moe_enabled = is_rocm_aiter_moe_enabled()
+
+        self.rocm_aiter_moe_enabled = rocm_aiter_ops.is_fused_moe_enabled()
         if self.rocm_aiter_moe_enabled:
             from .rocm_aiter_fused_moe import rocm_aiter_fused_experts
 
@@ -620,13 +618,9 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # Padding the weight for better performance on ROCm
         layer.w13_weight.data = self._maybe_pad_weight(layer.w13_weight.data)
         layer.w2_weight.data = self._maybe_pad_weight(layer.w2_weight.data)
-        # Lazy import to avoid importing triton.
-        from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-            shuffle_weights,
-        )
 
         if self.rocm_aiter_moe_enabled:
-            shuffled_w13, shuffled_w2 = shuffle_weights(
+            shuffled_w13, shuffled_w2 = rocm_aiter_ops.shuffle_weights(
                 layer.w13_weight.data, layer.w2_weight.data
             )
 
@@ -1002,6 +996,7 @@ def determine_expert_map(
     global_num_experts: int,
     expert_placement_strategy: ExpertPlacementStrategy = "linear",
     num_fused_shared_experts: int = 0,
+    return_expert_mask: bool = False,
 ) -> tuple[int, torch.Tensor | None, torch.Tensor | None]:
     """
     Calculates how many experts should be assigned to each rank for EP and
@@ -1064,7 +1059,7 @@ def determine_expert_map(
         )
 
     expert_mask = None
-    if is_rocm_aiter_moe_enabled():
+    if return_expert_mask:
         expert_mask = torch.ones(
             (global_num_experts + num_fused_shared_experts + 1,), dtype=torch.int32
         )
@@ -1292,14 +1287,18 @@ def __init__(
         self.logical_replica_count: torch.Tensor | None = None
 
         # ROCm aiter shared experts fusion
+        self.rocm_aiter_fmoe_enabled = rocm_aiter_ops.is_fused_moe_enabled()
+        self.aiter_fmoe_shared_expert_enabled = (
+            rocm_aiter_ops.is_fusion_moe_shared_experts_enabled()
+        )
+
         self.num_fused_shared_experts = (
             n_shared_experts
-            if n_shared_experts is not None
-            and is_rocm_aiter_fusion_shared_expert_enabled()
+            if n_shared_experts is not None and self.aiter_fmoe_shared_expert_enabled
             else 0
         )
         if (
-            not is_rocm_aiter_fusion_shared_expert_enabled()
+            not self.aiter_fmoe_shared_expert_enabled
             and self.num_fused_shared_experts != 0
         ):
             raise ValueError(
@@ -1346,6 +1345,7 @@ def __init__(
                 global_num_experts=self.global_num_experts,
                 expert_placement_strategy=expert_placement_strategy,
                 num_fused_shared_experts=self.num_fused_shared_experts,
+                return_expert_mask=self.rocm_aiter_fmoe_enabled,
             )
             self.local_num_experts = local_num_experts
             self.register_buffer("expert_map", expert_map)
@@ -1570,13 +1570,16 @@ def update_expert_map(self):
                 ep_rank=self.ep_rank,
                 global_num_experts=self.global_num_experts,
                 num_fused_shared_experts=self.num_fused_shared_experts,
+                return_expert_mask=self.rocm_aiter_fmoe_enabled,
             )
             self.local_num_experts = local_num_experts
             self.register_buffer("expert_map", expert_map)
             self.register_buffer("expert_mask", expert_mask)
-            self._init_aiter_shared_experts_topK_buffer(
-                vllm_config=get_current_vllm_config(), dp_size=get_dp_group().world_size
-            )
+            if self.aiter_fmoe_shared_expert_enabled:
+                self._init_aiter_shared_experts_topK_buffer(
+                    vllm_config=get_current_vllm_config(),
+                    dp_size=get_dp_group().world_size,
+                )
 
     def _load_per_tensor_weight_scale(
         self,
@@ -1753,20 +1756,19 @@ def _map_global_expert_id_to_local_expert_id(self, expert_id: int) -> int:
     def _init_aiter_shared_experts_topK_buffer(
         self, vllm_config: VllmConfig, dp_size: int
     ):
-        if is_rocm_aiter_fusion_shared_expert_enabled():
-            if self.num_fused_shared_experts > 0:
-                init_aiter_topK_meta_data(
-                    n_routed_experts=self.global_num_experts,
-                    n_shared_experts=self.num_fused_shared_experts,
-                    top_k=self.top_k,
-                    tp_rank=self.ep_rank if self.use_ep else self.tp_rank,
-                    tp_size=self.ep_size if self.use_ep else self.tp_size,
-                    shared_experts_score=1.0,
-                    max_num_tokens=vllm_config.scheduler_config.max_num_batched_tokens
-                    * dp_size,
-                    is_EP=self.use_ep,
-                )
-            self.local_num_experts += self.num_fused_shared_experts
+        if self.num_fused_shared_experts > 0:
+            init_aiter_topK_meta_data(
+                n_routed_experts=self.global_num_experts,
+                n_shared_experts=self.num_fused_shared_experts,
+                top_k=self.top_k,
+                tp_rank=self.ep_rank if self.use_ep else self.tp_rank,
+                tp_size=self.ep_size if self.use_ep else self.tp_size,
+                shared_experts_score=1.0,
+                max_num_tokens=vllm_config.scheduler_config.max_num_batched_tokens
+                * dp_size,
+                is_EP=self.use_ep,
+            )
+        self.local_num_experts += self.num_fused_shared_experts
 
     @overload
     def weight_loader(
@@ -2208,15 +2210,16 @@ def select_experts(
         elif use_grouped_topk:
             assert topk_group is not None
             assert num_expert_group is not None
-            if is_rocm_aiter_moe_enabled():
-                if not is_rocm_aiter_fusion_shared_expert_enabled():
+            if rocm_aiter_ops.is_fused_moe_enabled():
+                if not rocm_aiter_ops.is_fusion_moe_shared_experts_enabled():
                     assert num_fused_shared_experts == 0
                 grouped_topk_impl = partial(
-                    grouped_topk_aiter,
+                    rocm_aiter_grouped_topk,
                     num_fused_shared_experts=num_fused_shared_experts,
                 )
             else:
                 grouped_topk_impl = grouped_topk
+
             topk_weights, topk_ids = grouped_topk_impl(
                 hidden_states=hidden_states,
                 gating_output=router_logits,
@@ -2448,7 +2451,7 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
                 use_grouped_topk=self.use_grouped_topk,
                 global_num_experts=self.global_num_experts,
                 expert_map=self.expert_map
-                if not is_rocm_aiter_moe_enabled()
+                if not self.rocm_aiter_fmoe_enabled
                 else self.expert_mask,
                 topk_group=self.topk_group,
                 num_expert_group=self.num_expert_group,
@@ -2612,7 +2615,7 @@ def forward_impl(
                 use_grouped_topk=self.use_grouped_topk,
                 global_num_experts=self.global_num_experts,
                 expert_map=self.expert_map
-                if not is_rocm_aiter_moe_enabled()
+                if not self.rocm_aiter_fmoe_enabled
                 else self.expert_mask,
                 topk_group=self.topk_group,
                 num_expert_group=self.num_expert_group,
diff --git a/vllm/model_executor/layers/fused_moe/rocm_aiter_fused_moe.py b/vllm/model_executor/layers/fused_moe/rocm_aiter_fused_moe.py
index e18514ad43f6..8f05828d74f5 100644
--- a/vllm/model_executor/layers/fused_moe/rocm_aiter_fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/rocm_aiter_fused_moe.py
@@ -1,17 +1,15 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from enum import IntEnum
-from functools import cache, lru_cache
+from functools import lru_cache
 
 import torch
 
-from vllm import envs
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.model_executor.layers.fused_moe.config import (
     FUSED_MOE_UNQUANTIZED_CONFIG,
     FusedMoEQuantConfig,
 )
-from vllm.platforms import current_platform
-from vllm.utils.torch_utils import direct_register_custom_op
 
 
 class QuantMethod(IntEnum):
@@ -37,27 +35,6 @@ class ActivationMethod(IntEnum):
     GELU = 1
 
 
-@cache
-def is_rocm_aiter_moe_enabled() -> bool:
-    return (
-        current_platform.is_rocm()
-        and envs.VLLM_ROCM_USE_AITER_MOE
-        and envs.VLLM_ROCM_USE_AITER
-    )
-
-
-@cache
-def use_mxfp4_aiter_moe() -> bool:
-    return current_platform.is_rocm() and envs.VLLM_ROCM_USE_AITER
-
-
-@cache
-def is_rocm_aiter_fusion_shared_expert_enabled() -> bool:
-    return (
-        envs.VLLM_ROCM_USE_AITER_FUSION_SHARED_EXPERTS and is_rocm_aiter_moe_enabled()
-    )
-
-
 aiter_topK_meta_data = None
 
 
@@ -114,250 +91,6 @@ def init_aiter_topK_meta_data(
     aiter_topK_meta_data = (total_topk_weights, total_topk_ids)
 
 
-def rocm_aiter_asm_moe_tkw1_impl(
-    hidden_states: torch.Tensor,
-    w1: torch.Tensor,
-    w2: torch.Tensor,
-    topk_weights: torch.Tensor,
-    topk_ids: torch.Tensor,
-    fc1_scale: torch.Tensor | None = None,
-    fc2_scale: torch.Tensor | None = None,
-    fc1_smooth_scale: torch.Tensor | None = None,
-    fc2_smooth_scale: torch.Tensor | None = None,
-    a16: bool = False,
-    per_tensor_quant_scale: torch.Tensor | None = None,
-    expert_mask: torch.Tensor | None = None,
-    activation_method: int = ActivationMethod.SILU.value,
-) -> torch.Tensor:
-    from aiter import ActivationType
-    from aiter.fused_moe_bf16_asm import asm_moe_tkw1
-
-    activation = ActivationType(activation_method)
-
-    return asm_moe_tkw1(
-        hidden_states,
-        w1,
-        w2,
-        topk_weights,
-        topk_ids,
-        fc1_scale=fc1_scale,
-        fc2_scale=fc2_scale,
-        fc1_smooth_scale=fc1_smooth_scale,
-        fc2_smooth_scale=fc2_smooth_scale,
-        a16=a16,
-        per_tensor_quant_scale=per_tensor_quant_scale,
-        expert_mask=expert_mask,
-        activation=activation,
-    )
-
-
-def rocm_aiter_asm_moe_tkw1_fake(
-    hidden_states: torch.Tensor,
-    w1: torch.Tensor,
-    w2: torch.Tensor,
-    topk_weights: torch.Tensor,
-    topk_ids: torch.Tensor,
-    fc1_scale: torch.Tensor | None = None,
-    fc2_scale: torch.Tensor | None = None,
-    fc1_smooth_scale: torch.Tensor | None = None,
-    fc2_smooth_scale: torch.Tensor | None = None,
-    a16: bool = False,
-    per_tensor_quant_scale: torch.Tensor | None = None,
-    expert_mask: torch.Tensor | None = None,
-    activation_method: int = ActivationMethod.SILU.value,
-) -> torch.Tensor:
-    return torch.empty_like(hidden_states)
-
-
-def rocm_aiter_topk_softmax_impl(
-    topk_weights: torch.Tensor,
-    topk_indices: torch.Tensor,
-    token_expert_indices: torch.Tensor,
-    gating_output: torch.Tensor,
-    renormalize: bool,
-) -> None:
-    from aiter import topk_softmax
-
-    topk_softmax(
-        topk_weights, topk_indices, token_expert_indices, gating_output, renormalize
-    )
-
-
-def rocm_aiter_topk_softmax_fake(
-    topk_weights: torch.Tensor,
-    topk_indices: torch.Tensor,
-    token_expert_indices: torch.Tensor,
-    gating_output: torch.Tensor,
-    renormalize: bool,
-) -> None:
-    pass
-
-
-def rocm_aiter_biased_grouped_topk_impl(
-    gating_output: torch.Tensor,
-    correction_bias: torch.Tensor,
-    topk_weights: torch.Tensor,
-    topk_ids: torch.Tensor,
-    num_expert_group: int,
-    topk_group: int,
-    need_renorm: bool,
-    routed_scaling_factor: float = 1.0,  # mul to topk_weights
-) -> None:
-    from aiter import biased_grouped_topk
-
-    biased_grouped_topk(
-        gating_output,
-        correction_bias,
-        topk_weights,
-        topk_ids,
-        num_expert_group,
-        topk_group,
-        need_renorm,
-        routed_scaling_factor,
-    )
-
-
-def rocm_aiter_biased_grouped_topk_fake(
-    gating_output: torch.Tensor,
-    correction_bias: torch.Tensor,
-    topk_weights: torch.Tensor,
-    topk_ids: torch.Tensor,
-    num_expert_group: int,
-    topk_group: int,
-    need_renorm: bool,
-    routed_scaling_factor: float = 1.0,  # mul to topk_weights
-) -> None:
-    pass
-
-
-def rocm_aiter_grouped_topk_impl(
-    gating_output: torch.Tensor,
-    topk_weights: torch.Tensor,
-    topk_ids: torch.Tensor,
-    num_expert_group: int,
-    topk_group: int,
-    need_renorm: bool,
-    scoring_func: str = "softmax",
-    routed_scaling_factor: float = 1.0,  # mul to topk_weights
-) -> None:
-    from aiter import grouped_topk
-
-    grouped_topk(
-        gating_output,
-        topk_weights,
-        topk_ids,
-        num_expert_group,
-        topk_group,
-        need_renorm,
-        scoring_func,
-        routed_scaling_factor,
-    )
-
-
-def rocm_aiter_grouped_topk_fake(
-    gating_output: torch.Tensor,
-    topk_weights: torch.Tensor,
-    topk_ids: torch.Tensor,
-    num_expert_group: int,
-    topk_group: int,
-    need_renorm: bool,
-    scoring_func: str = "softmax",
-    routed_scaling_factor: float = 1.0,  # mul to topk_weights
-) -> None:
-    pass
-
-
-def rocm_aiter_fused_moe_impl(
-    hidden_states: torch.Tensor,
-    w1: torch.Tensor,
-    w2: torch.Tensor,
-    topk_weight: torch.Tensor,
-    topk_ids: torch.Tensor,
-    expert_mask: torch.Tensor | None = None,
-    activation_method: int = ActivationMethod.SILU.value,
-    quant_method: int = QuantMethod.NO.value,
-    doweight_stage1: bool = False,
-    w1_scale: torch.Tensor | None = None,
-    w2_scale: torch.Tensor | None = None,
-    a1_scale: torch.Tensor | None = None,
-    a2_scale: torch.Tensor | None = None,
-) -> torch.Tensor:
-    from aiter import ActivationType, QuantType
-    from aiter.fused_moe import fused_moe
-
-    activation = ActivationType(activation_method)
-    quant_type = QuantType(quant_method)
-
-    return fused_moe(
-        hidden_states,
-        w1,
-        w2,
-        topk_weight,
-        topk_ids,
-        expert_mask,
-        activation,
-        quant_type,
-        doweight_stage1,
-        w1_scale,
-        w2_scale,
-        a1_scale,
-        a2_scale,
-    )
-
-
-def rocm_aiter_fused_moe_fake(
-    hidden_states: torch.Tensor,
-    w1: torch.Tensor,
-    w2: torch.Tensor,
-    topk_weight: torch.Tensor,
-    topk_ids: torch.Tensor,
-    expert_mask: torch.Tensor | None = None,
-    activation_method: int = ActivationMethod.SILU.value,
-    quant_method: int = QuantMethod.NO.value,
-    doweight_stage1: bool = False,
-    w1_scale: torch.Tensor | None = None,
-    w2_scale: torch.Tensor | None = None,
-    a1_scale: torch.Tensor | None = None,
-    a2_scale: torch.Tensor | None = None,
-) -> torch.Tensor:
-    return torch.empty_like(hidden_states)
-
-
-if current_platform.is_rocm():
-    direct_register_custom_op(
-        op_name="rocm_aiter_asm_moe_tkw1",
-        op_func=rocm_aiter_asm_moe_tkw1_impl,
-        fake_impl=rocm_aiter_asm_moe_tkw1_fake,
-    )
-
-    direct_register_custom_op(
-        op_name="rocm_aiter_fused_moe",
-        op_func=rocm_aiter_fused_moe_impl,
-        fake_impl=rocm_aiter_fused_moe_fake,
-    )
-
-    direct_register_custom_op(
-        op_name="rocm_aiter_topk_softmax",
-        op_func=rocm_aiter_topk_softmax_impl,
-        mutates_args=["topk_weights", "topk_indices", "token_expert_indices"],
-        fake_impl=rocm_aiter_topk_softmax_fake,
-    )
-
-    direct_register_custom_op(
-        op_name="rocm_aiter_biased_grouped_topk",
-        op_func=rocm_aiter_biased_grouped_topk_impl,
-        mutates_args=["topk_weights", "topk_ids"],
-        fake_impl=rocm_aiter_biased_grouped_topk_fake,
-    )
-
-    direct_register_custom_op(
-        op_name="rocm_aiter_grouped_topk",
-        op_func=rocm_aiter_grouped_topk_impl,
-        mutates_args=["topk_weights", "topk_ids"],
-        fake_impl=rocm_aiter_grouped_topk_fake,
-    )
-
-
 def rocm_aiter_grouped_topk(
     hidden_states: torch.Tensor,
     gating_output: torch.Tensor,
@@ -372,7 +105,10 @@ def rocm_aiter_grouped_topk(
 ) -> tuple[torch.Tensor, torch.Tensor]:
     token = hidden_states.shape[0]
     device = hidden_states.device
-    if is_rocm_aiter_fusion_shared_expert_enabled() and num_fused_shared_experts > 0:
+    if (
+        rocm_aiter_ops.is_fusion_moe_shared_experts_enabled()
+        and num_fused_shared_experts > 0
+    ):
         assert aiter_topK_meta_data is not None, (
             "AITER topK meta data is not initialized. "
             "Please ensure that init_aiter_topK_meta_data "
@@ -397,7 +133,7 @@ def rocm_aiter_grouped_topk(
         topk_weights = torch.empty((token, topk), dtype=torch.float32, device=device)
 
     if e_score_correction_bias is not None:
-        torch.ops.vllm.rocm_aiter_biased_grouped_topk(
+        rocm_aiter_ops.biased_grouped_topk(
             gating_output,
             e_score_correction_bias.to(gating_output.dtype),
             topk_weights,
@@ -409,7 +145,7 @@ def rocm_aiter_grouped_topk(
         )
     else:
         assert scoring_func == "softmax" or scoring_func == "sigmoid"
-        torch.ops.vllm.rocm_aiter_grouped_topk(
+        rocm_aiter_ops.grouped_topk(
             gating_output,
             topk_weights,
             topk_ids,
@@ -420,7 +156,10 @@ def rocm_aiter_grouped_topk(
             routed_scaling_factor=routed_scaling_factor,
         )
 
-    if is_rocm_aiter_fusion_shared_expert_enabled() and num_fused_shared_experts > 0:
+    if (
+        rocm_aiter_ops.is_fusion_moe_shared_experts_enabled()
+        and num_fused_shared_experts > 0
+    ):
         return total_topk_weights, total_topk_ids
     return topk_weights, topk_ids
 
@@ -464,7 +203,7 @@ def rocm_aiter_fused_experts(
             "Only support topk=1 when `apply_router_weight_on_input` is True"
         )
 
-        return torch.ops.vllm.rocm_aiter_asm_moe_tkw1(
+        return rocm_aiter_ops.asm_moe_tkw1(
             hidden_states,
             w1,
             w2,
@@ -482,7 +221,9 @@ def rocm_aiter_fused_experts(
 
     else:
         quant_method = QuantMethod.NO.value
-
+        # quark moe for mxfp4 w_dtype
+        if quant_config.use_mxfp4_w4a16:
+            quant_method = QuantMethod.BLOCK_1X32.value
         # w8a8 block-scaled
         if quant_config.block_shape is not None and quant_config.use_fp8_w8a8:
             assert not apply_router_weight_on_input, (
@@ -507,7 +248,7 @@ def rocm_aiter_fused_experts(
                 "Only support topk=1 when `apply_router_weight_on_input` is True"
             )
 
-        return torch.ops.vllm.rocm_aiter_fused_moe(
+        return rocm_aiter_ops.fused_moe(
             hidden_states,
             w1,
             w2,
@@ -522,39 +263,3 @@ def rocm_aiter_fused_experts(
             a2_scale=quant_config.a2_scale,
             doweight_stage1=apply_router_weight_on_input,
         )
-
-
-def rocm_aiter_topk_softmax(
-    topk_weights: torch.Tensor,
-    topk_indices: torch.Tensor,
-    token_expert_indices: torch.Tensor,
-    gating_output: torch.Tensor,
-    renormalize: bool,
-) -> tuple[torch.Tensor, ...]:
-    torch.ops.vllm.rocm_aiter_topk_softmax(
-        topk_weights, topk_indices, token_expert_indices, gating_output, renormalize
-    )
-    return topk_weights, topk_indices
-
-
-def shuffle_weights(
-    *tensors: torch.Tensor, layout: tuple[int, int] = (16, 16)
-) -> tuple[torch.Tensor, ...]:
-    """
-    Applies shuffle_weight function from AITER to each
-    input tensor and returns them.
-
-    Rearranges (shuffles) the input tensor/s
-    into a specified block layout for optimized computation.
-
-    Args:
-        *tensors: Variable number of torch.Tensor objects.
-        layout: A pair of integers specifying the block sizes used to divide
-            the tensors during shuffling. Default is (16, 16).
-
-    Returns:
-    A Tuple of shuffled tensors.
-    """
-    from aiter.ops.shuffle import shuffle_weight
-
-    return tuple(shuffle_weight(tensor, layout=layout) for tensor in tensors)
diff --git a/vllm/model_executor/layers/layernorm.py b/vllm/model_executor/layers/layernorm.py
index a883ac81f41e..8cc374ac9155 100644
--- a/vllm/model_executor/layers/layernorm.py
+++ b/vllm/model_executor/layers/layernorm.py
@@ -6,18 +6,13 @@
 import torch.nn as nn
 import torch.nn.functional as F
 
-import vllm.envs as envs
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.layers.batch_invariant import (
     rms_norm_batch_invariant,
     vllm_is_batch_invariant,
 )
 from vllm.platforms import current_platform
-from vllm.utils.torch_utils import direct_register_custom_op
-
-
-def is_rocm_aiter_rmsnorm_enabled() -> bool:
-    return envs.VLLM_ROCM_USE_AITER_RMSNORM and envs.VLLM_ROCM_USE_AITER
 
 
 def rms_norm(
@@ -58,80 +53,34 @@ def fused_add_rms_norm(
     return x, residual
 
 
-def rocm_aiter_rms_norm_impl(
-    x: torch.Tensor, weight: torch.Tensor, variance_epsilon: float
+def poly_norm(
+    x: torch.Tensor, weight: torch.Tensor, bias: torch.Tensor, variance_epsilon: float
 ) -> torch.Tensor:
-    import aiter as rocm_aiter
-
-    if x.dim() > 2:
-        x_original_shape = x.shape
-        x = x.reshape(-1, x_original_shape[-1])
-        x = rocm_aiter.rms_norm(x, weight, variance_epsilon)
-        return x.reshape(x_original_shape)
-
-    return rocm_aiter.rms_norm(x, weight, variance_epsilon)
-
+    from vllm import _custom_ops as ops
 
-def rocm_aiter_rmsnorm2d_fwd_with_add_impl(
-    x: torch.Tensor,
-    residual: torch.Tensor,
-    weight: torch.Tensor,
-    variance_epsilon: float,
-) -> tuple[torch.Tensor, torch.Tensor]:
-    import aiter as rocm_aiter
-
-    residual_out = torch.empty_like(residual)
-    output = torch.empty_like(x)
-    rocm_aiter.rmsnorm2d_fwd_with_add(
-        output,  # output
-        x,  # input
-        residual,  # residual input
-        residual_out,  # residual output
+    out = torch.empty_like(x)
+    ops.poly_norm(
+        out,
+        x,
         weight,
+        bias,
         variance_epsilon,
     )
-    return output, residual_out
-
-
-def rocm_aiter_rms_norm_fake(
-    x: torch.Tensor, weight: torch.Tensor, variance_epsilon: float
-) -> torch.Tensor:
-    return torch.empty_like(x)
-
-
-def rocm_aiter_rmsnorm2d_fwd_with_add_fake(
-    x: torch.Tensor,
-    residual: torch.Tensor,
-    weight: torch.Tensor,
-    variance_epsilon: float,
-) -> tuple[torch.Tensor, torch.Tensor]:
-    return torch.empty_like(x), torch.empty_like(residual)
-
-
-if current_platform.is_rocm():
-    direct_register_custom_op(
-        op_name="rocm_aiter_rms_norm",
-        op_func=rocm_aiter_rms_norm_impl,
-        fake_impl=rocm_aiter_rms_norm_fake,
-    )
-
-    direct_register_custom_op(
-        op_name="rocm_aiter_rmsnorm2d_fwd_with_add",
-        op_func=rocm_aiter_rmsnorm2d_fwd_with_add_impl,
-        fake_impl=rocm_aiter_rmsnorm2d_fwd_with_add_fake,
-    )
+    return out
 
 
-def dispatch_rocm_rmsnorm_func(with_fused_add: bool, dtype: torch.dtype):
-    use_aiter = is_rocm_aiter_rmsnorm_enabled() and dtype in [
+def dispatch_rocm_rmsnorm_func(
+    with_fused_add: bool, dtype: torch.dtype, use_aiter: bool = False
+):
+    use_aiter = use_aiter and dtype in [
         torch.float16,
         torch.bfloat16,
     ]
 
     if use_aiter and with_fused_add:
-        return torch.ops.vllm.rocm_aiter_rmsnorm2d_fwd_with_add
+        return rocm_aiter_ops.rms_norm2d_with_add
     if use_aiter:
-        return torch.ops.vllm.rocm_aiter_rms_norm
+        return rocm_aiter_ops.rms_norm
 
     # fall back to CUDA implementation
     if with_fused_add:
@@ -169,11 +118,14 @@ def __init__(
             self.weight = nn.Parameter(self.weight)
 
         if current_platform.is_rocm():
+            aiter_rmsnorm_enabled = rocm_aiter_ops.is_rmsnorm_enabled()
             self.rocm_norm_func = dispatch_rocm_rmsnorm_func(
-                with_fused_add=False, dtype=weight_dtype
+                with_fused_add=False,
+                dtype=weight_dtype,
+                use_aiter=aiter_rmsnorm_enabled,
             )
             self.rocm_norm_func_with_add = dispatch_rocm_rmsnorm_func(
-                with_fused_add=True, dtype=weight_dtype
+                with_fused_add=True, dtype=weight_dtype, use_aiter=aiter_rmsnorm_enabled
             )
 
     @staticmethod
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
index d95d49eddfe3..d32ae6674ee6 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
@@ -12,6 +12,7 @@
 import vllm.envs as envs
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm import _custom_ops as ops
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import (
@@ -582,11 +583,8 @@ def __init__(
         # Disable marlin for rocm
         if current_platform.is_rocm():
             self.use_marlin = False
-        from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-            is_rocm_aiter_moe_enabled,
-        )
 
-        self.rocm_aiter_moe_enabled = is_rocm_aiter_moe_enabled()
+        self.rocm_aiter_moe_enabled = rocm_aiter_ops.is_fused_moe_enabled()
 
         # cutlass path
         self.is_fp8_w8a8_sm100 = quant_config._is_fp8_w8a8_sm100(
@@ -829,12 +827,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
 
         # Property to determine if AITER is used
         if self.rocm_aiter_moe_enabled:
-            from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (  # noqa E501
-                shuffle_weights,
-            )
-
             # reshaping weights is required for aiter moe kernel.
-            shuffled_w13, shuffled_w2 = shuffle_weights(
+            shuffled_w13, shuffled_w2 = rocm_aiter_ops.shuffle_weights(
                 layer.w13_weight.data, layer.w2_weight.data
             )
 
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
index ee431c9148b8..6da136cbc8f6 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
@@ -7,12 +7,12 @@
 from compressed_tensors.quantization import QuantizationArgs, QuantizationStrategy
 from torch.nn import Parameter
 
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
     CompressedTensorsScheme,
 )
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
     W8A8BlockFp8LinearOp,
-    check_aiter_fp8_linear_support,
     create_fp8_input_scale,
     create_fp8_scale_parameter,
     create_fp8_weight_parameter,
@@ -61,7 +61,7 @@ def __init__(self, weight_quant: QuantizationArgs, is_static_input_scheme: bool)
             )
 
         self.cutlass_block_fp8_supported = cutlass_block_fp8_supported()
-        self.use_aiter_and_is_supported = check_aiter_fp8_linear_support()
+        self.use_aiter_and_is_supported = rocm_aiter_ops.is_linear_fp8_enaled()
 
         if self.weight_block_size is not None:
             assert not self.is_static_input_scheme
diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index ce40645782e5..e4e1cbff712f 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -12,6 +12,7 @@
 import vllm.envs as envs
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm import _custom_ops as ops
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
@@ -56,7 +57,6 @@
 )
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
     W8A8BlockFp8LinearOp,
-    check_aiter_fp8_linear_support,
     create_fp8_input_scale,
     create_fp8_scale_parameter,
     create_fp8_weight_parameter,
@@ -369,7 +369,7 @@ def __init__(self, quant_config: Fp8Config):
         if vllm_is_batch_invariant():
             self.use_marlin = False
 
-        self.use_aiter_and_is_supported = check_aiter_fp8_linear_support()
+        self.use_aiter_and_is_supported = rocm_aiter_ops.is_linear_fp8_enaled()
         self.use_deep_gemm = is_deep_gemm_supported()
 
         self.weight_block_size = self.quant_config.weight_block_size
@@ -869,12 +869,8 @@ def create_weights(
 
     def process_weights_after_loading(self, layer: Module) -> None:
         # Lazy import to avoid importing triton too early.
-        from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-            is_rocm_aiter_moe_enabled,
-            shuffle_weights,
-        )
 
-        self.rocm_aiter_moe_enabled = is_rocm_aiter_moe_enabled()
+        self.rocm_aiter_moe_enabled = rocm_aiter_ops.is_fused_moe_enabled()
 
         # TODO (rob): refactor block quant into separate class.
         if self.block_quant:
@@ -916,7 +912,7 @@ def process_weights_after_loading(self, layer: Module) -> None:
             )
             if self.rocm_aiter_moe_enabled:
                 # reshaping weights is required for aiter moe kernel.
-                shuffled_w13, shuffled_w2 = shuffle_weights(
+                shuffled_w13, shuffled_w2 = rocm_aiter_ops.shuffle_weights(
                     layer.w13_weight.data, layer.w2_weight.data
                 )
 
@@ -962,7 +958,7 @@ def process_weights_after_loading(self, layer: Module) -> None:
             layer.w2_weight = torch.nn.Parameter(w2_weight, requires_grad=False)
             if self.rocm_aiter_moe_enabled:
                 # reshaping weights is required for aiter moe kernel.
-                shuffled_w13, shuffled_w2 = shuffle_weights(
+                shuffled_w13, shuffled_w2 = rocm_aiter_ops.shuffle_weights(
                     layer.w13_weight, layer.w2_weight
                 )
 
@@ -1042,7 +1038,7 @@ def process_weights_after_loading(self, layer: Module) -> None:
                     start += shard_size
 
             if self.rocm_aiter_moe_enabled:
-                shuffled_w13, shuffled_w2 = shuffle_weights(
+                shuffled_w13, shuffled_w2 = rocm_aiter_ops.shuffle_weights(
                     layer.w13_weight, layer.w2_weight
                 )
 
diff --git a/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py b/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py
index a19396a162bc..f5cd91469b78 100644
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py
@@ -4,54 +4,14 @@
 
 import torch
 
-import vllm.envs as envs
 from vllm import _custom_ops as ops
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.platforms import current_platform
-from vllm.utils.torch_utils import direct_register_custom_op
 
 from .cutlass import CutlassScaledMMLinearKernel
 from .ScaledMMLinearKernel import ScaledMMLinearLayerConfig
 
 
-def rocm_aiter_gemm_w8a8_impl(
-    A: torch.Tensor,
-    B: torch.Tensor,
-    As: torch.Tensor,
-    Bs: torch.Tensor,
-    bias: torch.Tensor | None = None,
-    output_dtype: torch.dtype = torch.float16,
-) -> torch.Tensor:
-    from aiter import gemm_a8w8_CK
-
-    # gemm_a8w8_CK(a, b, scale_a, scale_b, bias) expects
-    # a to be [M, K]
-    # b to be [N, K]
-    # CutlassScaledMMLinearKernel prepare weight `w_q` in [K, N] format
-    return gemm_a8w8_CK(A, B, As, Bs, bias, output_dtype)
-
-
-def rocm_aiter_gemm_w8a8_fake(
-    A: torch.Tensor,
-    B: torch.Tensor,
-    As: torch.Tensor,
-    Bs: torch.Tensor,
-    bias: torch.Tensor | None = None,
-    output_dtype: torch.dtype = torch.float16,
-) -> torch.Tensor:
-    m = A.shape[0]
-    n = B.shape[0]
-    Y = torch.empty(m, n, dtype=output_dtype, device=A.device)
-    return Y
-
-
-if current_platform.is_rocm():
-    direct_register_custom_op(
-        op_name="rocm_aiter_gemm_w8a8",
-        op_func=rocm_aiter_gemm_w8a8_impl,
-        fake_impl=rocm_aiter_gemm_w8a8_fake,
-    )
-
-
 class AiterScaledMMLinearKernel(CutlassScaledMMLinearKernel):
     @classmethod
     def get_min_capability(cls) -> int:
@@ -75,7 +35,7 @@ def can_implement(cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, str | None]:
                 + "installed on ROCm.",
             )
         # Check if rocm_aiter_gemm_w8a8_scaled_mm is enabled
-        if not (envs.VLLM_ROCM_USE_AITER_LINEAR and envs.VLLM_ROCM_USE_AITER):
+        if not (rocm_aiter_ops.is_linear_enabled()):
             return (
                 False,
                 "AiterScaledMMLinearKernel is disabled. "
@@ -157,6 +117,4 @@ def apply_weights(
         # a to be [M, K]
         # b to be [N, K]
         # CutlassScaledMMLinearKernel prepare weight `w_q` in [K, N] format
-        return torch.ops.vllm.rocm_aiter_gemm_w8a8(
-            x_q, w_q.t(), x_s, w_s, bias, out_dtype
-        )
+        return rocm_aiter_ops.gemm_w8a8(x_q, w_q.t(), x_s, w_s, bias, out_dtype)
diff --git a/vllm/model_executor/layers/quantization/quark/quark_moe.py b/vllm/model_executor/layers/quantization/quark/quark_moe.py
index eca6b0cb1d8e..30772c3665b0 100644
--- a/vllm/model_executor/layers/quantization/quark/quark_moe.py
+++ b/vllm/model_executor/layers/quantization/quark/quark_moe.py
@@ -8,6 +8,7 @@
 
 import vllm.envs as envs
 from vllm import _custom_ops as ops
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import (
     FusedMoE,
@@ -21,10 +22,6 @@
     ocp_mx_moe_quant_config,
 )
 from vllm.model_executor.layers.fused_moe.fused_marlin_moe import fused_marlin_moe
-from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-    is_rocm_aiter_moe_enabled,
-    use_mxfp4_aiter_moe,
-)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp8 import (
     prepare_moe_fp8_layer_for_marlin,
 )
@@ -122,7 +119,7 @@ def __init__(
         if current_platform.is_rocm():
             self.use_marlin = False
 
-        self.rocm_aiter_moe_enabled = is_rocm_aiter_moe_enabled()
+        self.rocm_aiter_moe_enabled = rocm_aiter_ops.is_fused_moe_enabled()
 
     def create_weights(
         self,
@@ -309,12 +306,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                 )
         # Property to determine if AITER is used
         if self.rocm_aiter_moe_enabled:
-            from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (  # noqa E501
-                shuffle_weights,
-            )
-
             # reshaping weights is required for aiter moe kernel.
-            shuffled_w13, shuffled_w2 = shuffle_weights(
+            shuffled_w13, shuffled_w2 = rocm_aiter_ops.shuffle_weights(
                 layer.w13_weight.data, layer.w2_weight.data
             )
 
@@ -470,13 +463,15 @@ def __init__(
                 "not implemented. Please open an issue."
             )
 
+        self.use_rocm_aiter_moe = rocm_aiter_ops.is_fused_moe_enabled()
+
         self.emulate = not current_platform.supports_mx() or not (
-            use_mxfp4_aiter_moe() and self.ocp_mx_scheme == "w_mxfp4_a_mxfp4"
+            self.use_rocm_aiter_moe and self.ocp_mx_scheme == "w_mxfp4_a_mxfp4"
         )
         if self.emulate:
             logger.warning_once(
                 f"The current mode (supports_mx={current_platform.supports_mx()}, "
-                f"use_mxfp4_aiter_moe={use_mxfp4_aiter_moe()}, "
+                f"use_mxfp4_aiter_moe={self.use_rocm_aiter_moe}, "
                 f"ocp_mx_scheme={self.ocp_mx_scheme}) "
                 "does not support native MXFP4/MXFP6 "
                 "computation. Simulated weight dequantization and activation "
@@ -656,28 +651,18 @@ def apply(
         )
 
         if not self.emulate:
-            from aiter import ActivationType, QuantType
-            from aiter.fused_moe import fused_moe
-
-            aiter_acts = {
-                ActivationType.No.name.lower(): ActivationType.No,
-                ActivationType.Silu.name.lower(): ActivationType.Silu,
-                ActivationType.Gelu.name.lower(): ActivationType.Gelu,
-            }
-            assert activation in aiter_acts, (
-                f"Aiter CK fp4 MoE doesn't support activation {activation}"
-            )
-            out = fused_moe(
+            from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
+                rocm_aiter_fused_experts,
+            )
+
+            out = rocm_aiter_fused_experts(
                 x,
                 layer.w13_weight,
                 layer.w2_weight,
-                topk_weights,
-                topk_ids,
-                quant_type=QuantType.per_1x32,
-                w1_scale=layer.w13_weight_scale,
-                w2_scale=layer.w2_weight_scale,
-                activation=aiter_acts[activation],
-                doweight_stage1=False,
+                topk_weights=topk_weights,
+                topk_ids=topk_ids,
+                activation=activation,
+                quant_config=self.moe_quant_config,
             )
         else:
             from vllm.model_executor.layers.fused_moe import fused_experts
diff --git a/vllm/model_executor/layers/quantization/quark/schemes/quark_ocp_mx.py b/vllm/model_executor/layers/quantization/quark/schemes/quark_ocp_mx.py
index c25c522dea55..007e78e68d5c 100644
--- a/vllm/model_executor/layers/quantization/quark/schemes/quark_ocp_mx.py
+++ b/vllm/model_executor/layers/quantization/quark/schemes/quark_ocp_mx.py
@@ -31,6 +31,13 @@
 logger = init_logger(__name__)
 
 
+# TODO: move registration of custom op to aiter_ops.py
+# `from vllm._aiter_ops import rocm_aiter_ops`
+# use `rocm_aiter_ops.is_asm_fp4_gemm_dynamic_quant_enabled()`
+# for envs checks which does not require @cache anymore.
+# triton kernel is torch compile compatible.
+# does not require direct registeration.
+# use `rocm_aiter_ops.triton_fp4_gemm_dynamic_qaunt`.
 @cache
 def is_rocm_aiter_fp4_asm_gemm_enabled() -> bool:
     return (
diff --git a/vllm/model_executor/layers/quantization/utils/fp8_utils.py b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
index 7fecda2166ef..63726c07b7d1 100644
--- a/vllm/model_executor/layers/quantization/utils/fp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
@@ -12,6 +12,7 @@
 
 import vllm.envs as envs
 from vllm import _custom_ops as ops
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
@@ -68,78 +69,6 @@ def cutlass_scaled_mm(
     )
 
 
-def rocm_aiter_gemm_w8a8_blockscale_impl(
-    input_2d: torch.Tensor,
-    weight: torch.Tensor,
-    input_scale: torch.Tensor,
-    weight_scale: torch.Tensor,
-    group_size: int,
-    output_dtype: torch.dtype = torch.float16,
-) -> torch.Tensor:
-    def is_aiter_triton_kernel_tuned(n, k):
-        return (n, k) in [
-            (1024, 8192),
-            (2112, 7168),
-            (3072, 1536),
-            (32768, 8192),
-            (4096, 7168),
-            (4608, 7168),
-            (512, 7168),
-            (7168, 2048),
-            (7168, 256),
-            (8192, 1024),
-            (8192, 32768),
-        ]
-
-    n, k = weight.shape
-    if input_scale is not None:
-        q_input = input_2d
-    elif not current_platform.is_fp8_fnuz() and is_aiter_triton_kernel_tuned(n, k):
-        from aiter.ops.triton.gemm_a8w8_blockscale import gemm_a8w8_blockscale
-
-        # MI350 case uses triton kernel
-        q_input, input_scale = per_token_group_quant_fp8(
-            input_2d,
-            group_size,
-            column_major_scales=False,
-            use_ue8m0=False,
-        )
-    else:
-        # MI300 uses tuned AITER ASM/C++ kernel
-        import aiter as rocm_aiter
-        from aiter import gemm_a8w8_blockscale, get_hip_quant
-
-        aiter_per1x128_quant = get_hip_quant(rocm_aiter.QuantType.per_1x128)
-        q_input, input_scale = aiter_per1x128_quant(
-            input_2d.contiguous(), quant_dtype=rocm_aiter.dtypes.fp8
-        )
-
-    return gemm_a8w8_blockscale(
-        q_input, weight, input_scale, weight_scale, dtype=output_dtype
-    )
-
-
-def rocm_aiter_gemm_w8a8_blockscale_fake(
-    input_2d: torch.Tensor,
-    weight: torch.Tensor,
-    input_scale: torch.Tensor,
-    weight_scale: torch.Tensor,
-    group_size: int,
-    output_dtype: torch.dtype = torch.float16,
-) -> torch.Tensor:
-    m = input_2d.shape[0]
-    n = weight.shape[0]
-    return torch.empty(m, n, dtype=output_dtype, device=input_2d.device)
-
-
-if current_platform.is_rocm():
-    direct_register_custom_op(
-        op_name="rocm_aiter_gemm_w8a8_blockscale",
-        op_func=rocm_aiter_gemm_w8a8_blockscale_impl,
-        fake_impl=rocm_aiter_gemm_w8a8_blockscale_fake,
-    )
-
-
 # TODO we should be able to change the type of block_size to GroupShape
 # after we resolve GroupShape compilation issue
 # https://github.com/vllm-project/vllm/issues/25270
@@ -385,14 +314,40 @@ def _run_aiter(
         input_scale: torch.Tensor | None = None,
     ) -> torch.Tensor:
         assert self.act_quant_group_shape == GroupShape(1, 128)
-        return torch.ops.vllm.rocm_aiter_gemm_w8a8_blockscale(
-            input_2d,
-            weight,
-            input_scale,
-            weight_scale,
-            self.act_quant_group_shape.col,
-            input_2d.dtype,
-        )
+
+        n, k = weight.shape
+        if input_scale is not None:
+            q_input = input_2d
+
+        # MI350 case uses triton kernel
+        if (
+            not current_platform.is_fp8_fnuz()
+            and rocm_aiter_ops.is_triton_gemm_w8a8_tuned(n, k)
+        ):
+            q_input, input_scale = per_token_group_quant_fp8(
+                input_2d,
+                self.act_quant_group_shape.col,
+                column_major_scales=False,
+                use_ue8m0=False,
+            )
+            return rocm_aiter_ops.triton_gemm_a8w8_blockscale(
+                q_input,
+                weight,
+                input_scale,
+                weight_scale,
+                input_2d.dtype,
+            )
+
+        # MI300 uses tuned AITER ASM/C++ kernel
+        else:
+            q_input, input_scale = rocm_aiter_ops.per_1x128_fp8_quant(input_2d)
+            return rocm_aiter_ops.gemm_w8a8_blockscale(
+                q_input,
+                weight,
+                input_scale,
+                weight_scale,
+                input_2d.dtype,
+            )
 
     def _run_triton(
         self,
@@ -971,15 +926,6 @@ def requant_weight_ue8m0_inplace(
         s_old.copy_(s_requant)
 
 
-def check_aiter_fp8_linear_support() -> bool:
-    """AITER is only supported on ROCm for MI3XX"""
-    return (
-        current_platform.is_rocm()
-        and envs.VLLM_ROCM_USE_AITER
-        and envs.VLLM_ROCM_USE_AITER_LINEAR
-    )
-
-
 def _maybe_pad_fp8_weight(weight: torch.Tensor) -> torch.Tensor:
     """Pad the weight tensor. This is an optimization on ROCm platform, which
     can benefit from tensors located far enough from one another in memory"""
diff --git a/vllm/model_executor/layers/quantization/utils/w8a8_utils.py b/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
index 380431e86435..7fe902807a74 100644
--- a/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
@@ -472,7 +472,7 @@ def apply(
         # Example:
         # When the number of token is 1, per-token scale is [[1]]
         # When per-tensor scale is [1] or ().
-        per_tensor_weights = (weight_scale.numel() == 1) and weight_scale.dim() < 2
+        per_tensor_weights = weight_scale.numel() == 1
         per_tensor_activations = (x_scale.numel() == 1) and x_scale.dim() < 2
 
         # TODO(luka) do this dispatch during init (after ScaledMM refactor)
diff --git a/vllm/model_executor/layers/rotary_embedding/base.py b/vllm/model_executor/layers/rotary_embedding/base.py
index 91276320df4d..2ef54e75df44 100644
--- a/vllm/model_executor/layers/rotary_embedding/base.py
+++ b/vllm/model_executor/layers/rotary_embedding/base.py
@@ -4,13 +4,10 @@
 
 import torch
 
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.model_executor.custom_op import CustomOp
 
 from .common import apply_rotary_emb_torch
-from .rocm_aiter_rope_ops import (
-    is_rocm_triton_rotary_embedding_enabled,
-    rocm_aiter_rotary_emb,
-)
 
 
 @CustomOp.register("rotary_embedding")
@@ -48,8 +45,8 @@ def __init__(
             cache = cache.to(dtype)
         self.cos_sin_cache: torch.Tensor
         self.register_buffer("cos_sin_cache", cache, persistent=False)
-        self.is_rocm_triton_rotary_embedding_enabled = (
-            is_rocm_triton_rotary_embedding_enabled()
+        self.is_rocm_triton_rotary_embed_enabled = (
+            rocm_aiter_ops.is_triton_rotary_embed_enabled()
         )
 
     def _compute_inv_freq(self, base: float) -> torch.Tensor:
@@ -169,9 +166,9 @@ def forward_hip(
         query: torch.Tensor,
         key: torch.Tensor | None = None,
     ) -> tuple[torch.Tensor, torch.Tensor | None]:
-        if self.is_rocm_triton_rotary_embedding_enabled:
+        if self.is_rocm_triton_rotary_embed_enabled:
             self._match_cos_sin_cache_dtype(query)
-            rocm_aiter_rotary_emb(
+            rocm_aiter_ops.triton_rotary_embed(
                 positions,
                 query,
                 key,
diff --git a/vllm/model_executor/layers/rotary_embedding/deepseek_scaling_rope.py b/vllm/model_executor/layers/rotary_embedding/deepseek_scaling_rope.py
index d9134f05fddf..e72834e473c1 100644
--- a/vllm/model_executor/layers/rotary_embedding/deepseek_scaling_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/deepseek_scaling_rope.py
@@ -146,6 +146,15 @@ def forward_native(
             key = key_rot
         return query, key
 
+    def forward_hip(
+        self,
+        positions: torch.Tensor,
+        query: torch.Tensor,
+        key: torch.Tensor | None = None,
+        offsets: torch.Tensor | None = None,
+    ) -> tuple[torch.Tensor, torch.Tensor | None]:
+        return self.forward_native(positions, query, key, offsets)
+
     def forward_cuda(
         self,
         positions: torch.Tensor,
diff --git a/vllm/model_executor/layers/rotary_embedding/rocm_aiter_rope_ops.py b/vllm/model_executor/layers/rotary_embedding/rocm_aiter_rope_ops.py
deleted file mode 100644
index a01d14f7b3a1..000000000000
--- a/vllm/model_executor/layers/rotary_embedding/rocm_aiter_rope_ops.py
+++ /dev/null
@@ -1,94 +0,0 @@
-# SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-
-import torch
-
-import vllm.envs as envs
-from vllm.platforms import current_platform
-from vllm.utils.torch_utils import direct_register_custom_op
-
-
-def is_rocm_triton_rotary_embedding_enabled() -> bool:
-    return (
-        current_platform.is_rocm()
-        and envs.VLLM_ROCM_USE_AITER
-        and envs.VLLM_ROCM_USE_TRITON_ROPE
-    )
-
-
-def rocm_aiter_rotary_emb_with_key_forward_triton_impl(
-    positions: torch.Tensor,
-    sin: torch.Tensor,
-    cos: torch.Tensor,
-    query: torch.Tensor,
-    key: torch.Tensor,
-    rotate_style: int = 0,
-    is_nope_first: bool = False,
-) -> None:
-    import aiter.ops.triton.rope as ops
-
-    ops.rope_cached_thd_positions_2c_fwd_inplace(
-        query,
-        key,
-        cos,
-        sin,
-        positions,
-        rotate_style,
-        reuse_freqs_front_part=True,
-        nope_first=is_nope_first,
-    )
-
-
-def rocm_aiter_rotary_emb_with_key_forward_triton_fake(
-    positions: torch.Tensor,
-    sin: torch.Tensor,
-    cos: torch.Tensor,
-    query: torch.Tensor,
-    key: torch.Tensor,
-    rotate_style: int = 0,
-    is_nope_first: bool = False,
-) -> None:
-    pass
-
-
-if is_rocm_triton_rotary_embedding_enabled():
-    direct_register_custom_op(
-        op_name="rocm_aiter_rotary_emb_with_key_forward_triton",
-        op_func=rocm_aiter_rotary_emb_with_key_forward_triton_impl,
-        mutates_args=["key", "query"],
-        fake_impl=rocm_aiter_rotary_emb_with_key_forward_triton_fake,
-        dispatch_key=current_platform.dispatch_key,
-    )
-
-
-def rocm_aiter_rotary_emb(
-    positions: torch.Tensor,
-    query: torch.Tensor,
-    key: torch.Tensor,
-    cos_sin_cache: torch.Tensor,
-    head_size: int,
-    rotary_dim: int,
-    is_neox_style: bool,
-):
-    num_tokens = positions.numel()
-    cos, sin = cos_sin_cache.chunk(2, dim=-1)
-    query_shape = query.shape
-    key_shape = key.shape
-    rotate_style = 0 if is_neox_style else 1
-
-    query = query.view(num_tokens, -1, head_size)
-    key = key.view(num_tokens, -1, head_size)
-    query_ = query[..., :rotary_dim]
-    key_ = key[..., :rotary_dim]
-    positions = positions.view(*query.shape[:1])
-    torch.ops.vllm.rocm_aiter_rotary_emb_with_key_forward_triton(
-        positions,
-        sin,
-        cos,
-        query_,
-        key_,
-        rotate_style,
-        False,
-    )
-    query = query.view(query_shape)
-    key = key.view(key_shape)
diff --git a/vllm/model_executor/models/deepseek_v2.py b/vllm/model_executor/models/deepseek_v2.py
index 63eaf63cc3c4..38189e17f7d8 100644
--- a/vllm/model_executor/models/deepseek_v2.py
+++ b/vllm/model_executor/models/deepseek_v2.py
@@ -33,6 +33,7 @@
 from torch import nn
 from transformers import DeepseekV2Config, DeepseekV3Config
 
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.attention import Attention
 from vllm.attention.backends.abstract import AttentionBackend
 from vllm.attention.ops.common import pack_seq_triton, unpack_seq_triton
@@ -50,10 +51,6 @@
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
 from vllm.model_executor.layers.fused_moe import SharedFusedMoE
-from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-    is_rocm_aiter_fusion_shared_expert_enabled,
-    is_rocm_aiter_moe_enabled,
-)
 from vllm.model_executor.layers.layernorm import LayerNorm, RMSNorm
 from vllm.model_executor.layers.linear import (
     ColumnParallelLinear,
@@ -294,10 +291,8 @@ def __init__(
             self.physical_expert_start + self.n_local_physical_experts
         )
 
-        if (
-            config.n_shared_experts is None
-            or is_rocm_aiter_fusion_shared_expert_enabled()
-        ):
+        self.is_rocm_aiter_moe_enabled = rocm_aiter_ops.is_fused_moe_enabled()
+        if config.n_shared_experts is None or self.is_rocm_aiter_moe_enabled:
             self.shared_experts = None
         else:
             intermediate_size = config.moe_intermediate_size * config.n_shared_experts
@@ -330,14 +325,14 @@ def __init__(
             # we do scaling outside, set factor to 1.0 to avoid double mul
             # aiter applies routed_scaling_factor internally
             routed_scaling_factor=1.0
-            if not is_rocm_aiter_moe_enabled()
+            if not self.is_rocm_aiter_moe_enabled
             else self.routed_scaling_factor,
             e_score_correction_bias=self.gate.e_score_correction_bias,
             enable_eplb=self.enable_eplb,
             num_redundant_experts=self.n_redundant_experts,
             is_sequence_parallel=self.is_sequence_parallel,
             n_shared_experts=config.n_shared_experts
-            if is_rocm_aiter_fusion_shared_expert_enabled()
+            if rocm_aiter_ops.is_fusion_moe_shared_experts_enabled()
             else None,
         )
 
@@ -371,7 +366,7 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # Fix FP16 overflow
         # See DeepseekV2DecoderLayer for more details.
         if hidden_states.dtype != torch.float16:
-            if not is_rocm_aiter_moe_enabled():
+            if not self.is_rocm_aiter_moe_enabled:
                 final_hidden_states *= self.routed_scaling_factor
         elif self.shared_experts is not None:
             assert shared_output is not None
@@ -1428,6 +1423,9 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
         )
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
+        rocm_aiter_moe_shared_expert_enabled = (
+            rocm_aiter_ops.is_fusion_moe_shared_experts_enabled()
+        )
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("gate_up_proj", "gate_proj", 0),
@@ -1456,7 +1454,7 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
             num_experts=self.config.n_routed_experts
             + (
                 self.config.n_shared_experts
-                if is_rocm_aiter_fusion_shared_expert_enabled()
+                if rocm_aiter_moe_shared_expert_enabled
                 else 0
             ),
             num_redundant_experts=self.num_redundant_experts,
@@ -1472,9 +1470,8 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
             if spec_layer is not None:
                 continue  # skip spec decode layers for main model
 
-            is_fuse_shared_experts_layer = (
-                is_rocm_aiter_fusion_shared_expert_enabled()
-                and ("mlp.shared_experts" in name)
+            is_fuse_shared_experts_layer = rocm_aiter_moe_shared_expert_enabled and (
+                "mlp.shared_experts" in name
             )
 
             for param_name, weight_name, shard_id in stacked_params_mapping:
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index 1abd6300036d..e6536a02a73d 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -142,6 +142,8 @@ def use_rocm_custom_paged_attention(
     alibi_slopes: torch.Tensor | None = None,
     sinks: torch.Tensor | None = None,
 ) -> bool:
+    from vllm._aiter_ops import rocm_aiter_ops
+
     GPU_ARCH = torch.cuda.get_device_properties("cuda").gcnArchName
     ON_GFX9 = any(arch in GPU_ARCH for arch in ["gfx90a", "gfx942", "gfx950"])
     ON_GFX11_GFX12 = any(arch in GPU_ARCH for arch in ["gfx11", "gfx12"])
@@ -157,7 +159,7 @@ def use_rocm_custom_paged_attention(
             and (gqa_ratio >= 1 and gqa_ratio <= 16)
             and max_seq_len <= 128 * 1024
             and (envs.VLLM_ROCM_CUSTOM_PAGED_ATTN)
-            and not (envs.VLLM_ROCM_USE_AITER_PAGED_ATTN and envs.VLLM_ROCM_USE_AITER)
+            and not (rocm_aiter_ops.is_pa_attn_enabled())
             and sinks is None
         )
 
@@ -202,12 +204,15 @@ class RocmPlatform(Platform):
     ]
 
     @classmethod
-    def get_vit_attn_backend(cls, head_size: int, dtype: torch.dtype) -> "_Backend":
+    def get_vit_attn_backend(cls, head_size: int, dtype: torch.dtype) -> _Backend:
         from importlib.util import find_spec
 
+        from vllm._aiter_ops import rocm_aiter_ops
         from vllm.attention.backends.registry import _Backend
 
-        if envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MHA and on_gfx9():
+        if rocm_aiter_ops.is_mha_enabled():
+            # Note: AITER FA is only supported for Qwen-VL models.
+            # TODO: Add support for other VL models in their model class.
             return _Backend.ROCM_AITER_FA
 
         if on_gfx9() and find_spec("flash_attn") is not None:
@@ -228,19 +233,23 @@ def get_attn_backend_cls(
         has_sink,
         use_sparse,
     ) -> str:
+        from vllm._aiter_ops import rocm_aiter_ops
         from vllm.attention.backends.registry import _Backend
 
         if use_sparse:
             raise NotImplementedError("Sparse Attention is not supported on ROCm.")
-        if use_mla:
-            from vllm.v1.attention.backends.mla.rocm_aiter_mla import (
-                is_aiter_mla_enabled,
+
+        if not use_v1:
+            raise RuntimeError(
+                "V0 attention backends have been removed. Set VLLM_USE_V1=1 "
+                "to select a supported backend."
             )
 
+        if use_mla:
             if selected_backend is None:
                 selected_backend = (
                     _Backend.ROCM_AITER_MLA
-                    if is_aiter_mla_enabled() or block_size == 1
+                    if rocm_aiter_ops.is_mla_enabled() or block_size == 1
                     else _Backend.TRITON_MLA
                 )
 
@@ -265,12 +274,12 @@ def get_attn_backend_cls(
             logger.info("Using FlexAttention backend.")
             return "vllm.v1.attention.backends.flex_attention.FlexAttentionBackend"
         if (
-            envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MHA and on_gfx9()
+            rocm_aiter_ops.is_mha_enabled()
         ) or selected_backend == _Backend.ROCM_AITER_FA:
             logger.info("Using Aiter Flash Attention backend.")
             return "vllm.v1.attention.backends.rocm_aiter_fa.AiterFlashAttentionBackend"
         if (
-            envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_UNIFIED_ATTENTION
+            rocm_aiter_ops.is_triton_unified_attn_enabled()
         ) or selected_backend == _Backend.ROCM_AITER_UNIFIED_ATTN:
             logger.info("Using Aiter Unified Attention backend.")
             return (
diff --git a/vllm/v1/attention/backends/mla/common.py b/vllm/v1/attention/backends/mla/common.py
index 40ce12c4bd75..e38f7bcfa44e 100755
--- a/vllm/v1/attention/backends/mla/common.py
+++ b/vllm/v1/attention/backends/mla/common.py
@@ -198,6 +198,7 @@
 
 import vllm.envs as envs
 from vllm import _custom_ops as ops
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.attention.backends.abstract import (
     AttentionBackend,
     AttentionLayer,
@@ -270,28 +271,15 @@ class QueryLenSupport(Enum):
     flashinfer_available = False
 
 
-def is_rocm_aiter_fp8bmm_enabled() -> bool:
-    return (
-        current_platform.is_rocm()
-        and envs.VLLM_ROCM_USE_AITER_FP8BMM
-        and envs.VLLM_ROCM_USE_AITER
-    )
-
-
-if is_rocm_aiter_fp8bmm_enabled():
-    from aiter.ops.triton.batched_gemm_a8w8_a_per_token_group_prequant_w_per_batched_tensor_quant import (  # noqa: E501
-        batched_gemm_a8w8_a_per_token_group_prequant_w_per_batched_tensor_quant as aiter_triton_fp8_bmm,  # noqa: E501
-    )
-
-    def dynamic_per_batched_tensor_quant(
-        x: torch.Tensor, dtype: torch.dtype = torch.float8_e4m3fn
-    ):
-        DTYPE_MAX = torch.finfo(dtype).max
-        min_val, max_val = x.aminmax()
-        amax = torch.maximum(min_val.abs(), max_val.abs()).clamp(min=1e-10)
-        scale = DTYPE_MAX / amax
-        x_scl_sat = (x * scale).clamp(min=-DTYPE_MAX, max=DTYPE_MAX)
-        return x_scl_sat.to(dtype).contiguous(), scale.float().reciprocal()
+def dynamic_per_batched_tensor_quant(
+    x: torch.Tensor, dtype: torch.dtype = torch.float8_e4m3fn
+):
+    DTYPE_MAX = torch.finfo(dtype).max
+    min_val, max_val = x.aminmax()
+    amax = torch.maximum(min_val.abs(), max_val.abs()).clamp(min=1e-10)
+    scale = DTYPE_MAX / amax
+    x_scl_sat = (x * scale).clamp(min=-DTYPE_MAX, max=DTYPE_MAX)
+    return x_scl_sat.to(dtype).contiguous(), scale.float().reciprocal()
 
 
 logger = init_logger(__name__)
@@ -1109,6 +1097,7 @@ def __init__(
         self.kv_b_proj = kv_b_proj
         self.indexer = indexer
         self.q_pad_num_heads = q_pad_num_heads
+        self.is_aiter_triton_fp8_bmm_enabled = rocm_aiter_ops.is_fp8bmm_enabled()
 
     def process_weights_after_loading(self, act_dtype: torch.dtype):
         def get_layer_weight(layer):
@@ -1158,7 +1147,7 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
             [self.qk_nope_head_dim, self.v_head_dim], dim=-1
         )
 
-        if is_rocm_aiter_fp8bmm_enabled():
+        if self.is_aiter_triton_fp8_bmm_enabled:
             W_K = W_UK.transpose(0, 1)  # 16 512 128
             W_V = W_UV.permute(1, 2, 0)  # 16 128 512
             self.W_K, self.W_K_scale = dynamic_per_batched_tensor_quant(
@@ -1187,7 +1176,7 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
                     dtype=torch.bfloat16,
                     device=self.W_K.device,
                 )
-                aiter_triton_fp8_bmm(
+                rocm_aiter_ops.triton_fp8_bmm(
                     x, self.W_K, self.W_K_scale, group_size=128, transpose_bm=True
                 )
 
@@ -1196,7 +1185,7 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
                     dtype=torch.bfloat16,
                     device=self.W_V.device,
                 )
-                aiter_triton_fp8_bmm(
+                rocm_aiter_ops.triton_fp8_bmm(
                     x, self.W_V, self.W_V_scale, group_size=128, transpose_bm=True
                 )
         else:
@@ -1208,10 +1197,9 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
     def _v_up_proj(self, x: torch.Tensor, out: torch.Tensor):
         # Convert from (B, N, L) to (N, B, L)
         x = x.view(-1, self.num_heads, self.kv_lora_rank).transpose(0, 1)
-
-        if is_rocm_aiter_fp8bmm_enabled():
+        if self.is_aiter_triton_fp8_bmm_enabled:
             # Multiply + Transpose (N, B, L) x (N, L, V)->(N, B, V)->(B, N, V)
-            x = aiter_triton_fp8_bmm(
+            x = rocm_aiter_ops.triton_fp8_bmm(
                 x, self.W_V, self.W_V_scale, group_size=128, transpose_bm=True
             )
             # Convert from (B, N, V) to (B, N * V)
@@ -1571,7 +1559,7 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
             [self.qk_nope_head_dim, self.v_head_dim], dim=-1
         )
 
-        if is_rocm_aiter_fp8bmm_enabled():
+        if self.is_aiter_triton_fp8_bmm_enabled:
             W_K = W_UK.transpose(0, 1)  # 16 512 128
             W_V = W_UV.permute(1, 2, 0)  # 16 128 512
             self.W_K, self.W_K_scale = dynamic_per_batched_tensor_quant(
@@ -1600,7 +1588,7 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
                     dtype=torch.bfloat16,
                     device=self.W_K.device,
                 )
-                aiter_triton_fp8_bmm(
+                rocm_aiter_ops.triton_fp8_bmm(
                     x, self.W_K, self.W_K_scale, group_size=128, transpose_bm=True
                 )
 
@@ -1609,7 +1597,7 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
                     dtype=torch.bfloat16,
                     device=self.W_V.device,
                 )
-                aiter_triton_fp8_bmm(
+                rocm_aiter_ops.triton_fp8_bmm(
                     x, self.W_V, self.W_V_scale, group_size=128, transpose_bm=True
                 )
         else:
@@ -1958,7 +1946,6 @@ def forward(
             # Convert from (B, N, P) to (N, B, P)
             decode_q_nope = decode_q_nope.transpose(0, 1)
 
-            # Pads the head_dim if necessary (for the underlying kernel)
             if self.q_pad_num_heads is not None:
                 B, N, L = decode_q_pe.shape
                 decode_pe_padded = decode_q_pe.new_empty((B, self.q_pad_num_heads, L))
@@ -1966,9 +1953,9 @@ def forward(
                 decode_pe_padded.copy_(decode_q_pe)
                 decode_q_pe = decode_pe_padded
 
-            if is_rocm_aiter_fp8bmm_enabled():
+            if self.is_aiter_triton_fp8_bmm_enabled:
                 # Multiply+Transpose (N, B, P)x(N, P, L)->(N, B, L)->(B, N, L)
-                decode_ql_nope = aiter_triton_fp8_bmm(
+                decode_ql_nope = rocm_aiter_ops.triton_fp8_bmm(
                     decode_q_nope,
                     self.W_K,
                     self.W_K_scale,
diff --git a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
index 4ad7236eb1be..5757aeadba05 100644
--- a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
+++ b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
@@ -6,9 +6,8 @@
 
 import torch
 
-import vllm.envs as envs
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.attention.backends.abstract import AttentionLayer
-from vllm.attention.ops.rocm_aiter_mla import aiter_mla_decode_fwd
 from vllm.config import VllmConfig
 from vllm.utils.math_utils import cdiv
 from vllm.v1.attention.backends.mla.common import (
@@ -22,10 +21,6 @@
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 
-def is_aiter_mla_enabled() -> bool:
-    return envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MLA
-
-
 class AiterMLABackend(MLACommonBackend):
     @staticmethod
     def get_name() -> str:
@@ -284,7 +279,7 @@ def _forward_decode(
         # max_seqlen_qo must be 1 except for MTP
         # TODO: Find the best value for MTP
         max_seqlen_qo = 1
-        aiter_mla_decode_fwd(
+        rocm_aiter_ops.mla_decode_fwd(
             q,
             kv_buffer,
             o,

From d0e186c16f0d62af8c128e2dc7c94cde1387ac02 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Tue, 11 Nov 2025 00:30:06 +0800
Subject: [PATCH 020/183] [V0 Deprecation] Remove unused `context_len` and
 `seq_len` from M-RoPE (#28395)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 vllm/model_executor/models/ernie45_vl.py              | 3 ---
 vllm/model_executor/models/glm4_1v.py                 | 3 ---
 vllm/model_executor/models/glm4v.py                   | 3 ---
 vllm/model_executor/models/interfaces.py              | 4 ----
 vllm/model_executor/models/keye.py                    | 3 ---
 vllm/model_executor/models/keye_vl1_5.py              | 3 ---
 vllm/model_executor/models/paddleocr_vl.py            | 3 ---
 vllm/model_executor/models/qwen2_5_omni_thinker.py    | 3 ---
 vllm/model_executor/models/qwen2_5_vl.py              | 3 ---
 vllm/model_executor/models/qwen2_vl.py                | 3 ---
 vllm/model_executor/models/qwen3_omni_moe_thinker.py  | 2 --
 vllm/model_executor/models/qwen3_vl.py                | 4 +---
 vllm/model_executor/models/transformers/multimodal.py | 4 +---
 13 files changed, 2 insertions(+), 39 deletions(-)

diff --git a/vllm/model_executor/models/ernie45_vl.py b/vllm/model_executor/models/ernie45_vl.py
index 7c1eba103ae7..f287cff12086 100644
--- a/vllm/model_executor/models/ernie45_vl.py
+++ b/vllm/model_executor/models/ernie45_vl.py
@@ -1435,8 +1435,6 @@ def get_mrope_input_positions(
         hf_config: PretrainedConfig,
         image_grid_thw: list[list[int]] | torch.Tensor,
         video_grid_thw: list[list[int]] | torch.Tensor,
-        context_len: int = 0,
-        seq_len: int | None = None,
         second_per_grid_ts: list[float] | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
@@ -1569,7 +1567,6 @@ def get_mrope_input_positions(
             llm_pos_ids_list.append(torch.arange(text_len).view(1, -1).expand(3, -1))
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
-        llm_positions = llm_positions[:, context_len:seq_len]
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
         return llm_positions, mrope_position_delta
 
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index 121e84469c52..b9cd3545ec45 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -1622,8 +1622,6 @@ def get_mrope_input_positions(
         image_grid_thw: list[list[int]] | torch.Tensor | None,
         video_grid_thw: list[list[int]] | torch.Tensor | None,
         second_per_grid_ts: list[float] | None = None,
-        context_len: int = 0,
-        seq_len: int | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
     ) -> tuple[torch.Tensor, int]:
@@ -1754,7 +1752,6 @@ def get_mrope_input_positions(
             llm_pos_ids_list.append(torch.arange(text_len).view(1, -1).expand(3, -1))
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
-        llm_positions = llm_positions[:, context_len:seq_len]
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
         return llm_positions, mrope_position_delta
 
diff --git a/vllm/model_executor/models/glm4v.py b/vllm/model_executor/models/glm4v.py
index 2de1e4810952..ebf6934dddea 100644
--- a/vllm/model_executor/models/glm4v.py
+++ b/vllm/model_executor/models/glm4v.py
@@ -625,8 +625,6 @@ def get_mrope_input_positions(
         hf_config: PretrainedConfig,
         image_grid_thw: list[list[int]] | torch.Tensor,
         video_grid_thw: list[list[int]] | torch.Tensor,
-        context_len: int = 0,
-        seq_len: int | None = None,
         second_per_grid_ts: list[float] | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
@@ -758,7 +756,6 @@ def get_mrope_input_positions(
             llm_pos_ids_list.append(torch.arange(text_len).view(1, -1).expand(3, -1))
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
-        llm_positions = llm_positions[:, context_len:seq_len]
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
         return llm_positions, mrope_position_delta
 
diff --git a/vllm/model_executor/models/interfaces.py b/vllm/model_executor/models/interfaces.py
index b634c7ec7d67..d6a8f86d998b 100644
--- a/vllm/model_executor/models/interfaces.py
+++ b/vllm/model_executor/models/interfaces.py
@@ -995,8 +995,6 @@ def get_mrope_input_positions(
         image_grid_thw: list[list[int]] | torch.Tensor | None,
         video_grid_thw: list[list[int]] | torch.Tensor | None,
         second_per_grid_ts: list[float] | None = None,
-        context_len: int = 0,
-        seq_len: int | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
     ) -> tuple[torch.Tensor, int]:
@@ -1012,8 +1010,6 @@ def get_mrope_input_positions(
             image_grid_thw: Image grid dimensions (t, h, w)
             video_grid_thw: Video grid dimensions (t, h, w)
             second_per_grid_ts: Seconds per grid timestep for videos
-            context_len: Context length
-            seq_len: Sequence length
             audio_feature_lengths: Audio feature lengths for multimodal models
             use_audio_in_video: Whether to use audio in video for interleaving
 
diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index 5f8659a3064e..42f16ad9f3b3 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -1630,8 +1630,6 @@ def get_mrope_input_positions(
         hf_config: PretrainedConfig,
         image_grid_thw: list[list[int]] | torch.Tensor,
         video_grid_thw: list[list[int]] | torch.Tensor,
-        context_len: int = 0,
-        seq_len: int | None = None,
         second_per_grid_ts: list[float] | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
@@ -1759,6 +1757,5 @@ def split_thw(grid_thw: torch.Tensor | list[int]) -> list[list[int]]:
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
-        llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
diff --git a/vllm/model_executor/models/keye_vl1_5.py b/vllm/model_executor/models/keye_vl1_5.py
index 13e5b2d5f157..6f95a59d36d2 100644
--- a/vllm/model_executor/models/keye_vl1_5.py
+++ b/vllm/model_executor/models/keye_vl1_5.py
@@ -600,8 +600,6 @@ def get_mrope_input_positions(
         hf_config: PretrainedConfig,
         image_grid_thw: list[list[int]] | torch.Tensor,
         video_grid_thw: list[list[int]] | torch.Tensor,
-        context_len: int = 0,
-        seq_len: int | None = None,
         second_per_grid_ts: list[float] | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
@@ -729,6 +727,5 @@ def split_thw(grid_thw: torch.Tensor | list[int]) -> list[list[int]]:
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
-        llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
diff --git a/vllm/model_executor/models/paddleocr_vl.py b/vllm/model_executor/models/paddleocr_vl.py
index 377b41a35578..631475c964c0 100644
--- a/vllm/model_executor/models/paddleocr_vl.py
+++ b/vllm/model_executor/models/paddleocr_vl.py
@@ -1179,8 +1179,6 @@ def get_mrope_input_positions(
         image_grid_thw: list[list[int]] | torch.Tensor,
         video_grid_thw: list[list[int]] | torch.Tensor,
         second_per_grid_ts: list[float],
-        context_len: int = 0,
-        seq_len: int | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
     ) -> tuple[torch.Tensor, int]:
@@ -1293,7 +1291,6 @@ def get_mrope_input_positions(
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
-        llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
 
diff --git a/vllm/model_executor/models/qwen2_5_omni_thinker.py b/vllm/model_executor/models/qwen2_5_omni_thinker.py
index 7e970ebbe2bb..fac281d2caf4 100644
--- a/vllm/model_executor/models/qwen2_5_omni_thinker.py
+++ b/vllm/model_executor/models/qwen2_5_omni_thinker.py
@@ -927,8 +927,6 @@ def get_mrope_input_positions(
         image_grid_thw: list[list[int]] | torch.Tensor,
         video_grid_thw: list[list[int]] | torch.Tensor,
         second_per_grid_ts: list[float] | None = None,
-        context_len: int = 0,
-        seq_len: int | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
     ) -> tuple[torch.Tensor, int]:
@@ -1125,7 +1123,6 @@ def get_mrope_input_positions(
         mrope_position_delta = (
             torch.cat(llm_pos_ids_list, dim=1).max() + 1 - len(src_item)
         )
-        llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
 
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index d337f1606943..48834ba699e4 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -1118,8 +1118,6 @@ def get_mrope_input_positions(
         image_grid_thw: list[list[int]] | torch.Tensor,
         video_grid_thw: list[list[int]] | torch.Tensor,
         second_per_grid_ts: list[float],
-        context_len: int = 0,
-        seq_len: int | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
     ) -> tuple[torch.Tensor, int]:
@@ -1232,7 +1230,6 @@ def get_mrope_input_positions(
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
-        llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
 
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index 9206ac8f9d03..b3999e6c934e 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -1240,8 +1240,6 @@ def get_mrope_input_positions(
         image_grid_thw: list[list[int]] | torch.Tensor | None,
         video_grid_thw: list[list[int]] | torch.Tensor | None,
         second_per_grid_ts: list[float] | None = None,
-        context_len: int = 0,
-        seq_len: int | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
     ) -> tuple[torch.Tensor, int]:
@@ -1360,7 +1358,6 @@ def get_mrope_input_positions(
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
-        llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
 
diff --git a/vllm/model_executor/models/qwen3_omni_moe_thinker.py b/vllm/model_executor/models/qwen3_omni_moe_thinker.py
index f20e67902721..da489a812f55 100755
--- a/vllm/model_executor/models/qwen3_omni_moe_thinker.py
+++ b/vllm/model_executor/models/qwen3_omni_moe_thinker.py
@@ -1417,8 +1417,6 @@ def get_mrope_input_positions(
         image_grid_thw: list[list[int]] | torch.Tensor | None,
         video_grid_thw: list[list[int]] | torch.Tensor | None,
         second_per_grid_ts: list[float] | None = None,
-        context_len: int = 0,
-        seq_len: int | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
     ) -> tuple[torch.Tensor, int]:
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index 2d8f431bb8fa..fe0124ef3258 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -1419,8 +1419,6 @@ def get_mrope_input_positions(
         hf_config: PretrainedConfig,
         image_grid_thw: list[list[int]] | torch.Tensor,
         video_grid_thw: list[list[int]] | torch.Tensor,
-        context_len: int = 0,
-        seq_len: int | None = None,
         second_per_grid_ts: list[float] | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
@@ -1519,7 +1517,7 @@ def get_mrope_input_positions(
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
-        llm_positions = llm_positions[:, context_len:seq_len]
+
         return llm_positions, mrope_position_delta
 
     def get_language_model(self) -> torch.nn.Module:
diff --git a/vllm/model_executor/models/transformers/multimodal.py b/vllm/model_executor/models/transformers/multimodal.py
index 10abd8659536..476074542e6a 100644
--- a/vllm/model_executor/models/transformers/multimodal.py
+++ b/vllm/model_executor/models/transformers/multimodal.py
@@ -371,8 +371,6 @@ def get_mrope_input_positions(
         image_grid_thw: list[list[int]] | torch.Tensor | None,
         video_grid_thw: list[list[int]] | torch.Tensor | None,
         second_per_grid_ts: list[float] | None = None,
-        context_len: int = 0,
-        seq_len: int | None = None,
         audio_feature_lengths: torch.Tensor | None = None,
         use_audio_in_video: bool = False,
     ) -> tuple[torch.Tensor, int]:
@@ -390,7 +388,7 @@ def get_mrope_input_positions(
             video_grid_thw=video_grid_thw,
         )
 
-        mrope_positions = mrope_positions[:, 0, context_len:seq_len]
+        mrope_positions = mrope_positions[:, 0]
         mrope_position_delta = mrope_position_delta[0].item()
 
         return mrope_positions, mrope_position_delta

From b039bfda8f72b442d42dbdac40f51572bf045ad1 Mon Sep 17 00:00:00 2001
From: Varun Sundar Rabindranath <varunsundar08@gmail.com>
Date: Mon, 10 Nov 2025 12:21:52 -0500
Subject: [PATCH 021/183] [Bugfix] Fix persistent_masked_m_silu_mul_quant tests
 (#28366)

Signed-off-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
Co-authored-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
---
 csrc/quantization/activation_kernels.cu           | 15 ++++++++++-----
 .../moe/test_silu_mul_fp8_quant_deep_gemm.py      |  5 ++++-
 .../layers/fused_moe/batched_deep_gemm_moe.py     |  3 ++-
 3 files changed, 16 insertions(+), 7 deletions(-)

diff --git a/csrc/quantization/activation_kernels.cu b/csrc/quantization/activation_kernels.cu
index 6fcd246f63c5..2521b2797e2c 100644
--- a/csrc/quantization/activation_kernels.cu
+++ b/csrc/quantization/activation_kernels.cu
@@ -578,11 +578,13 @@ void persistent_masked_m_silu_mul_quant(
 
   // This kernel currently only supports H % 128 == 0 and assumes a
   // fixed GROUP_SIZE of 128.
+  static constexpr int GROUP_SIZE = 128;
+
   TORCH_CHECK(input.dtype() == torch::kBFloat16);
   TORCH_CHECK(y_q.dtype() == torch::kFloat8_e4m3fn ||
               y_q.dtype() == torch::kFloat8_e4m3fnuz);
   TORCH_CHECK(y_s.dtype() == torch::kFloat32);
-  TORCH_CHECK(input.size(-1) % 256 == 0);
+  TORCH_CHECK(input.size(-1) % (GROUP_SIZE * 2) == 0);
 
   using Idx_t = int64_t;
 
@@ -601,8 +603,6 @@ void persistent_masked_m_silu_mul_quant(
 
   Idx_t stride_counts_e = tokens_per_expert.stride(0);
 
-  static constexpr int GROUP_SIZE = 128;
-
   const cudaStream_t stream = at::cuda::getCurrentCUDAStream();
 
   #define KERNEL(BLOCK_COUNT, USE_UE8M0, THREAD_COUNT, STAGES)                 \
@@ -628,21 +628,26 @@ void persistent_masked_m_silu_mul_quant(
 
   static constexpr int SILU_V2_BLOCK_COUNT = 132 * 32;
 
+  int const NUM_GROUPS = H / GROUP_SIZE;
   if (!use_ue8m0) {
-    if (H >= 4096) {
+    if (H >= 4096 && (NUM_GROUPS % 8 == 0)) {
+      /* 8 warps config */
       static constexpr int NUM_STAGES = 4;
       static constexpr int THREAD_COUNT = 256;
       KERNEL(SILU_V2_BLOCK_COUNT, false, THREAD_COUNT, NUM_STAGES);
     } else {
+      /* 1 warp config */
       static constexpr int THREAD_COUNT = 32;
       KERNEL(SILU_V2_BLOCK_COUNT, false, THREAD_COUNT, 2);
     }
   } else {
-    if (H >= 4096) {
+    if (H >= 4096 && (NUM_GROUPS % 8 == 0)) {
+      /* 8 warps config */
       static constexpr int NUM_STAGES = 4;
       static constexpr int THREAD_COUNT = 256;
       KERNEL(SILU_V2_BLOCK_COUNT, true, THREAD_COUNT, NUM_STAGES);
     } else {
+      /* 1 warp config */
       static constexpr int THREAD_COUNT = 32;
       KERNEL(SILU_V2_BLOCK_COUNT, true, THREAD_COUNT, 2);
     }
diff --git a/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py b/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
index 97a55c37b9a3..420dbbffaac0 100644
--- a/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
+++ b/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
@@ -25,6 +25,7 @@
     (8, 16, 128 * 2, fp8_dtype),
     (8, 16, 128 * 3, fp8_dtype),
     (8, 64, 7168, fp8_dtype),
+    (8, 128, 128 * 33, fp8_dtype),
     (8, 128, 7168, fp8_dtype),
     (8, 512, 7168, fp8_dtype),
     (8, 1024, 7168, fp8_dtype),
@@ -54,8 +55,10 @@ def test_silu_mul_fp8_quant_deep_gemm(E, T, H, fp8_type):
     )
 
     # Run the SiLU V2 kernel
+    # TODO (varun): use_e8m0 is set to false as the reference impl does
+    # not handle that case.
     y_q, y_s = persistent_masked_m_silu_mul_quant(
-        y, tokens_per_expert, group_size=group_size
+        y, tokens_per_expert, group_size=group_size, use_ue8m0=False
     )
 
     torch.cuda.synchronize()
diff --git a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
index 095ec966ea7e..b8a97e92ab79 100644
--- a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
@@ -100,6 +100,7 @@ def persistent_masked_m_silu_mul_quant(
     tokens_per_expert: torch.Tensor,  # (E,) number of valid tokens per expert
     num_parallel_tokens=16,
     group_size: int = 128,
+    use_ue8m0: bool | None = None,
 ) -> tuple[torch.Tensor, torch.Tensor]:
     """Quantize silu(y[..., :H]) * y[..., H:] to FP8 with group per-token scales
     y has shape (E, T, 2*H). The first half of the last dimension is
@@ -164,7 +165,7 @@ def persistent_masked_m_silu_mul_quant(
         device=y.device,
     )
 
-    use_ue8m0 = is_deep_gemm_e8m0_used()
+    use_ue8m0 = use_ue8m0 if use_ue8m0 is not None else is_deep_gemm_e8m0_used()
 
     cuda_arch = current_platform.get_device_capability(
         device_id=y.device.index

From 34553b9d2702dd2a27a578fec819e88e76dcbfb4 Mon Sep 17 00:00:00 2001
From: jiahanc <173873397+jiahanc@users.noreply.github.com>
Date: Mon, 10 Nov 2025 09:34:57 -0800
Subject: [PATCH 022/183] [Performance] Support FP8 flashinfer TRTLLM MOE on
 Qwen3 and Qwen-3next (#27492)

Signed-off-by: jiahanc <173873397+jiahanc@users.noreply.github.com>
---
 .../model_executor/layers/fused_moe/config.py | 21 +++++++++++++++
 .../layers/fused_moe/flashinfer_trtllm_moe.py | 26 +++++++++----------
 vllm/model_executor/layers/fused_moe/layer.py | 20 ++++++++++++++
 .../model_executor/layers/quantization/fp8.py | 14 +++++-----
 .../quantization/utils/flashinfer_utils.py    | 23 +++++++++-------
 vllm/model_executor/models/qwen3_moe.py       |  2 ++
 vllm/model_executor/models/qwen3_next.py      |  2 ++
 7 files changed, 78 insertions(+), 30 deletions(-)

diff --git a/vllm/model_executor/layers/fused_moe/config.py b/vllm/model_executor/layers/fused_moe/config.py
index cbc3caafcf2f..a7bd64b1c65e 100644
--- a/vllm/model_executor/layers/fused_moe/config.py
+++ b/vllm/model_executor/layers/fused_moe/config.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from dataclasses import dataclass
+from enum import IntEnum
 from typing import Optional, Union
 
 import torch
@@ -91,6 +92,26 @@ def _quant_flags_to_group_shape(
     return a_shape, w_shape
 
 
+# The type of method in top-K routing
+# Please keep this in sync with the counterpart defined in https://github.com/flashinfer-ai/flashinfer/blob/main/include/flashinfer/trtllm/fused_moe/runner.h
+class RoutingMethodType(IntEnum):
+    # Default: Softmax -> TopK
+    Default = (0,)
+    # Renormalize: TopK -> Softmax
+    Renormalize = (1,)
+    # DeepSeekV3: Sigmoid -> RoutingBiasAdd -> Top2 in group -> Top4 groups
+    # -> Top8 experts from the Top4 groups
+    DeepSeekV3 = (2,)
+    # Llama4: Top1 -> Sigmoid
+    Llama4 = (3,)
+    # RenormalizeNaive: Softmax -> TopK -> Renormalize
+    RenormalizeNaive = (4,)
+    # TopK: TopK (no softmax)
+    TopK = (5,)
+    # Unspecified
+    Unspecified = 6.0
+
+
 @dataclass
 class FusedMoEQuantDesc:
     """
diff --git a/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py b/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py
index f21fe16c5108..51e06ac54f49 100644
--- a/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py
@@ -3,6 +3,7 @@
 
 import torch
 
+from vllm.model_executor.layers.fused_moe.config import RoutingMethodType
 from vllm.model_executor.layers.fused_moe.utils import moe_kernel_quantize_input
 from vllm.model_executor.layers.quantization.utils.flashinfer_utils import (
     calculate_tile_tokens_dim,
@@ -23,26 +24,24 @@ def flashinfer_fused_moe_blockscale_fp8(
     w2_weight_scale_inv: torch.Tensor,
     global_num_experts: int,
     top_k: int,
-    num_expert_group: int,
-    topk_group: int,
+    num_expert_group: int | None,
+    topk_group: int | None,
     intermediate_size: int,
     expert_offset: int,
     local_num_experts: int,
     block_shape: list[int],
-    routed_scaling: float = 1.0,
+    routing_method_type: int = RoutingMethodType.DeepSeekV3,
+    routed_scaling: float | None = 1.0,
 ) -> torch.Tensor:
     from vllm.utils.flashinfer import flashinfer_trtllm_fp8_block_scale_moe
 
+    topk_group = topk_group if topk_group is not None else 0
     assert top_k <= global_num_experts
-    assert top_k <= 8
-    assert topk_group <= 4
-    assert global_num_experts > num_expert_group
-    assert global_num_experts % num_expert_group == 0
+    assert top_k <= 10
     assert global_num_experts % 4 == 0
-    assert top_k < (topk_group * global_num_experts / num_expert_group)
     assert block_shape == [128, 128]
-    # Routing kernel expects #experts <= #threads 256
-    assert global_num_experts <= 256
+    # Routing kernel expects #experts <= #threads 512
+    assert global_num_experts <= 512
 
     a_q, a_sf = per_token_group_quant_fp8(x, block_shape[1])
     # NOTE: scales of hidden states have to be transposed!
@@ -64,10 +63,8 @@ def flashinfer_fused_moe_blockscale_fp8(
         local_expert_offset=expert_offset,
         local_num_experts=local_num_experts,
         routed_scaling_factor=routed_scaling,
-        tile_tokens_dim=calculate_tile_tokens_dim(
-            x.shape[0], top_k, global_num_experts
-        ),
-        routing_method_type=2,  # DeepSeek-styled routing method
+        tile_tokens_dim=None,
+        routing_method_type=routing_method_type,
         use_shuffled_weight=False,
     )
 
@@ -88,6 +85,7 @@ def flashinfer_fused_moe_blockscale_fp8_fake(
     expert_offset: int,
     local_num_experts: int,
     block_shape: list[int],
+    routing_method_type: int,
     routed_scaling: float = 1.0,
 ) -> torch.Tensor:
     return torch.empty_like(x)
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index 45b0f50a7997..f86a93e30003 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -31,6 +31,7 @@
     FusedMoEConfig,
     FusedMoEParallelConfig,
     FusedMoEQuantConfig,
+    RoutingMethodType,
     biased_moe_quant_config,
 )
 from vllm.model_executor.layers.fused_moe.fused_moe import zero_experts_compute_triton
@@ -1213,6 +1214,7 @@ def __init__(
         zero_expert_type: str | None = None,
         expert_mapping: list[tuple[str, str, int, str]] | None = None,
         n_shared_experts: int | None = None,
+        routing_method_type: int | None = None,
     ):
         super().__init__()
 
@@ -1397,6 +1399,24 @@ def __init__(
                 "Only softmax scoring function is supported for non-grouped topk."
             )
 
+        # ToDo: Better logic to determine the routing method type
+        if routing_method_type is not None:
+            self.routing_method_type = routing_method_type
+        else:
+            if scoring_func == "sigmoid":
+                if self.use_grouped_topk:
+                    self.routing_method_type = RoutingMethodType.DeepSeekV3
+                elif self.top_k == 1:
+                    self.routing_method_type = RoutingMethodType.Llama4
+            elif self.scoring_func == "softmax":
+                self.routing_method_type = (
+                    RoutingMethodType.Renormalize
+                    if not self.renormalize
+                    else RoutingMethodType.RenormalizeNaive
+                )
+            else:
+                self.routing_method_type = RoutingMethodType.TopK
+
         self.moe_config: FusedMoEConfig = FusedMoEConfig(
             num_experts=self.global_num_experts,
             experts_per_token=top_k,
diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index e4e1cbff712f..f5fc750baaea 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -28,6 +28,7 @@
 )
 from vllm.model_executor.layers.fused_moe.config import (
     FusedMoEQuantConfig,
+    RoutingMethodType,
     fp8_w8a8_moe_quant_config,
 )
 from vllm.model_executor.layers.fused_moe.fused_marlin_moe import fused_marlin_moe
@@ -1222,22 +1223,20 @@ def apply(
             assert activation == "silu", (
                 f"Expected 'silu' activation but got {activation}"
             )
-            assert scoring_func == "sigmoid", (
-                f"Expected 'sigmoid' scoring func but got {scoring_func}"
-            )
+
             if self.block_quant:
                 import vllm.model_executor.layers.fused_moe.flashinfer_trtllm_moe  # noqa: E501, F401
 
-                assert (
-                    renormalize and use_grouped_topk and custom_routing_function is None
-                )
                 e_score_correction_bias = (
                     e_score_correction_bias.to(x.dtype)
                     if e_score_correction_bias is not None
                     else None
                 )
+                routing_method_type = layer.routing_method_type
                 return torch.ops.vllm.flashinfer_fused_moe_blockscale_fp8(
-                    routing_logits=router_logits.to(torch.float32),
+                    routing_logits=router_logits.to(torch.float32)
+                    if routing_method_type == RoutingMethodType.DeepSeekV3
+                    else router_logits,
                     routing_bias=e_score_correction_bias,
                     x=x,
                     w13_weight=layer.w13_weight,
@@ -1252,6 +1251,7 @@ def apply(
                     expert_offset=layer.ep_rank * layer.local_num_experts,
                     local_num_experts=layer.local_num_experts,
                     block_shape=self.weight_block_size,
+                    routing_method_type=routing_method_type,
                     routed_scaling=routed_scaling_factor,
                 )
             else:
diff --git a/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py b/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
index 50ea049c3d5a..e49d374f154d 100644
--- a/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
@@ -27,20 +27,25 @@ class FlashinferMoeBackend(Enum):
 
 
 def calculate_tile_tokens_dim(num_tokens, top_k, num_experts):
+    from flashinfer import next_positive_power_of_2
+
     # FlashInfer 0.2.10 has issues with larger tile sizes. Set to 8 for now.
     # TODO: Revert this to dynamic calculation once a new version of FlashInfer
     # with the necessary kernels is released.
     tile_tokens_dim = 8
 
-    # from flashinfer import next_positive_power_of_2
-
-    # # Guess tokens per expert assuming perfect expert distribution first.
-    # num_tokens_per_expert = (num_tokens * top_k) // num_experts
-    # # And pad the number to the next power of 2.
-    # tile_tokens_dim = next_positive_power_of_2(num_tokens_per_expert)
-    # # Cap to 8-64 tokens per CTA tile as it's the range supported by the
-    # # kernel.
-    # tile_tokens_dim = min(max(tile_tokens_dim, 8), 64)
+    # A factor considering tokens are not perfectly balanced among experts.
+    imbalance_factor = 1.3
+    # Calculate the number of tokens per expert
+    # assuming perfect distribution.
+    num_tokens_per_expert = (num_tokens * top_k) // num_experts
+    # Apply the imbalance factor.
+    num_tokens_per_expert = int(num_tokens_per_expert * imbalance_factor)
+    # And pad the number to the next power of 2.
+    tile_tokens_dim = next_positive_power_of_2(num_tokens_per_expert)
+    # Cap to 8-max_tile_tokens_dim tokens per CTA tile
+    # as it's the range supported by the kernel.
+    tile_tokens_dim = min(max(tile_tokens_dim, 8), 64)
 
     return tile_tokens_dim
 
diff --git a/vllm/model_executor/models/qwen3_moe.py b/vllm/model_executor/models/qwen3_moe.py
index a7e6772bb708..d57b82cb0227 100644
--- a/vllm/model_executor/models/qwen3_moe.py
+++ b/vllm/model_executor/models/qwen3_moe.py
@@ -43,6 +43,7 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
+from vllm.model_executor.layers.fused_moe.config import RoutingMethodType
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.linear import (
     MergedColumnParallelLinear,
@@ -171,6 +172,7 @@ def __init__(
             enable_eplb=self.enable_eplb,
             num_redundant_experts=self.n_redundant_experts,
             is_sequence_parallel=self.is_sequence_parallel,
+            routing_method_type=RoutingMethodType.Renormalize,
         )
 
         self.gate = ReplicatedLinear(
diff --git a/vllm/model_executor/models/qwen3_next.py b/vllm/model_executor/models/qwen3_next.py
index 55bbad7a8b27..aa7de5aa5f29 100644
--- a/vllm/model_executor/models/qwen3_next.py
+++ b/vllm/model_executor/models/qwen3_next.py
@@ -34,6 +34,7 @@
     fused_recurrent_gated_delta_rule,
 )
 from vllm.model_executor.layers.fused_moe import SharedFusedMoE
+from vllm.model_executor.layers.fused_moe.config import RoutingMethodType
 from vllm.model_executor.layers.layernorm import (
     GemmaRMSNorm as Qwen3NextRMSNorm,
 )
@@ -173,6 +174,7 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
             enable_eplb=self.enable_eplb,
             num_redundant_experts=self.n_redundant_experts,
             is_sequence_parallel=self.is_sequence_parallel,
+            routing_method_type=RoutingMethodType.Renormalize,
         )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:

From 6d54336ae550528408e0c84cffb7857c426509f0 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?R=C3=A9mi=20Delacourt?=
 <54138269+Flechman@users.noreply.github.com>
Date: Mon, 10 Nov 2025 20:53:32 +0100
Subject: [PATCH 023/183] [Bugfix] Fix llguidance backend, rollback when EOS
 was encountered (#25905)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Signed-off-by: Rémi Delacourt <remi@mistral.ai>
Signed-off-by: remi <remi@mistral.ai>
Co-authored-by: Russell Bryant <rbryant@redhat.com>
---
 .../test_backend_guidance.py                  | 118 ++++++++++++++++++
 vllm/v1/structured_output/backend_guidance.py |  10 +-
 2 files changed, 126 insertions(+), 2 deletions(-)
 create mode 100644 tests/v1/structured_output/test_backend_guidance.py

diff --git a/tests/v1/structured_output/test_backend_guidance.py b/tests/v1/structured_output/test_backend_guidance.py
new file mode 100644
index 000000000000..771076186a3b
--- /dev/null
+++ b/tests/v1/structured_output/test_backend_guidance.py
@@ -0,0 +1,118 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from transformers import AutoTokenizer
+
+from vllm.config import StructuredOutputsConfig, VllmConfig
+from vllm.config.model import ModelConfig
+from vllm.config.speculative import SpeculativeConfig
+from vllm.sampling_params import SamplingParams, StructuredOutputsParams
+from vllm.v1.request import Request
+from vllm.v1.structured_output import StructuredOutputManager
+from vllm.v1.structured_output.backend_guidance import GuidanceBackend
+from vllm.v1.structured_output.backend_types import StructuredOutputOptions
+
+TOKENIZER = "gpt2"
+
+
+def test_backend_guidance_rollback_terminated():
+    # Test that the backend guidance successfully rollbacks from a
+    # terminated state. This can happen with speculative decoding,
+    # where the draft model proposes EOS and it is verified by the
+    # guidance backend. In that case we are in a stopped state, but
+    # it should be reverted in case EOS is not accepted by the target
+    # model.
+    vllm_config = VllmConfig(
+        decoding_config=StructuredOutputsConfig(
+            backend="guidance",
+        )
+    )
+    tokenizer = AutoTokenizer.from_pretrained(TOKENIZER)
+
+    backend = GuidanceBackend(
+        vllm_config,
+        tokenizer=tokenizer,
+        vocab_size=50257,
+    )
+
+    grammar = backend.compile_grammar(
+        StructuredOutputOptions.JSON, '{"type": "object"}'
+    )
+
+    prompt = tokenizer.encode('{"a": "b"}')
+    assert len(prompt) > 1
+    dummy_wrong = tokenizer.encode('{"a"}')
+    for token in prompt:
+        assert grammar.accept_tokens("", [token])
+    assert not grammar.is_terminated()
+    assert grammar.accept_tokens("", [tokenizer.eos_token_id])
+    assert grammar.is_terminated()
+    # Giving any other token should also be accepted
+    assert grammar.accept_tokens("", dummy_wrong)
+    # Rollback is done from where state was terminated, so from '}' not EOS
+    grammar.rollback(len(prompt) - 1)
+    assert not grammar.is_terminated()
+    assert grammar.validate_tokens([tokenizer.eos_token_id]) == []
+    assert grammar.validate_tokens(dummy_wrong) != dummy_wrong
+    assert grammar.accept_tokens("", prompt[1:])
+    assert not grammar.is_terminated()
+    assert grammar.accept_tokens("", [tokenizer.eos_token_id])
+    assert grammar.is_terminated()
+    # Rollback of <= 0 should not change the terminated state
+    grammar.rollback(0)
+    assert grammar.is_terminated()
+    grammar.rollback(-1)
+    assert grammar.is_terminated()
+
+
+def test_grammar_bitmask_with_specdec():
+    tokenizer = AutoTokenizer.from_pretrained(TOKENIZER)
+    prompt = tokenizer.encode('{"a": "b"}')
+    vllm_config = VllmConfig(
+        model_config=ModelConfig(tokenizer=TOKENIZER),
+        structured_outputs_config=StructuredOutputsConfig(backend="guidance"),
+        speculative_config=SpeculativeConfig(model="[ngram]", num_speculative_tokens=3),
+    )
+    structured_output_manager = StructuredOutputManager(vllm_config)
+
+    for i in range(1, 2):
+        sampling_params = SamplingParams(
+            structured_outputs=StructuredOutputsParams(
+                json='{"type": "object"}',
+            ),
+        )
+        sampling_params.structured_outputs._backend = "guidance"
+
+        my_req_id = f"my_req_id_{i}"
+        request = Request(
+            my_req_id,
+            prompt_token_ids=prompt[:i],
+            sampling_params=sampling_params,
+            pooling_params=None,
+            eos_token_id=tokenizer.eos_token_id,
+        )
+
+        structured_output_manager.grammar_init(request)
+
+        def grammar_bitmask(req: Request, tokens: list[int]) -> None:
+            structured_output_manager.grammar_bitmask(
+                requests={req.request_id: req},
+                structured_output_request_ids={req.request_id: 0},
+                scheduled_spec_decode_tokens={req.request_id: tokens},
+            )
+            # At this point, we rolled-back, so should not be terminated
+            assert not req.structured_output_request.grammar.is_terminated()
+
+        # The grammar might not yet be compiled, so we wait for it
+        while not request.structured_output_request._check_grammar_completion():
+            continue
+
+        assert request.structured_output_request.grammar.accept_tokens(
+            request.request_id, prompt[:i]
+        )
+
+        grammar_bitmask(request, prompt[i:] + [tokenizer.eos_token_id])
+        grammar_bitmask(
+            request, prompt[i:] + [tokenizer.eos_token_id] + prompt
+        )  # EOS not the final token
+        grammar_bitmask(request, prompt[i:])  # EOS not present
+        grammar_bitmask(request, prompt[i:] + [tokenizer.eos_token_id])
diff --git a/vllm/v1/structured_output/backend_guidance.py b/vllm/v1/structured_output/backend_guidance.py
index 00a625e103bd..2962a439dcb3 100644
--- a/vllm/v1/structured_output/backend_guidance.py
+++ b/vllm/v1/structured_output/backend_guidance.py
@@ -111,6 +111,7 @@ class GuidanceGrammar(StructuredOutputGrammar):
     vocab_size: int
     printed_error: bool = False
     terminated: bool = False
+    rollback_lag: int = 0
 
     def check_error(self):
         if not self.printed_error:
@@ -127,6 +128,8 @@ def accept_tokens(self, request_id: str, tokens: list[int]) -> bool:
         """
 
         if self.ll_tokenizer.eos_token in tokens:
+            if self.ll_matcher.is_stopped() and not self.terminated:
+                self.rollback_lag = 1
             self.terminated = True
 
         if self.ll_matcher.is_stopped():
@@ -163,8 +166,11 @@ def validate_tokens(self, tokens: list[int]) -> list[int]:
         return tokens[:num_tokens]
 
     def rollback(self, num_tokens: int) -> None:
-        self.ll_matcher.rollback(num_tokens)
-        self.check_error()
+        if num_tokens > 0:
+            self.ll_matcher.rollback(num_tokens - self.rollback_lag)
+            self.terminated = False
+            self.rollback_lag = 0
+            self.check_error()
 
     def fill_bitmask(self, bitmask: torch.Tensor, idx: int) -> None:
         # this will automatically return [EOS] mask if the matcher is stopped

From 9c84ca8293034cdf8a324f7bec3a60101e0e12c2 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Jonas=20M=2E=20K=C3=BCbler?=
 <44084297+jmkuebler@users.noreply.github.com>
Date: Mon, 10 Nov 2025 21:06:04 +0100
Subject: [PATCH 024/183] [FA/Chore] Bump FA version for FP8 two-level
 accumulation  (#27889)

Signed-off-by: Jonas Kuebler <kuebj@amazon.com>
Co-authored-by: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
---
 cmake/external_projects/vllm_flash_attn.cmake | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/cmake/external_projects/vllm_flash_attn.cmake b/cmake/external_projects/vllm_flash_attn.cmake
index 931090db50e9..29db9fa273a4 100644
--- a/cmake/external_projects/vllm_flash_attn.cmake
+++ b/cmake/external_projects/vllm_flash_attn.cmake
@@ -38,7 +38,7 @@ else()
   FetchContent_Declare(
           vllm-flash-attn
           GIT_REPOSITORY https://github.com/vllm-project/flash-attention.git
-          GIT_TAG a893712401d70362fbb299cd9c4b3476e8e9ed54
+          GIT_TAG 8e1b01d56210dc72030a2d0d41c2d8d266ba6309
           GIT_PROGRESS TRUE
           # Don't share the vllm-flash-attn build between build types
           BINARY_DIR ${CMAKE_BINARY_DIR}/vllm-flash-attn

From 40d33264c680a8c725b93db6ccce608f99e5c7da Mon Sep 17 00:00:00 2001
From: Sage Moore <sage@neuralmagic.com>
Date: Mon, 10 Nov 2025 12:39:19 -0800
Subject: [PATCH 025/183] [Bugfix][EPLB] Disabled shared expert overlap when
 EPLB is enabled (#28377)

Signed-off-by: Sage Moore <sage@neuralmagic.com>
Signed-off-by: Sage Moore <sagemoore@utexas.edu>
Signed-off-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
---
 .../layers/fused_moe/shared_fused_moe.py          | 15 ++++++++++-----
 1 file changed, 10 insertions(+), 5 deletions(-)

diff --git a/vllm/model_executor/layers/fused_moe/shared_fused_moe.py b/vllm/model_executor/layers/fused_moe/shared_fused_moe.py
index 6b4a0b8cf073..3d0c5636d6c0 100644
--- a/vllm/model_executor/layers/fused_moe/shared_fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/shared_fused_moe.py
@@ -28,13 +28,18 @@ def __init__(
         super().__init__(**kwargs)
         self._shared_experts = shared_experts
 
-        # Disable shared expert overlap if we are not using
-        # flashinfer + DP since there is nothing to be gained in this case.
-        # Disabling the overlap optimization also prevents the shared experts
-        # from being hidden from torch.compile.
+        # Disable shared expert overlap if we are using eplb, because of
+        # correctness issues, or if using flashinfer with DP, since there
+        # is nothing to be gained in this case. Disabling the overlap
+        # optimization also prevents the shared experts from being hidden
+        # from torch.compile.
         self.use_overlapped = (
             use_overlapped
-            and not (self.use_flashinfer_cutlass_kernels and self.dp_size > 1)
+            and not (
+                # TODO(wentao): find the root cause and remove this condition
+                self.enable_eplb
+                or (self.use_flashinfer_cutlass_kernels and self.dp_size > 1)
+            )
             and self._shared_experts is not None
         )
 

From bf6a3d0ff5a69e0a30567f2ad417530c002eaa4e Mon Sep 17 00:00:00 2001
From: Wei Wei <wwei6@meta.com>
Date: Mon, 10 Nov 2025 13:03:21 -0800
Subject: [PATCH 026/183] [Misc] Add more scoping for improved trace (#28329)

Signed-off-by: Wei Wei <wwei6@meta.com>
---
 vllm/v1/core/sched/scheduler.py    | 116 ++++++++++++++--------------
 vllm/v1/engine/core.py             | 117 ++++++++++++++++++-----------
 vllm/v1/engine/llm_engine.py       |  37 +++++----
 vllm/v1/worker/gpu_model_runner.py |  70 +++++++++--------
 4 files changed, 192 insertions(+), 148 deletions(-)

diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index c17b19b58c97..46dc1071b839 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -38,6 +38,7 @@
 from vllm.v1.request import Request, RequestStatus
 from vllm.v1.spec_decode.metrics import SpecDecodingStats
 from vllm.v1.structured_output import StructuredOutputManager
+from vllm.v1.utils import record_function_or_nullcontext
 
 logger = init_logger(__name__)
 
@@ -259,49 +260,52 @@ def schedule(self) -> SchedulerOutput:
                 continue
 
             # Schedule newly needed KV blocks for the request.
-            while True:
-                new_blocks = self.kv_cache_manager.allocate_slots(
-                    request,
-                    num_new_tokens,
-                    num_lookahead_tokens=self.num_lookahead_tokens,
-                )
-
-                if new_blocks is not None:
-                    # The request can be scheduled.
-                    break
-
-                # The request cannot be scheduled.
-                # Preempt the lowest-priority request.
-                if self.policy == SchedulingPolicy.PRIORITY:
-                    preempted_req = max(
-                        self.running,
-                        key=lambda r: (r.priority, r.arrival_time),
+            with record_function_or_nullcontext("schedule: allocate_slots"):
+                while True:
+                    new_blocks = self.kv_cache_manager.allocate_slots(
+                        request,
+                        num_new_tokens,
+                        num_lookahead_tokens=self.num_lookahead_tokens,
                     )
-                    self.running.remove(preempted_req)
-                    if preempted_req in scheduled_running_reqs:
-                        scheduled_running_reqs.remove(preempted_req)
-                        token_budget += num_scheduled_tokens[preempted_req.request_id]
-                        req_to_new_blocks.pop(preempted_req.request_id)
-                        num_scheduled_tokens.pop(preempted_req.request_id)
-                        req_index -= 1
-                else:
-                    preempted_req = self.running.pop()
 
-                self.kv_cache_manager.free(preempted_req)
-                self.encoder_cache_manager.free(preempted_req)
-                preempted_req.status = RequestStatus.PREEMPTED
-                preempted_req.num_computed_tokens = 0
-                preempted_req.num_preemptions += 1
-                if self.log_stats:
-                    preempted_req.record_event(
-                        EngineCoreEventType.PREEMPTED, scheduled_timestamp
-                    )
+                    if new_blocks is not None:
+                        # The request can be scheduled.
+                        break
 
-                self.waiting.prepend_request(preempted_req)
-                preempted_reqs.append(preempted_req)
-                if preempted_req == request:
-                    # No more request to preempt. Cannot schedule this request.
-                    break
+                    # The request cannot be scheduled.
+                    # Preempt the lowest-priority request.
+                    if self.policy == SchedulingPolicy.PRIORITY:
+                        preempted_req = max(
+                            self.running,
+                            key=lambda r: (r.priority, r.arrival_time),
+                        )
+                        self.running.remove(preempted_req)
+                        if preempted_req in scheduled_running_reqs:
+                            scheduled_running_reqs.remove(preempted_req)
+                            token_budget += num_scheduled_tokens[
+                                preempted_req.request_id
+                            ]
+                            req_to_new_blocks.pop(preempted_req.request_id)
+                            num_scheduled_tokens.pop(preempted_req.request_id)
+                            req_index -= 1
+                    else:
+                        preempted_req = self.running.pop()
+
+                    self.kv_cache_manager.free(preempted_req)
+                    self.encoder_cache_manager.free(preempted_req)
+                    preempted_req.status = RequestStatus.PREEMPTED
+                    preempted_req.num_computed_tokens = 0
+                    preempted_req.num_preemptions += 1
+                    if self.log_stats:
+                        preempted_req.record_event(
+                            EngineCoreEventType.PREEMPTED, scheduled_timestamp
+                        )
+
+                    self.waiting.prepend_request(preempted_req)
+                    preempted_reqs.append(preempted_req)
+                    if preempted_req == request:
+                        # No more request to preempt. Cannot schedule this request.
+                        break
 
             if new_blocks is None:
                 # Cannot schedule this request.
@@ -599,13 +603,14 @@ def schedule(self) -> SchedulerOutput:
         # Get the longest common prefix among all requests in the running queue.
         # This can be potentially used for cascade attention.
         num_common_prefix_blocks = [0] * len(self.kv_cache_config.kv_cache_groups)
-        if self.running:
-            any_request = self.running[0]
-            num_common_prefix_blocks = (
-                self.kv_cache_manager.get_num_common_prefix_blocks(
-                    any_request.request_id
+        with record_function_or_nullcontext("schedule: get_num_common_prefix_blocks"):
+            if self.running:
+                any_request = self.running[0]
+                num_common_prefix_blocks = (
+                    self.kv_cache_manager.get_num_common_prefix_blocks(
+                        any_request.request_id
+                    )
                 )
-            )
 
         # Construct the scheduler output.
         new_reqs_data = [
@@ -614,13 +619,14 @@ def schedule(self) -> SchedulerOutput:
             )
             for req in scheduled_new_reqs
         ]
-        cached_reqs_data = self._make_cached_request_data(
-            scheduled_running_reqs,
-            scheduled_resumed_reqs,
-            num_scheduled_tokens,
-            scheduled_spec_decode_tokens,
-            req_to_new_blocks,
-        )
+        with record_function_or_nullcontext("schedule: make_cached_request_data"):
+            cached_reqs_data = self._make_cached_request_data(
+                scheduled_running_reqs,
+                scheduled_resumed_reqs,
+                num_scheduled_tokens,
+                scheduled_spec_decode_tokens,
+                req_to_new_blocks,
+            )
 
         # Record the request ids that were scheduled in this step.
         self.prev_step_scheduled_req_ids.clear()
@@ -649,8 +655,8 @@ def schedule(self) -> SchedulerOutput:
         if self.connector is not None:
             meta = self.connector.build_connector_meta(scheduler_output)
             scheduler_output.kv_connector_metadata = meta
-
-        self._update_after_schedule(scheduler_output)
+        with record_function_or_nullcontext("schedule: update_after_schedule"):
+            self._update_after_schedule(scheduler_output)
         return scheduler_output
 
     def _update_after_schedule(
diff --git a/vllm/v1/engine/core.py b/vllm/v1/engine/core.py
index fba018432e0a..c3efd52130cc 100644
--- a/vllm/v1/engine/core.py
+++ b/vllm/v1/engine/core.py
@@ -61,6 +61,7 @@
 from vllm.v1.request import Request, RequestStatus
 from vllm.v1.serial_utils import MsgpackDecoder, MsgpackEncoder
 from vllm.v1.structured_output import StructuredOutputManager
+from vllm.v1.utils import record_function_or_nullcontext
 from vllm.version import __version__ as VLLM_VERSION
 
 logger = init_logger(__name__)
@@ -315,17 +316,21 @@ def step(self) -> tuple[dict[int, EngineCoreOutputs], bool]:
         # or finished and not yet removed from the batch.
         if not self.scheduler.has_requests():
             return {}, False
-        scheduler_output = self.scheduler.schedule()
-        future = self.model_executor.execute_model(scheduler_output, non_block=True)
-        grammar_output = self.scheduler.get_grammar_bitmask(scheduler_output)
-        with self.log_error_detail(scheduler_output):
-            model_output = future.result()
-            if model_output is None:
-                model_output = self.model_executor.sample_tokens(grammar_output)
-
-        engine_core_outputs = self.scheduler.update_from_output(
-            scheduler_output, model_output
-        )
+        with record_function_or_nullcontext("core step: schedule"):
+            scheduler_output = self.scheduler.schedule()
+
+        with record_function_or_nullcontext("core step: execute_model"):
+            future = self.model_executor.execute_model(scheduler_output, non_block=True)
+            grammar_output = self.scheduler.get_grammar_bitmask(scheduler_output)
+            with self.log_error_detail(scheduler_output):
+                model_output = future.result()
+                if model_output is None:
+                    model_output = self.model_executor.sample_tokens(grammar_output)
+
+        with record_function_or_nullcontext("core step: update_from_output"):
+            engine_core_outputs = self.scheduler.update_from_output(
+                scheduler_output, model_output
+            )
 
         return engine_core_outputs, scheduler_output.total_num_scheduled_tokens > 0
 
@@ -363,32 +368,49 @@ def step_with_batch_queue(
         model_executed = False
         deferred_scheduler_output = None
         if self.scheduler.has_requests():
-            scheduler_output = self.scheduler.schedule()
-            exec_future = self.model_executor.execute_model(
-                scheduler_output, non_block=True
-            )
+            with record_function_or_nullcontext("core step_with_batch_queue: schedule"):
+                scheduler_output = self.scheduler.schedule()
+            with record_function_or_nullcontext(
+                "core step_with_batch_queue: execute_model"
+            ):
+                exec_future = self.model_executor.execute_model(
+                    scheduler_output, non_block=True
+                )
             model_executed = scheduler_output.total_num_scheduled_tokens > 0
 
             if scheduler_output.pending_structured_output_tokens:
-                # We need to defer sampling until we have processed the model output
-                # from the prior step.
-                deferred_scheduler_output = scheduler_output
-                # Block-wait for execute to return (continues running async on the GPU).
-                with self.log_error_detail(scheduler_output):
-                    exec_result = exec_future.result()
-                    assert exec_result is None
+                with record_function_or_nullcontext(
+                    "core step_with_batch_queue: pending_structured_output_tokens"
+                ):
+                    # We need to defer sampling until we have processed the model output
+                    # from the prior step.
+                    deferred_scheduler_output = scheduler_output
+                    # Block-wait for execute to return
+                    # (continues running async on the GPU).
+                    with self.log_error_detail(scheduler_output):
+                        exec_result = exec_future.result()
+                        assert exec_result is None
             else:
-                # We aren't waiting for any tokens, get any grammar output immediately.
-                grammar_output = self.scheduler.get_grammar_bitmask(scheduler_output)
+                with record_function_or_nullcontext(
+                    "core step_with_batch_queue: get_grammar_bitmask"
+                ):
+                    # We aren't waiting for any tokens, get any grammar
+                    # output immediately.
+                    grammar_output = self.scheduler.get_grammar_bitmask(
+                        scheduler_output
+                    )
                 # Block-wait for execute to return (continues running async on the GPU).
                 with self.log_error_detail(scheduler_output):
                     exec_result = exec_future.result()
 
                 if exec_result is None:
-                    # Call sample tokens.
-                    future = self.model_executor.sample_tokens(
-                        grammar_output, non_block=True
-                    )
+                    with record_function_or_nullcontext(
+                        "core step_with_batch_queue: sample_tokens"
+                    ):
+                        # Call sample tokens.
+                        future = self.model_executor.sample_tokens(
+                            grammar_output, non_block=True
+                        )
                 else:
                     # No sampling required (e.g. all requests finished).
                     future = cast(Future[ModelRunnerOutput], exec_future)
@@ -408,27 +430,34 @@ def step_with_batch_queue(
             # only be called when the scheduler contains requests or the queue
             # is non-empty.
             return None, False
-
-        # Block until the next result is available.
-        future, scheduler_output = batch_queue.pop()
-        with self.log_error_detail(scheduler_output):
-            model_output = future.result()
-
-        engine_core_outputs = self.scheduler.update_from_output(
-            scheduler_output, model_output
-        )
+        with record_function_or_nullcontext("core step_with_batch_queue: model_output"):
+            # Block until the next result is available.
+            future, scheduler_output = batch_queue.pop()
+            with self.log_error_detail(scheduler_output):
+                model_output = future.result()
+        with record_function_or_nullcontext(
+            "core step_with_batch_queue: update_from_output"
+        ):
+            engine_core_outputs = self.scheduler.update_from_output(
+                scheduler_output, model_output
+            )
 
         # NOTE(nick): We can either handle the deferred tasks here or save
         # in a field and do it immediately once step_with_batch_queue is
         # re-called. The latter slightly favors TTFT over TPOT/throughput.
         if deferred_scheduler_output:
-            # We now have the tokens needed to compute the bitmask for the
-            # deferred request. Get the bitmask and call sample tokens.
-            grammar_output = self.scheduler.get_grammar_bitmask(
-                deferred_scheduler_output
-            )
-            future = self.model_executor.sample_tokens(grammar_output, non_block=True)
-            batch_queue.appendleft((future, deferred_scheduler_output))
+            with record_function_or_nullcontext(
+                "core step_with_batch_queue: deferred_scheduler_output"
+            ):
+                # We now have the tokens needed to compute the bitmask for the
+                # deferred request. Get the bitmask and call sample tokens.
+                grammar_output = self.scheduler.get_grammar_bitmask(
+                    deferred_scheduler_output
+                )
+                future = self.model_executor.sample_tokens(
+                    grammar_output, non_block=True
+                )
+                batch_queue.appendleft((future, deferred_scheduler_output))
 
         return engine_core_outputs, model_executed
 
diff --git a/vllm/v1/engine/llm_engine.py b/vllm/v1/engine/llm_engine.py
index e32c74aff313..d27d13840989 100644
--- a/vllm/v1/engine/llm_engine.py
+++ b/vllm/v1/engine/llm_engine.py
@@ -36,6 +36,7 @@
 from vllm.v1.metrics.loggers import StatLoggerFactory, StatLoggerManager
 from vllm.v1.metrics.reader import Metric, get_metrics_snapshot
 from vllm.v1.metrics.stats import IterationStats
+from vllm.v1.utils import record_function_or_nullcontext
 from vllm.v1.worker.worker_base import WorkerBase
 
 logger = init_logger(__name__)
@@ -280,28 +281,32 @@ def step(self) -> list[RequestOutput | PoolingRequestOutput]:
             return []
 
         # 1) Get EngineCoreOutput from the EngineCore.
-        outputs = self.engine_core.get_output()
+        with record_function_or_nullcontext("llm_genine step: get_output"):
+            outputs = self.engine_core.get_output()
 
         # 2) Process EngineCoreOutputs.
-        iteration_stats = IterationStats() if self.log_stats else None
-        processed_outputs = self.output_processor.process_outputs(
-            outputs.outputs,
-            engine_core_timestamp=outputs.timestamp,
-            iteration_stats=iteration_stats,
-        )
-        self.output_processor.update_scheduler_stats(outputs.scheduler_stats)
+        with record_function_or_nullcontext("llm_genine step: process_outputs"):
+            iteration_stats = IterationStats() if self.log_stats else None
+            processed_outputs = self.output_processor.process_outputs(
+                outputs.outputs,
+                engine_core_timestamp=outputs.timestamp,
+                iteration_stats=iteration_stats,
+            )
+            self.output_processor.update_scheduler_stats(outputs.scheduler_stats)
 
         # 3) Abort any reqs that finished due to stop strings.
-        self.engine_core.abort_requests(processed_outputs.reqs_to_abort)
+        with record_function_or_nullcontext("llm_genine step: abort_requests"):
+            self.engine_core.abort_requests(processed_outputs.reqs_to_abort)
 
         # 4) Record stats
-        if self.logger_manager is not None and outputs.scheduler_stats is not None:
-            self.logger_manager.record(
-                scheduler_stats=outputs.scheduler_stats,
-                iteration_stats=iteration_stats,
-                mm_cache_stats=self.processor.stat_mm_cache(),
-            )
-            self.do_log_stats_with_interval()
+        with record_function_or_nullcontext("llm_genine step: record_stats"):
+            if self.logger_manager is not None and outputs.scheduler_stats is not None:
+                self.logger_manager.record(
+                    scheduler_stats=outputs.scheduler_stats,
+                    iteration_stats=iteration_stats,
+                    mm_cache_stats=self.processor.stat_mm_cache(),
+                )
+                self.do_log_stats_with_interval()
 
         return processed_outputs.request_outputs
 
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 26007d29d61b..9403b5756e05 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -2525,7 +2525,7 @@ def execute_model(
                 "after execute_model() returns None."
             )
         num_scheduled_tokens = scheduler_output.total_num_scheduled_tokens
-        with record_function_or_nullcontext("Preprocess"):
+        with record_function_or_nullcontext("gpu_model_runner: preprocess"):
             with self.synchronize_input_prep():
                 # Update persistent batch states.
                 self._update_states(scheduler_output)
@@ -2648,7 +2648,7 @@ def execute_model(
                 batch_descriptor=batch_descriptor,
                 ubatch_slices=ubatch_slices,
             ),
-            record_function_or_nullcontext("Forward"),
+            record_function_or_nullcontext("gpu_model_runner: forward"),
             self.maybe_get_kv_connector_output(scheduler_output) as kv_connector_output,
         ):
             model_output = self._model_forward(
@@ -2659,7 +2659,7 @@ def execute_model(
                 **model_kwargs,
             )
 
-        with record_function_or_nullcontext("Postprocess"):
+        with record_function_or_nullcontext("gpu_model_runner: postprocess"):
             if self.use_aux_hidden_state_outputs:
                 # True when EAGLE 3 is used.
                 hidden_states, aux_hidden_states = model_output
@@ -2756,12 +2756,12 @@ def sample_tokens(
                 scheduler_output, grammar_output, self.input_batch, logits
             )
 
-        with record_function_or_nullcontext("Sample"):
+        with record_function_or_nullcontext("gpu_model_runner: sample"):
             sampler_output = self._sample(logits, spec_decode_metadata)
 
         def propose_draft_token_ids(sampled_token_ids):
             assert spec_decode_common_attn_metadata is not None
-            with record_function_or_nullcontext("Draft"):
+            with record_function_or_nullcontext("gpu_model_runner: draft"):
                 self._draft_token_ids = self.propose_draft_token_ids(
                     scheduler_output,
                     sampled_token_ids,
@@ -2799,7 +2799,7 @@ def propose_draft_token_ids(sampled_token_ids):
             # as inputs, and does not need to wait for bookkeeping to finish.
             propose_draft_token_ids(sampler_output.sampled_token_ids)
 
-        with record_function_or_nullcontext("Bookkeep"):
+        with record_function_or_nullcontext("gpu_model_runner: bookkeep"):
             (
                 num_nans_in_logits,
                 logprobs_lists,
@@ -2826,37 +2826,41 @@ def propose_draft_token_ids(sampled_token_ids):
             # tokens on the CPU, so they are run after bookkeeping.
             propose_draft_token_ids(valid_sampled_token_ids)
 
-        with record_function_or_nullcontext("EPLB"):
+        with record_function_or_nullcontext("gpu_model_runner: eplb"):
             self.eplb_step()
-
-        output = ModelRunnerOutput(
-            req_ids=req_ids_output_copy,
-            req_id_to_index=req_id_to_index_output_copy,
-            sampled_token_ids=valid_sampled_token_ids,
-            logprobs=logprobs_lists,
-            prompt_logprobs_dict=prompt_logprobs_dict,
-            pooler_output=[],
-            kv_connector_output=kv_connector_output,
-            num_nans_in_logits=num_nans_in_logits,
-        )
+        with record_function_or_nullcontext("gpu_model_runner: ModelRunnerOutput"):
+            output = ModelRunnerOutput(
+                req_ids=req_ids_output_copy,
+                req_id_to_index=req_id_to_index_output_copy,
+                sampled_token_ids=valid_sampled_token_ids,
+                logprobs=logprobs_lists,
+                prompt_logprobs_dict=prompt_logprobs_dict,
+                pooler_output=[],
+                kv_connector_output=kv_connector_output,
+                num_nans_in_logits=num_nans_in_logits,
+            )
 
         if not self.use_async_scheduling:
             return output
-
-        async_output = AsyncGPUModelRunnerOutput(
-            model_runner_output=output,
-            sampled_token_ids=sampler_output.sampled_token_ids,
-            logprobs_tensors=sampler_output.logprobs_tensors,
-            invalid_req_indices=invalid_req_indices,
-            async_output_copy_stream=self.async_output_copy_stream,
-        )
-
-        # Save ref of sampled_token_ids CPU tensor if the batch contains
-        # any requests with sampling params that that require output ids.
-        self.input_batch.set_async_sampled_token_ids(
-            async_output.sampled_token_ids_cpu,
-            async_output.async_copy_ready_event,
-        )
+        with record_function_or_nullcontext(
+            "gpu_model_runner: AsyncGPUModelRunnerOutput"
+        ):
+            async_output = AsyncGPUModelRunnerOutput(
+                model_runner_output=output,
+                sampled_token_ids=sampler_output.sampled_token_ids,
+                logprobs_tensors=sampler_output.logprobs_tensors,
+                invalid_req_indices=invalid_req_indices,
+                async_output_copy_stream=self.async_output_copy_stream,
+            )
+        with record_function_or_nullcontext(
+            "gpu_model_runner: set_async_sampled_token_ids"
+        ):
+            # Save ref of sampled_token_ids CPU tensor if the batch contains
+            # any requests with sampling params that that require output ids.
+            self.input_batch.set_async_sampled_token_ids(
+                async_output.sampled_token_ids_cpu,
+                async_output.async_copy_ready_event,
+            )
 
         return async_output
 

From 6dec9f61098786690b4ca2140682dbafb849f8d9 Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Mon, 10 Nov 2025 17:01:17 -0500
Subject: [PATCH 027/183] [BugFix] Fix DeepGEMM over-allocating workspace
 (#28254)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
---
 vllm/model_executor/layers/fused_moe/deep_gemm_moe.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/layers/fused_moe/deep_gemm_moe.py b/vllm/model_executor/layers/fused_moe/deep_gemm_moe.py
index 484b8aa9d107..86cdd25f2c87 100644
--- a/vllm/model_executor/layers/fused_moe/deep_gemm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/deep_gemm_moe.py
@@ -215,7 +215,7 @@ def workspace_shapes(
         )
         assert M_sum % block_m == 0
 
-        workspace1 = (M_sum, max(N, K))
+        workspace1 = (M_sum, N)
         workspace2 = (M_sum, max(N // 2, K))
         output = (M, K)
         return (workspace1, workspace2, output)

From 4b94ed8f928533b1f7c3a0293790ccb592b49f1a Mon Sep 17 00:00:00 2001
From: Andrew Xia <axia@meta.com>
Date: Mon, 10 Nov 2025 14:07:49 -0800
Subject: [PATCH 028/183] [Frontend][2/n] remove empty content from
 _parse_tool_calls_from_content (#28331)

Signed-off-by: Andrew Xia <axia@fb.com>
Co-authored-by: Andrew Xia <axia@fb.com>
---
 vllm/entrypoints/openai/serving_engine.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/vllm/entrypoints/openai/serving_engine.py b/vllm/entrypoints/openai/serving_engine.py
index 8ce4ff574699..30b8499b08d5 100644
--- a/vllm/entrypoints/openai/serving_engine.py
+++ b/vllm/entrypoints/openai/serving_engine.py
@@ -1375,6 +1375,8 @@ def _parse_tool_calls_from_content(
                     for tool_call in tool_call_info.tool_calls
                 )
                 content = tool_call_info.content
+                if content and content.strip() == "":
+                    content = None
             else:
                 # No tool calls.
                 return None, content

From 30700b1cd7de51f191be718215a58f5a8ddcb8aa Mon Sep 17 00:00:00 2001
From: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com>
Date: Mon, 10 Nov 2025 17:36:11 -0500
Subject: [PATCH 029/183] [CI] Fix Plugin Tests Tests (#28413)

Signed-off-by: Robert Shaw <robertgshaw2@gmail.com>
---
 vllm/config/vllm.py | 24 +++++++++++++-----------
 1 file changed, 13 insertions(+), 11 deletions(-)

diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index d4ee6f980e6e..0fca967d9083 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -608,17 +608,19 @@ def __post_init__(self):
             )
         current_platform.check_and_update_config(self)
 
-        assert (
-            self.parallel_config.dcp_kv_cache_interleave_size
-            <= self.cache_config.block_size
-            and self.cache_config.block_size
-            % self.parallel_config.dcp_kv_cache_interleave_size
-            == 0
-        ), (
-            f"Block_size({self.cache_config.block_size}) should be "
-            "greater than or equal to and divisible by dcp_kv_cache_interleave_size "
-            f"({self.parallel_config.dcp_kv_cache_interleave_size})."
-        )
+        # If DCP, ensure the block size is right.
+        if self.parallel_config.decode_context_parallel_size > 1:
+            assert (
+                self.parallel_config.dcp_kv_cache_interleave_size
+                <= self.cache_config.block_size
+                and self.cache_config.block_size
+                % self.parallel_config.dcp_kv_cache_interleave_size
+                == 0
+            ), (
+                f"Block_size({self.cache_config.block_size}) should be greater "
+                "than or equal to and divisible by dcp_kv_cache_interleave_size "
+                f"({self.parallel_config.dcp_kv_cache_interleave_size})."
+            )
 
         assert (
             self.parallel_config.dcp_kv_cache_interleave_size == 1

From 021143561fcffa9bee133d0b3bd311bc5cb3703c Mon Sep 17 00:00:00 2001
From: Yong Hoon Shin <48474650+sarckk@users.noreply.github.com>
Date: Mon, 10 Nov 2025 13:13:36 -1000
Subject: [PATCH 030/183] [ROCm] Add missing gemm_a8w8_blockscale import
 (#28378)

Signed-off-by: Yong Hoon Shin <yhshin@meta.com>
---
 .../layers/quantization/utils/fp8_utils.py    | 41 ++++++++++---------
 1 file changed, 21 insertions(+), 20 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/utils/fp8_utils.py b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
index 63726c07b7d1..c63196b89357 100644
--- a/vllm/model_executor/layers/quantization/utils/fp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
@@ -316,38 +316,39 @@ def _run_aiter(
         assert self.act_quant_group_shape == GroupShape(1, 128)
 
         n, k = weight.shape
-        if input_scale is not None:
-            q_input = input_2d
 
-        # MI350 case uses triton kernel
-        if (
+        use_triton = (
             not current_platform.is_fp8_fnuz()
             and rocm_aiter_ops.is_triton_gemm_w8a8_tuned(n, k)
-        ):
+        )
+
+        if use_triton:
+            gemm_a8w8_blockscale_op = rocm_aiter_ops.triton_gemm_a8w8_blockscale
+        else:
+            gemm_a8w8_blockscale_op = rocm_aiter_ops.gemm_w8a8_blockscale
+
+        if input_scale is not None:
+            q_input = input_2d
+        # MI350 case uses triton kernel
+        elif use_triton:
             q_input, input_scale = per_token_group_quant_fp8(
                 input_2d,
                 self.act_quant_group_shape.col,
                 column_major_scales=False,
                 use_ue8m0=False,
             )
-            return rocm_aiter_ops.triton_gemm_a8w8_blockscale(
-                q_input,
-                weight,
-                input_scale,
-                weight_scale,
-                input_2d.dtype,
-            )
-
         # MI300 uses tuned AITER ASM/C++ kernel
         else:
             q_input, input_scale = rocm_aiter_ops.per_1x128_fp8_quant(input_2d)
-            return rocm_aiter_ops.gemm_w8a8_blockscale(
-                q_input,
-                weight,
-                input_scale,
-                weight_scale,
-                input_2d.dtype,
-            )
+
+        return gemm_a8w8_blockscale_op(
+            q_input,
+            weight,
+            input_scale,
+            weight_scale,
+            list(self.weight_group_shape),
+            output_dtype=input_2d.dtype,
+        )
 
     def _run_triton(
         self,

From d17ecc6b19b597615893be6c0eb61c9b4a9c9455 Mon Sep 17 00:00:00 2001
From: Ilya Markov <markovilya197@gmail.com>
Date: Tue, 11 Nov 2025 00:33:11 +0100
Subject: [PATCH 031/183] [PERF] Allreduce fusion. Support torch native
 matching. Tuning of the thresholds (#24248)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Signed-off-by: Luka Govedič <lgovedic@redhat.com>
Signed-off-by: Luka Govedič <ProExpertProg@users.noreply.github.com>
Signed-off-by: ilmarkov <markovilya197@gmail.com>
Co-authored-by: Luka Govedič <lgovedic@redhat.com>
Co-authored-by: Luka Govedič <ProExpertProg@users.noreply.github.com>
Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com>
---
 .buildkite/test-pipeline.yaml                 |    4 +-
 .../kernels/benchmark_fused_collective.py     | 1129 +++++++++++++++++
 tests/compile/test_fusions_e2e.py             |    7 +
 vllm/compilation/collective_fusion.py         |  132 +-
 vllm/config/compilation.py                    |   50 +-
 vllm/model_executor/layers/fused_moe/layer.py |   45 +-
 6 files changed, 1284 insertions(+), 83 deletions(-)
 create mode 100644 benchmarks/kernels/benchmark_fused_collective.py

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index b81c090fa471..3152cd6488f3 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -463,8 +463,8 @@ steps:
   - pytest -v -s compile/test_multimodal_compile.py
   - pytest -v -s compile/piecewise/
 
-- label: PyTorch Fullgraph Test # 22min
-  timeout_in_minutes: 35
+- label: PyTorch Fullgraph Test # 27min
+  timeout_in_minutes: 40
   mirror_hardwares: [amdexperimental]
   torch_nightly: true
   source_file_dependencies:
diff --git a/benchmarks/kernels/benchmark_fused_collective.py b/benchmarks/kernels/benchmark_fused_collective.py
new file mode 100644
index 000000000000..38e7fdcf5542
--- /dev/null
+++ b/benchmarks/kernels/benchmark_fused_collective.py
@@ -0,0 +1,1129 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+"""
+Benchmark for FlashInfer fused collective operations vs standard operations.
+
+This benchmark compares:
+1. FlashInfer's trtllm_allreduce_fusion (fused allreduce + rmsnorm + optional quant)
+2. Standard tensor_model_parallel_all_reduce + separate rmsnorm/quant operations
+
+Usage with torchrun:
+    torchrun --nproc_per_node=2 benchmark_fused_collective.py
+
+"""
+
+import argparse
+import itertools
+import os
+import time
+
+import pandas as pd
+import torch  # type: ignore
+import torch.distributed as dist  # type: ignore
+
+from vllm.config.vllm import CompilationConfig, VllmConfig, set_current_vllm_config
+from vllm.distributed import (
+    get_tp_group,
+    tensor_model_parallel_all_reduce,
+)
+from vllm.distributed.parallel_state import (
+    graph_capture,
+    init_distributed_environment,
+    initialize_model_parallel,
+)
+from vllm.logger import init_logger
+from vllm.model_executor.layers.layernorm import RMSNorm  # noqa
+from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8  # noqa
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape  # noqa
+from vllm.platforms import current_platform  # noqa
+
+RMS_NORM_OP = torch.ops._C.rms_norm
+FUSED_ADD_RMS_NORM_OP = torch.ops._C.fused_add_rms_norm
+RMS_NORM_STATIC_FP8_QUANT_OP = torch.ops._C.rms_norm_static_fp8_quant
+FUSED_ADD_RMS_NORM_STATIC_FP8_QUANT_OP = (
+    torch.ops._C.fused_add_rms_norm_static_fp8_quant
+)
+SCALED_FP4_QUANT_OP = torch.ops._C.scaled_fp4_quant
+
+logger = init_logger(__name__)
+
+# Try to import FlashInfer
+try:
+    import flashinfer.comm as flashinfer_comm  # type: ignore
+
+    if not hasattr(flashinfer_comm, "trtllm_allreduce_fusion"):
+        flashinfer_comm = None
+        logger.warning(
+            "FlashInfer comm module found but missing trtllm_allreduce_fusion"
+        )
+except ImportError:
+    flashinfer_comm = None
+    logger.warning("FlashInfer not found, only benchmarking standard operations")
+
+# Constants
+FP8_DTYPE = current_platform.fp8_dtype()
+MiB = 1024 * 1024
+
+# FlashInfer max sizes per world size
+# Enable 64MB for 2, 4, 8 world sizes to verify large input sizes
+# use --disable-oneshot to disable oneshot mode for very large input sizes
+_FI_MAX_SIZES = {
+    2: 64 * MiB,  # 64MB
+    4: 64 * MiB,  # 64MB
+    8: 64 * MiB,  # 64MB
+}
+
+# Global workspace tensor for FlashInfer
+_FI_WORKSPACE_TENSOR = None
+
+
+def setup_flashinfer_workspace(
+    world_size: int,
+    rank: int,
+    hidden_dim: int,
+    max_token_num: int,
+    use_fp32_lamport: bool = False,
+):
+    """Setup FlashInfer workspace for fused allreduce operations."""
+    global _FI_WORKSPACE_TENSOR
+
+    if flashinfer_comm is None:
+        return None, None
+
+    if world_size not in _FI_MAX_SIZES:
+        logger.warning("FlashInfer not supported for world size %s", world_size)
+        return None, None
+
+    try:
+        # Create IPC workspace
+        ipc_handles, workspace_tensor = (
+            flashinfer_comm.trtllm_create_ipc_workspace_for_all_reduce_fusion(
+                tp_rank=rank,
+                tp_size=world_size,
+                max_token_num=max_token_num,
+                hidden_dim=hidden_dim,
+                group=get_tp_group().device_group,
+                use_fp32_lamport=use_fp32_lamport,
+            )
+        )
+
+        _FI_WORKSPACE_TENSOR = workspace_tensor
+        return ipc_handles, workspace_tensor
+    except Exception as e:
+        logger.error("Failed to setup FlashInfer workspace: %s", e)
+        return None, None
+
+
+def cleanup_flashinfer_workspace(ipc_handles):
+    """Cleanup FlashInfer workspace."""
+    if flashinfer_comm is None or ipc_handles is None:
+        return
+
+    try:
+        group = get_tp_group().device_group
+        flashinfer_comm.trtllm_destroy_ipc_workspace_for_all_reduce(ipc_handles, group)
+    except Exception as e:
+        logger.error("Failed to cleanup FlashInfer workspace: %s", e)
+
+
+class FlashInferFusedAllReduceParams:
+    """Parameters for FlashInfer fused allreduce operations."""
+
+    def __init__(
+        self,
+        rank: int,
+        world_size: int,
+        use_fp32_lamport: bool = False,
+        max_token_num: int = 1024,
+    ):
+        self.rank = rank
+        self.world_size = world_size
+        self.use_fp32_lamport = use_fp32_lamport
+        self.trigger_completion_at_end = True
+        self.launch_with_pdl = True
+        self.fp32_acc = True
+        self.max_token_num = max_token_num
+
+    def get_trtllm_fused_allreduce_kwargs(self):
+        return {
+            "world_rank": self.rank,
+            "world_size": self.world_size,
+            "launch_with_pdl": self.launch_with_pdl,
+            "trigger_completion_at_end": self.trigger_completion_at_end,
+            "fp32_acc": self.fp32_acc,
+        }
+
+
+def flashinfer_fused_allreduce_rmsnorm(
+    input_tensor: torch.Tensor,
+    residual: torch.Tensor | None,
+    rms_gamma: torch.Tensor,
+    rms_eps: float,
+    allreduce_params: "FlashInferFusedAllReduceParams",
+    use_oneshot: bool,
+    norm_out: torch.Tensor | None = None,
+):
+    """FlashInfer fused allreduce + rmsnorm operation."""
+    if flashinfer_comm is None or _FI_WORKSPACE_TENSOR is None:
+        raise RuntimeError("FlashInfer not available or workspace not initialized")
+
+    if norm_out is None:
+        norm_out = input_tensor
+        residual_out = residual
+    else:
+        residual_out = input_tensor
+
+    flashinfer_comm.trtllm_allreduce_fusion(
+        allreduce_in=input_tensor,
+        token_num=input_tensor.shape[0],
+        residual_in=residual,
+        residual_out=residual_out,
+        norm_out=norm_out,
+        rms_gamma=rms_gamma,
+        rms_eps=rms_eps,
+        hidden_dim=input_tensor.shape[-1],
+        workspace_ptrs=_FI_WORKSPACE_TENSOR,
+        pattern_code=flashinfer_comm.AllReduceFusionPattern.kARResidualRMSNorm,
+        allreduce_out=None,
+        quant_out=None,
+        scale_out=None,
+        layout_code=flashinfer_comm.QuantizationSFLayout.SWIZZLED_128x4,
+        scale_factor=None,
+        use_oneshot=use_oneshot,
+        **allreduce_params.get_trtllm_fused_allreduce_kwargs(),
+    )
+
+
+def flashinfer_fused_allreduce_rmsnorm_fp8_quant(
+    input_tensor: torch.Tensor,
+    residual: torch.Tensor | None,
+    rms_gamma: torch.Tensor,
+    rms_eps: float,
+    scale_factor: torch.Tensor,
+    allreduce_params: FlashInferFusedAllReduceParams,
+    use_oneshot: bool = True,
+    norm_out: torch.Tensor | None = None,
+    quant_out: torch.Tensor | None = None,
+):
+    """FlashInfer fused allreduce + rmsnorm + FP8 quantization."""
+    if flashinfer_comm is None or _FI_WORKSPACE_TENSOR is None:
+        raise RuntimeError("FlashInfer not available or workspace not initialized")
+
+    if norm_out is None:
+        norm_out = input_tensor
+        residual_out = residual
+    else:
+        residual_out = input_tensor
+
+    flashinfer_comm.trtllm_allreduce_fusion(
+        allreduce_in=input_tensor,
+        token_num=input_tensor.shape[0],
+        residual_in=residual,
+        residual_out=residual_out,
+        norm_out=norm_out,
+        rms_gamma=rms_gamma,
+        rms_eps=rms_eps,
+        hidden_dim=input_tensor.shape[-1],
+        workspace_ptrs=_FI_WORKSPACE_TENSOR,
+        pattern_code=flashinfer_comm.AllReduceFusionPattern.kARResidualRMSNormFP8Quant,
+        allreduce_out=None,
+        quant_out=quant_out,
+        scale_out=None,
+        layout_code=flashinfer_comm.QuantizationSFLayout.SWIZZLED_128x4,
+        scale_factor=scale_factor,
+        use_oneshot=use_oneshot,
+        **allreduce_params.get_trtllm_fused_allreduce_kwargs(),
+    )
+
+
+def flashinfer_fused_allreduce_rmsnorm_fp4_quant(
+    input_tensor: torch.Tensor,
+    residual: torch.Tensor | None,
+    rms_gamma: torch.Tensor,
+    rms_eps: float,
+    input_global_scale: torch.Tensor,
+    allreduce_params: FlashInferFusedAllReduceParams,
+    quant_out: torch.Tensor,
+    use_oneshot: bool,
+    output_scale: torch.Tensor,
+    norm_out: torch.Tensor | None = None,
+):
+    """FlashInfer fused allreduce + rmsnorm + FP4 quantization."""
+    if flashinfer_comm is None or _FI_WORKSPACE_TENSOR is None:
+        raise RuntimeError("FlashInfer not available or workspace not initialized")
+
+    if norm_out is None:
+        norm_out = input_tensor
+        residual_out = residual
+    else:
+        residual_out = input_tensor
+
+    flashinfer_comm.trtllm_allreduce_fusion(
+        allreduce_in=input_tensor,
+        token_num=input_tensor.shape[0],
+        residual_in=residual,
+        residual_out=residual_out,
+        norm_out=norm_out,
+        rms_gamma=rms_gamma,
+        rms_eps=rms_eps,
+        hidden_dim=input_tensor.shape[-1],
+        workspace_ptrs=_FI_WORKSPACE_TENSOR,
+        pattern_code=flashinfer_comm.AllReduceFusionPattern.kARResidualRMSNormFP4Quant,
+        allreduce_out=None,
+        quant_out=quant_out,
+        scale_out=output_scale,
+        layout_code=flashinfer_comm.QuantizationSFLayout.SWIZZLED_128x4,
+        scale_factor=input_global_scale,
+        use_oneshot=use_oneshot,
+        **allreduce_params.get_trtllm_fused_allreduce_kwargs(),
+    )
+
+
+class VllmFusedAllreduce:
+    def __init__(self, hidden_dim, dtype):
+        self.rms_eps = 1e-6
+        self.rms_norm = RMSNorm(hidden_dim, eps=self.rms_eps, dtype=dtype)
+        self.fp8_quant = QuantFP8(
+            static=True,
+            group_shape=GroupShape.PER_TENSOR,
+        )
+
+    def allreduce_rmsnorm(
+        self, input_tensor: torch.Tensor, residual: torch.Tensor | None
+    ):
+        allreduce_out = tensor_model_parallel_all_reduce(input_tensor)
+        return self.rms_norm(allreduce_out, residual)
+
+    def allreduce_rmsnorm_fp8_quant(
+        self,
+        input_tensor: torch.Tensor,
+        residual: torch.Tensor | None,
+        scale_factor: torch.Tensor,
+    ):
+        allreduce_out = tensor_model_parallel_all_reduce(input_tensor)
+        rms_out = self.rms_norm(allreduce_out, residual)
+        if residual is None:
+            quant_out = self.fp8_quant(rms_out, scale_factor)
+            return quant_out
+        else:
+            rms_out, residual_out = rms_out
+            quant_out = self.fp8_quant(rms_out, scale_factor)
+            return quant_out, residual_out
+
+    def allreduce_rmsnorm_fp4_quant(
+        self,
+        input_tensor: torch.Tensor,
+        residual: torch.Tensor | None,
+        input_global_scale: torch.Tensor,
+        quant_out: torch.Tensor,
+        output_scale: torch.Tensor,
+    ):
+        allreduce_out = tensor_model_parallel_all_reduce(input_tensor)
+        rms_out = self.rms_norm(allreduce_out, residual)
+        if residual is None:
+            SCALED_FP4_QUANT_OP(quant_out, rms_out, output_scale, input_global_scale)
+            return quant_out, output_scale
+        else:
+            rms_out, residual_out = rms_out
+            SCALED_FP4_QUANT_OP(quant_out, rms_out, output_scale, input_global_scale)
+            return quant_out, residual_out, output_scale
+
+
+def create_test_tensors(
+    num_tokens: int, hidden_dim: int, dtype: torch.dtype, use_residual: bool = True
+):
+    """Create test tensors for benchmarking."""
+    input_tensor = torch.randn(num_tokens, hidden_dim, dtype=dtype)
+    residual = (
+        torch.randn_like(input_tensor)
+        if use_residual
+        else torch.zeros_like(input_tensor)
+    )
+    rms_gamma = torch.ones(hidden_dim, dtype=dtype)
+    norm_out = None if use_residual else torch.empty_like(input_tensor)
+
+    # Quantization scales
+    scale_fp8 = torch.tensor(1.0, dtype=torch.float32)
+    scale_fp4 = torch.tensor(1.0, dtype=torch.float32)
+    quant_out_fp8 = torch.empty_like(input_tensor, dtype=FP8_DTYPE)
+    # Pre-allocate FP4 output tensors (to avoid allocation overhead in benchmarks)
+    fp4_quant_out = torch.empty((num_tokens, hidden_dim // 2), dtype=torch.uint8)
+    fp4_output_scale = torch.empty((128, 4), dtype=torch.int32)
+
+    return (
+        input_tensor,
+        norm_out,
+        residual,
+        rms_gamma,
+        scale_fp8,
+        quant_out_fp8,
+        scale_fp4,
+        fp4_quant_out,
+        fp4_output_scale,
+    )
+
+
+def benchmark_operation(
+    operation_func, *args, warmup: int = 5, trials: int = 20, **kwargs
+):
+    """Benchmark a single operation using CUDA graphs."""
+    # Warmup before graph capture
+    for _ in range(warmup):
+        operation_func(*args, **kwargs)
+    torch.cuda.synchronize()
+
+    # Create CUDA graph
+    graph = torch.cuda.CUDAGraph()
+    num_op_per_cudagraph = 10
+
+    # Use vLLM's graph_capture to make tensor_model_parallel_all_reduce graph-safe
+    device = torch.device(f"cuda:{torch.cuda.current_device()}")
+    with graph_capture(device=device), torch.cuda.graph(graph):
+        for _ in range(num_op_per_cudagraph):
+            operation_func(*args, **kwargs)
+
+    # Graph warmup
+    torch.cuda.synchronize()
+    for _ in range(warmup):
+        graph.replay()
+
+    # Benchmark with CUDA graph
+    torch.cuda.synchronize()
+    start_time = time.perf_counter()
+
+    for _ in range(trials // num_op_per_cudagraph):
+        # operation_func(*args, **kwargs)
+        graph.replay()
+
+    torch.cuda.synchronize()
+    end_time = time.perf_counter()
+
+    avg_time_ms = ((end_time - start_time) / trials) * 1000
+    return avg_time_ms
+
+
+def run_benchmarks(
+    num_tokens: int,
+    hidden_dim: int,
+    dtype: torch.dtype,
+    use_residual: bool,
+    allreduce_params: FlashInferFusedAllReduceParams | None,
+    quant_modes: set[str],
+    no_oneshot: bool,
+):
+    """Run all benchmarks for given configuration.
+
+    Args:
+        quant_mode: "none", "fp8_only", "fp4_only", or "all"
+    """
+    (
+        input_tensor,
+        norm_out,
+        residual,
+        rms_gamma,
+        scale_fp8,
+        quant_out_fp8,
+        scale_fp4,
+        fp4_quant_out,
+        fp4_output_scale,
+    ) = create_test_tensors(num_tokens, hidden_dim, dtype, use_residual)
+
+    rms_eps = 1e-6
+    results = {}
+    vllm_fused_allreduce = VllmFusedAllreduce(hidden_dim, dtype)
+    use_oneshot_options = [False] if no_oneshot else [True, False]
+
+    # Create RMSNorm and QuantFP8 layers once for native benchmarks
+
+    if "none" in quant_modes:
+        # Standard AllReduce + RMSNorm
+        for custom_op in ["-rms_norm", "+rms_norm"]:
+            with set_current_vllm_config(
+                VllmConfig(compilation_config=CompilationConfig(custom_ops=[custom_op]))
+            ):
+                try:
+                    suffix = (
+                        "_custom_rms_norm" if "+" in custom_op else "_native_rms_norm"
+                    )
+                    time_ms = benchmark_operation(
+                        vllm_fused_allreduce.allreduce_rmsnorm,
+                        input_tensor,
+                        residual=residual,
+                    )
+                    results[f"standard_allreduce_{suffix}"] = time_ms
+                except Exception as e:
+                    logger.error("Standard AllReduce+RMSNorm failed: %s", e)
+                    results[f"standard_allreduce_{suffix}"] = float("inf")
+
+        # Standard AllReduce + RMSNorm Native Compiled
+        with set_current_vllm_config(
+            VllmConfig(compilation_config=CompilationConfig(custom_ops=["-rms_norm"]))
+        ):
+            try:
+                standard_allreduce_rmsnorm_native_compiled = torch.compile(
+                    vllm_fused_allreduce.allreduce_rmsnorm,
+                    fullgraph=True,
+                    dynamic=False,
+                )
+                time_ms = benchmark_operation(
+                    standard_allreduce_rmsnorm_native_compiled,
+                    input_tensor,
+                    residual=residual,
+                )
+                results["standard_allreduce_rmsnorm_native_compiled"] = time_ms
+            except Exception as e:
+                logger.error("Standard AllReduce+RMSNorm Native Compiled failed: %s", e)
+                results["standard_allreduce_rmsnorm_native_compiled"] = float("inf")
+
+        # FlashInfer Fused AllReduce + RMSNorm Oneshot/Twoshot
+        if flashinfer_comm is not None and allreduce_params is not None:
+            for use_oneshot in use_oneshot_options:
+                suffix = "_oneshot" if use_oneshot else "_twoshot"
+                try:
+                    time_ms = benchmark_operation(
+                        flashinfer_fused_allreduce_rmsnorm,
+                        input_tensor,
+                        residual=residual,
+                        norm_out=norm_out,
+                        rms_gamma=rms_gamma,
+                        rms_eps=rms_eps,
+                        allreduce_params=allreduce_params,
+                        use_oneshot=use_oneshot,
+                    )
+                    results[f"flashinfer_fused_allreduce_rmsnorm{suffix}"] = time_ms
+                except Exception as e:
+                    logger.error("FlashInfer Fused AllReduce+RMSNorm failed: %s", e)
+                    results[f"flashinfer_fused_allreduce_rmsnorm{suffix}"] = float(
+                        "inf"
+                    )
+
+    if "fp8" in quant_modes:
+        # Standard AllReduce + RMSNorm + FP8 Quant
+        for rms_norm_custom_op in ["-rms_norm", "+rms_norm"]:
+            suffix = (
+                "_custom_rms_norm" if "+" in rms_norm_custom_op else "_native_rms_norm"
+            )
+            for quant_fp8_custom_op in ["-quant_fp8", "+quant_fp8"]:
+                suffix += (
+                    "_custom_quant_fp8"
+                    if "+" in quant_fp8_custom_op
+                    else "_native_quant_fp8"
+                )
+                with set_current_vllm_config(
+                    VllmConfig(
+                        compilation_config=CompilationConfig(
+                            custom_ops=[rms_norm_custom_op, quant_fp8_custom_op]
+                        )
+                    )
+                ):
+                    try:
+                        time_ms = benchmark_operation(
+                            vllm_fused_allreduce.allreduce_rmsnorm_fp8_quant,
+                            input_tensor,
+                            residual=residual,
+                            scale_factor=scale_fp8,
+                        )
+                        results[f"standard_allreduce{suffix}"] = time_ms
+                    except Exception as e:
+                        logger.error("Standard AllReduce+RMSNorm+FP8 failed: %s", e)
+                        results[f"standard_allreduce{suffix}"] = float("inf")
+
+        # Standard AllReduce + RMSNorm + FP8 Quant Native Compiled
+        with set_current_vllm_config(
+            VllmConfig(
+                compilation_config=CompilationConfig(
+                    custom_ops=["-rms_norm", "-quant_fp8"]
+                )
+            )
+        ):
+            try:
+                standard_allreduce_rmsnorm_fp8_quant_native_compiled = torch.compile(
+                    vllm_fused_allreduce.allreduce_rmsnorm_fp8_quant,
+                    fullgraph=True,
+                    dynamic=False,
+                )
+                time_ms = benchmark_operation(
+                    standard_allreduce_rmsnorm_fp8_quant_native_compiled,
+                    input_tensor,
+                    residual=residual,
+                    scale_factor=scale_fp8,
+                )
+                results["standard_allreduce_rmsnorm_fp8_quant_native_compiled"] = (
+                    time_ms
+                )
+            except Exception as e:
+                logger.error(
+                    "Standard AllReduce+RMSNorm+FP8 Native Compiled failed: %s", e
+                )
+                results["standard_allreduce_rmsnorm_fp8_quant_native_compiled"] = float(
+                    "inf"
+                )
+
+        # FlashInfer Fused AllReduce + RMSNorm + FP8 Quant Oneshot
+        if flashinfer_comm is not None and allreduce_params is not None:
+            for use_oneshot in use_oneshot_options:
+                suffix = "_oneshot" if use_oneshot else "_twoshot"
+                try:
+                    time_ms = benchmark_operation(
+                        flashinfer_fused_allreduce_rmsnorm_fp8_quant,
+                        input_tensor,
+                        norm_out=norm_out,
+                        residual=residual,
+                        rms_gamma=rms_gamma,
+                        rms_eps=rms_eps,
+                        scale_factor=scale_fp8,
+                        quant_out=quant_out_fp8,
+                        allreduce_params=allreduce_params,
+                        use_oneshot=use_oneshot,
+                    )
+                    results[f"flashinfer_fused_allreduce_rmsnorm_fp8_quant{suffix}"] = (
+                        time_ms
+                    )
+                except Exception as e:
+                    logger.error(
+                        "FlashInfer Fused AllReduce+RMSNorm+FP8 Oneshot failed: %s",
+                        e,
+                    )
+                    results[f"flashinfer_fused_allreduce_rmsnorm_fp8_quant{suffix}"] = (
+                        float("inf")
+                    )
+
+    if "fp4" in quant_modes and current_platform.has_device_capability(100):
+        # Standard AllReduce + RMSNorm + FP4 Quant
+        for rms_norm_custom_op in ["-rms_norm", "+rms_norm"]:
+            suffix = (
+                "_custom_rms_norm" if "+" in rms_norm_custom_op else "_native_rms_norm"
+            )
+            with set_current_vllm_config(
+                VllmConfig(
+                    compilation_config=CompilationConfig(
+                        custom_ops=[rms_norm_custom_op]
+                    )
+                )
+            ):
+                try:
+                    time_ms = benchmark_operation(
+                        vllm_fused_allreduce.allreduce_rmsnorm_fp4_quant,
+                        input_tensor,
+                        residual=residual,
+                        input_global_scale=scale_fp4,
+                        quant_out=fp4_quant_out,
+                        output_scale=fp4_output_scale,
+                    )
+                    results[f"standard_allreduce_{suffix}_fp4_quant"] = time_ms
+                except Exception as e:
+                    logger.error("Standard AllReduce+RMSNorm+FP4 failed: %s", e)
+                    results[f"standard_allreduce_{suffix}_fp4_quant"] = float("inf")
+
+        # Standard AllReduce + RMSNorm + FP4 Quant Native Compiled
+        with set_current_vllm_config(
+            VllmConfig(compilation_config=CompilationConfig(custom_ops=["-rms_norm"]))
+        ):
+            try:
+                standard_allreduce_rmsnorm_fp4_quant_native_compiled = torch.compile(
+                    vllm_fused_allreduce.allreduce_rmsnorm_fp4_quant,
+                    fullgraph=True,
+                    dynamic=False,
+                )
+                time_ms = benchmark_operation(
+                    standard_allreduce_rmsnorm_fp4_quant_native_compiled,
+                    input_tensor,
+                    residual=residual,
+                    quant_out=fp4_quant_out,
+                    input_global_scale=scale_fp4,
+                    output_scale=fp4_output_scale,
+                )
+                results["standard_allreduce_rmsnorm_fp4_quant_native_compiled"] = (
+                    time_ms
+                )
+            except Exception as e:
+                logger.error(
+                    "Standard AllReduce+RMSNorm+FP4 Native Compiled failed: %s", e
+                )
+                results["standard_allreduce_rmsnorm_fp4_quant_native_compiled"] = float(
+                    "inf"
+                )
+
+        # FlashInfer Fused AllReduce + RMSNorm + FP4 Quant Oneshot
+        if flashinfer_comm is not None and allreduce_params is not None:
+            for use_oneshot in use_oneshot_options:
+                suffix = "_oneshot" if use_oneshot else "_twoshot"
+                try:
+                    time_ms = benchmark_operation(
+                        flashinfer_fused_allreduce_rmsnorm_fp4_quant,
+                        input_tensor,
+                        residual=residual,
+                        norm_out=norm_out,
+                        rms_gamma=rms_gamma,
+                        rms_eps=rms_eps,
+                        input_global_scale=scale_fp4,
+                        allreduce_params=allreduce_params,
+                        quant_out=fp4_quant_out,
+                        output_scale=fp4_output_scale,
+                        use_oneshot=use_oneshot,
+                    )
+                    results[f"flashinfer_fused_allreduce_rmsnorm_fp4_quant{suffix}"] = (
+                        time_ms
+                    )
+                except Exception as e:
+                    logger.error(
+                        "FlashInfer Fused AllReduce+RMSNorm+FP4 Oneshot failed: %s",
+                        e,
+                    )
+                    results[f"flashinfer_fused_allreduce_rmsnorm_fp4_quant{suffix}"] = (
+                        float("inf")
+                    )
+
+        # FlashInfer Fused AllReduce + RMSNorm + FP4 Quant Two-shot
+        if flashinfer_comm is not None and allreduce_params is not None:
+            try:
+                time_ms = benchmark_operation(
+                    flashinfer_fused_allreduce_rmsnorm_fp4_quant,
+                    input_tensor,
+                    residual=residual,
+                    norm_out=norm_out,
+                    rms_gamma=rms_gamma,
+                    rms_eps=rms_eps,
+                    input_global_scale=scale_fp4,
+                    allreduce_params=allreduce_params,
+                    quant_out=fp4_quant_out,
+                    output_scale=fp4_output_scale,
+                    use_oneshot=False,
+                )
+                results["flashinfer_fused_allreduce_rmsnorm_fp4_quant_twoshot"] = (
+                    time_ms
+                )
+            except Exception as e:
+                logger.error(
+                    "FlashInfer Fused AllReduce+RMSNorm+FP4 Two-shot failed: %s",
+                    e,
+                )
+                results["flashinfer_fused_allreduce_rmsnorm_fp4_quant_twoshot"] = float(
+                    "inf"
+                )
+
+    return results
+
+
+def prepare_results_with_speedups(results_dict):
+    """Prepare results with speedup calculations based on dynamic baseline selection."""
+    prepared_results = []
+
+    # Determine the fastest baseline for each operation type
+    def get_fastest_baseline(op_name, results_dict):
+        """Get the fastest baseline between standard and native_compiled versions."""
+        if "fp8_quant" in op_name:
+            candidates = [
+                "standard_allreduce_rmsnorm_fp8_quant",
+                "standard_allreduce_rmsnorm_fp8_quant_native_compiled",
+            ]
+        elif "fp4_quant" in op_name:
+            candidates = [
+                "standard_allreduce_rmsnorm_fp4_quant",
+                "standard_allreduce_rmsnorm_fp4_quant_native_compiled",
+            ]
+        else:
+            candidates = [
+                "standard_allreduce_rmsnorm",
+                "standard_allreduce_rmsnorm_native_compiled",
+            ]
+
+        # Find the fastest among available candidates
+        fastest_time = float("inf")
+        fastest_baseline = None
+
+        for candidate in candidates:
+            if (
+                candidate in results_dict
+                and results_dict[candidate] != float("inf")
+                and results_dict[candidate] < fastest_time
+            ):
+                fastest_time = results_dict[candidate]
+                fastest_baseline = candidate
+
+        return fastest_baseline
+
+    # Create dynamic baseline mapping
+    dynamic_baseline_mapping = {}
+    for op_name in results_dict:
+        if (
+            op_name.startswith("flashinfer_")
+            or op_name.startswith("standard_")
+            and not op_name.endswith("_native_compiled")
+        ):
+            dynamic_baseline_mapping[op_name] = get_fastest_baseline(
+                op_name, results_dict
+            )
+
+    for op_name, time_ms in results_dict.items():
+        if time_ms == float("inf"):
+            speedup_str = "FAILED"
+            time_str = "FAILED"
+        else:
+            time_str = f"{time_ms:.3f}"
+            # Find the appropriate baseline for this operation
+            baseline_op = dynamic_baseline_mapping.get(op_name)
+            if baseline_op and baseline_op in results_dict:
+                baseline_time = results_dict[baseline_op]
+                if baseline_time != float("inf") and baseline_time > 0:
+                    speedup = baseline_time / time_ms
+                    speedup_str = f"{speedup:.2f}x"
+                else:
+                    speedup_str = "N/A"
+            else:
+                # For baseline operations, determine if this is the fastest baseline
+                if op_name.endswith("_native_compiled") or (
+                    op_name.startswith("standard_")
+                    and not op_name.endswith("_native_compiled")
+                ):
+                    fastest_baseline = get_fastest_baseline(op_name, results_dict)
+                    if fastest_baseline == op_name:
+                        speedup_str = "baseline"
+                    else:
+                        if fastest_baseline and fastest_baseline in results_dict:
+                            baseline_time = results_dict[fastest_baseline]
+                            if baseline_time != float("inf") and baseline_time > 0:
+                                speedup = baseline_time / time_ms
+                                speedup_str = f"{speedup:.2f}x"
+                            else:
+                                speedup_str = "N/A"
+                        else:
+                            speedup_str = "N/A"
+                else:
+                    speedup_str = "N/A"
+
+        prepared_results.append(
+            {
+                "operation": op_name,
+                "time_ms": time_ms,
+                "time_str": time_str,
+                "speedup_str": speedup_str,
+            }
+        )
+
+    return prepared_results
+
+
+def print_results(
+    results_dict,
+    num_tokens,
+    hidden_dim,
+    dtype,
+    use_residual,
+    quant_modes,
+    input_size_mb,
+):
+    """Print benchmark results in a formatted table."""
+    print(f"\n{'=' * 80}")
+    print(
+        f"Results: num_tokens={num_tokens}, hidden_dim={hidden_dim} "
+        f"(input size: {input_size_mb:.2f} MB)"
+    )
+    print(
+        f"dtype={dtype}, residual={'yes' if use_residual else 'no'}, "
+        f"quant_modes={','.join(sorted(list(quant_modes)))}"
+    )
+    print(f"{'=' * 80}")
+    print(f"{'Operation':<50} {'Time (ms)':<12} {'Speedup':<10}")
+    print(f"{'-' * 80}")
+
+    # Prepare results with speedup calculations
+    prepared_results = prepare_results_with_speedups(results_dict)
+
+    for result in prepared_results:
+        if result["time_ms"] == float("inf"):
+            time_display = result["time_str"]
+        else:
+            time_display = f"{result['time_ms']:.3f}"
+
+        print(
+            f"{result['operation']:<50} {time_display:<12} {result['speedup_str']:<10}"
+        )
+
+
+def format_results_markdown(
+    all_results: list[dict], world_size: int, args: argparse.Namespace
+) -> str:
+    """Format all benchmark results as markdown."""
+    lines: list[str] = []
+    lines.append("# FlashInfer Fused Collective Operations Benchmark Results")
+    lines.append("")
+    lines.append(f"**World Size:** {world_size}  ")
+    lines.append(f"**Hidden Dimension:** {args.hidden_dim}  ")
+    lines.append(f"**Warmup Iterations:** {args.warmup}  ")
+    lines.append(f"**Benchmark Trials:** {args.trials}  ")
+    modes = ",".join(all_results[0]["quant_modes"]) if all_results else "N/A"
+    lines.append(f"**Quantization Modes:** {modes}  ")
+    lines.append("")
+    lines.append("---")
+    lines.append("")
+
+    for entry in all_results:
+        num_tokens = entry["num_tokens"]
+        dtype = entry["dtype"]
+        use_residual = entry["use_residual"]
+        results_dict = entry["results"]
+        input_size_mb = entry["input_size_mb"]
+        residual_str = "with residual" if use_residual else "no residual"
+
+        lines.append(
+            f"## Configuration: num_tokens={num_tokens}, dtype={dtype}, {residual_str}"
+        )
+        lines.append(f"**Input Size:** {input_size_mb:.2f} MB")
+        lines.append("")
+
+        prepared = prepare_results_with_speedups(results_dict)
+        # Build DataFrame for markdown export
+        rows = [
+            {
+                "Operation": r["operation"].replace("_", " ").title(),
+                "Time (ms)": r["time_str"],
+                "Speedup": r["speedup_str"],
+            }
+            for r in prepared
+        ]
+        df = pd.DataFrame(rows)
+        if df.empty:
+            lines.append("No results.")
+        else:
+            lines.append(df.to_markdown(index=False))
+        lines.append("")
+
+    return "\n".join(lines)
+
+
+def save_results_to_file(
+    all_results: list[dict], world_size: int, args: argparse.Namespace, rank: int
+):
+    """Save benchmark results to markdown file (only on rank 0)."""
+    if rank != 0:
+        return
+
+    if not all_results:
+        logger.warning("No results to save")
+        return
+
+    output_path = args.output_file
+
+    try:
+        markdown_content = format_results_markdown(all_results, world_size, args)
+
+        with open(output_path, "a") as f:
+            f.write(markdown_content)
+
+    except Exception as e:
+        logger.error("Failed to save results to file: %s", e)
+
+
+def main():
+    parser = argparse.ArgumentParser(
+        description="Benchmark fused collective operations"
+    )
+    parser.add_argument(
+        "--num-tokens",
+        type=int,
+        nargs="+",
+        default=[128, 512, 1024, 2048],
+        help="Numbers of tokens to test",
+    )
+    parser.add_argument(
+        "--hidden-dim", type=int, default=8192, help="Hidden dimension size"
+    )
+    parser.add_argument(
+        "--dtypes",
+        type=str,
+        nargs="+",
+        default=["bfloat16"],
+        choices=["float16", "bfloat16", "float32"],
+        help="Data types to test",
+    )
+    parser.add_argument(
+        "--no-residual",
+        action="store_true",
+        help="Skip residual connection tests",
+    )
+
+    parser.add_argument(
+        "--quant-modes",
+        type=str,
+        default="none,fp8,fp4",
+        help=(
+            "Comma-separated quantization modes to run: none, fp8, fp4. "
+            "Default: none,fp8,fp4"
+        ),
+    )
+
+    parser.add_argument(
+        "--warmup", type=int, default=5, help="Number of warmup iterations"
+    )
+    parser.add_argument(
+        "--trials", type=int, default=20, help="Number of benchmark trials"
+    )
+    parser.add_argument(
+        "--output-file",
+        type=str,
+        help="""Output file path for markdown results 
+                (default: benchmark_results_<timestamp>.md)
+        """,
+    )
+
+    parser.add_argument(
+        "--no-oneshot",
+        action="store_true",
+        help="Skip oneshot benchmarks",
+    )
+
+    args = parser.parse_args()
+
+    # Check if running with torchrun (required for collective operations)
+    if "RANK" not in os.environ or "WORLD_SIZE" not in os.environ:
+        raise RuntimeError(
+            "Must run with torchrun for distributed benchmarking. "
+            "Example: torchrun --nproc_per_node=2 benchmark_fused_collective.py"
+        )
+
+    # Initialize distributed environment
+    rank = int(os.environ["RANK"])
+    world_size = int(os.environ["WORLD_SIZE"])
+
+    device = torch.device(f"cuda:{rank}")
+    torch.cuda.set_device(device)
+    torch.set_default_device(device)
+
+    init_distributed_environment()
+    initialize_model_parallel(tensor_model_parallel_size=world_size)
+
+    # Validate world size (must be > 1 for collective operations)
+    if world_size <= 1:
+        raise ValueError(
+            "World size must be > 1 for collective operations benchmarking. "
+            f"Current world size: {world_size}. Use torchrun with --nproc_per_node > 1."
+        )
+
+    # Parse quantization modes
+    valid_quant_modes = {"none", "fp8", "fp4"}
+    raw_modes = [
+        m.strip().lower() for m in (args.quant_modes or "").split(",") if m.strip()
+    ]
+    quant_modes = set(raw_modes) if raw_modes else {"none", "fp8", "fp4"}
+    invalid = sorted(list(quant_modes - valid_quant_modes))
+    if invalid:
+        raise ValueError(
+            f"Invalid --quant-modes entries: {','.join(invalid)}. "
+            f"Valid options are: {','.join(sorted(valid_quant_modes))}."
+        )
+
+    if rank == 0:
+        logger.info("Running benchmark with world_size=%s, rank=%s", world_size, rank)
+        logger.info("Quantization modes: %s", ",".join(sorted(list(quant_modes))))
+        if flashinfer_comm is not None:
+            logger.info(
+                "FlashInfer available - will benchmark fused operations",
+            )
+        else:
+            logger.info(
+                "FlashInfer not available - only benchmarking standard operations"
+            )
+
+    # Convert dtype strings to torch dtypes
+    dtype_map = {
+        "float16": torch.float16,
+        "bfloat16": torch.bfloat16,
+        "float32": torch.float32,
+    }
+    dtypes = [dtype_map[dt] for dt in args.dtypes]
+
+    # Test configurations
+    residual_options = [True] if not args.no_residual else [False]
+
+    configs = list(itertools.product(args.num_tokens, dtypes, residual_options))
+
+    # Setup FlashInfer workspace if available
+    ipc_handles = None
+    allreduce_params = None
+
+    if flashinfer_comm is not None:
+        # Use the largest hidden dimension for workspace setup
+        max_num_token = _FI_MAX_SIZES.get(world_size) // (
+            args.hidden_dim * world_size * 2
+        )
+
+        ipc_handles, workspace_tensor = setup_flashinfer_workspace(
+            world_size, rank, args.hidden_dim, max_num_token
+        )
+
+        if workspace_tensor is not None:
+            allreduce_params = FlashInferFusedAllReduceParams(
+                rank=rank,
+                world_size=world_size,
+                max_token_num=max_num_token,
+            )
+
+    # Collect all results for markdown export
+    all_results = []
+
+    try:
+        # Run benchmarks
+        for num_tokens, dtype, use_residual in configs:
+            if rank == 0:
+                logger.info(
+                    "\nTesting:  num_tokens=%s, hidden_dim=%s, dtype=%s, residual=%s",
+                    num_tokens,
+                    args.hidden_dim,
+                    dtype,
+                    use_residual,
+                )
+
+            results = run_benchmarks(
+                num_tokens,
+                args.hidden_dim,
+                dtype,
+                use_residual,
+                allreduce_params,
+                quant_modes=quant_modes,
+                no_oneshot=args.no_oneshot,
+            )
+
+            # Store results for markdown export
+            if rank == 0:
+                # Calculate input size in MB
+                input_size_mb = (
+                    num_tokens * args.hidden_dim * torch.finfo(dtype).bits
+                ) / (8 * 1024 * 1024)
+                all_results.append(
+                    {
+                        "num_tokens": num_tokens,
+                        "hidden_dim": args.hidden_dim,
+                        "dtype": str(dtype).replace("torch.", ""),
+                        "use_residual": use_residual,
+                        "quant_modes": sorted(list(quant_modes)),
+                        "input_size_mb": input_size_mb,
+                        "results": results,
+                    }
+                )
+
+                print_results(
+                    results,
+                    num_tokens,
+                    args.hidden_dim,
+                    dtype,
+                    use_residual,
+                    quant_modes,
+                    input_size_mb,
+                )
+
+        # Save results to markdown file
+        if args.output_file and rank == 0:
+            save_results_to_file(all_results, world_size, args, rank)
+
+    finally:
+        # Cleanup
+        if ipc_handles is not None:
+            cleanup_flashinfer_workspace(ipc_handles)
+
+        dist.barrier()
+
+
+if __name__ == "__main__":
+    main()
diff --git a/tests/compile/test_fusions_e2e.py b/tests/compile/test_fusions_e2e.py
index 58026e7e7e78..4b910bc28579 100644
--- a/tests/compile/test_fusions_e2e.py
+++ b/tests/compile/test_fusions_e2e.py
@@ -71,6 +71,13 @@ class ModelBackendTestCase(NamedTuple):
             attention_fusions=0,
             allreduce_fusions=65,
         ),
+        ModelBackendTestCase(
+            model_name="Qwen/Qwen3-30B-A3B",
+            model_kwargs=dict(max_model_len=1024),
+            backend=_Backend.TRITON_ATTN,
+            attention_fusions=0,
+            allreduce_fusions=97,
+        ),
     ]
 
 elif current_platform.is_rocm():
diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index 7294ddce64ba..69d4606d73eb 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -9,7 +9,6 @@
 from torch._inductor.pattern_matcher import PatternMatcherPass
 from torch.distributed._symmetric_memory import enable_symm_mem_for_group
 
-import vllm.envs as envs
 from vllm.config import VllmConfig
 from vllm.distributed import get_tp_group, tensor_model_parallel_all_reduce
 from vllm.distributed.parallel_state import (
@@ -450,34 +449,41 @@ def __call__(self, graph: fx.Graph):
         logger.debug("Replaced %s patterns", self.matched_count)
 
 
+# Max size of the input tensor per world size per device capability
+# to use flashinfer fused allreduce
+FI_ALLREDUCE_FUSION_MAX_SIZE_MB: dict[int, dict[int, float]] = {
+    90: {
+        2: 64,  # 64MB
+        4: 2,  # 2MB
+        8: 0.5,  # 0.5MB
+    },
+    100: {
+        2: 64,  # 64MB
+        4: 32,  # 32MB
+        8: 1,  # 1MB
+    },
+}
+
+# Max size of the input tensor per world size per device capability
+# to use flashinfer one shot fused allreduce
+# OneShot max size is at most 64MB / world size (FlashInfer restriction)
+_FI_ALLREDUCE_ONE_SHOT_MAX_SIZES_MB: dict[int, dict[int, float]] = {
+    90: {
+        2: 32,  # 32MB
+        4: 2,  # 2MB
+        8: 0.5,  # 0.5MB
+    },
+    100: {
+        2: 32,  # 32MB
+        4: 4,  # 4MB
+        8: 1,  # 1MB
+    },
+}
+
+
 if flashinfer_comm is not None:
     _FI_WORKSPACE_TENSOR = None
-
     MiB = 1024 * 1024
-    # Max size of the input tensor per world size
-    # to use flashinfer fused allreduce
-    _FI_MAX_SIZES = {
-        2: 64 * MiB,  # 64MB
-        4: MiB,  # 1MB
-        6: MiB // 2,  # 512KB
-        8: MiB // 2,  # 512KB
-    }
-
-    try:
-        _FI_MAX_SIZES.update(
-            {
-                int(k): int(float(v) * MiB)
-                for k, v in envs.VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB.items()
-            }
-        )
-    except Exception as e:
-        raise ValueError(
-            "Failed to parse VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB: " + str(e)
-        ) from e
-
-    # opt for a more conservative default value
-    # when world size is not in _FI_MAX_SIZES
-    _DEFAULT_FI_MAX_SIZE = MiB // 2
 
     def call_trtllm_fused_allreduce_norm(
         allreduce_in: torch.Tensor,
@@ -491,7 +497,6 @@ def call_trtllm_fused_allreduce_norm(
         fp32_acc: bool,
         max_token_num: int,
         pattern_code: int,
-        fuse_rms_quant: bool,
         norm_out: torch.Tensor | None = None,
         quant_out: torch.Tensor | None = None,
         scale_out: torch.Tensor | None = None,
@@ -500,12 +505,20 @@ def call_trtllm_fused_allreduce_norm(
         num_tokens, hidden_size = allreduce_in.shape
         element_size = allreduce_in.element_size()
         current_tensor_size = num_tokens * hidden_size * element_size
-        max_fusion_size = max_token_num * hidden_size * element_size
-        use_flashinfer = current_tensor_size <= min(
-            _FI_MAX_SIZES.get(world_size, _DEFAULT_FI_MAX_SIZE),
-            max_fusion_size,
-        )
-        if use_flashinfer:
+
+        if num_tokens <= max_token_num:
+            device_capability = current_platform.get_device_capability().to_int()
+            # Get one shot input size limit for the current world size
+            # for the current device capability
+            max_one_shot_size_mb = _FI_ALLREDUCE_ONE_SHOT_MAX_SIZES_MB.get(
+                device_capability, {}
+            ).get(world_size, None)
+            # Use one shot if no max size for one shot is specified
+            use_oneshot = (
+                max_one_shot_size_mb is None
+                or current_tensor_size <= max_one_shot_size_mb * MiB
+            )
+
             assert _FI_WORKSPACE_TENSOR is not None, (
                 "Flashinfer must be enabled when using flashinfer"
             )
@@ -532,7 +545,7 @@ def call_trtllm_fused_allreduce_norm(
                 hidden_dim=allreduce_in.shape[-1],
                 workspace_ptrs=_FI_WORKSPACE_TENSOR,
                 launch_with_pdl=launch_with_pdl,
-                use_oneshot=True,
+                use_oneshot=use_oneshot,
                 trigger_completion_at_end=trigger_completion_at_end,
                 fp32_acc=fp32_acc,
                 pattern_code=pattern_code,
@@ -545,7 +558,7 @@ def call_trtllm_fused_allreduce_norm(
             )
         else:
             allreduce_out = tensor_model_parallel_all_reduce(allreduce_in)
-            if scale_factor is not None and scale_out is None and fuse_rms_quant:
+            if scale_factor is not None and scale_out is None:
                 # Do fused rms norm static fp8 quant fused op
                 if norm_out is None:
                     torch.ops._C.fused_add_rms_norm_static_fp8_quant(
@@ -568,15 +581,10 @@ def call_trtllm_fused_allreduce_norm(
                     norm_out = allreduce_out
                 else:
                     torch.ops._C.rms_norm(norm_out, allreduce_out, rms_gamma, rms_eps)
-                if scale_factor is not None:
-                    if scale_out is not None:
-                        torch.ops._C.scaled_fp4_quant(
-                            quant_out, norm_out, scale_out, scale_factor
-                        )
-                    else:
-                        torch.ops._C.static_scaled_fp8_quant(
-                            quant_out, norm_out, scale_factor
-                        )
+                if scale_factor is not None and scale_out is not None:
+                    torch.ops._C.scaled_fp4_quant(
+                        quant_out, norm_out, scale_out, scale_factor
+                    )
             if scale_factor is None or norm_out is not None:
                 # we need to return allreduce output
                 # in cases of non quant fused AR + RMS norm
@@ -595,7 +603,6 @@ def call_trtllm_fused_allreduce_norm_fake(
         fp32_acc: bool,
         max_token_num: int,
         pattern_code: int,
-        fuse_rms_quant: bool,
         norm_out: torch.Tensor | None = None,
         quant_out: torch.Tensor | None = None,
         scale_out: torch.Tensor | None = None,
@@ -629,7 +636,6 @@ def __init__(
         world_size: int,
         use_fp32_lamport: bool = False,
         max_token_num: int = 1024,
-        fuse_rms_quant: bool = False,
     ):
         self.rank = rank
         self.world_size = world_size
@@ -637,9 +643,7 @@ def __init__(
         self.trigger_completion_at_end = True
         self.launch_with_pdl = True
         self.fp32_acc = True
-        self.use_oneshot = False
         self.max_token_num = max_token_num
-        self.fuse_rms_quant = fuse_rms_quant
 
     def get_trtllm_fused_allreduce_kwargs(self):
         return {
@@ -649,7 +653,6 @@ def get_trtllm_fused_allreduce_kwargs(self):
             "trigger_completion_at_end": self.trigger_completion_at_end,
             "fp32_acc": self.fp32_acc,
             "max_token_num": self.max_token_num,
-            "fuse_rms_quant": self.fuse_rms_quant,
         }
 
 
@@ -1119,23 +1122,35 @@ def __init__(self, config: VllmConfig):
                 "skipping allreduce fusion pass"
             )
             return
-        # Check if the world size is supported
-        if self.tp_size not in _FI_MAX_SIZES:
+        max_size = config.compilation_config.pass_config.flashinfer_max_size(
+            self.tp_size
+        )
+        if max_size is None:
+            # Flashinfer doesn't support current world size
             logger.warning(
                 "Flashinfer allreduce fusion is not supported for world size %s",
                 self.tp_size,
             )
             return
-        max_num_token = min(
-            _FI_MAX_SIZES.get(self.tp_size, _DEFAULT_FI_MAX_SIZE)
-            // (self.hidden_dim * self.tp_size * (4 if use_fp32_lamport else 2)),
-            config.compilation_config.pass_config.fi_allreduce_fusion_max_token_num,
+        element_size = 4 if use_fp32_lamport else 2
+        self.max_token_num = max_size // (self.hidden_dim * element_size)
+        # take the min to save workspace size and we'll never use more
+        # than max_num_batched_tokens anyways
+        self.max_token_num = min(
+            self.max_token_num, config.scheduler_config.max_num_batched_tokens
+        )
+        logger.debug_once(
+            f"Flashinfer max size: {max_size // (1024 * 1024)} MB,"
+            "Maximal number of tokens used by "
+            f"Flashinfer Allreduce Fusion: {self.max_token_num}",
+            scope="global",
         )
+
         self.ipc_handles, workspace_tensor = (
             flashinfer_comm.trtllm_create_ipc_workspace_for_all_reduce_fusion(
                 tp_rank=rank,
                 tp_size=self.tp_size,
-                max_token_num=max_num_token,
+                max_token_num=self.max_token_num,
                 hidden_dim=self.hidden_dim,
                 group=self.group,
                 use_fp32_lamport=use_fp32_lamport,
@@ -1148,10 +1163,7 @@ def __init__(self, config: VllmConfig):
             rank=rank,
             world_size=self.tp_size,
             use_fp32_lamport=use_fp32_lamport,
-            max_token_num=max_num_token,
-            # fuse rms norm static fp8 quant fused op
-            # in fallback path, when we don't use flashinfer
-            fuse_rms_quant=config.compilation_config.pass_config.enable_fusion,
+            max_token_num=self.max_token_num,
         )
 
         self.register_patterns()
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index c84a060922e3..92cf16f259fe 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -111,11 +111,52 @@ class PassConfig:
     """Whether to enable async TP."""
     enable_fi_allreduce_fusion: bool = False
     """Whether to enable flashinfer allreduce fusion."""
-    fi_allreduce_fusion_max_token_num: int = 16384
-    """Max number of tokens to used in flashinfer allreduce fusion."""
+    fi_allreduce_fusion_max_size_mb: float | None = None
+    """The threshold of the communicated tensor sizes under which
+    vllm should use flashinfer fused allreduce. Specified as a
+    float in MB.
+    Unspecified will fallback to default values 
+    which are compute capability and world size dependent.
+        FI_ALLREDUCE_FUSION_MAX_SIZE_MB = {
+            90: {
+                2: 64,  # 64MB
+                4: 2,  # 2MB
+                8: 1,  # 1MB
+            },
+            100: {
+                2: 64,  # 64MB
+                4: 32,  # 32MB
+                8: 1,  # 1MB
+            },
+        }, where key is the device capability"""
 
     # TODO(luka) better pass enabling system.
 
+    def flashinfer_max_size(self, world_size: int) -> int | None:
+        """
+        Returns the max communication size in bytes for flashinfer
+        allreduce fusion for the given world size. Returns None if world size
+        is not supported by configs as it's not supported by flashinfer.
+        """
+
+        MiB = 1024 * 1024
+        max_size_mb = self.fi_allreduce_fusion_max_size_mb
+        if max_size_mb is None:
+            max_size_mb = self.default_fi_allreduce_fusion_max_size_mb().get(world_size)
+
+        return int(max_size_mb * MiB) if max_size_mb is not None else None
+
+    @staticmethod
+    def default_fi_allreduce_fusion_max_size_mb() -> dict[int, float]:
+        from vllm.compilation.collective_fusion import FI_ALLREDUCE_FUSION_MAX_SIZE_MB
+        from vllm.platforms import current_platform
+
+        if not current_platform.is_cuda():
+            return {}
+        return FI_ALLREDUCE_FUSION_MAX_SIZE_MB.get(
+            current_platform.get_device_capability().to_int(), {}
+        )
+
     def uuid(self):
         """
         Produces a hash unique to the pass configuration.
@@ -136,6 +177,11 @@ def __post_init__(self) -> None:
                     "Fusion enabled but reshape elimination disabled. "
                     "Attention + quant (fp8) fusion might not work"
                 )
+            if self.enable_fi_allreduce_fusion:
+                logger.warning_once(
+                    "Fusion enabled but reshape elimination disabled. "
+                    "Allreduce + rms norm + quant (fp8) fusion might not work"
+                )
 
 
 @config
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index f86a93e30003..27ad9c8fd1c2 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -2356,6 +2356,16 @@ def forward_native(
                 value=0.0,
             )
 
+        def reduce_output(states: torch.Tensor) -> torch.Tensor:
+            if (
+                not self.is_sequence_parallel
+                and not self.use_dp_chunking
+                and self.reduce_results
+                and (self.tp_size > 1 or self.ep_size > 1)
+            ):
+                states = self.maybe_all_reduce_tensor_model_parallel(states)
+            return states
+
         if self.shared_experts is None:
             if current_platform.is_tpu():
                 # TODO: Once the OOM issue for the TPU backend is resolved, we
@@ -2366,7 +2376,14 @@ def forward_native(
                 fused_output = torch.ops.vllm.moe_forward(
                     hidden_states, router_logits, self.layer_name
                 )
-            return fused_output[..., :og_hidden_states]
+            if self.zero_expert_num is not None and self.zero_expert_num > 0:
+                assert isinstance(fused_output, tuple)
+                fused_output, zero_expert_result = fused_output
+                return (reduce_output(fused_output) + zero_expert_result)[
+                    ..., :og_hidden_states
+                ]
+            else:
+                return reduce_output(fused_output)[..., :og_hidden_states]
         else:
             if current_platform.is_tpu():
                 # TODO: Once the OOM issue for the TPU backend is resolved, we
@@ -2379,8 +2396,8 @@ def forward_native(
                     hidden_states, router_logits, self.layer_name
                 )
             return (
-                shared_output[..., :og_hidden_states],
-                fused_output[..., :og_hidden_states],
+                reduce_output(shared_output)[..., :og_hidden_states],
+                reduce_output(fused_output)[..., :og_hidden_states],
             )
 
     def forward_cuda(
@@ -2667,31 +2684,21 @@ def forward_impl(
                 assert isinstance(final_hidden_states, tuple)
                 final_hidden_states, zero_expert_result = final_hidden_states
 
-            def reduce_output(
-                states: torch.Tensor, do_combine: bool = True
-            ) -> torch.Tensor:
-                if do_naive_dispatch_combine and do_combine:
+            def combine_output(states: torch.Tensor) -> torch.Tensor:
+                if do_naive_dispatch_combine:
                     states = get_ep_group().combine(states, self.is_sequence_parallel)
-
-                if (
-                    not self.is_sequence_parallel
-                    and self.reduce_results
-                    and (self.tp_size > 1 or self.ep_size > 1)
-                ):
-                    states = self.maybe_all_reduce_tensor_model_parallel(states)
-
                 return states
 
             if self.shared_experts is not None:
                 return (
-                    reduce_output(final_hidden_states[0], do_combine=False),
-                    reduce_output(final_hidden_states[1]),
+                    final_hidden_states[0],
+                    combine_output(final_hidden_states[1]),
                 )
             elif self.zero_expert_num is not None and self.zero_expert_num > 0:
                 assert isinstance(final_hidden_states, torch.Tensor)
-                return reduce_output(final_hidden_states) + zero_expert_result
+                return (combine_output(final_hidden_states), zero_expert_result)
             else:
-                return reduce_output(final_hidden_states)
+                return combine_output(final_hidden_states)
 
     @classmethod
     def make_expert_params_mapping(

From b30372cbd045aeac50833cd6fe6084d2edd5252c Mon Sep 17 00:00:00 2001
From: Jialin Ouyang <Jialin.Ouyang@gmail.com>
Date: Mon, 10 Nov 2025 15:34:18 -0800
Subject: [PATCH 032/183] [Perf] Move gc.freeze logic from EngineCoreProc to
 EngineCore for better coverage (#27896)

Signed-off-by: Jialin Ouyang <Jialin.Ouyang@gmail.com>
---
 vllm/benchmarks/serve.py              |  5 ++---
 vllm/distributed/parallel_state.py    |  3 +++
 vllm/entrypoints/openai/api_server.py |  6 ++----
 vllm/utils/gc_utils.py                | 15 +++++++++++++++
 vllm/v1/engine/core.py                | 15 ++++++++-------
 5 files changed, 30 insertions(+), 14 deletions(-)

diff --git a/vllm/benchmarks/serve.py b/vllm/benchmarks/serve.py
index e58cf5911282..0e9b0fbe2c02 100644
--- a/vllm/benchmarks/serve.py
+++ b/vllm/benchmarks/serve.py
@@ -19,7 +19,6 @@
 import argparse
 import asyncio
 import contextlib
-import gc
 import importlib.util
 import json
 import os
@@ -49,6 +48,7 @@
 from vllm.benchmarks.lib.ready_checker import wait_for_endpoint
 from vllm.benchmarks.lib.utils import convert_to_pytorch_benchmark_format, write_to_json
 from vllm.transformers_utils.tokenizer import get_tokenizer
+from vllm.utils.gc_utils import freeze_gc_heap
 
 MILLISECONDS_TO_SECONDS_CONVERSION = 1000
 
@@ -1414,8 +1414,7 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
     percentile_metrics: str = args.percentile_metrics or default_percentile_metrics
 
     # Avoid GC processing "static" data - reduce pause times.
-    gc.collect()
-    gc.freeze()
+    freeze_gc_heap()
 
     benchmark_result = await benchmark(
         task_type=task_type,
diff --git a/vllm/distributed/parallel_state.py b/vllm/distributed/parallel_state.py
index a9b01e82562b..c78e6a32733c 100644
--- a/vllm/distributed/parallel_state.py
+++ b/vllm/distributed/parallel_state.py
@@ -1483,6 +1483,9 @@ def destroy_distributed_environment():
 
 
 def cleanup_dist_env_and_memory(shutdown_ray: bool = False):
+    # Ensure all objects are not freezed before cleanup
+    gc.unfreeze()
+
     destroy_model_parallel()
     destroy_distributed_environment()
     if shutdown_ray:
diff --git a/vllm/entrypoints/openai/api_server.py b/vllm/entrypoints/openai/api_server.py
index c8c8d5c034d5..51191879e478 100644
--- a/vllm/entrypoints/openai/api_server.py
+++ b/vllm/entrypoints/openai/api_server.py
@@ -1,8 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-
 import asyncio
-import gc
 import hashlib
 import importlib
 import inspect
@@ -118,6 +116,7 @@
 from vllm.tasks import POOLING_TASKS
 from vllm.usage.usage_lib import UsageContext
 from vllm.utils.argparse_utils import FlexibleArgumentParser
+from vllm.utils.gc_utils import freeze_gc_heap
 from vllm.utils.network_utils import is_valid_ipv6_address
 from vllm.utils.system_utils import decorate_logs, set_ulimit
 from vllm.v1.engine.exceptions import EngineDeadError
@@ -153,8 +152,7 @@ async def _force_log():
 
         # Mark the startup heap as static so that it's ignored by GC.
         # Reduces pause times of oldest generation collections.
-        gc.collect()
-        gc.freeze()
+        freeze_gc_heap()
         try:
             yield
         finally:
diff --git a/vllm/utils/gc_utils.py b/vllm/utils/gc_utils.py
index 4dd85ef26f34..160ac9ac263a 100644
--- a/vllm/utils/gc_utils.py
+++ b/vllm/utils/gc_utils.py
@@ -89,6 +89,21 @@ def handle(self, phase: str, info: dict[str, int]) -> None:
             )
 
 
+def freeze_gc_heap() -> None:
+    """
+    Freeze all objects tracked by the garbage collector. It should be invoked
+    after server init / warmup, to reduce GC overhead from static objects
+    during serving time.
+    """
+    # Ensure all static objects are pushed down to the oldest generation for
+    # freeze
+    gc.collect(0)
+    gc.collect(1)
+    gc.collect(2)
+    # Freeze all GC tracked objects
+    gc.freeze()
+
+
 def maybe_attach_gc_debug_callback() -> None:
     """
     Attached a callback for GC debug when VLLM_GC_DEBUG is enabled.
diff --git a/vllm/v1/engine/core.py b/vllm/v1/engine/core.py
index c3efd52130cc..ffb5232e770d 100644
--- a/vllm/v1/engine/core.py
+++ b/vllm/v1/engine/core.py
@@ -1,6 +1,5 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-import gc
 import os
 import queue
 import signal
@@ -27,7 +26,10 @@
 from vllm.multimodal.cache import engine_receiver_cache_from_config
 from vllm.tasks import POOLING_TASKS, SupportedTask
 from vllm.transformers_utils.config import maybe_register_config_serialize_by_value
-from vllm.utils.gc_utils import maybe_attach_gc_debug_callback
+from vllm.utils.gc_utils import (
+    freeze_gc_heap,
+    maybe_attach_gc_debug_callback,
+)
 from vllm.utils.hashing import get_hash_fn_by_name
 from vllm.utils.network_utils import make_zmq_socket
 from vllm.utils.system_utils import decorate_logs, set_process_title
@@ -197,6 +199,10 @@ def __init__(
             self.step if self.batch_queue is None else self.step_with_batch_queue
         )
 
+        # Mark the startup heap as static so that it's ignored by GC.
+        # Reduces pause times of oldest generation collections.
+        freeze_gc_heap()
+
     def _initialize_kv_caches(
         self, vllm_config: VllmConfig
     ) -> tuple[int, int, KVCacheConfig]:
@@ -651,11 +657,6 @@ def __init__(
                 assert addresses.coordinator_input is not None
                 logger.info("Waiting for READY message from DP Coordinator...")
 
-        # Mark the startup heap as static so that it's ignored by GC.
-        # Reduces pause times of oldest generation collections.
-        gc.collect()
-        gc.freeze()
-
         # If enable, attach GC debugger after static variable freeze.
         maybe_attach_gc_debug_callback()
 

From a5a790eea6035760c71eae1861c1e5f369bc6d08 Mon Sep 17 00:00:00 2001
From: Adrian Abeyta <aabeyta@redhat.com>
Date: Mon, 10 Nov 2025 17:42:37 -0600
Subject: [PATCH 033/183] [Bugfix] Ensure calculated KV scales are applied in
 attention. (#27232)

Signed-off-by: adabeyta <aabeyta@redhat.com>
---
 .buildkite/test-pipeline.yaml      |  7 +++++--
 tests/compile/test_full_graph.py   | 10 ++++++++--
 vllm/attention/layer.py            | 29 +++++++----------------------
 vllm/v1/worker/gpu_model_runner.py | 19 +++++++++----------
 4 files changed, 29 insertions(+), 36 deletions(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 3152cd6488f3..a0d2076199b1 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -471,8 +471,8 @@ steps:
   - vllm/
   - tests/compile
   commands:
-  - pytest -v -s compile/test_full_graph.py
-    # Limit to no custom ops to reduce running time 
+  - pytest -v -s compile/test_full_graph.py -k 'not test_fp8_kv_scale_compile'
+    # Limit to no custom ops to reduce running time
     # Wrap with quotes to escape yaml and avoid starting -k string with a -
   - "pytest -v -s compile/test_fusions_e2e.py -k 'TRITON and -quant_fp8'"
 
@@ -951,10 +951,13 @@ steps:
   - vllm/model_executor/layers/activation.py
   - vllm/model_executor/layers/quantization/input_quant_fp8.py
   - tests/compile/test_fusions_e2e.py
+  - tests/compile/test_full_graph.py
   commands:
     - nvidia-smi
     # Run all e2e fusion tests
     - pytest -v -s tests/compile/test_fusions_e2e.py
+    # test_fp8_kv_scale_compile requires FlashAttention (not supported on default L4/L40)
+    - pytest -v -s tests/compile/test_full_graph.py::test_fp8_kv_scale_compile
 
 - label: Blackwell GPT-OSS Eval
   timeout_in_minutes: 60
diff --git a/tests/compile/test_full_graph.py b/tests/compile/test_full_graph.py
index 0ad8c17d8668..71f90f6d8d3e 100644
--- a/tests/compile/test_full_graph.py
+++ b/tests/compile/test_full_graph.py
@@ -183,8 +183,14 @@ def test_custom_compile_config(
     "compilation_mode",
     [CompilationMode.NONE, CompilationMode.VLLM_COMPILE],
 )
-def test_fp8_kv_scale_compile(compilation_mode: int):
-    model = "Qwen/Qwen2-0.5B"
+@pytest.mark.parametrize(
+    "model",
+    [
+        "Qwen/Qwen2-0.5B",  # Standard attention model
+        "deepseek-ai/DeepSeek-V2-Lite",  # MLA (Multi-head Latent Attention) model
+    ],
+)
+def test_fp8_kv_scale_compile(compilation_mode: int, model: str):
     model_kwargs = {
         "quantization": "fp8",
         "kv_cache_dtype": "fp8_e4m3",
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index 17e025155a43..96272981692c 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -745,6 +745,9 @@ def forward(
         k_pe: torch.Tensor,
         output_shape: torch.Size | None = None,
     ) -> torch.Tensor:
+        if self.calculate_kv_scales:
+            torch.ops.vllm.maybe_calc_kv_scales(q, kv_c_normed, k_pe, self.layer_name)
+
         if self.use_direct_call:
             forward_context: ForwardContext = get_forward_context()
             attn_metadata = forward_context.attn_metadata
@@ -752,12 +755,6 @@ def forward(
                 attn_metadata = attn_metadata[self.layer_name]
             self_kv_cache = self.kv_cache[forward_context.virtual_engine]
 
-            # Mirror Attention.forward scale calculation path
-            if self.calculate_kv_scales and getattr(
-                attn_metadata, "enable_kv_scales_calculation", False
-            ):
-                self.calc_kv_scales(q, kv_c_normed, k_pe)
-
             if self.attn_backend.accept_output_buffer:
                 output = torch.empty(output_shape, dtype=q.dtype, device=q.device)
                 self.impl.forward(
@@ -786,14 +783,6 @@ def forward(
                 )
                 return output
             else:
-                # We can still access forward context to check calculation flag
-                if self.calculate_kv_scales:
-                    forward_context = get_forward_context()
-                    attn_metadata = forward_context.attn_metadata
-                    if isinstance(attn_metadata, dict):
-                        attn_metadata = attn_metadata[self.layer_name]
-                    if getattr(attn_metadata, "enable_kv_scales_calculation", False):
-                        self.calc_kv_scales(q, kv_c_normed, k_pe)
                 return torch.ops.vllm.unified_mla_attention(
                     q,
                     kv_c_normed,
@@ -881,17 +870,13 @@ def maybe_calc_kv_scales(
     layer_name: str,
 ) -> None:
     forward_context: ForwardContext = get_forward_context()
-    attn_metadata = forward_context.attn_metadata
-
-    if isinstance(attn_metadata, dict):
-        attn_metadata = attn_metadata[layer_name]
+    self = forward_context.no_compile_layers[layer_name]
 
-    if attn_metadata is None or not getattr(
-        attn_metadata, "enable_kv_scales_calculation", False
-    ):
+    # Only calculate if the layer's calculate_kv_scales flag is True
+    # This flag gets set to False after the first forward pass
+    if not self.calculate_kv_scales:
         return
 
-    self = forward_context.no_compile_layers[layer_name]
     self.calc_kv_scales(query, key, value)
 
 
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 9403b5756e05..6fccf2ea2f47 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -279,6 +279,9 @@ def __init__(
         # This will be overridden in load_model()
         self.is_multimodal_pruning_enabled = False
         self.max_model_len = model_config.max_model_len
+
+        # Always set to false after the first forward pass
+        self.calculate_kv_scales = self.cache_config.calculate_kv_scales
         self.dcp_world_size = self.parallel_config.decode_context_parallel_size
         self.dcp_rank = 0 if self.dcp_world_size <= 1 else get_dcp_group().rank_in_group
         self.max_num_tokens = scheduler_config.max_num_batched_tokens
@@ -2625,16 +2628,12 @@ def execute_model(
             )
 
         # Set cudagraph mode to none if calc_kv_scales is true.
-        if attn_metadata is not None:
-            metadata_list = (
-                attn_metadata.values()
-                if isinstance(attn_metadata, dict)
-                else [attn_metadata]
-            )
-            if any(
-                getattr(m, "enable_kv_scales_calculation", False) for m in metadata_list
-            ):
-                cudagraph_runtime_mode = CUDAGraphMode.NONE
+        # KV scales calculation involves dynamic operations that are incompatible
+        # with CUDA graph capture.
+        if self.calculate_kv_scales:
+            cudagraph_runtime_mode = CUDAGraphMode.NONE
+            # Mark KV scales as calculated after the first forward pass
+            self.calculate_kv_scales = False
 
         # Run the model.
         # Use persistent buffers for CUDA graphs.

From 0bf29fadf5f8b28817fbccb037fb70adaef3f7f1 Mon Sep 17 00:00:00 2001
From: Matthew Bonanni <mbonanni@redhat.com>
Date: Mon, 10 Nov 2025 17:57:41 -0600
Subject: [PATCH 034/183] [Test] Remove old non-varlen FA2 test (#28420)

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
---
 tests/kernels/attention/test_flash_attn.py | 119 ---------------------
 1 file changed, 119 deletions(-)

diff --git a/tests/kernels/attention/test_flash_attn.py b/tests/kernels/attention/test_flash_attn.py
index 18995545552e..6e5468969bf2 100644
--- a/tests/kernels/attention/test_flash_attn.py
+++ b/tests/kernels/attention/test_flash_attn.py
@@ -9,7 +9,6 @@
 from vllm.vllm_flash_attn import (
     fa_version_unsupported_reason,
     flash_attn_varlen_func,
-    flash_attn_with_kvcache,
     is_fa_version_supported,
 )
 
@@ -83,124 +82,6 @@ def ref_paged_attn(
     return torch.cat(outputs, dim=0)
 
 
-@pytest.mark.parametrize("use_out", [True, False])
-@pytest.mark.parametrize("kv_lens", [[1328, 18, 463], [1, 54, 293, 70]])
-@pytest.mark.parametrize("num_heads", NUM_HEADS)
-@pytest.mark.parametrize("head_size", HEAD_SIZES)
-@pytest.mark.parametrize("block_size", BLOCK_SIZES)
-@pytest.mark.parametrize("dtype", DTYPES)
-@pytest.mark.parametrize("soft_cap", SOFT_CAPS)
-@pytest.mark.parametrize("num_blocks", NUM_BLOCKS)
-@pytest.mark.parametrize("sliding_window", SLIDING_WINDOWS)
-@pytest.mark.parametrize("fa_version", [2, 3])
-@pytest.mark.parametrize("q_dtype", QDTYPES)
-@torch.inference_mode()
-def test_flash_attn_with_paged_kv(
-    use_out: bool,
-    kv_lens: list[int],
-    num_heads: tuple[int, int],
-    head_size: int,
-    dtype: torch.dtype,
-    block_size: int,
-    soft_cap: float | None,
-    num_blocks: int,
-    sliding_window: int | None,
-    fa_version: int,
-    q_dtype: torch.dtype | None,
-) -> None:
-    torch.set_default_device("cuda")
-    if not is_fa_version_supported(fa_version):
-        pytest.skip(
-            f"Flash attention version {fa_version} not supported due "
-            f'to: "{fa_version_unsupported_reason(fa_version)}"'
-        )
-    if q_dtype is not None and (dtype != torch.bfloat16 or fa_version == 2):
-        pytest.skip(
-            "Flash attention with quantized inputs is only "
-            "supported on version 3 with bfloat16 base type"
-        )
-
-    current_platform.seed_everything(0)
-    num_seqs = len(kv_lens)
-    num_query_heads = num_heads[0]
-    num_kv_heads = num_heads[1]
-    assert num_query_heads % num_kv_heads == 0
-    max_kv_len = max(kv_lens)
-    scale = head_size**-0.5
-    window_size = (sliding_window - 1, 0) if sliding_window is not None else (-1, -1)
-
-    query = torch.randn(num_seqs, num_query_heads, head_size, dtype=dtype)
-    key_cache = torch.randn(
-        num_blocks, block_size, num_kv_heads, head_size, dtype=dtype
-    )
-    value_cache = torch.randn_like(key_cache)
-    kv_lens_tensor = torch.tensor(kv_lens, dtype=torch.int32)
-
-    max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(
-        0, num_blocks, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
-    )
-
-    q = query.unsqueeze(1)
-    out = torch.empty_like(q) if use_out else None
-
-    maybe_quantized_query = q
-    maybe_quantized_key_cache = key_cache
-    maybe_quantized_value_cache = value_cache
-    q_descale = None
-    k_descale = None
-    v_descale = None
-    if q_dtype is not None:
-        # QKV are drawn from N(0, 1): no need for a fp8 scaling factor
-        maybe_quantized_query = q.to(q_dtype)
-        maybe_quantized_key_cache = key_cache.to(q_dtype)
-        maybe_quantized_value_cache = value_cache.to(q_dtype)
-
-        scale_shape = (num_seqs, num_kv_heads)
-        q_descale = torch.ones(scale_shape, dtype=torch.float32)
-        k_descale = torch.ones(scale_shape, dtype=torch.float32)
-        v_descale = torch.ones(scale_shape, dtype=torch.float32)
-
-    output = flash_attn_with_kvcache(
-        q=maybe_quantized_query,
-        k_cache=maybe_quantized_key_cache,
-        v_cache=maybe_quantized_value_cache,
-        out=out,
-        softmax_scale=scale,
-        causal=True,
-        block_table=block_tables,
-        cache_seqlens=kv_lens_tensor,
-        softcap=soft_cap if soft_cap is not None else 0,
-        window_size=window_size,
-        fa_version=fa_version,
-        q_descale=q_descale,
-        k_descale=k_descale,
-        v_descale=v_descale,
-    )
-    output = output if not use_out else out
-    output = output.squeeze(1)
-
-    atol, rtol = 1.5e-2, 1e-2
-    if q_dtype is not None:
-        atol, rtol = 1.5e-1, 1.5e-1
-
-    ref_output = ref_paged_attn(
-        query=query,
-        key_cache=key_cache,
-        value_cache=value_cache,
-        query_lens=[1] * num_seqs,
-        kv_lens=kv_lens,
-        block_tables=block_tables,
-        scale=scale,
-        soft_cap=soft_cap,
-        sliding_window=sliding_window,
-    )
-    (
-        torch.testing.assert_close(output, ref_output, atol=atol, rtol=rtol),
-        f"{torch.max(torch.abs(output - ref_output))}",
-    )
-
-
 @pytest.mark.parametrize("use_out", [True, False])
 @pytest.mark.parametrize(
     "seq_lens", [[(1, 1328), (5, 18), (129, 463)], [(1, 523), (1, 37), (1, 2011)]]

From 35d801f13fa5bd79ae74707388b1fa4e1caf9ba5 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Mon, 10 Nov 2025 19:08:40 -0500
Subject: [PATCH 035/183] [Feature] Refactor batch invariant fp8 DeepGEMM
 (#27606)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
---
 .../model_executor/layers/quantization/fp8.py | 98 +++----------------
 1 file changed, 11 insertions(+), 87 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index f5fc750baaea..c7d5b251cf4e 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -43,7 +43,6 @@
     QuantizationConfig,
     QuantizeMethodBase,
 )
-from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
 from vllm.model_executor.layers.quantization.kv_cache import BaseKVCacheMethod
 from vllm.model_executor.layers.quantization.utils.flashinfer_utils import (
     FlashinferMoeBackend,
@@ -95,11 +94,9 @@
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 from vllm.utils.deep_gemm import (
-    fp8_gemm_nt,
     get_col_major_tma_aligned_tensor,
     is_deep_gemm_e8m0_used,
     is_deep_gemm_supported,
-    should_use_deepgemm_for_fp8_linear,
 )
 from vllm.utils.flashinfer import has_flashinfer_moe
 from vllm.utils.import_utils import has_deep_gemm
@@ -554,83 +551,19 @@ def apply(
         # if batch invariant mode is enabled, prefer DeepGEMM FP8 path
         # we will use BF16 dequant when DeepGEMM is not supported.
         if vllm_is_batch_invariant():
-            # Call is_deep_gemm_supported() ahead of time for torch.compile
-            # dynamo has trouble tracing through
-            if self.block_quant and should_use_deepgemm_for_fp8_linear(
-                torch.bfloat16, layer.weight, self.use_deep_gemm
-            ):
-                # use group quant consistent with block size across K
-                assert self.act_q_group_shape is not None
-                q_input, input_scale = QuantFP8(
-                    False,
-                    self.act_q_group_shape,
-                    column_major_scales=True,
-                )(x)
-
-                output_2d = torch.empty(
-                    (q_input.shape[0], layer.weight.shape[0]),
-                    dtype=torch.bfloat16,
-                    device=q_input.device,
-                )
-                fp8_gemm_nt(
-                    (q_input, input_scale),
-                    (layer.weight, layer.weight_scale),
-                    output_2d,
-                )
-                if bias is not None:
-                    output_2d = output_2d + bias
-                return output_2d
-
-            # Dequantize FP8 weights to BF16
-            weight_fp8 = layer.weight.to(torch.bfloat16)
-            weight_scale = layer.weight_scale.to(torch.bfloat16)
-
-            # Handle different quantization granularities
             if self.block_quant:
-                # Block-wise quantization:
-                # - Weight is NOT transposed, shape is [N, K] (output_size, input_size)
-                # - Scale has shape [num_blocks_k, num_blocks_n] (TRANSPOSED!)
                 assert self.weight_block_size is not None
-                block_n, block_k = self.weight_block_size  # Note: order is [N, K]
-
-                N, K = weight_fp8.shape
-
-                # determine expected number of blocks along N and K
-                num_blocks_n = (N + block_n - 1) // block_n
-                num_blocks_k = (K + block_k - 1) // block_k
-
-                # scale layout may be [num_blocks_n, num_blocks_k]
-                # or [num_blocks_k, num_blocks_n] depending on backend
-                if weight_scale.dim() != 2:
-                    raise RuntimeError(
-                        f"FP8 block scale must be 2D, got {tuple(weight_scale.shape)}"
-                    )
-
-                scale_rows, scale_cols = weight_scale.shape
-                if (scale_rows, scale_cols) == (num_blocks_k, num_blocks_n):
-                    if num_blocks_n == num_blocks_k:
-                        # ambiguous square case, warn and skip transpose
-                        logger.warning(
-                            "Batch-invariant FP8: square block-scale %dx%d; "
-                            "skipping transpose to avoid misorientation.",
-                            scale_rows,
-                            scale_cols,
-                        )
-                    else:
-                        # clear KN -> transpose to NK
-                        weight_scale = weight_scale.t()
-
-                # Expand scale to match weight dimensions
-                # scale_expanded should have shape [N, K]
-                scale_expanded = weight_scale.repeat_interleave(
-                    block_n, dim=0
-                ).repeat_interleave(block_k, dim=1)
-                # Trim to exact weight size (in case of padding)
-                scale_expanded = scale_expanded[:N, :K]
-                weight_bf16 = weight_fp8 * scale_expanded
+                return self.w8a8_block_fp8_linear.apply(
+                    input=x,
+                    weight=layer.weight,
+                    weight_scale=layer.weight_scale,
+                    input_scale=layer.input_scale,
+                    bias=bias,
+                )
             else:
-                # Per-tensor quantization: weight IS transposed to [K, N]
-                # scale should be scalar or [1] or per-output-channel [N]
+                # per-tensor/channel: dequant to BF16 and run GEMM
+                weight_fp8 = layer.weight.to(torch.bfloat16)
+                weight_scale = layer.weight_scale.to(torch.bfloat16)
                 if weight_scale.numel() == 1:
                     # Per-tensor: simple scalar multiplication
                     weight_bf16 = weight_fp8 * weight_scale
@@ -649,16 +582,7 @@ def apply(
                     else:
                         # Fallback
                         weight_bf16 = weight_fp8 * weight_scale
-
-            # For block quant, weight is [N, K], for per-tensor it's [K, N]
-            # F.linear expects weight to be [N, K], so:
-            if self.block_quant:
-                # Already in correct shape [N, K]
-                output = torch.nn.functional.linear(x, weight_bf16, bias)
-            else:
-                # Need to transpose back: [K, N] -> [N, K]
-                output = torch.nn.functional.linear(x, weight_bf16.t(), bias)
-            return output
+                return torch.nn.functional.linear(x, weight_bf16.t(), bias)
 
         if self.use_marlin:
             return apply_fp8_marlin_linear(

From 39029d519276fddbe0c36440e0eefcdda069b969 Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Mon, 10 Nov 2025 20:36:29 -0500
Subject: [PATCH 036/183] [CI/Test Fix] Fix CP tests on Blackwell (#28404)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Signed-off-by: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
---
 tests/distributed/test_context_parallel.py | 12 ++++++++++++
 vllm/attention/ops/common.py               |  1 -
 2 files changed, 12 insertions(+), 1 deletion(-)

diff --git a/tests/distributed/test_context_parallel.py b/tests/distributed/test_context_parallel.py
index 7f8e77a75621..3576efca591c 100644
--- a/tests/distributed/test_context_parallel.py
+++ b/tests/distributed/test_context_parallel.py
@@ -14,6 +14,7 @@
 from typing import Literal, NamedTuple
 
 import pytest
+import torch
 
 from vllm.config.model import RunnerOption
 from vllm.logger import init_logger
@@ -254,6 +255,17 @@ def test_cp_generation(
     test_options: CPTestOptions,
     num_gpus_available,
 ):
+    if (
+        model_id == "deepseek-ai/DeepSeek-V2-Lite-Chat"
+        and torch.cuda.get_device_capability() < (9, 0)
+    ):
+        pytest.skip(reason="MLA+DCP requires compute capability of 9.0 or higher")
+    if (
+        model_id == "bigcode/gpt_bigcode-santacoder"
+        and torch.cuda.get_device_capability() != (9, 0)
+    ):
+        pytest.skip(reason="GQA+DCP currently requires compute capability of 9.0")
+
     _compare_cp_with_tp(
         model_id,
         parallel_setup,
diff --git a/vllm/attention/ops/common.py b/vllm/attention/ops/common.py
index 75fdcb8f48b2..2cbb5c91cc3b 100644
--- a/vllm/attention/ops/common.py
+++ b/vllm/attention/ops/common.py
@@ -195,7 +195,6 @@ def cp_lse_ag_out_rs(
     cp_attn_lse = cp_attn_lse.contiguous()
     lses = cp_group.all_gather(cp_attn_lse, dim=0).view_as(lses)
     out, lse = correct_attn_out(cp_attn_out, lses, cp_group.rank_in_group, ctx)
-    assert out.is_contiguous()
     out = cp_group.reduce_scatter(out, dim=1)
 
     if return_lse:

From de540c0354b9ecfa979c917a4599f8030d4105be Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Mon, 10 Nov 2025 21:29:48 -0500
Subject: [PATCH 037/183] [Feature] Add env var `VLLM_MOE_USE_DEEP_GEMM`
 (#28422)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
---
 vllm/envs.py                                           |  6 ++++++
 .../compressed_tensors/compressed_tensors_moe.py       | 10 +++++++++-
 vllm/model_executor/layers/quantization/fp8.py         |  2 +-
 vllm/model_executor/warmup/deep_gemm_warmup.py         |  3 +++
 4 files changed, 19 insertions(+), 2 deletions(-)

diff --git a/vllm/envs.py b/vllm/envs.py
index 30c62e90e9fb..9421488051e5 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -147,6 +147,7 @@
     VLLM_TPU_MOST_MODEL_LEN: int | None = None
     VLLM_TPU_USING_PATHWAYS: bool = False
     VLLM_USE_DEEP_GEMM: bool = True
+    VLLM_MOE_USE_DEEP_GEMM: bool = True
     VLLM_USE_DEEP_GEMM_E8M0: bool = True
     VLLM_DEEP_GEMM_WARMUP: Literal[
         "skip",
@@ -1116,6 +1117,10 @@ def get_vllm_port() -> int | None:
     ),
     # Allow use of DeepGemm kernels for fused moe ops.
     "VLLM_USE_DEEP_GEMM": lambda: bool(int(os.getenv("VLLM_USE_DEEP_GEMM", "1"))),
+    # Allow use of DeepGemm specifically for MoE fused ops (overrides only MoE).
+    "VLLM_MOE_USE_DEEP_GEMM": lambda: bool(
+        int(os.getenv("VLLM_MOE_USE_DEEP_GEMM", "1"))
+    ),
     # Whether to use E8M0 scaling when DeepGEMM is used on Blackwell GPUs.
     "VLLM_USE_DEEP_GEMM_E8M0": lambda: bool(
         int(os.getenv("VLLM_USE_DEEP_GEMM_E8M0", "1"))
@@ -1569,6 +1574,7 @@ def compute_hash() -> str:
         "VLLM_USE_FLASHINFER_SAMPLER",
         "VLLM_DISABLED_KERNELS",
         "VLLM_USE_DEEP_GEMM",
+        "VLLM_MOE_USE_DEEP_GEMM",
         "VLLM_USE_DEEP_GEMM_E8M0",
         "VLLM_USE_FUSED_MOE_GROUPED_TOPK",
         "VLLM_USE_FLASHINFER_MOE_FP16",
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
index d32ae6674ee6..59567f2ca13c 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
@@ -966,10 +966,18 @@ def select_gemm_impl(
                 max_num_tokens=max_num_tokens_per_rank,
                 num_dispatchers=prepare_finalize.num_dispatchers(),
                 quant_config=self.moe_quant_config,
+                allow_deep_gemm=(
+                    envs.VLLM_USE_DEEP_GEMM and envs.VLLM_MOE_USE_DEEP_GEMM
+                ),
             )
         else:
             logger.debug("TritonOrDeepGemmExperts(%s)", self.__class__.__name__)
-            return TritonOrDeepGemmExperts(self.moe_quant_config, allow_deep_gemm=True)
+            return TritonOrDeepGemmExperts(
+                self.moe_quant_config,
+                allow_deep_gemm=(
+                    envs.VLLM_USE_DEEP_GEMM and envs.VLLM_MOE_USE_DEEP_GEMM
+                ),
+            )
 
     def get_fused_moe_quant_config(
         self, layer: torch.nn.Module
diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index c7d5b251cf4e..83d136600b77 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -158,7 +158,7 @@ def get_fp8_moe_backend(block_quant: bool) -> Fp8MoeBackend:
         return Fp8MoeBackend.MARLIN
 
     # deepGEMM on supported platforms with block-quantized weights
-    if envs.VLLM_USE_DEEP_GEMM and block_quant:
+    if envs.VLLM_USE_DEEP_GEMM and envs.VLLM_MOE_USE_DEEP_GEMM and block_quant:
         if not has_deep_gemm():
             logger.warning_once("DeepGEMM backend requested but not available.")
         elif is_deep_gemm_supported():
diff --git a/vllm/model_executor/warmup/deep_gemm_warmup.py b/vllm/model_executor/warmup/deep_gemm_warmup.py
index bdcebd498ef0..e0c584df8760 100644
--- a/vllm/model_executor/warmup/deep_gemm_warmup.py
+++ b/vllm/model_executor/warmup/deep_gemm_warmup.py
@@ -148,6 +148,9 @@ def _fp8_linear_may_use_deep_gemm(module: torch.nn.Module) -> bool:
 
 
 def _fused_moe_grouped_gemm_may_use_deep_gemm(module: torch.nn.Module) -> bool:
+    if not (envs.VLLM_USE_DEEP_GEMM and envs.VLLM_MOE_USE_DEEP_GEMM):
+        return False
+
     if not isinstance(module, FusedMoE):
         return False
 

From f2d9ad0620d9aa71481527dcfafdb8357da00470 Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Mon, 10 Nov 2025 19:53:24 -0700
Subject: [PATCH 038/183] Only register rocm_aiter_ops if aiter is found
 (#28428)

Signed-off-by: mgoin <mgoin64@gmail.com>
---
 vllm/_aiter_ops.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/vllm/_aiter_ops.py b/vllm/_aiter_ops.py
index 9a4b5f3399be..8d35aa65738b 100644
--- a/vllm/_aiter_ops.py
+++ b/vllm/_aiter_ops.py
@@ -938,4 +938,5 @@ def shuffle_weights(
         return tuple(shuffle_weight(tensor, layout=layout) for tensor in tensors)
 
 
-rocm_aiter_ops.register_ops_once()
+if IS_AITER_FOUND:
+    rocm_aiter_ops.register_ops_once()

From 57201a6a4c53bbd6adb9a4b702c95d5f480161d5 Mon Sep 17 00:00:00 2001
From: Xin Yang <105740670+xyang16@users.noreply.github.com>
Date: Mon, 10 Nov 2025 18:57:12 -0800
Subject: [PATCH 039/183] Fix rotary embedding benchmark script (#28323)

Signed-off-by: Xin Yang <xyangx@amazon.com>
---
 benchmarks/kernels/benchmark_rope.py | 154 +++++++++++----------------
 1 file changed, 64 insertions(+), 90 deletions(-)

diff --git a/benchmarks/kernels/benchmark_rope.py b/benchmarks/kernels/benchmark_rope.py
index 29ef6409bb16..074b7a440b61 100644
--- a/benchmarks/kernels/benchmark_rope.py
+++ b/benchmarks/kernels/benchmark_rope.py
@@ -1,97 +1,76 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from itertools import accumulate
+import itertools
 
-import nvtx
 import torch
 
-from vllm.model_executor.layers.rotary_embedding import RotaryEmbedding, get_rope
-from vllm.platforms import current_platform
+from vllm.model_executor.layers.rotary_embedding import get_rope
+from vllm.triton_utils import triton
 from vllm.utils.argparse_utils import FlexibleArgumentParser
 
+batch_size_range = [2**i for i in range(0, 8, 2)]
+seq_len_range = [2**i for i in range(6, 10, 1)]
+num_heads_range = [32, 48]
+configs = list(itertools.product(batch_size_range, seq_len_range, num_heads_range))
 
-def benchmark_rope_kernels_multi_lora(
-    is_neox_style: bool,
-    batch_size: int,
-    seq_len: int,
-    num_heads: int,
-    head_size: int,
-    rotary_dim: int | None,
-    dtype: torch.dtype,
-    seed: int,
-    device: str,
-    max_position: int = 8192,
-    base: float = 10000,
-) -> None:
-    current_platform.seed_everything(seed)
-    torch.set_default_device(device)
-    if rotary_dim is None:
-        rotary_dim = head_size
-    # silulating serving 4 LoRAs
-    scaling_factors = [1, 2, 4, 8]
-    # batched RoPE can take multiple scaling factors
-    batched_rope = get_rope(
-        head_size,
-        rotary_dim,
-        max_position,
-        base,
-        is_neox_style,
-        {"rope_type": "linear", "factor": tuple(scaling_factors)},
+
+def get_benchmark(head_size, rotary_dim, is_neox_style, device):
+    @triton.testing.perf_report(
+        triton.testing.Benchmark(
+            x_names=["batch_size", "seq_len", "num_heads"],
+            x_vals=[list(_) for _ in configs],
+            line_arg="provider",
+            line_vals=["torch", "flashinfer", "vllm"],
+            line_names=["PyTorch", "FlashInfer", "vLLM"],
+            styles=[("blue", "-"), ("green", "-"), ("red", "-")],
+            ylabel="us",
+            plot_name=f"rope-perf{'-neox-style' if is_neox_style else ''}",
+            args={},
+        )
     )
-    # non-batched RoPE takes only one scaling factor, we create multiple
-    # instances to simulate the same behavior
-    non_batched_ropes: list[RotaryEmbedding] = []
-    for scaling_factor in scaling_factors:
-        non_batched_ropes.append(
-            get_rope(
-                head_size,
-                rotary_dim,
-                max_position,
-                base,
-                is_neox_style,
-                {"rope_type": "linear", "factor": (scaling_factor,)},
-            )
+    def benchmark(batch_size, seq_len, num_heads, provider):
+        dtype = torch.bfloat16
+        max_position = 8192
+        base = 10000
+        rope = get_rope(head_size, rotary_dim, max_position, base, is_neox_style)
+        rope = rope.to(dtype=dtype, device=device)
+        cos_sin_cache = rope.cos_sin_cache.to(dtype=torch.float, device=device)
+
+        positions = torch.randint(0, max_position, (batch_size, seq_len), device=device)
+        query = torch.randn(
+            (batch_size, seq_len, num_heads * head_size), dtype=dtype, device=device
         )
+        key = torch.randn_like(query)
 
-    positions = torch.randint(0, max_position, (batch_size, seq_len))
-    query = torch.randn(batch_size, seq_len, num_heads * head_size, dtype=dtype)
-    key = torch.randn_like(query)
+        quantiles = [0.5, 0.2, 0.8]
 
-    # create query offsets for batched RoPE, we concat multiple kv cache
-    # together and each query needs to find the right kv cache of its type
-    offset_map = torch.tensor(
-        list(
-            accumulate(
-                [0]
-                + [
-                    max_position * scaling_factor * 2
-                    for scaling_factor in scaling_factors[:-1]
-                ]
+        if provider == "torch":
+            ms, min_ms, max_ms = triton.testing.do_bench(
+                lambda: rope.forward_native(positions, query.clone(), key.clone()),
+                quantiles=quantiles,
             )
-        )
-    )
-    query_types = torch.randint(
-        0, len(scaling_factors), (batch_size, seq_len), device=device
-    )
-    # map query types to offsets
-    query_offsets = offset_map[query_types]
-    # the kernel takes flattened offsets
-    flatten_offsets = query_offsets.flatten()
+        elif provider == "flashinfer":
+            ms, min_ms, max_ms = triton.testing.do_bench(
+                lambda: torch.ops.vllm.flashinfer_rotary_embedding(
+                    positions,
+                    query.clone(),
+                    key.clone(),
+                    head_size,
+                    cos_sin_cache,
+                    is_neox_style,
+                ),
+                quantiles=quantiles,
+            )
+        else:
+            ms, min_ms, max_ms = triton.testing.do_bench(
+                lambda: rope.forward_cuda(positions, query.clone(), key.clone()),
+                quantiles=quantiles,
+            )
+
+        return 1000 * ms, 1000 * max_ms, 1000 * min_ms
 
-    # batched queries of the same type together for non-batched RoPE
-    queries = [query[query_types == i] for i in range(len(scaling_factors))]
-    keys = [key[query_types == i] for i in range(len(scaling_factors))]
-    packed_qkr = zip(queries, keys, non_batched_ropes)
-    # synchronize before start timing
-    torch.cuda.synchronize()
-    with nvtx.annotate("non-batched", color="yellow"):
-        for q, k, r in packed_qkr:
-            r.forward(positions, q, k)
-    torch.cuda.synchronize()
-    with nvtx.annotate("batched", color="green"):
-        batched_rope.forward(positions, query, key, flatten_offsets)
-    torch.cuda.synchronize()
+    return benchmark
 
 
 if __name__ == "__main__":
@@ -116,17 +95,12 @@ def benchmark_rope_kernels_multi_lora(
     parser.add_argument(
         "--device", type=str, choices=["cuda:0", "cuda:1"], default="cuda:0"
     )
+    parser.add_argument("--save-path", type=str, default="./configs/rope/")
     args = parser.parse_args()
-    print(args)
 
-    benchmark_rope_kernels_multi_lora(
-        is_neox_style=args.is_neox_style,
-        batch_size=args.batch_size,
-        seq_len=args.seq_len,
-        num_heads=args.num_heads,
-        head_size=args.head_size,
-        rotary_dim=args.rotary_dim,
-        dtype=getattr(torch, args.dtype),
-        seed=args.seed,
-        device=args.device,
+    # Get the benchmark function
+    benchmark = get_benchmark(
+        args.head_size, args.rotary_dim, args.is_neox_style, args.device
     )
+    # Run performance benchmark
+    benchmark.run(print_data=True, save_path=args.save_path)

From 8d706cca903a008169e7ac8f1dc1f65c8ffd85c0 Mon Sep 17 00:00:00 2001
From: Zhuohan Li <zhuohan123@gmail.com>
Date: Mon, 10 Nov 2025 19:41:23 -0800
Subject: [PATCH 040/183] [Misc] FlattenLogprobs -> FlatLogprobs (#28335)

---
 tests/samplers/test_logprobs.py | 16 +++++--------
 tests/test_logprobs.py          | 40 ++++++++++++++++-----------------
 vllm/envs.py                    |  8 +++----
 vllm/logprobs.py                | 26 ++++++++++-----------
 4 files changed, 43 insertions(+), 47 deletions(-)

diff --git a/tests/samplers/test_logprobs.py b/tests/samplers/test_logprobs.py
index 87f5d40ac1da..c9d227599cde 100644
--- a/tests/samplers/test_logprobs.py
+++ b/tests/samplers/test_logprobs.py
@@ -4,7 +4,7 @@
 import pytest
 
 from vllm import SamplingParams
-from vllm.logprobs import FlattenLogprobs
+from vllm.logprobs import FlatLogprobs
 
 MODELS = ["distilbert/distilgpt2"]
 MAX_TOKENS = 5
@@ -16,17 +16,17 @@
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("dtype", ["half"])
 @pytest.mark.parametrize("greedy", [True, False])
-@pytest.mark.parametrize("flatten_logprobs", [True, False])
+@pytest.mark.parametrize("flat_logprobs", [True, False])
 def test_ranks(
     vllm_runner,
     model,
     dtype,
     greedy,
-    flatten_logprobs,
+    flat_logprobs,
     example_prompts,
     monkeypatch: pytest.MonkeyPatch,
 ):
-    monkeypatch.setenv("VLLM_FLATTEN_LOGPROBS", "1" if flatten_logprobs else "0")
+    monkeypatch.setenv("VLLM_FLAT_LOGPROBS", "1" if flat_logprobs else "0")
     with vllm_runner(model, dtype=dtype, max_logprobs=MAX_LOGPROBS) as vllm_model:
         tokenizer = vllm_model.llm.get_tokenizer()
         example_prompt_tokens = [tokenizer.encode(prompt) for prompt in example_prompts]
@@ -44,12 +44,8 @@ def test_ranks(
         decode_tokens, _, decode_logprobs, prompt_logprobs = result
 
         # Ensure the return type of logprobs is accurate
-        assert isinstance(
-            prompt_logprobs, FlattenLogprobs if flatten_logprobs else list
-        )
-        assert isinstance(
-            decode_logprobs, FlattenLogprobs if flatten_logprobs else list
-        )
+        assert isinstance(prompt_logprobs, FlatLogprobs if flat_logprobs else list)
+        assert isinstance(decode_logprobs, FlatLogprobs if flat_logprobs else list)
 
         ########################
         # Check prompt logprobs
diff --git a/tests/test_logprobs.py b/tests/test_logprobs.py
index 1799d3638178..d26a460d2bca 100644
--- a/tests/test_logprobs.py
+++ b/tests/test_logprobs.py
@@ -5,7 +5,7 @@
 import pytest
 
 from vllm.logprobs import (
-    FlattenLogprobs,
+    FlatLogprobs,
     Logprob,
     LogprobsOnePosition,
     append_logprobs_for_next_position,
@@ -14,8 +14,8 @@
 )
 
 
-def test_create_logprobs_non_flatten(monkeypatch: pytest.MonkeyPatch) -> None:
-    monkeypatch.setenv("VLLM_FLATTEN_LOGPROBS", "0")
+def test_create_logprobs_non_flat(monkeypatch: pytest.MonkeyPatch) -> None:
+    monkeypatch.setenv("VLLM_FLAT_LOGPROBS", "0")
 
     prompt_logprobs = create_prompt_logprobs()
     assert isinstance(prompt_logprobs, list)
@@ -28,11 +28,11 @@ def test_create_logprobs_non_flatten(monkeypatch: pytest.MonkeyPatch) -> None:
     assert len(sample_logprobs) == 0
 
 
-def test_create_logprobs_flatten(monkeypatch: pytest.MonkeyPatch) -> None:
-    monkeypatch.setenv("VLLM_FLATTEN_LOGPROBS", "1")
+def test_create_logprobs_flat(monkeypatch: pytest.MonkeyPatch) -> None:
+    monkeypatch.setenv("VLLM_FLAT_LOGPROBS", "1")
 
     prompt_logprobs = create_prompt_logprobs()
-    assert isinstance(prompt_logprobs, FlattenLogprobs)
+    assert isinstance(prompt_logprobs, FlatLogprobs)
     assert prompt_logprobs.start_indices == [0]
     assert prompt_logprobs.end_indices == [0]
     assert len(prompt_logprobs.token_ids) == 0
@@ -44,7 +44,7 @@ def test_create_logprobs_flatten(monkeypatch: pytest.MonkeyPatch) -> None:
     assert prompt_logprobs[0] == dict()
 
     sample_logprobs = create_sample_logprobs()
-    assert isinstance(sample_logprobs, FlattenLogprobs)
+    assert isinstance(sample_logprobs, FlatLogprobs)
     assert len(sample_logprobs.start_indices) == 0
     assert len(sample_logprobs.end_indices) == 0
     assert len(sample_logprobs.token_ids) == 0
@@ -54,10 +54,10 @@ def test_create_logprobs_flatten(monkeypatch: pytest.MonkeyPatch) -> None:
     assert len(sample_logprobs) == 0
 
 
-def test_append_logprobs_for_next_position_none_flatten(
+def test_append_logprobs_for_next_position_none_flat(
     monkeypatch: pytest.MonkeyPatch,
 ) -> None:
-    monkeypatch.setenv("VLLM_FLATTEN_LOGPROBS", "0")
+    monkeypatch.setenv("VLLM_FLAT_LOGPROBS", "0")
     logprobs = create_sample_logprobs()
     append_logprobs_for_next_position(
         logprobs,
@@ -85,10 +85,10 @@ def test_append_logprobs_for_next_position_none_flatten(
     ]
 
 
-def test_append_logprobs_for_next_position_flatten(
+def test_append_logprobs_for_next_position_flat(
     monkeypatch: pytest.MonkeyPatch,
 ) -> None:
-    monkeypatch.setenv("VLLM_FLATTEN_LOGPROBS", "1")
+    monkeypatch.setenv("VLLM_FLAT_LOGPROBS", "1")
     logprobs = create_sample_logprobs()
     append_logprobs_for_next_position(
         logprobs,
@@ -106,7 +106,7 @@ def test_append_logprobs_for_next_position_flatten(
         rank=11,
         num_logprobs=-1,
     )
-    assert isinstance(logprobs, FlattenLogprobs)
+    assert isinstance(logprobs, FlatLogprobs)
     assert logprobs.start_indices == [0, 1]
     assert logprobs.end_indices == [1, 3]
     assert logprobs.token_ids == [1, 2, 3]
@@ -129,8 +129,8 @@ def test_append_logprobs_for_next_position_flatten(
 }
 
 
-def test_flatten_logprobs_append() -> None:
-    logprobs = FlattenLogprobs()
+def test_flat_logprobs_append() -> None:
+    logprobs = FlatLogprobs()
     logprobs.append(LOGPROBS_ONE_POSITION_0)
     logprobs.append(LOGPROBS_ONE_POSITION_1)
     assert logprobs.start_indices == [0, 1]
@@ -149,8 +149,8 @@ def test_flatten_logprobs_append() -> None:
     assert logprobs.decoded_tokens == ["10", "20", "30", "40", "50", "60"]
 
 
-def test_flatten_logprobs_extend() -> None:
-    logprobs = FlattenLogprobs()
+def test_flat_logprobs_extend() -> None:
+    logprobs = FlatLogprobs()
     # Extend with list[LogprobsOnePosition]
     logprobs.extend([LOGPROBS_ONE_POSITION_2, LOGPROBS_ONE_POSITION_0])
     assert logprobs.start_indices == [0, 3]
@@ -160,9 +160,9 @@ def test_flatten_logprobs_extend() -> None:
     assert logprobs.ranks == [40, 50, 60, 10]
     assert logprobs.decoded_tokens == ["40", "50", "60", "10"]
 
-    other_logprobs = FlattenLogprobs()
+    other_logprobs = FlatLogprobs()
     other_logprobs.extend([LOGPROBS_ONE_POSITION_1, LOGPROBS_ONE_POSITION_0])
-    # Extend with another FlattenLogprobs
+    # Extend with another FlatLogprobs
     logprobs.extend(other_logprobs)
     assert logprobs.start_indices == [0, 3, 4, 6]
     assert logprobs.end_indices == [3, 4, 6, 7]
@@ -172,8 +172,8 @@ def test_flatten_logprobs_extend() -> None:
     assert logprobs.decoded_tokens == ["40", "50", "60", "10", "20", "30", "10"]
 
 
-def test_flatten_logprobs_access() -> None:
-    logprobs = FlattenLogprobs()
+def test_flat_logprobs_access() -> None:
+    logprobs = FlatLogprobs()
     logprobs.extend(
         [LOGPROBS_ONE_POSITION_1, LOGPROBS_ONE_POSITION_2, LOGPROBS_ONE_POSITION_0]
     )
diff --git a/vllm/envs.py b/vllm/envs.py
index 9421488051e5..52178e5f5250 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -223,7 +223,7 @@
     VLLM_GC_DEBUG: str = ""
     VLLM_DISABLE_SHARED_EXPERTS_STREAM: bool = False
     VLLM_COMPILE_CACHE_SAVE_FORMAT: Literal["binary", "unpacked"] = "binary"
-    VLLM_FLATTEN_LOGPROBS: bool = False
+    VLLM_FLAT_LOGPROBS: bool = False
 
 
 def get_default_cache_root():
@@ -1481,11 +1481,11 @@ def get_vllm_port() -> int | None:
     "VLLM_COMPILE_CACHE_SAVE_FORMAT": env_with_choices(
         "VLLM_COMPILE_CACHE_SAVE_FORMAT", "binary", ["binary", "unpacked"]
     ),
-    # Flag to enable FlattenLogprobs whose GC overhead is significantly smaller than
+    # Flag to enable FlatLogprobs whose GC overhead is significantly smaller than
     # the original list[dict[int, Logprob]] approach.
     # After enabled, PromptLogprobs and SampleLogprobs would populated as
-    # FlattenLogprobs.
-    "VLLM_FLATTEN_LOGPROBS": lambda: bool(int(os.getenv("VLLM_FLATTEN_LOGPROBS", "0"))),
+    # FlatLogprobs.
+    "VLLM_FLAT_LOGPROBS": lambda: bool(int(os.getenv("VLLM_FLAT_LOGPROBS", "0"))),
 }
 
 # --8<-- [end:env-vars-definition]
diff --git a/vllm/logprobs.py b/vllm/logprobs.py
index bf66e5f75c79..a34398db2c96 100644
--- a/vllm/logprobs.py
+++ b/vllm/logprobs.py
@@ -30,16 +30,16 @@ class Logprob:
 
 
 @dataclass
-class FlattenLogprobs(MutableSequence[LogprobsOnePosition]):
+class FlatLogprobs(MutableSequence[LogprobsOnePosition]):
     """
-    Flatten logprobs of a request into multiple primitive type lists.
+    Flat logprobs of a request into multiple primitive type lists.
 
     Compared to list[dict[int, Logprob]], this data structure reduced GC
     overhead significantly. As it flattened logprob information for
     all positions and ranks in to multiple primitive type lists (i.e.
     logprobs, token_ids, ranks per token_ids, decoded_tokens).
     So regardless of the sequence length and top_logprobs setup,
-    FlattenLogprobs would only introduce a constant amount of objects.
+    FlatLogprobs would only introduce a constant amount of objects.
 
     As each position might contains different amount of ranks,
     start_indices_per_position would be used to access the logprob ranges
@@ -107,7 +107,7 @@ def __len__(self) -> int:
     def __getitem__(self, position: int) -> LogprobsOnePosition: ...
 
     @overload
-    def __getitem__(self, s: slice, /) -> "FlattenLogprobs": ...
+    def __getitem__(self, s: slice, /) -> "FlatLogprobs": ...
 
     def __getitem__(self, index: int | slice):
         """Extracts logprobs of a given position or slice"""
@@ -123,7 +123,7 @@ def __getitem__(self, index: int | slice):
         elif isinstance(index, slice):
             min_index = self.start_indices[index][0]
             max_index = self.end_indices[index][-1]
-            return FlattenLogprobs(
+            return FlatLogprobs(
                 # Shift updated start_indices and end_indices to
                 # be 0-indexed
                 start_indices=[i - min_index for i in self.start_indices[index]],
@@ -137,13 +137,13 @@ def __getitem__(self, index: int | slice):
             raise TypeError(f"Invalid index type: {type(index)}")
 
     def __setitem__(self, item, value) -> None:
-        raise TypeError("Cannot set logprobs in FlattenLogprobs")
+        raise TypeError("Cannot set logprobs in FlatLogprobs")
 
     def __delitem__(self, item) -> None:
-        raise TypeError("Cannot delete logprobs from FlattenLogprobs")
+        raise TypeError("Cannot delete logprobs from FlatLogprobs")
 
     def insert(self, item) -> None:
-        raise TypeError("Cannot insert logprobs to FlattenLogprobs")
+        raise TypeError("Cannot insert logprobs to FlatLogprobs")
 
     def __iter__(self) -> Iterator[LogprobsOnePosition]:
         """
@@ -156,14 +156,14 @@ def __iter__(self) -> Iterator[LogprobsOnePosition]:
 
 # {token_id -> logprob} per each sequence group. None if the corresponding
 # sequence group doesn't require prompt logprob.
-PromptLogprobs = FlattenLogprobs | list[LogprobsOnePosition | None]
+PromptLogprobs = FlatLogprobs | list[LogprobsOnePosition | None]
 # {token_id -> logprob} for each sequence group.
-SampleLogprobs = FlattenLogprobs | list[LogprobsOnePosition]
+SampleLogprobs = FlatLogprobs | list[LogprobsOnePosition]
 
 
 def create_prompt_logprobs() -> PromptLogprobs:
     """Creates a container to store prompt logprobs for a request"""
-    logprobs = FlattenLogprobs() if envs.VLLM_FLATTEN_LOGPROBS else []
+    logprobs = FlatLogprobs() if envs.VLLM_FLAT_LOGPROBS else []
     # NOTE: logprob of first prompt token is None.
     logprobs.append(None)
     return logprobs
@@ -171,7 +171,7 @@ def create_prompt_logprobs() -> PromptLogprobs:
 
 def create_sample_logprobs() -> SampleLogprobs:
     """Creates a container to store decode logprobs for a request"""
-    return FlattenLogprobs() if envs.VLLM_FLATTEN_LOGPROBS else []
+    return FlatLogprobs() if envs.VLLM_FLAT_LOGPROBS else []
 
 
 def append_logprobs_for_next_position(
@@ -191,7 +191,7 @@ def append_logprobs_for_next_position(
     topk_ranks = range(1, num_logprobs + 1)
     ranks = itertools.chain((rank,), topk_ranks)
 
-    if isinstance(request_logprobs, FlattenLogprobs):
+    if isinstance(request_logprobs, FlatLogprobs):
         request_logprobs.append_fast(token_ids, logprobs, ranks, decoded_tokens)
     else:
         request_logprobs.append(

From bca74e32b7ef03515cda508ba88151e2e547bdc9 Mon Sep 17 00:00:00 2001
From: Zuyi Zhao <zhaozuy@amazon.com>
Date: Mon, 10 Nov 2025 20:57:01 -0800
Subject: [PATCH 041/183] [Frontend] Add sagemaker_standards dynamic lora
 adapter and stateful session management decorators to vLLM OpenAI API server
 (#27892)

Signed-off-by: Zuyi Zhao <zhaozuy@amazon.com>
Signed-off-by: Shen Teng <sheteng@amazon.com>
Co-authored-by: Shen Teng <sheteng@amazon.com>
Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com>
---
 requirements/common.txt                       |   1 +
 tests/entrypoints/sagemaker/__init__.py       |   0
 tests/entrypoints/sagemaker/conftest.py       |  58 ++
 .../test_sagemaker_handler_overrides.py       | 734 ++++++++++++++++++
 .../sagemaker/test_sagemaker_lora_adapters.py | 171 ++++
 .../test_sagemaker_middleware_integration.py  | 346 +++++++++
 .../test_sagemaker_stateful_sessions.py       | 153 ++++
 vllm/entrypoints/dynamic_lora.py              |  57 ++
 vllm/entrypoints/openai/api_server.py         | 100 +--
 vllm/entrypoints/sagemaker/__init__.py        |   4 +
 vllm/entrypoints/sagemaker/routes.py          |  72 ++
 11 files changed, 1613 insertions(+), 83 deletions(-)
 create mode 100644 tests/entrypoints/sagemaker/__init__.py
 create mode 100644 tests/entrypoints/sagemaker/conftest.py
 create mode 100644 tests/entrypoints/sagemaker/test_sagemaker_handler_overrides.py
 create mode 100644 tests/entrypoints/sagemaker/test_sagemaker_lora_adapters.py
 create mode 100644 tests/entrypoints/sagemaker/test_sagemaker_middleware_integration.py
 create mode 100644 tests/entrypoints/sagemaker/test_sagemaker_stateful_sessions.py
 create mode 100644 vllm/entrypoints/dynamic_lora.py
 create mode 100644 vllm/entrypoints/sagemaker/__init__.py
 create mode 100644 vllm/entrypoints/sagemaker/routes.py

diff --git a/requirements/common.txt b/requirements/common.txt
index 8009581f62a4..90efb79a845d 100644
--- a/requirements/common.txt
+++ b/requirements/common.txt
@@ -49,3 +49,4 @@ cbor2 # Required for cross-language serialization of hashable objects
 setproctitle # Used to set process names for better debugging and monitoring
 openai-harmony >= 0.0.3  # Required for gpt-oss
 anthropic == 0.71.0
+model-hosting-container-standards < 1.0.0
\ No newline at end of file
diff --git a/tests/entrypoints/sagemaker/__init__.py b/tests/entrypoints/sagemaker/__init__.py
new file mode 100644
index 000000000000..e69de29bb2d1
diff --git a/tests/entrypoints/sagemaker/conftest.py b/tests/entrypoints/sagemaker/conftest.py
new file mode 100644
index 000000000000..4c859c2527d2
--- /dev/null
+++ b/tests/entrypoints/sagemaker/conftest.py
@@ -0,0 +1,58 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+"""Shared fixtures and utilities for SageMaker tests."""
+
+import pytest
+import pytest_asyncio
+
+from ...utils import RemoteOpenAIServer
+
+# Model name constants used across tests
+MODEL_NAME_ZEPHYR = "HuggingFaceH4/zephyr-7b-beta"
+MODEL_NAME_SMOLLM = "HuggingFaceTB/SmolLM2-135M-Instruct"
+LORA_ADAPTER_NAME_SMOLLM = "jekunz/smollm-135m-lora-fineweb-faroese"
+
+# SageMaker header constants
+HEADER_SAGEMAKER_CLOSED_SESSION_ID = "X-Amzn-SageMaker-Closed-Session-Id"
+HEADER_SAGEMAKER_SESSION_ID = "X-Amzn-SageMaker-Session-Id"
+HEADER_SAGEMAKER_NEW_SESSION_ID = "X-Amzn-SageMaker-New-Session-Id"
+
+
+@pytest.fixture(scope="session")
+def smollm2_lora_files():
+    """Download LoRA files once per test session."""
+    from huggingface_hub import snapshot_download
+
+    return snapshot_download(repo_id=LORA_ADAPTER_NAME_SMOLLM)
+
+
+@pytest.fixture(scope="module")
+def basic_server_with_lora(smollm2_lora_files):
+    """Basic server fixture with standard configuration."""
+    args = [
+        "--dtype",
+        "bfloat16",
+        "--max-model-len",
+        "8192",
+        "--enforce-eager",
+        # lora config below
+        "--enable-lora",
+        "--max-lora-rank",
+        "256",
+        "--max-cpu-loras",
+        "2",
+        "--max-num-seqs",
+        "64",
+    ]
+
+    envs = {"VLLM_ALLOW_RUNTIME_LORA_UPDATING": "True"}
+    with RemoteOpenAIServer(MODEL_NAME_SMOLLM, args, env_dict=envs) as remote_server:
+        yield remote_server
+
+
+@pytest_asyncio.fixture
+async def async_client(basic_server_with_lora: RemoteOpenAIServer):
+    """Async OpenAI client fixture for use with basic_server."""
+    async with basic_server_with_lora.get_async_client() as async_client:
+        yield async_client
diff --git a/tests/entrypoints/sagemaker/test_sagemaker_handler_overrides.py b/tests/entrypoints/sagemaker/test_sagemaker_handler_overrides.py
new file mode 100644
index 000000000000..0d4f8e885824
--- /dev/null
+++ b/tests/entrypoints/sagemaker/test_sagemaker_handler_overrides.py
@@ -0,0 +1,734 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+"""Integration tests for handler override functionality.
+
+Tests real customer usage scenarios:
+- Using @custom_ping_handler and @custom_invocation_handler decorators
+  to override handlers
+- Setting environment variables for handler specifications
+- Writing customer scripts with custom_sagemaker_ping_handler() and
+  custom_sagemaker_invocation_handler() functions
+- Priority: env vars > decorators > customer script files > framework
+  defaults
+
+Note: These tests focus on validating server responses rather than directly calling
+get_ping_handler() and get_invoke_handler() to ensure full integration testing.
+"""
+
+import os
+import tempfile
+
+import pytest
+import requests
+
+from ...utils import RemoteOpenAIServer
+from .conftest import (
+    MODEL_NAME_SMOLLM,
+)
+
+
+class TestHandlerOverrideIntegration:
+    """Integration tests simulating real customer usage scenarios.
+
+    Each test simulates a fresh server startup where customers:
+    - Use @custom_ping_handler and @custom_invocation_handler decorators
+    - Set environment variables (CUSTOM_FASTAPI_PING_HANDLER, etc.)
+    - Write customer scripts with custom_sagemaker_ping_handler() and
+      custom_sagemaker_invocation_handler() functions
+    """
+
+    def setup_method(self):
+        """Setup for each test - simulate fresh server startup."""
+        self._clear_caches()
+        self._clear_env_vars()
+
+    def teardown_method(self):
+        """Cleanup after each test."""
+        self._clear_env_vars()
+
+    def _clear_caches(self):
+        """Clear handler registry and function loader cache."""
+        try:
+            from model_hosting_container_standards.common.handler import (
+                handler_registry,
+            )
+            from model_hosting_container_standards.sagemaker.sagemaker_loader import (
+                SageMakerFunctionLoader,
+            )
+
+            handler_registry.clear()
+            SageMakerFunctionLoader._default_function_loader = None
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+    def _clear_env_vars(self):
+        """Clear SageMaker environment variables."""
+        try:
+            from model_hosting_container_standards.common.fastapi.config import (
+                FastAPIEnvVars,
+            )
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+
+            # Clear SageMaker env vars
+            for var in [
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME,
+            ]:
+                os.environ.pop(var, None)
+
+            # Clear FastAPI env vars
+            for var in [
+                FastAPIEnvVars.CUSTOM_FASTAPI_PING_HANDLER,
+                FastAPIEnvVars.CUSTOM_FASTAPI_INVOCATION_HANDLER,
+            ]:
+                os.environ.pop(var, None)
+        except ImportError:
+            pass
+
+    @pytest.mark.asyncio
+    async def test_customer_script_functions_auto_loaded(self):
+        """Test customer scenario: script functions automatically override
+        framework defaults."""
+        try:
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+        # Customer writes a script file with ping() and invoke() functions
+        with tempfile.NamedTemporaryFile(mode="w", suffix=".py", delete=False) as f:
+            f.write(
+                """
+from fastapi import Request
+
+async def custom_sagemaker_ping_handler():
+    return {
+        "status": "healthy",
+        "source": "customer_override", 
+        "message": "Custom ping from customer script"
+    }
+
+async def custom_sagemaker_invocation_handler(request: Request):
+    return {
+        "predictions": ["Custom response from customer script"],
+        "source": "customer_override"
+    }
+"""
+            )
+            script_path = f.name
+
+        try:
+            script_dir = os.path.dirname(script_path)
+            script_name = os.path.basename(script_path)
+
+            # Customer sets SageMaker environment variables to point to their script
+            env_vars = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: script_dir,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: script_name,
+            }
+
+            args = [
+                "--dtype",
+                "bfloat16",
+                "--max-model-len",
+                "2048",
+                "--enforce-eager",
+                "--max-num-seqs",
+                "32",
+            ]
+
+            with RemoteOpenAIServer(
+                MODEL_NAME_SMOLLM, args, env_dict=env_vars
+            ) as server:
+                # Customer tests their server and sees their overrides work
+                # automatically
+                ping_response = requests.get(server.url_for("ping"))
+                assert ping_response.status_code == 200
+                ping_data = ping_response.json()
+
+                invoke_response = requests.post(
+                    server.url_for("invocations"),
+                    json={
+                        "model": MODEL_NAME_SMOLLM,
+                        "messages": [{"role": "user", "content": "Hello"}],
+                        "max_tokens": 5,
+                    },
+                )
+                assert invoke_response.status_code == 200
+                invoke_data = invoke_response.json()
+
+                # Customer sees their functions are used
+                assert ping_data["source"] == "customer_override"
+                assert ping_data["message"] == "Custom ping from customer script"
+                assert invoke_data["source"] == "customer_override"
+                assert invoke_data["predictions"] == [
+                    "Custom response from customer script"
+                ]
+
+        finally:
+            os.unlink(script_path)
+
+    @pytest.mark.asyncio
+    async def test_customer_decorator_usage(self):
+        """Test customer scenario: using @custom_ping_handler and
+        @custom_invocation_handler decorators."""
+        try:
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+        # Customer writes a script file with decorators
+        with tempfile.NamedTemporaryFile(mode="w", suffix=".py", delete=False) as f:
+            f.write(
+                """
+import model_hosting_container_standards.sagemaker as sagemaker_standards
+from fastapi import Request
+
+@sagemaker_standards.custom_ping_handler
+async def my_ping():
+    return {
+        "type": "ping",
+        "source": "customer_decorator"
+    }
+
+@sagemaker_standards.custom_invocation_handler  
+async def my_invoke(request: Request):
+    return {
+        "type": "invoke", 
+        "source": "customer_decorator"
+    }
+"""
+            )
+            script_path = f.name
+
+        try:
+            script_dir = os.path.dirname(script_path)
+            script_name = os.path.basename(script_path)
+
+            env_vars = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: script_dir,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: script_name,
+            }
+
+            args = [
+                "--dtype",
+                "bfloat16",
+                "--max-model-len",
+                "2048",
+                "--enforce-eager",
+                "--max-num-seqs",
+                "32",
+            ]
+
+            with RemoteOpenAIServer(
+                MODEL_NAME_SMOLLM, args, env_dict=env_vars
+            ) as server:
+                ping_response = requests.get(server.url_for("ping"))
+                assert ping_response.status_code == 200
+                ping_data = ping_response.json()
+
+                invoke_response = requests.post(
+                    server.url_for("invocations"),
+                    json={
+                        "model": MODEL_NAME_SMOLLM,
+                        "messages": [{"role": "user", "content": "Hello"}],
+                        "max_tokens": 5,
+                    },
+                )
+                assert invoke_response.status_code == 200
+                invoke_data = invoke_response.json()
+
+                # Customer sees their handlers are used by the server
+                assert ping_data["source"] == "customer_decorator"
+                assert invoke_data["source"] == "customer_decorator"
+
+        finally:
+            os.unlink(script_path)
+
+    @pytest.mark.asyncio
+    async def test_handler_priority_order(self):
+        """Test priority: @custom_ping_handler/@custom_invocation_handler
+        decorators vs script functions."""
+        try:
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+        # Customer writes a script with both decorator and regular functions
+        with tempfile.NamedTemporaryFile(mode="w", suffix=".py", delete=False) as f:
+            f.write(
+                """
+import model_hosting_container_standards.sagemaker as sagemaker_standards
+from fastapi import Request
+
+# Customer uses @custom_ping_handler decorator (higher priority than script functions)
+@sagemaker_standards.custom_ping_handler
+async def decorated_ping():
+    return {
+        "status": "healthy",
+        "source": "ping_decorator_in_script", 
+        "priority": "decorator"
+    }
+
+# Customer also has a regular function (lower priority than
+# @custom_ping_handler decorator)
+async def custom_sagemaker_ping_handler():
+    return {
+        "status": "healthy",
+        "source": "script_function",
+        "priority": "function"
+    }
+
+# Customer has a regular invoke function
+async def custom_sagemaker_invocation_handler(request: Request):
+    return {
+        "predictions": ["Script function response"],
+        "source": "script_invoke_function",
+        "priority": "function"
+    }
+"""
+            )
+            script_path = f.name
+
+        try:
+            script_dir = os.path.dirname(script_path)
+            script_name = os.path.basename(script_path)
+
+            env_vars = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: script_dir,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: script_name,
+            }
+
+            args = [
+                "--dtype",
+                "bfloat16",
+                "--max-model-len",
+                "2048",
+                "--enforce-eager",
+                "--max-num-seqs",
+                "32",
+            ]
+
+            with RemoteOpenAIServer(
+                MODEL_NAME_SMOLLM, args, env_dict=env_vars
+            ) as server:
+                ping_response = requests.get(server.url_for("ping"))
+                assert ping_response.status_code == 200
+                ping_data = ping_response.json()
+
+                invoke_response = requests.post(
+                    server.url_for("invocations"),
+                    json={
+                        "model": MODEL_NAME_SMOLLM,
+                        "messages": [{"role": "user", "content": "Hello"}],
+                        "max_tokens": 5,
+                    },
+                )
+                assert invoke_response.status_code == 200
+                invoke_data = invoke_response.json()
+
+                # @custom_ping_handler decorator has higher priority than
+                # script function
+                assert ping_data["source"] == "ping_decorator_in_script"
+                assert ping_data["priority"] == "decorator"
+
+                # Script function is used for invoke
+                assert invoke_data["source"] == "script_invoke_function"
+                assert invoke_data["priority"] == "function"
+
+        finally:
+            os.unlink(script_path)
+
+    @pytest.mark.asyncio
+    async def test_environment_variable_script_loading(self):
+        """Test that environment variables correctly specify script location
+        and loading."""
+        try:
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+        # Customer writes a script in a specific directory
+        with tempfile.NamedTemporaryFile(mode="w", suffix=".py", delete=False) as f:
+            f.write(
+                """
+from fastapi import Request
+
+async def custom_sagemaker_ping_handler():
+    return {
+        "status": "healthy",
+        "source": "env_loaded_script",
+        "method": "environment_variable_loading"
+    }
+
+async def custom_sagemaker_invocation_handler(request: Request):
+    return {
+        "predictions": ["Loaded via environment variables"],
+        "source": "env_loaded_script",
+        "method": "environment_variable_loading"
+    }
+"""
+            )
+            script_path = f.name
+
+        try:
+            script_dir = os.path.dirname(script_path)
+            script_name = os.path.basename(script_path)
+
+            # Test environment variable script loading
+            env_vars = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: script_dir,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: script_name,
+            }
+
+            args = [
+                "--dtype",
+                "bfloat16",
+                "--max-model-len",
+                "2048",
+                "--enforce-eager",
+                "--max-num-seqs",
+                "32",
+            ]
+
+            with RemoteOpenAIServer(
+                MODEL_NAME_SMOLLM, args, env_dict=env_vars
+            ) as server:
+                ping_response = requests.get(server.url_for("ping"))
+                assert ping_response.status_code == 200
+                ping_data = ping_response.json()
+
+                invoke_response = requests.post(
+                    server.url_for("invocations"),
+                    json={
+                        "model": MODEL_NAME_SMOLLM,
+                        "messages": [{"role": "user", "content": "Hello"}],
+                        "max_tokens": 5,
+                    },
+                )
+                assert invoke_response.status_code == 200
+                invoke_data = invoke_response.json()
+
+                # Verify that the script was loaded via environment variables
+                assert ping_data["source"] == "env_loaded_script"
+                assert ping_data["method"] == "environment_variable_loading"
+                assert invoke_data["source"] == "env_loaded_script"
+                assert invoke_data["method"] == "environment_variable_loading"
+
+        finally:
+            os.unlink(script_path)
+
+    @pytest.mark.asyncio
+    async def test_framework_default_handlers(self):
+        """Test that framework default handlers work when no customer
+        overrides exist."""
+        args = [
+            "--dtype",
+            "bfloat16",
+            "--max-model-len",
+            "2048",
+            "--enforce-eager",
+            "--max-num-seqs",
+            "32",
+        ]
+
+        # Explicitly pass empty env_dict to ensure no SageMaker env vars are set
+        # This prevents pollution from previous tests
+        try:
+            from model_hosting_container_standards.common.fastapi.config import (
+                FastAPIEnvVars,
+            )
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+
+            env_dict = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: "",
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: "",
+                FastAPIEnvVars.CUSTOM_FASTAPI_PING_HANDLER: "",
+                FastAPIEnvVars.CUSTOM_FASTAPI_INVOCATION_HANDLER: "",
+            }
+        except ImportError:
+            env_dict = {}
+
+        with RemoteOpenAIServer(MODEL_NAME_SMOLLM, args, env_dict=env_dict) as server:
+            # Test that default ping works
+            ping_response = requests.get(server.url_for("ping"))
+            assert ping_response.status_code == 200
+
+            # Test that default invocations work
+            invoke_response = requests.post(
+                server.url_for("invocations"),
+                json={
+                    "model": MODEL_NAME_SMOLLM,
+                    "messages": [{"role": "user", "content": "Hello"}],
+                    "max_tokens": 5,
+                },
+            )
+            assert invoke_response.status_code == 200
+
+    @pytest.mark.asyncio
+    async def test_handler_env_var_override(self):
+        """Test CUSTOM_FASTAPI_PING_HANDLER and CUSTOM_FASTAPI_INVOCATION_HANDLER
+        environment variable overrides."""
+        try:
+            from model_hosting_container_standards.common.fastapi.config import (
+                FastAPIEnvVars,
+            )
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+        # Create a script with both env var handlers and script functions
+        with tempfile.NamedTemporaryFile(mode="w", suffix=".py", delete=False) as f:
+            f.write(
+                """
+from fastapi import Request, Response
+import json
+
+async def env_var_ping_handler(raw_request: Request) -> Response:
+    return Response(
+        content=json.dumps({
+            "status": "healthy",
+            "source": "env_var_ping",
+            "method": "environment_variable"
+        }),
+        media_type="application/json"
+    )
+
+async def env_var_invoke_handler(raw_request: Request) -> Response:
+    return Response(
+        content=json.dumps({
+            "predictions": ["Environment variable response"],
+            "source": "env_var_invoke",
+            "method": "environment_variable"
+        }),
+        media_type="application/json"
+    )
+
+async def custom_sagemaker_ping_handler():
+    return {
+        "status": "healthy",
+        "source": "script_ping",
+        "method": "script_function"
+    }
+
+async def custom_sagemaker_invocation_handler(request: Request):
+    return {
+        "predictions": ["Script function response"],
+        "source": "script_invoke",
+        "method": "script_function"
+    }
+"""
+            )
+            script_path = f.name
+
+        try:
+            script_dir = os.path.dirname(script_path)
+            script_name = os.path.basename(script_path)
+
+            # Set environment variables to override both handlers
+            env_vars = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: script_dir,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: script_name,
+                FastAPIEnvVars.CUSTOM_FASTAPI_PING_HANDLER: (
+                    f"{script_name}:env_var_ping_handler"
+                ),
+                FastAPIEnvVars.CUSTOM_FASTAPI_INVOCATION_HANDLER: (
+                    f"{script_name}:env_var_invoke_handler"
+                ),
+            }
+
+            args = [
+                "--dtype",
+                "bfloat16",
+                "--max-model-len",
+                "2048",
+                "--enforce-eager",
+                "--max-num-seqs",
+                "32",
+            ]
+
+            with RemoteOpenAIServer(
+                MODEL_NAME_SMOLLM, args, env_dict=env_vars
+            ) as server:
+                # Test ping handler override
+                ping_response = requests.get(server.url_for("ping"))
+                assert ping_response.status_code == 200
+                ping_data = ping_response.json()
+
+                # Environment variable should override script function
+                assert ping_data["method"] == "environment_variable"
+                assert ping_data["source"] == "env_var_ping"
+
+                # Test invocation handler override
+                invoke_response = requests.post(
+                    server.url_for("invocations"),
+                    json={
+                        "model": MODEL_NAME_SMOLLM,
+                        "messages": [{"role": "user", "content": "Hello"}],
+                        "max_tokens": 5,
+                    },
+                )
+                assert invoke_response.status_code == 200
+                invoke_data = invoke_response.json()
+
+                # Environment variable should override script function
+                assert invoke_data["method"] == "environment_variable"
+                assert invoke_data["source"] == "env_var_invoke"
+
+        finally:
+            os.unlink(script_path)
+
+    @pytest.mark.asyncio
+    async def test_env_var_priority_over_decorator_and_script(self):
+        """Test that environment variables have highest priority over decorators
+        and script functions for both ping and invocation handlers."""
+        try:
+            from model_hosting_container_standards.common.fastapi.config import (
+                FastAPIEnvVars,
+            )
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+        # Create a script with all three handler types for both ping and invocation
+        with tempfile.NamedTemporaryFile(mode="w", suffix=".py", delete=False) as f:
+            f.write(
+                """
+import model_hosting_container_standards.sagemaker as sagemaker_standards
+from fastapi import Request, Response
+import json
+
+# Environment variable handlers (highest priority)
+async def env_priority_ping(raw_request: Request) -> Response:
+    return Response(
+        content=json.dumps({
+            "status": "healthy",
+            "source": "env_var",
+            "priority": "environment_variable"
+        }),
+        media_type="application/json"
+    )
+
+async def env_priority_invoke(raw_request: Request) -> Response:
+    return Response(
+        content=json.dumps({
+            "predictions": ["Environment variable response"],
+            "source": "env_var",
+            "priority": "environment_variable"
+        }),
+        media_type="application/json"
+    )
+
+# Decorator handlers (medium priority)
+@sagemaker_standards.custom_ping_handler
+async def decorator_ping(raw_request: Request) -> Response:
+    return Response(
+        content=json.dumps({
+            "status": "healthy",
+            "source": "decorator",
+            "priority": "decorator"
+        }),
+        media_type="application/json"
+    )
+
+@sagemaker_standards.custom_invocation_handler
+async def decorator_invoke(raw_request: Request) -> Response:
+    return Response(
+        content=json.dumps({
+            "predictions": ["Decorator response"],
+            "source": "decorator",
+            "priority": "decorator"
+        }),
+        media_type="application/json"
+    )
+
+# Script functions (lowest priority)
+async def custom_sagemaker_ping_handler():
+    return {
+        "status": "healthy",
+        "source": "script",
+        "priority": "script_function"
+    }
+
+async def custom_sagemaker_invocation_handler(request: Request):
+    return {
+        "predictions": ["Script function response"],
+        "source": "script",
+        "priority": "script_function"
+    }
+"""
+            )
+            script_path = f.name
+
+        try:
+            script_dir = os.path.dirname(script_path)
+            script_name = os.path.basename(script_path)
+
+            # Set environment variables to specify highest priority handlers
+            env_vars = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: script_dir,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: script_name,
+                FastAPIEnvVars.CUSTOM_FASTAPI_PING_HANDLER: (
+                    f"{script_name}:env_priority_ping"
+                ),
+                FastAPIEnvVars.CUSTOM_FASTAPI_INVOCATION_HANDLER: (
+                    f"{script_name}:env_priority_invoke"
+                ),
+            }
+
+            args = [
+                "--dtype",
+                "bfloat16",
+                "--max-model-len",
+                "2048",
+                "--enforce-eager",
+                "--max-num-seqs",
+                "32",
+            ]
+
+            with RemoteOpenAIServer(
+                MODEL_NAME_SMOLLM, args, env_dict=env_vars
+            ) as server:
+                # Test ping handler priority
+                ping_response = requests.get(server.url_for("ping"))
+                assert ping_response.status_code == 200
+                ping_data = ping_response.json()
+
+                # Environment variable has highest priority and should be used
+                assert ping_data["priority"] == "environment_variable"
+                assert ping_data["source"] == "env_var"
+
+                # Test invocation handler priority
+                invoke_response = requests.post(
+                    server.url_for("invocations"),
+                    json={
+                        "model": MODEL_NAME_SMOLLM,
+                        "messages": [{"role": "user", "content": "Hello"}],
+                        "max_tokens": 5,
+                    },
+                )
+                assert invoke_response.status_code == 200
+                invoke_data = invoke_response.json()
+
+                # Environment variable has highest priority and should be used
+                assert invoke_data["priority"] == "environment_variable"
+                assert invoke_data["source"] == "env_var"
+
+        finally:
+            os.unlink(script_path)
diff --git a/tests/entrypoints/sagemaker/test_sagemaker_lora_adapters.py b/tests/entrypoints/sagemaker/test_sagemaker_lora_adapters.py
new file mode 100644
index 000000000000..a2867efdc584
--- /dev/null
+++ b/tests/entrypoints/sagemaker/test_sagemaker_lora_adapters.py
@@ -0,0 +1,171 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import openai  # use the official async_client for correctness check
+import pytest
+import requests
+
+from ...utils import RemoteOpenAIServer
+from .conftest import MODEL_NAME_SMOLLM
+
+
+@pytest.mark.asyncio
+async def test_sagemaker_load_adapter_happy_path(
+    async_client: openai.AsyncOpenAI,
+    basic_server_with_lora: RemoteOpenAIServer,
+    smollm2_lora_files,
+):
+    # The SageMaker standards library creates a POST /adapters endpoint
+    # that maps to the load_lora_adapter handler with request shape:
+    # {"lora_name": "body.name", "lora_path": "body.src"}
+    load_response = requests.post(
+        basic_server_with_lora.url_for("adapters"),
+        json={"name": "smollm2-lora-sagemaker", "src": smollm2_lora_files},
+    )
+    load_response.raise_for_status()
+
+    models = await async_client.models.list()
+    models = models.data
+    dynamic_lora_model = models[-1]
+    assert dynamic_lora_model.root == smollm2_lora_files
+    assert dynamic_lora_model.parent == MODEL_NAME_SMOLLM
+    assert dynamic_lora_model.id == "smollm2-lora-sagemaker"
+
+
+@pytest.mark.asyncio
+async def test_sagemaker_unload_adapter_happy_path(
+    async_client: openai.AsyncOpenAI,
+    basic_server_with_lora: RemoteOpenAIServer,
+    smollm2_lora_files,
+):
+    # First, load an adapter
+    adapter_name = "smollm2-lora-sagemaker-unload"
+    load_response = requests.post(
+        basic_server_with_lora.url_for("adapters"),
+        json={"name": adapter_name, "src": smollm2_lora_files},
+    )
+    load_response.raise_for_status()
+
+    # Verify it's in the models list
+    models = await async_client.models.list()
+    adapter_ids = [model.id for model in models.data]
+    assert adapter_name in adapter_ids
+
+    # Now unload it using DELETE /adapters/{adapter_name}
+    # The SageMaker standards maps this to unload_lora_adapter with:
+    # {"lora_name": "path_params.adapter_name"}
+    unload_response = requests.delete(
+        basic_server_with_lora.url_for("adapters", adapter_name),
+    )
+    unload_response.raise_for_status()
+
+    # Verify it's no longer in the models list
+    models = await async_client.models.list()
+    adapter_ids = [model.id for model in models.data]
+    assert adapter_name not in adapter_ids
+
+
+@pytest.mark.asyncio
+async def test_sagemaker_load_adapter_not_found(
+    basic_server_with_lora: RemoteOpenAIServer,
+):
+    load_response = requests.post(
+        basic_server_with_lora.url_for("adapters"),
+        json={"name": "nonexistent-adapter", "src": "/path/does/not/exist"},
+    )
+    assert load_response.status_code == 404
+
+
+@pytest.mark.asyncio
+async def test_sagemaker_load_adapter_invalid_files(
+    basic_server_with_lora: RemoteOpenAIServer,
+    tmp_path,
+):
+    invalid_files = tmp_path / "invalid_adapter"
+    invalid_files.mkdir()
+    (invalid_files / "adapter_config.json").write_text("not valid json")
+
+    load_response = requests.post(
+        basic_server_with_lora.url_for("adapters"),
+        json={"name": "invalid-adapter", "src": str(invalid_files)},
+    )
+    assert load_response.status_code == 400
+
+
+@pytest.mark.asyncio
+async def test_sagemaker_unload_nonexistent_adapter(
+    basic_server_with_lora: RemoteOpenAIServer,
+):
+    # Attempt to unload an adapter that doesn't exist
+    unload_response = requests.delete(
+        basic_server_with_lora.url_for("adapters", "nonexistent-adapter-name"),
+    )
+    assert unload_response.status_code in (400, 404)
+
+
+@pytest.mark.asyncio
+async def test_sagemaker_invocations_with_adapter(
+    basic_server_with_lora: RemoteOpenAIServer,
+    smollm2_lora_files,
+):
+    # First, load an adapter via SageMaker endpoint
+    adapter_name = "smollm2-lora-invoke-test"
+    load_response = requests.post(
+        basic_server_with_lora.url_for("adapters"),
+        json={"name": adapter_name, "src": smollm2_lora_files},
+    )
+    load_response.raise_for_status()
+
+    # Now test the /invocations endpoint with the adapter
+    invocation_response = requests.post(
+        basic_server_with_lora.url_for("invocations"),
+        headers={
+            "X-Amzn-SageMaker-Adapter-Identifier": adapter_name,
+        },
+        json={
+            "prompt": "Hello, how are you?",
+            "max_tokens": 10,
+        },
+    )
+    invocation_response.raise_for_status()
+    invocation_output = invocation_response.json()
+
+    # Verify we got a valid completion response
+    assert "choices" in invocation_output
+    assert len(invocation_output["choices"]) > 0
+    assert "text" in invocation_output["choices"][0]
+
+
+@pytest.mark.asyncio
+async def test_sagemaker_multiple_adapters_load_unload(
+    async_client: openai.AsyncOpenAI,
+    basic_server_with_lora: RemoteOpenAIServer,
+    smollm2_lora_files,
+):
+    adapter_names = [f"sagemaker-adapter-{i}" for i in range(5)]
+
+    # Load all adapters
+    for adapter_name in adapter_names:
+        load_response = requests.post(
+            basic_server_with_lora.url_for("adapters"),
+            json={"name": adapter_name, "src": smollm2_lora_files},
+        )
+        load_response.raise_for_status()
+
+    # Verify all are in the models list
+    models = await async_client.models.list()
+    adapter_ids = [model.id for model in models.data]
+    for adapter_name in adapter_names:
+        assert adapter_name in adapter_ids
+
+    # Unload all adapters
+    for adapter_name in adapter_names:
+        unload_response = requests.delete(
+            basic_server_with_lora.url_for("adapters", adapter_name),
+        )
+        unload_response.raise_for_status()
+
+    # Verify all are removed from models list
+    models = await async_client.models.list()
+    adapter_ids = [model.id for model in models.data]
+    for adapter_name in adapter_names:
+        assert adapter_name not in adapter_ids
diff --git a/tests/entrypoints/sagemaker/test_sagemaker_middleware_integration.py b/tests/entrypoints/sagemaker/test_sagemaker_middleware_integration.py
new file mode 100644
index 000000000000..f1ed0c7e2897
--- /dev/null
+++ b/tests/entrypoints/sagemaker/test_sagemaker_middleware_integration.py
@@ -0,0 +1,346 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+"""Integration test for middleware loader functionality.
+
+Tests that customer middlewares get called correctly with a vLLM server.
+"""
+
+import os
+import tempfile
+
+import pytest
+import requests
+
+from ...utils import RemoteOpenAIServer
+from .conftest import (
+    MODEL_NAME_SMOLLM,
+)
+
+
+class TestMiddlewareIntegration:
+    """Integration test for middleware with vLLM server."""
+
+    def setup_method(self):
+        """Setup for each test - simulate fresh server startup."""
+        self._clear_caches()
+
+    def _clear_caches(self):
+        """Clear middleware registry and function loader cache."""
+        try:
+            from model_hosting_container_standards.common.fastapi.middleware import (
+                middleware_registry,
+            )
+            from model_hosting_container_standards.common.fastapi.middleware.source.decorator_loader import (  # noqa: E501
+                decorator_loader,
+            )
+            from model_hosting_container_standards.sagemaker.sagemaker_loader import (
+                SageMakerFunctionLoader,
+            )
+
+            middleware_registry.clear_middlewares()
+            decorator_loader.clear()
+            SageMakerFunctionLoader._default_function_loader = None
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+    @pytest.mark.asyncio
+    async def test_customer_middleware_with_vllm_server(self):
+        """Test that customer middlewares work with actual vLLM server.
+
+        Tests decorator-based middlewares (@custom_middleware, @input_formatter,
+        @output_formatter)
+        on multiple endpoints (chat/completions, invocations).
+        """
+        try:
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+        # Customer writes a middleware script with multiple decorators
+        with tempfile.NamedTemporaryFile(mode="w", suffix=".py", delete=False) as f:
+            f.write(
+                """
+from model_hosting_container_standards.common.fastapi.middleware import (
+    custom_middleware, input_formatter, output_formatter
+)
+
+# Global flag to track if input formatter was called
+_input_formatter_called = False
+
+@input_formatter
+async def customer_input_formatter(request):
+    # Process input - mark that input formatter was called
+    global _input_formatter_called
+    _input_formatter_called = True
+    return request
+
+@custom_middleware("throttle")
+async def customer_throttle_middleware(request, call_next):
+    response = await call_next(request)
+    response.headers["X-Customer-Throttle"] = "applied"
+    order = response.headers.get("X-Middleware-Order", "")
+    response.headers["X-Middleware-Order"] = order + "throttle,"
+    return response
+
+@output_formatter
+async def customer_output_formatter(response):
+    global _input_formatter_called
+    response.headers["X-Customer-Processed"] = "true"
+    # Since input_formatter and output_formatter are combined into
+    # pre_post_process middleware,
+    # if output_formatter is called, input_formatter should have been called too
+    if _input_formatter_called:
+        response.headers["X-Input-Formatter-Called"] = "true"
+    order = response.headers.get("X-Middleware-Order", "")
+    response.headers["X-Middleware-Order"] = order + "output_formatter,"
+    return response
+"""
+            )
+            script_path = f.name
+
+        try:
+            script_dir = os.path.dirname(script_path)
+            script_name = os.path.basename(script_path)
+
+            # Set environment variables to point to customer script
+            env_vars = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: script_dir,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: script_name,
+            }
+
+            args = [
+                "--dtype",
+                "bfloat16",
+                "--max-model-len",
+                "2048",
+                "--enforce-eager",
+                "--max-num-seqs",
+                "32",
+            ]
+
+            with RemoteOpenAIServer(
+                MODEL_NAME_SMOLLM, args, env_dict=env_vars
+            ) as server:
+                # Test 1: Middlewares applied to chat/completions endpoint
+                chat_response = requests.post(
+                    server.url_for("v1/chat/completions"),
+                    json={
+                        "model": MODEL_NAME_SMOLLM,
+                        "messages": [{"role": "user", "content": "Hello"}],
+                        "max_tokens": 5,
+                        "temperature": 0.0,
+                    },
+                )
+
+                assert chat_response.status_code == 200
+
+                # Verify all middlewares were executed
+                assert "X-Customer-Throttle" in chat_response.headers
+                assert chat_response.headers["X-Customer-Throttle"] == "applied"
+                assert "X-Customer-Processed" in chat_response.headers
+                assert chat_response.headers["X-Customer-Processed"] == "true"
+
+                # Verify input formatter was called
+                assert "X-Input-Formatter-Called" in chat_response.headers
+                assert chat_response.headers["X-Input-Formatter-Called"] == "true"
+
+                # Verify middleware execution order
+                execution_order = chat_response.headers.get(
+                    "X-Middleware-Order", ""
+                ).rstrip(",")
+                order_parts = execution_order.split(",") if execution_order else []
+                assert "throttle" in order_parts
+                assert "output_formatter" in order_parts
+
+                # Test 2: Middlewares applied to invocations endpoint
+                invocations_response = requests.post(
+                    server.url_for("invocations"),
+                    json={
+                        "model": MODEL_NAME_SMOLLM,
+                        "messages": [{"role": "user", "content": "Hello"}],
+                        "max_tokens": 5,
+                        "temperature": 0.0,
+                    },
+                )
+
+                assert invocations_response.status_code == 200
+
+                # Verify all middlewares were executed
+                assert "X-Customer-Throttle" in invocations_response.headers
+                assert invocations_response.headers["X-Customer-Throttle"] == "applied"
+                assert "X-Customer-Processed" in invocations_response.headers
+                assert invocations_response.headers["X-Customer-Processed"] == "true"
+
+                # Verify input formatter was called
+                assert "X-Input-Formatter-Called" in invocations_response.headers
+                assert (
+                    invocations_response.headers["X-Input-Formatter-Called"] == "true"
+                )
+
+        finally:
+            os.unlink(script_path)
+
+    @pytest.mark.asyncio
+    async def test_middleware_with_ping_endpoint(self):
+        """Test that middlewares work with SageMaker ping endpoint."""
+        try:
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+        # Customer writes a middleware script
+        with tempfile.NamedTemporaryFile(mode="w", suffix=".py", delete=False) as f:
+            f.write(
+                """
+from model_hosting_container_standards.common.fastapi.middleware import (
+    custom_middleware
+)
+
+@custom_middleware("pre_post_process")
+async def ping_tracking_middleware(request, call_next):
+    response = await call_next(request)
+    if request.url.path == "/ping":
+        response.headers["X-Ping-Tracked"] = "true"
+    return response
+"""
+            )
+            script_path = f.name
+
+        try:
+            script_dir = os.path.dirname(script_path)
+            script_name = os.path.basename(script_path)
+
+            env_vars = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: script_dir,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: script_name,
+            }
+
+            args = [
+                "--dtype",
+                "bfloat16",
+                "--max-model-len",
+                "2048",
+                "--enforce-eager",
+                "--max-num-seqs",
+                "32",
+            ]
+
+            with RemoteOpenAIServer(
+                MODEL_NAME_SMOLLM, args, env_dict=env_vars
+            ) as server:
+                # Test ping endpoint with middleware
+                response = requests.get(server.url_for("ping"))
+
+                assert response.status_code == 200
+                assert "X-Ping-Tracked" in response.headers
+                assert response.headers["X-Ping-Tracked"] == "true"
+
+        finally:
+            os.unlink(script_path)
+
+    @pytest.mark.asyncio
+    async def test_middleware_env_var_override(self):
+        """Test middleware environment variable overrides."""
+        try:
+            from model_hosting_container_standards.common.fastapi.config import (
+                FastAPIEnvVars,
+            )
+            from model_hosting_container_standards.sagemaker.config import (
+                SageMakerEnvVars,
+            )
+        except ImportError:
+            pytest.skip("model-hosting-container-standards not available")
+
+        # Create a script with middleware functions specified via env vars
+        with tempfile.NamedTemporaryFile(mode="w", suffix=".py", delete=False) as f:
+            f.write(
+                """
+from fastapi import Request
+
+# Global flag to track if pre_process was called
+_pre_process_called = False
+
+async def env_throttle_middleware(request, call_next):
+    response = await call_next(request)
+    response.headers["X-Env-Throttle"] = "applied"
+    return response
+
+async def env_pre_process(request: Request) -> Request:
+    # Mark that pre_process was called
+    global _pre_process_called
+    _pre_process_called = True
+    return request
+
+async def env_post_process(response):
+    global _pre_process_called
+    if hasattr(response, 'headers'):
+        response.headers["X-Env-Post-Process"] = "applied"
+        # Since pre_process and post_process are combined into
+        # pre_post_process middleware,
+        # if post_process is called, pre_process should have been called too
+        if _pre_process_called:
+            response.headers["X-Pre-Process-Called"] = "true"
+    return response
+"""
+            )
+            script_path = f.name
+
+        try:
+            script_dir = os.path.dirname(script_path)
+            script_name = os.path.basename(script_path)
+
+            # Set environment variables for middleware
+            # Use script_name with .py extension as per plugin example
+            env_vars = {
+                SageMakerEnvVars.SAGEMAKER_MODEL_PATH: script_dir,
+                SageMakerEnvVars.CUSTOM_SCRIPT_FILENAME: script_name,
+                FastAPIEnvVars.CUSTOM_FASTAPI_MIDDLEWARE_THROTTLE: (
+                    f"{script_name}:env_throttle_middleware"
+                ),
+                FastAPIEnvVars.CUSTOM_PRE_PROCESS: f"{script_name}:env_pre_process",
+                FastAPIEnvVars.CUSTOM_POST_PROCESS: f"{script_name}:env_post_process",
+            }
+
+            args = [
+                "--dtype",
+                "bfloat16",
+                "--max-model-len",
+                "2048",
+                "--enforce-eager",
+                "--max-num-seqs",
+                "32",
+            ]
+
+            with RemoteOpenAIServer(
+                MODEL_NAME_SMOLLM, args, env_dict=env_vars
+            ) as server:
+                response = requests.get(server.url_for("ping"))
+                assert response.status_code == 200
+
+                # Check if environment variable middleware was applied
+                headers = response.headers
+
+                # Verify that env var middlewares were applied
+                assert "X-Env-Throttle" in headers, (
+                    "Throttle middleware should be applied via env var"
+                )
+                assert headers["X-Env-Throttle"] == "applied"
+
+                assert "X-Env-Post-Process" in headers, (
+                    "Post-process middleware should be applied via env var"
+                )
+                assert headers["X-Env-Post-Process"] == "applied"
+
+                # Verify that pre_process was called
+                assert "X-Pre-Process-Called" in headers, (
+                    "Pre-process should be called via env var"
+                )
+                assert headers["X-Pre-Process-Called"] == "true"
+
+        finally:
+            os.unlink(script_path)
diff --git a/tests/entrypoints/sagemaker/test_sagemaker_stateful_sessions.py b/tests/entrypoints/sagemaker/test_sagemaker_stateful_sessions.py
new file mode 100644
index 000000000000..6206000385bd
--- /dev/null
+++ b/tests/entrypoints/sagemaker/test_sagemaker_stateful_sessions.py
@@ -0,0 +1,153 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+
+import openai  # use the official client for correctness check
+import pytest
+import requests
+
+from ...utils import RemoteOpenAIServer
+from .conftest import (
+    HEADER_SAGEMAKER_CLOSED_SESSION_ID,
+    HEADER_SAGEMAKER_NEW_SESSION_ID,
+    HEADER_SAGEMAKER_SESSION_ID,
+    MODEL_NAME_SMOLLM,
+)
+
+CLOSE_BADREQUEST_CASES = [
+    (
+        "nonexistent_session_id",
+        {"session_id": "nonexistent-session-id"},
+        {},
+        "session not found",
+    ),
+    ("malformed_close_request", {}, {"extra-field": "extra-field-data"}, None),
+]
+
+
+@pytest.mark.asyncio
+async def test_create_session_badrequest(basic_server_with_lora: RemoteOpenAIServer):
+    bad_response = requests.post(
+        basic_server_with_lora.url_for("invocations"),
+        json={"requestType": "NEW_SESSION", "extra-field": "extra-field-data"},
+    )
+
+    assert bad_response.status_code == 400
+
+
+@pytest.mark.asyncio
+@pytest.mark.parametrize(
+    "test_name,session_id_change,request_body_change,expected_error",
+    CLOSE_BADREQUEST_CASES,
+)
+async def test_close_session_badrequest(
+    basic_server_with_lora: RemoteOpenAIServer,
+    test_name: str,
+    session_id_change: dict[str, str],
+    request_body_change: dict[str, str],
+    expected_error: str | None,
+):
+    # first attempt to create a session
+    url = basic_server_with_lora.url_for("invocations")
+    create_response = requests.post(url, json={"requestType": "NEW_SESSION"})
+    create_response.raise_for_status()
+    valid_session_id, expiration = create_response.headers.get(
+        HEADER_SAGEMAKER_NEW_SESSION_ID, ""
+    ).split(";")
+    assert valid_session_id
+
+    close_request_json = {"requestType": "CLOSE"}
+    if request_body_change:
+        close_request_json.update(request_body_change)
+    bad_session_id = session_id_change.get("session_id")
+    bad_close_response = requests.post(
+        url,
+        headers={HEADER_SAGEMAKER_SESSION_ID: bad_session_id or valid_session_id},
+        json=close_request_json,
+    )
+
+    # clean up created session, should succeed
+    clean_up_response = requests.post(
+        url,
+        headers={HEADER_SAGEMAKER_SESSION_ID: valid_session_id},
+        json={"requestType": "CLOSE"},
+    )
+    clean_up_response.raise_for_status()
+
+    assert bad_close_response.status_code == 400
+    if expected_error:
+        assert expected_error in bad_close_response.json()["error"]["message"]
+
+
+@pytest.mark.asyncio
+async def test_close_session_invalidrequest(
+    basic_server_with_lora: RemoteOpenAIServer, async_client: openai.AsyncOpenAI
+):
+    # first attempt to create a session
+    url = basic_server_with_lora.url_for("invocations")
+    create_response = requests.post(url, json={"requestType": "NEW_SESSION"})
+    create_response.raise_for_status()
+    valid_session_id, expiration = create_response.headers.get(
+        HEADER_SAGEMAKER_NEW_SESSION_ID, ""
+    ).split(";")
+    assert valid_session_id
+
+    close_request_json = {"requestType": "CLOSE"}
+    invalid_close_response = requests.post(
+        url,
+        # no headers to specify session_id
+        json=close_request_json,
+    )
+
+    # clean up created session, should succeed
+    clean_up_response = requests.post(
+        url,
+        headers={HEADER_SAGEMAKER_SESSION_ID: valid_session_id},
+        json={"requestType": "CLOSE"},
+    )
+    clean_up_response.raise_for_status()
+
+    assert invalid_close_response.status_code == 424
+    assert "invalid session_id" in invalid_close_response.json()["error"]["message"]
+
+
+@pytest.mark.asyncio
+async def test_session(basic_server_with_lora: RemoteOpenAIServer):
+    # first attempt to create a session
+    url = basic_server_with_lora.url_for("invocations")
+    create_response = requests.post(url, json={"requestType": "NEW_SESSION"})
+    create_response.raise_for_status()
+    valid_session_id, expiration = create_response.headers.get(
+        HEADER_SAGEMAKER_NEW_SESSION_ID, ""
+    ).split(";")
+    assert valid_session_id
+
+    # test invocation with session id
+
+    request_args = {
+        "model": MODEL_NAME_SMOLLM,
+        "prompt": "what is 1+1?",
+        "max_completion_tokens": 5,
+        "temperature": 0.0,
+        "logprobs": False,
+    }
+
+    invocation_response = requests.post(
+        basic_server_with_lora.url_for("invocations"),
+        headers={HEADER_SAGEMAKER_SESSION_ID: valid_session_id},
+        json=request_args,
+    )
+    invocation_response.raise_for_status()
+
+    # close created session, should succeed
+    close_response = requests.post(
+        url,
+        headers={HEADER_SAGEMAKER_SESSION_ID: valid_session_id},
+        json={"requestType": "CLOSE"},
+    )
+    close_response.raise_for_status()
+
+    assert (
+        close_response.headers.get(HEADER_SAGEMAKER_CLOSED_SESSION_ID)
+        == valid_session_id
+    )
diff --git a/vllm/entrypoints/dynamic_lora.py b/vllm/entrypoints/dynamic_lora.py
new file mode 100644
index 000000000000..cc0f437e5c77
--- /dev/null
+++ b/vllm/entrypoints/dynamic_lora.py
@@ -0,0 +1,57 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import model_hosting_container_standards.sagemaker as sagemaker_standards
+from fastapi import APIRouter, Depends, Request
+from fastapi.responses import JSONResponse, Response
+
+from vllm.entrypoints.openai.api_server import models, validate_json_request
+from vllm.entrypoints.openai.protocol import (
+    ErrorResponse,
+    LoadLoRAAdapterRequest,
+    UnloadLoRAAdapterRequest,
+)
+from vllm.entrypoints.openai.serving_models import OpenAIServingModels
+from vllm.logger import init_logger
+
+logger = init_logger(__name__)
+
+
+def register_dynamic_lora_routes(router: APIRouter):
+    @sagemaker_standards.register_load_adapter_handler(
+        request_shape={
+            "lora_name": "body.name",
+            "lora_path": "body.src",
+        },
+    )
+    @router.post("/v1/load_lora_adapter", dependencies=[Depends(validate_json_request)])
+    async def load_lora_adapter(request: LoadLoRAAdapterRequest, raw_request: Request):
+        handler: OpenAIServingModels = models(raw_request)
+        response = await handler.load_lora_adapter(request)
+        if isinstance(response, ErrorResponse):
+            return JSONResponse(
+                content=response.model_dump(), status_code=response.error.code
+            )
+
+        return Response(status_code=200, content=response)
+
+    @sagemaker_standards.register_unload_adapter_handler(
+        request_shape={
+            "lora_name": "path_params.adapter_name",
+        }
+    )
+    @router.post(
+        "/v1/unload_lora_adapter", dependencies=[Depends(validate_json_request)]
+    )
+    async def unload_lora_adapter(
+        request: UnloadLoRAAdapterRequest, raw_request: Request
+    ):
+        handler: OpenAIServingModels = models(raw_request)
+        response = await handler.unload_lora_adapter(request)
+        if isinstance(response, ErrorResponse):
+            return JSONResponse(
+                content=response.model_dump(), status_code=response.error.code
+            )
+
+        return Response(status_code=200, content=response)
+
+    return router
diff --git a/vllm/entrypoints/openai/api_server.py b/vllm/entrypoints/openai/api_server.py
index 51191879e478..fbb2d32a229d 100644
--- a/vllm/entrypoints/openai/api_server.py
+++ b/vllm/entrypoints/openai/api_server.py
@@ -19,6 +19,7 @@
 from http import HTTPStatus
 from typing import Annotated, Any, Literal
 
+import model_hosting_container_standards.sagemaker as sagemaker_standards
 import prometheus_client
 import pydantic
 import regex as re
@@ -65,7 +66,6 @@
     ErrorInfo,
     ErrorResponse,
     IOProcessorResponse,
-    LoadLoRAAdapterRequest,
     PoolingBytesResponse,
     PoolingRequest,
     PoolingResponse,
@@ -82,7 +82,6 @@
     TranscriptionResponse,
     TranslationRequest,
     TranslationResponse,
-    UnloadLoRAAdapterRequest,
 )
 from vllm.entrypoints.openai.serving_chat import OpenAIServingChat
 from vllm.entrypoints.openai.serving_classification import ServingClassification
@@ -387,13 +386,6 @@ async def get_server_load_metrics(request: Request):
     return JSONResponse(content={"server_load": request.app.state.server_load_metrics})
 
 
-@router.get("/ping", response_class=Response)
-@router.post("/ping", response_class=Response)
-async def ping(raw_request: Request) -> Response:
-    """Ping check. Endpoint required for SageMaker"""
-    return await health(raw_request)
-
-
 @router.post(
     "/tokenize",
     dependencies=[Depends(validate_json_request)],
@@ -1236,47 +1228,6 @@ async def is_scaling_elastic_ep(raw_request: Request):
 ]
 
 
-@router.post(
-    "/invocations",
-    dependencies=[Depends(validate_json_request)],
-    responses={
-        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
-        HTTPStatus.UNSUPPORTED_MEDIA_TYPE.value: {"model": ErrorResponse},
-        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
-    },
-)
-async def invocations(raw_request: Request):
-    """For SageMaker, routes requests based on the request type."""
-    try:
-        body = await raw_request.json()
-    except json.JSONDecodeError as e:
-        raise HTTPException(
-            status_code=HTTPStatus.BAD_REQUEST.value, detail=f"JSON decode error: {e}"
-        ) from e
-
-    valid_endpoints = [
-        (validator, endpoint)
-        for validator, (get_handler, endpoint) in INVOCATION_VALIDATORS
-        if get_handler(raw_request) is not None
-    ]
-
-    for request_validator, endpoint in valid_endpoints:
-        try:
-            request = request_validator.validate_python(body)
-        except pydantic.ValidationError:
-            continue
-
-        return await endpoint(request, raw_request)
-
-    type_names = [
-        t.__name__ if isinstance(t := validator._type, type) else str(t)
-        for validator, _ in valid_endpoints
-    ]
-    msg = f"Cannot find suitable handler for request. Expected one of: {type_names}"
-    res = base(raw_request).create_error_response(message=msg)
-    return JSONResponse(content=res.model_dump(), status_code=res.error.code)
-
-
 if envs.VLLM_TORCH_PROFILER_DIR:
     logger.warning_once(
         "Torch Profiler is enabled in the API server. This should ONLY be "
@@ -1304,39 +1255,6 @@ async def stop_profile(raw_request: Request):
         return Response(status_code=200)
 
 
-if envs.VLLM_ALLOW_RUNTIME_LORA_UPDATING:
-    logger.warning(
-        "LoRA dynamic loading & unloading is enabled in the API server. "
-        "This should ONLY be used for local development!"
-    )
-
-    @router.post("/v1/load_lora_adapter", dependencies=[Depends(validate_json_request)])
-    async def load_lora_adapter(request: LoadLoRAAdapterRequest, raw_request: Request):
-        handler = models(raw_request)
-        response = await handler.load_lora_adapter(request)
-        if isinstance(response, ErrorResponse):
-            return JSONResponse(
-                content=response.model_dump(), status_code=response.error.code
-            )
-
-        return Response(status_code=200, content=response)
-
-    @router.post(
-        "/v1/unload_lora_adapter", dependencies=[Depends(validate_json_request)]
-    )
-    async def unload_lora_adapter(
-        request: UnloadLoRAAdapterRequest, raw_request: Request
-    ):
-        handler = models(raw_request)
-        response = await handler.unload_lora_adapter(request)
-        if isinstance(response, ErrorResponse):
-            return JSONResponse(
-                content=response.model_dump(), status_code=response.error.code
-            )
-
-        return Response(status_code=200, content=response)
-
-
 def load_log_config(log_config_file: str | None) -> dict | None:
     if not log_config_file:
         return None
@@ -1606,6 +1524,20 @@ def build_app(args: Namespace) -> FastAPI:
         )
     else:
         app = FastAPI(lifespan=lifespan)
+
+    if envs.VLLM_ALLOW_RUNTIME_LORA_UPDATING:
+        logger.warning(
+            "LoRA dynamic loading & unloading is enabled in the API server. "
+            "This should ONLY be used for local development!"
+        )
+        from vllm.entrypoints.dynamic_lora import register_dynamic_lora_routes
+
+        register_dynamic_lora_routes(router)
+
+    from vllm.entrypoints.sagemaker.routes import register_sagemaker_routes
+
+    register_sagemaker_routes(router)
+
     app.include_router(router)
     app.root_path = args.root_path
 
@@ -1696,6 +1628,8 @@ async def log_response(request: Request, call_next):
                 f"Invalid middleware {middleware}. Must be a function or a class."
             )
 
+    app = sagemaker_standards.bootstrap(app)
+
     return app
 
 
diff --git a/vllm/entrypoints/sagemaker/__init__.py b/vllm/entrypoints/sagemaker/__init__.py
new file mode 100644
index 000000000000..c1767137e4ea
--- /dev/null
+++ b/vllm/entrypoints/sagemaker/__init__.py
@@ -0,0 +1,4 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+"""SageMaker-specific integration for vLLM."""
diff --git a/vllm/entrypoints/sagemaker/routes.py b/vllm/entrypoints/sagemaker/routes.py
new file mode 100644
index 000000000000..498b7294f0d8
--- /dev/null
+++ b/vllm/entrypoints/sagemaker/routes.py
@@ -0,0 +1,72 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import json
+from http import HTTPStatus
+
+import model_hosting_container_standards.sagemaker as sagemaker_standards
+import pydantic
+from fastapi import APIRouter, Depends, HTTPException, Request
+from fastapi.responses import JSONResponse, Response
+
+from vllm.entrypoints.openai.api_server import (
+    INVOCATION_VALIDATORS,
+    base,
+    health,
+    validate_json_request,
+)
+from vllm.entrypoints.openai.protocol import ErrorResponse
+
+
+def register_sagemaker_routes(router: APIRouter):
+    @router.post("/ping", response_class=Response)
+    @router.get("/ping", response_class=Response)
+    @sagemaker_standards.register_ping_handler
+    async def ping(raw_request: Request) -> Response:
+        """Ping check. Endpoint required for SageMaker"""
+        return await health(raw_request)
+
+    @router.post(
+        "/invocations",
+        dependencies=[Depends(validate_json_request)],
+        responses={
+            HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+            HTTPStatus.UNSUPPORTED_MEDIA_TYPE.value: {"model": ErrorResponse},
+            HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+        },
+    )
+    @sagemaker_standards.register_invocation_handler
+    @sagemaker_standards.stateful_session_manager()
+    @sagemaker_standards.inject_adapter_id(adapter_path="model")
+    async def invocations(raw_request: Request):
+        """For SageMaker, routes requests based on the request type."""
+        try:
+            body = await raw_request.json()
+        except json.JSONDecodeError as e:
+            raise HTTPException(
+                status_code=HTTPStatus.BAD_REQUEST.value,
+                detail=f"JSON decode error: {e}",
+            ) from e
+
+        valid_endpoints = [
+            (validator, endpoint)
+            for validator, (get_handler, endpoint) in INVOCATION_VALIDATORS
+            if get_handler(raw_request) is not None
+        ]
+
+        for request_validator, endpoint in valid_endpoints:
+            try:
+                request = request_validator.validate_python(body)
+            except pydantic.ValidationError:
+                continue
+
+            return await endpoint(request, raw_request)
+
+        type_names = [
+            t.__name__ if isinstance(t := validator._type, type) else str(t)
+            for validator, _ in valid_endpoints
+        ]
+        msg = f"Cannot find suitable handler for request. Expected one of: {type_names}"
+        res = base(raw_request).create_error_response(message=msg)
+        return JSONResponse(content=res.model_dump(), status_code=res.error.code)
+
+    return router

From e605e8e3233f895340f46665f93ab37b307491aa Mon Sep 17 00:00:00 2001
From: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com>
Date: Tue, 11 Nov 2025 00:59:08 -0500
Subject: [PATCH 042/183] [Bugfix] Fix Stream Sync for Shared Expert Overlap
 (#28430)

Signed-off-by: Vadim Gimpelson <vadim.gimpelson@gmail.com>
Signed-off-by: Robert Shaw <robertgshaw2@gmail.com>
Co-authored-by: Vadim Gimpelson <vadim.gimpelson@gmail.com>
---
 .../gsm8k/configs/Qwen1.5-MoE-W4A16-CT.yaml   |  3 --
 vllm/model_executor/layers/fused_moe/layer.py | 45 +++++++------------
 2 files changed, 15 insertions(+), 33 deletions(-)

diff --git a/tests/evals/gsm8k/configs/Qwen1.5-MoE-W4A16-CT.yaml b/tests/evals/gsm8k/configs/Qwen1.5-MoE-W4A16-CT.yaml
index ea9c95158405..9297bf6ddf2d 100644
--- a/tests/evals/gsm8k/configs/Qwen1.5-MoE-W4A16-CT.yaml
+++ b/tests/evals/gsm8k/configs/Qwen1.5-MoE-W4A16-CT.yaml
@@ -3,6 +3,3 @@ accuracy_threshold: 0.45
 num_questions: 1319
 num_fewshot: 5
 max_model_len: 4096
-# Duo stream incompatabilbe with this model: https://github.com/vllm-project/vllm/issues/28220
-env:
-  VLLM_DISABLE_SHARED_EXPERTS_STREAM: "1"
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index 27ad9c8fd1c2..39547cc83c7b 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -2456,28 +2456,6 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
             staged_hidden_states.copy_(hidden_states, non_blocking=True)
             staged_router_logits.copy_(router_logits, non_blocking=True)
 
-            # If there are shared experts but we are not using a modular kernel,
-            # the shared experts must be called here
-            if has_separate_shared_experts:
-                assert self.shared_experts is not None
-
-                if self.shared_experts_stream is not None:
-                    # For chunked, we start the shared experts stream here
-                    # (Note that no concurrency with the router/gate)
-                    self.shared_experts_stream.wait_stream(current_stream())
-
-                    with torch.cuda.stream(self.shared_experts_stream):
-                        # Note that staged_hidden_states clone() is necessary
-                        # here to avoid conflict with the main stream
-                        shared_output = self.shared_experts(
-                            staged_hidden_states.clone()
-                        )
-                else:
-                    shared_output = self.shared_experts(staged_hidden_states)
-
-            else:
-                shared_output = None
-
             # Matrix multiply.
             final_hidden_states = self.quant_method.apply(
                 layer=self,
@@ -2506,11 +2484,7 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
             if has_separate_shared_experts:
                 assert not isinstance(final_hidden_states, tuple)
                 assert self.shared_experts is not None
-
-                # Here we finish the shared experts stream
-                if self.shared_experts_stream is not None:
-                    current_stream().wait_stream(self.shared_experts_stream)
-
+                shared_output = self.shared_experts(staged_hidden_states)
                 final_hidden_states = (
                     shared_output,
                     final_hidden_states,
@@ -2619,11 +2593,22 @@ def forward_impl(
             assert self.shared_experts is not None
 
             if self.shared_experts_stream is not None:
+                # Clone BEFORE switching streams to avoid race condition
+                # where routed_expert kernel may mutate hidden_states.
+                hidden_states_clone = hidden_states.clone()
+                self.shared_experts_stream.wait_stream(current_stream())
+
                 # Run shared experts in parallel on a separate stream
                 with torch.cuda.stream(self.shared_experts_stream):
-                    # Note that hidden_states clone() is necessary here to avoid
-                    # conflict with the main stream
-                    shared_output = self.shared_experts(hidden_states.clone())
+                    shared_output = self.shared_experts(hidden_states_clone)
+
+                # Record that the clone will be used by shared_experts_stream
+                # to avoid gc issue from deallocation of hidden_states_clone
+                # For more details: https://docs.pytorch.org/docs/stable/generated/torch.Tensor.record_stream.html # noqa: E501
+                # NOTE: we dont need shared_output.record_stream(current_stream())
+                # because we synch the streams before using shared_output.
+                hidden_states_clone.record_stream(self.shared_experts_stream)
+
             else:
                 shared_output = self.shared_experts(hidden_states)
         else:

From a7adbc6c6b4bcdef5cfffdcd06edf86fcbfb7c69 Mon Sep 17 00:00:00 2001
From: iAmir97 <71513472+iAmir97@users.noreply.github.com>
Date: Tue, 11 Nov 2025 13:44:35 +0700
Subject: [PATCH 043/183] [Doc] Sleep mode documentation  (#28357)

Signed-off-by: Amir Balwel <amir.balwel@embeddedllm.com>
Signed-off-by: iAmir97 <71513472+iAmir97@users.noreply.github.com>
Co-authored-by: Amir Balwel <amir.balwel@embeddedllm.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
---
 docs/features/sleep_mode.md | 39 +++++++++++++++++++++++++++++++++++++
 1 file changed, 39 insertions(+)

diff --git a/docs/features/sleep_mode.md b/docs/features/sleep_mode.md
index e7dd9fee12d3..edcbaa716447 100644
--- a/docs/features/sleep_mode.md
+++ b/docs/features/sleep_mode.md
@@ -13,6 +13,9 @@ Key benefits:
 !!! note
     This feature is only supported on CUDA platform.
 
+!!! note
+    For more information, see this [Blog Post](https://blog.vllm.ai/2025/10/26/sleep-mode.html).
+
 ## Sleep levels
 
 Level 1 sleep will offload the model weights and discard the KV cache. The content of KV cache is forgotten. Level 1 sleep is good for sleeping and waking up the engine to run the same model again. The model weights are backed up in CPU memory. Please make sure there's enough CPU memory to store the model weights. Level 2 sleep will discard both the model weights and the KV cache (while the model's buffers are kept in CPU, like rope scaling tensors). The content of both the model weights and KV cache is forgotten. Level 2 sleep is good for sleeping and waking up the engine to run a different model or update the model, where previous model weights are not needed, e.g. RLHF weight update.
@@ -31,6 +34,7 @@ llm = LLM("Qwen/Qwen3-0.6B", enable_sleep_mode=True)
 #### Python API
 
 ```python
+# Sleep level 1
 # Put the engine to sleep (level=1: offload weights to CPU RAM, discard KV cache)
 llm.sleep(level=1)
 
@@ -38,6 +42,21 @@ llm.sleep(level=1)
 llm.wake_up()
 ```
 
+```python
+# Sleep level 2
+# Put the engine to sleep (level=2: discard both weights and KV cache)
+llm.sleep(level=2)
+
+# Reallocate weights memory only
+llm.wake_up(tags=["weights"])
+
+# Load weights in-place
+llm.collective_rpc("reload_weights")
+
+# Reallocate KV cache
+llm.wake_up(tags=["kv_cache"])
+```
+
 #### RLHF weight updates
 
 During RLHF training, vLLM allows you to selectively wake up only the model weights or the KV cache using the tags argument in wake_up(). This fine-grained control is especially useful when updating model weights: by waking up just the weights (e.g., llm.wake_up(tags=["weights"])), you avoid allocating memory for the KV cache until after the weight update is complete. This approach helps prevent GPU out-of-memory (OOM) errors, particularly with large models, by minimizing peak memory usage during weight synchronization and update operations.
@@ -69,10 +88,30 @@ VLLM_SERVER_DEV_MODE=1 vllm serve Qwen/Qwen3-0.6B \
   --port 8000
 ```
 
+Below is an example of how to sleep and wake up a model in level 1.
+
+```bash
+curl -X POST 'http://localhost:8000/sleep?level=1'
+curl -X POST 'http://localhost:8000/wake_up'
+```
+
+And this is an example of how to sleep and wake up a model in level 2.
+
+```bash
+curl -X POST 'http://localhost:8000/sleep?level=2'
+# Reallocate weights memory only
+curl -X POST 'http://localhost:8000/wake_up?tags=weights'
+# Load weights in-place
+curl -X POST 'http://localhost:8000/collective_rpc' -H 'Content-Type: application/json' -d '{"method":"reload_weights"}'
+# Reallocate KV cache
+curl -X POST 'http://localhost:8000/wake_up?tags=kv_cache'
+```
+
 #### HTTP endpoints
 
 - `POST /sleep?level=1` — Put the model to sleep (`level=1`).
 - `POST /wake_up` — Wake up the model. Supports optional `tags` query parameters for partial wake-up (e.g., `?tags=weights`).
+- `POST /collective_rpc` — Perform a collective remote procedure call (RPC).
 - `GET /is_sleeping` — Check if the model is sleeping.
 
 !!! note

From cc079763c59adb8c03305663a5b8857ba85deb1b Mon Sep 17 00:00:00 2001
From: David Ben-David <sdavidbd@gmail.com>
Date: Tue, 11 Nov 2025 09:39:36 +0200
Subject: [PATCH 044/183] [BugFix] Avoid calling KV connector layer APIs when
 metadata is unset (#28253)

Signed-off-by: David Ben-David <davidb@pliops.com>
Co-authored-by: David Ben-David <davidb@pliops.com>
Co-authored-by: Mark McLoughlin <markmc@redhat.com>
---
 vllm/attention/layer.py                                  | 4 ++++
 vllm/distributed/kv_transfer/kv_connector/v1/base.py     | 9 ++++++++-
 .../kv_transfer/kv_connector/v1/multi_connector.py       | 6 ++++++
 3 files changed, 18 insertions(+), 1 deletion(-)

diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index 96272981692c..acab0529f352 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -837,6 +837,8 @@ def wait_for_kv_layer_from_connector(layer_name: str):
         return
 
     connector = get_kv_transfer_group()
+    if not connector.has_connector_metadata():
+        return
 
     forward_context: ForwardContext = get_forward_context()
     attn_metadata = forward_context.attn_metadata
@@ -854,6 +856,8 @@ def maybe_save_kv_layer_to_connector(
         return
 
     connector = get_kv_transfer_group()
+    if not connector.has_connector_metadata():
+        return
 
     forward_context: ForwardContext = get_forward_context()
     attn_metadata = forward_context.attn_metadata
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/base.py b/vllm/distributed/kv_transfer/kv_connector/v1/base.py
index 354aa9a87183..f85eb414b222 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/base.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/base.py
@@ -204,11 +204,18 @@ def _get_connector_metadata(self) -> KVConnectorMetadata:
         Returns:
             ConnectorMetadata: the connector metadata.
         """
-
         # Should only be called while set to valid metadata.
         assert self._connector_metadata is not None
         return self._connector_metadata
 
+    def has_connector_metadata(self) -> bool:
+        """Check whether the connector metadata is currently set.
+
+        Returns:
+            bool: True if connector metadata exists, False otherwise.
+        """
+        return self._connector_metadata is not None
+
     def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
         """
         Initialize with the KV caches. Useful for pre-registering the
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py
index d7bbf02c8367..c9d08e9b78ed 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py
@@ -171,16 +171,22 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
     # We must override the base class method here because we need to bind
     # the metadata to each connector in the order of the connectors in the
     # MultiKVConnectorMetadata.
+    #
+    # Note: Call the base class method to ensure metadata is also set on the
+    # MultiConnector instance itself; otherwise, `has_connector_metadata()` will
+    # always return False.
     def bind_connector_metadata(self, connector_metadata: KVConnectorMetadata) -> None:
         assert isinstance(connector_metadata, MultiKVConnectorMetadata)
         if connector_metadata.extra_async_saves:
             self._extra_async_saves.update(connector_metadata.extra_async_saves)
         for c, cm in zip(self._connectors, connector_metadata.metadata):
             c.bind_connector_metadata(cm)
+        super().bind_connector_metadata(connector_metadata)
 
     def clear_connector_metadata(self) -> None:
         for c in self._connectors:
             c.clear_connector_metadata()
+        super().clear_connector_metadata()
 
     def shutdown(self):
         exception: Exception | None = None

From 4fd4b743a23cc6ccbd832f11be12317a8c2f0fbc Mon Sep 17 00:00:00 2001
From: Roger Wang <hey@rogerw.io>
Date: Tue, 11 Nov 2025 00:07:24 -0800
Subject: [PATCH 045/183] [Bugfix] Fix max image size for PaddleOCR-VL (#28442)

Signed-off-by: Roger Wang <hey@rogerw.io>
---
 vllm/model_executor/models/paddleocr_vl.py | 36 +++++++++++++---------
 1 file changed, 21 insertions(+), 15 deletions(-)

diff --git a/vllm/model_executor/models/paddleocr_vl.py b/vllm/model_executor/models/paddleocr_vl.py
index 631475c964c0..12ae15699e7d 100644
--- a/vllm/model_executor/models/paddleocr_vl.py
+++ b/vllm/model_executor/models/paddleocr_vl.py
@@ -198,23 +198,18 @@ def get_num_image_tokens(
         if image_processor is None:
             image_processor = self.get_image_processor()
 
-        do_resize = True
         hf_config = self.get_hf_config()
         vision_config = hf_config.vision_config
         patch_size = vision_config.patch_size
         merge_size = vision_config.spatial_merge_size
-
-        if do_resize:
-            resized_height, resized_width = smart_resize(
-                height=image_height,
-                width=image_width,
-                factor=patch_size * merge_size,
-                min_pixels=image_processor.min_pixels,
-                max_pixels=image_processor.max_pixels,
-            )
-            preprocessed_size = ImageSize(width=resized_width, height=resized_height)
-        else:
-            preprocessed_size = ImageSize(width=image_width, height=image_height)
+        resized_height, resized_width = smart_resize(
+            height=image_height,
+            width=image_width,
+            factor=patch_size * merge_size,
+            min_pixels=image_processor.min_pixels,
+            max_pixels=image_processor.max_pixels,
+        )
+        preprocessed_size = ImageSize(width=resized_width, height=resized_height)
 
         grid_t = 1
         grid_h = preprocessed_size.height // patch_size
@@ -227,8 +222,19 @@ def get_num_image_tokens(
 
     def get_image_size_with_most_features(self) -> ImageSize:
         hf_config = self.get_hf_config()
-        image_size = hf_config.vision_config.image_size
-        return ImageSize(height=image_size, width=image_size)
+
+        # See `smart_resize` for the calculation of the image size.
+        merge_size = hf_config.vision_config.spatial_merge_size
+        patch_size = hf_config.vision_config.patch_size
+        factor = merge_size * patch_size
+        max_num_tokens = self.get_image_processor().max_pixels // (factor**2)
+        # Find factors of max_num_tokens close to its square root
+        # to create a dummy image with a reasonable aspect ratio.
+        h_patches = int(math.sqrt(max_num_tokens))
+        while max_num_tokens % h_patches != 0:
+            h_patches -= 1
+        w_patches = max_num_tokens // h_patches
+        return ImageSize(height=h_patches * factor, width=w_patches * factor)
 
 
 class PaddleOCRVLDummyInputsBuilder(BaseDummyInputsBuilder[PaddleOCRVLProcessingInfo]):

From 798c7bebca5e3ea48b947af4cc7904a4507ba873 Mon Sep 17 00:00:00 2001
From: Sage Moore <sage@neuralmagic.com>
Date: Tue, 11 Nov 2025 00:19:51 -0800
Subject: [PATCH 046/183] [EPLB] Refactor balance_packing to use numpy and
 optimize GPU-CPU transfers in EPLB (#28369)

Signed-off-by: Sage Moore <sage@neuralmagic.com>
---
 vllm/distributed/eplb/rebalance_algo.py    | 40 +++++++++++++++-------
 vllm/distributed/eplb/rebalance_execute.py | 14 +++++---
 2 files changed, 37 insertions(+), 17 deletions(-)

diff --git a/vllm/distributed/eplb/rebalance_algo.py b/vllm/distributed/eplb/rebalance_algo.py
index c9d30d6481ab..e6645e524cc3 100644
--- a/vllm/distributed/eplb/rebalance_algo.py
+++ b/vllm/distributed/eplb/rebalance_algo.py
@@ -12,6 +12,7 @@
 on how the EPLB algorithm works.
 """
 
+import numpy as np
 import torch
 
 
@@ -34,29 +35,44 @@ def balanced_packing(
     assert num_groups % num_packs == 0
     groups_per_pack = num_groups // num_packs
 
+    device = weight.device
+
     if groups_per_pack == 1:
         pack_index = torch.arange(
-            weight.size(-1), dtype=torch.int64, device=weight.device
+            weight.size(-1), dtype=torch.int64, device=device
         ).expand(weight.shape)
-        rank_in_pack = torch.zeros_like(weight, dtype=torch.int64)
+        rank_in_pack = torch.zeros_like(weight, dtype=torch.int64, device=device)
         return pack_index, rank_in_pack
 
-    indices = weight.float().sort(-1, descending=True).indices.cpu()
-    pack_index = torch.full_like(weight, fill_value=-1, dtype=torch.int64, device="cpu")
-    rank_in_pack = torch.full_like(pack_index, fill_value=-1)
+    weight_np = weight.cpu().numpy()
+
+    # Sort and get indices in decending order
+    indices_np = np.argsort(-weight_np, axis=-1)
+
+    pack_index_np = np.full((num_layers, num_groups), -1, dtype=np.int64)
+    rank_in_pack_np = np.full((num_layers, num_groups), -1, dtype=np.int64)
+
+    # Run the packing algorithm
     for i in range(num_layers):
-        pack_weights = [0] * num_packs
+        pack_weights = [0.0] * num_packs
         pack_items = [0] * num_packs
-        for group in indices[i]:
+
+        for group in indices_np[i]:
+            # Find a pack with capacity that has the lowest weight
             pack = min(
-                (i for i in range(num_packs) if pack_items[i] < groups_per_pack),
+                (j for j in range(num_packs) if pack_items[j] < groups_per_pack),
                 key=pack_weights.__getitem__,
             )
+
             assert pack_items[pack] < groups_per_pack
-            pack_index[i, group] = pack
-            rank_in_pack[i, group] = pack_items[pack]
-            pack_weights[pack] += weight[i, group]
+            pack_index_np[i, group] = pack
+            rank_in_pack_np[i, group] = pack_items[pack]
+            pack_weights[pack] += weight_np[i, group]
             pack_items[pack] += 1
+
+    pack_index = torch.from_numpy(pack_index_np).to(device)
+    rank_in_pack = torch.from_numpy(rank_in_pack_np).to(device)
+
     return pack_index, rank_in_pack
 
 
@@ -212,7 +228,7 @@ def rebalance_experts(
             replicas for each logical expert
     """
     num_layers, num_logical_experts = weight.shape
-    weight = weight.float().cpu()
+    weight = weight.float()
     if num_groups % num_nodes == 0:
         # use hierarchical load-balance policy
         phy2log, phyrank, logcnt = rebalance_experts_hierarchical(
diff --git a/vllm/distributed/eplb/rebalance_execute.py b/vllm/distributed/eplb/rebalance_execute.py
index f8ec3e956401..5c1efbaf03ba 100644
--- a/vllm/distributed/eplb/rebalance_execute.py
+++ b/vllm/distributed/eplb/rebalance_execute.py
@@ -321,15 +321,19 @@ def rearrange_expert_weights_inplace(
             )
         return
 
+    old_global_expert_indices_cpu = old_global_expert_indices.cpu()
+    new_global_expert_indices_cpu = new_global_expert_indices.cpu()
+
+    # NOTE(bowen): We need this synchronize to run, but I don't know why.
+    # If you figure out the reason, please let me know -- thank you!
+    torch.cuda.synchronize()
+
     for layer in range(num_moe_layers):
-        # NOTE(bowen): We need this synchronize to run, but I don't know why.
-        # If you figure out the reason, please let me know -- thank you!
-        torch.cuda.synchronize()
         shuffle_layer(
             num_local_physical_experts,
             ep_rank,
-            old_global_expert_indices[layer].tolist(),
-            new_global_expert_indices[layer].tolist(),
+            old_global_expert_indices_cpu[layer].tolist(),
+            new_global_expert_indices_cpu[layer].tolist(),
             expert_weights[layer],
             expert_weights_buffer,
             ep_group,

From f0359fffa434a4fce981389f9dff93a2a4c2b13e Mon Sep 17 00:00:00 2001
From: Jiangyun Zhu <riverclouds.zhu@qq.com>
Date: Tue, 11 Nov 2025 16:24:28 +0800
Subject: [PATCH 047/183] [Bugfix] fix qwen3-next crash (#28202)

Signed-off-by: zjy0516 <riverclouds.zhu@qq.com>
---
 vllm/model_executor/models/qwen3_next.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/models/qwen3_next.py b/vllm/model_executor/models/qwen3_next.py
index aa7de5aa5f29..ddb8693c16e2 100644
--- a/vllm/model_executor/models/qwen3_next.py
+++ b/vllm/model_executor/models/qwen3_next.py
@@ -587,7 +587,7 @@ def _forward_core(
                 self.conv1d.bias,
                 self.activation,
                 conv_state_indices=non_spec_state_indices_tensor[
-                    : attn_metadata.num_decodes
+                    : attn_metadata.num_actual_tokens
                 ],
                 validate_data=True,
             )

From c7991269dd8fe86096a3eee5040e855801ae9665 Mon Sep 17 00:00:00 2001
From: Fanli Lin <fanli.lin@intel.com>
Date: Tue, 11 Nov 2025 16:45:38 +0800
Subject: [PATCH 048/183] [BugFix] 'DeepseekV2Config' object has no attribute
 'use_mla'`  (#28387)

Signed-off-by: Lin, Fanli <fanli.lin@intel.com>
---
 vllm/model_executor/models/kimi_vl.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/vllm/model_executor/models/kimi_vl.py b/vllm/model_executor/models/kimi_vl.py
index b54f53931d71..b79bdf8595ca 100644
--- a/vllm/model_executor/models/kimi_vl.py
+++ b/vllm/model_executor/models/kimi_vl.py
@@ -456,7 +456,11 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
             (".gate_up_proj", ".gate_proj", 0),
             (".gate_up_proj", ".up_proj", 1),
         ]
-        if not config.use_mla:
+        use_mha = (
+            config.model_type == "deepseek"
+            or config.qk_nope_head_dim + config.qk_rope_head_dim == 0
+        )
+        if use_mha:
             stacked_params_mapping += [
                 (".qkv_proj", ".q_proj", "q"),
                 (".qkv_proj", ".k_proj", "k"),

From 9973e6e04ad3e4a6c74c51a2dc87b2d3ddc4837f Mon Sep 17 00:00:00 2001
From: Lukas Geiger <lukas.geiger94@gmail.com>
Date: Tue, 11 Nov 2025 10:35:10 +0000
Subject: [PATCH 049/183] [Model][Qwen3VL] Slighly speedup
 `fast_pos_embed_interpolate` (#28434)

Signed-off-by: Lukas Geiger <lukas.geiger94@gmail.com>
---
 vllm/model_executor/models/qwen3_vl.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index fe0124ef3258..1cd34bf54a35 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -491,8 +491,8 @@ def fast_pos_embed_interpolate(self, grid_thw: list[list[int]]) -> torch.Tensor:
             weights = weights.to(dtype=self.dtype)
 
             embeds = self.pos_embed(indices)
-            weighted_embeds = embeds * weights
-            combined = weighted_embeds.sum(dim=0)
+            embeds *= weights
+            combined = embeds.sum(dim=0)
 
             combined = combined.reshape(
                 h // m_size, m_size, w // m_size, m_size, hidden_dim

From d381eb967f171ea8824357075b15bf2895619609 Mon Sep 17 00:00:00 2001
From: Ido Segev <segevido@gmail.com>
Date: Tue, 11 Nov 2025 13:06:04 +0200
Subject: [PATCH 050/183] Multi turn benchmark progress bar for synthetic
 conversation generation (#28394)

Signed-off-by: Ido Segev <idos@pliops.com>
---
 benchmarks/multi_turn/bench_dataset.py | 18 +++++++++++++++---
 benchmarks/multi_turn/requirements.txt |  3 ++-
 2 files changed, 17 insertions(+), 4 deletions(-)

diff --git a/benchmarks/multi_turn/bench_dataset.py b/benchmarks/multi_turn/bench_dataset.py
index 2674899d1cc5..8cb8a2f386a9 100644
--- a/benchmarks/multi_turn/bench_dataset.py
+++ b/benchmarks/multi_turn/bench_dataset.py
@@ -11,6 +11,7 @@
     Color,
     logger,
 )
+from tqdm import tqdm
 from transformers import AutoTokenizer  # type: ignore
 
 # Conversation ID is a string (e.g: "UzTK34D")
@@ -417,6 +418,10 @@ def generate_conversations(
             data = file.read()
             tokens_in_file = tokenizer.encode(data, add_special_tokens=False)
             list_of_tokens.extend(tokens_in_file)
+        logger.info(
+            f"Loaded {len(tokens_in_file)} tokens from file {filename}, "
+            f"total tokens so far: {len(list_of_tokens)}"
+        )
 
     conversations: ConversationsMap = {}
     conv_id = 0
@@ -449,18 +454,25 @@ def generate_conversations(
         )
         base_offset += common_prefix_tokens
 
-    for conv_id in range(args.num_conversations):
+    for conv_id in tqdm(
+        range(args.num_conversations),
+        total=args.num_conversations,
+        desc="Generating conversations",
+        unit="conv",
+    ):
         # Generate a single conversation
         messages: MessagesList = []
 
         nturns = turn_count[conv_id]
 
         # User prompt token count per turn (with lower limit)
-        input_token_count: np.ndarray = args.input_num_tokens.sample(nturns)
+        input_token_count: np.ndarray = args.input_num_tokens.sample(nturns).astype(int)
         input_token_count = np.maximum(input_token_count, base_prompt_token_count)
 
         # Assistant answer token count per turn (with lower limit)
-        output_token_count: np.ndarray = args.output_num_tokens.sample(nturns)
+        output_token_count: np.ndarray = args.output_num_tokens.sample(nturns).astype(
+            int
+        )
         output_token_count = np.maximum(output_token_count, 1)
 
         user_turn = True
diff --git a/benchmarks/multi_turn/requirements.txt b/benchmarks/multi_turn/requirements.txt
index f0e1935914a1..bae656a5c5c4 100644
--- a/benchmarks/multi_turn/requirements.txt
+++ b/benchmarks/multi_turn/requirements.txt
@@ -2,4 +2,5 @@ numpy>=1.24
 pandas>=2.0.0
 aiohttp>=3.10
 transformers>=4.46
-xlsxwriter>=3.2.1
\ No newline at end of file
+xlsxwriter>=3.2.1
+tqdm>=4.66

From 2e78150d24e339bf6420a623cdae655051127d8f Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Tue, 11 Nov 2025 05:28:28 -0700
Subject: [PATCH 051/183] [CI] Add mergify rules for `nvidia` label (#28417)

Signed-off-by: mgoin <mgoin64@gmail.com>
---
 .github/mergify.yml | 17 +++++++++++++++++
 1 file changed, 17 insertions(+)

diff --git a/.github/mergify.yml b/.github/mergify.yml
index 18d4a2e83144..997a40e18e58 100644
--- a/.github/mergify.yml
+++ b/.github/mergify.yml
@@ -151,6 +151,23 @@ pull_request_rules:
       add:
         - gpt-oss
 
+- name: label-nvidia
+  description: Automatically apply nvidia label
+  conditions:
+    - label != stale
+    - or:
+      - files~=cuda
+      - files~=cutlass
+      - files~=flashinfer
+      - files~=trtllm
+      - title~=(?i)NVIDIA
+      - title~=(?i)CUDA
+      - title~=(?i)CUTLASS
+  actions:
+    label:
+      add:
+        - nvidia
+
 - name: label-rocm
   description: Automatically apply rocm label
   conditions:

From b30dfa03c564ce51c56bf2dd16283f074253c27c Mon Sep 17 00:00:00 2001
From: Matthew Bonanni <mbonanni@redhat.com>
Date: Tue, 11 Nov 2025 06:40:44 -0600
Subject: [PATCH 052/183] [Attention] Refactor CUDA attention backend selection
 logic (#24794)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
Signed-off-by: Matthew Bonanni <mbonanni001@gmail.com>
Co-authored-by: Luka Govedič <ProExpertProg@users.noreply.github.com>
---
 .buildkite/test-pipeline.yaml                 |   5 +
 tests/compile/test_fusion_attn.py             |  31 +-
 tests/compile/test_fusions_e2e.py             |  24 +-
 tests/config/test_multimodal_config.py        |   6 +-
 .../attention/test_attention_selector.py      |  75 ++--
 tests/kernels/attention/test_mha_attn.py      |  12 +-
 tests/models/test_initialization.py           |  11 +
 tests/v1/attention/test_attention_backends.py |  47 ++-
 tests/v1/attention/test_mla_backends.py       |  29 +-
 tests/v1/attention/utils.py                   |  10 +-
 tests/v1/spec_decode/test_eagle.py            |  18 +-
 tests/v1/spec_decode/test_mtp.py              |   6 +-
 tests/v1/spec_decode/test_tree_attention.py   |   8 +-
 tests/v1/worker/test_gpu_model_runner.py      |  25 +-
 vllm/attention/backends/abstract.py           | 149 ++++++-
 vllm/attention/backends/registry.py           | 252 ++++++++----
 vllm/attention/layer.py                       |  68 ++--
 vllm/attention/selector.py                    | 124 +++---
 vllm/config/cache.py                          |  10 +-
 vllm/config/model.py                          |   8 +-
 vllm/config/multimodal.py                     |  32 +-
 .../kv_connector/v1/nixl_connector.py         |   8 +-
 vllm/engine/arg_utils.py                      |   4 +-
 vllm/envs.py                                  |   6 +-
 vllm/model_executor/models/dots_ocr.py        |  37 +-
 vllm/model_executor/models/ernie45_vl.py      |  37 +-
 vllm/model_executor/models/glm4_1v.py         |  35 +-
 vllm/model_executor/models/keye.py            |  24 +-
 vllm/model_executor/models/ovis2_5.py         |   6 +-
 vllm/model_executor/models/paddleocr_vl.py    |  47 +--
 vllm/model_executor/models/qwen2_5_vl.py      |  42 +-
 vllm/model_executor/models/qwen2_vl.py        |  38 +-
 .../models/qwen3_omni_moe_thinker.py          |  15 +-
 vllm/model_executor/models/qwen3_vl.py        |  26 +-
 vllm/model_executor/models/siglip2navit.py    |  26 +-
 vllm/model_executor/models/vision.py          |   8 +-
 vllm/platforms/cpu.py                         |  12 +-
 vllm/platforms/cuda.py                        | 362 +++++++++---------
 vllm/platforms/interface.py                   |  42 +-
 vllm/platforms/rocm.py                        |  49 ++-
 vllm/platforms/tpu.py                         |  15 +-
 vllm/platforms/xpu.py                         |  34 +-
 vllm/v1/attention/backends/cpu_attn.py        |  32 +-
 vllm/v1/attention/backends/flash_attn.py      |  71 ++--
 vllm/v1/attention/backends/flashinfer.py      |  63 +--
 vllm/v1/attention/backends/flex_attention.py  |  21 +-
 vllm/v1/attention/backends/mla/common.py      |  22 +-
 vllm/v1/attention/backends/mla/cutlass_mla.py |  16 +-
 .../attention/backends/mla/flashattn_mla.py   |  27 ++
 .../attention/backends/mla/flashinfer_mla.py  |  26 +-
 vllm/v1/attention/backends/mla/flashmla.py    |  37 +-
 .../attention/backends/mla/flashmla_sparse.py |  30 +-
 vllm/v1/attention/backends/mla/indexer.py     |   6 +-
 vllm/v1/attention/backends/mla/triton_mla.py  |  10 +
 vllm/v1/attention/backends/rocm_aiter_fa.py   |  25 +-
 vllm/v1/attention/backends/rocm_attn.py       |  10 +-
 vllm/v1/attention/backends/tree_attn.py       |  26 +-
 vllm/v1/attention/backends/triton_attn.py     |  47 ++-
 vllm/v1/attention/backends/xformers.py        |  26 +-
 vllm/v1/spec_decode/eagle.py                  |   8 +-
 vllm/v1/worker/gpu_model_runner.py            |   4 +-
 61 files changed, 1333 insertions(+), 997 deletions(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index a0d2076199b1..83a7df3b093f 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -890,11 +890,16 @@ steps:
   - vllm/model_executor/layers/fused_moe/flashinfer_cutlass_prepare_finalize.py
   - vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
   - vllm/v1/attention/backends/flashinfer.py
+  - vllm/v1/attention/backends/mla/cutlass_mla.py
+  - vllm/v1/attention/backends/mla/flashinfer_mla.py
+  - vllm/platforms/cuda.py
+  - vllm/attention/selector.py
   commands:
     - nvidia-smi
     - python3 examples/offline_inference/basic/chat.py
     # Attention
     # num_heads2 broken by https://github.com/flashinfer-ai/flashinfer/issues/1353
+    - pytest -v -s tests/kernels/attention/test_attention_selector.py
     - pytest -v -s tests/kernels/attention/test_flashinfer.py -k 'not num_heads2'
     - pytest -v -s tests/kernels/attention/test_flashinfer_trtllm_attention.py
     - pytest -v -s tests/kernels/attention/test_cutlass_mla_decode.py
diff --git a/tests/compile/test_fusion_attn.py b/tests/compile/test_fusion_attn.py
index fecb1e2e918f..ea61c94953a7 100644
--- a/tests/compile/test_fusion_attn.py
+++ b/tests/compile/test_fusion_attn.py
@@ -10,7 +10,7 @@
 from tests.v1.attention.utils import BatchSpec, create_common_attn_metadata
 from vllm._custom_ops import cutlass_scaled_fp4_mm, scaled_fp4_quant
 from vllm.attention import Attention, AttentionMetadata
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.selector import global_force_attn_backend_context_manager
 from vllm.compilation.fusion_attn import ATTN_OP, AttnFusionPass
 from vllm.compilation.fx_utils import find_op_nodes
@@ -104,7 +104,7 @@ def build_attn_metadata(self, batch_size: int) -> AttentionMetadata:
 
         # TODO(luka) use get_kv_cache_stride_order
         # Create dummy KV cache for the selected backend
-        if backend == _Backend.ROCM_ATTN:
+        if backend == AttentionBackendEnum.ROCM_ATTN:
             # k/v as 1st dimention
             # HND: [num_blocks, num_kv_heads, block_size, head_size]
             kv_cache = torch.zeros(
@@ -116,7 +116,7 @@ def build_attn_metadata(self, batch_size: int) -> AttentionMetadata:
                 dtype=self.kv_cache_dtype,
                 device=self.device,
             )
-        elif backend == _Backend.ROCM_AITER_UNIFIED_ATTN:
+        elif backend == AttentionBackendEnum.ROCM_AITER_UNIFIED_ATTN:
             # k/v as 1st dimention
             # NHD: [num_blocks, block_size, num_kv_heads, head_size]
             kv_cache = torch.zeros(
@@ -128,7 +128,7 @@ def build_attn_metadata(self, batch_size: int) -> AttentionMetadata:
                 dtype=self.kv_cache_dtype,
                 device=self.device,
             )
-        elif backend == _Backend.TRITON_ATTN:
+        elif backend == AttentionBackendEnum.TRITON_ATTN:
             # k/v as 2nd dimention
             # NHD: [num_blocks, block_size, num_kv_heads, head_size]
             kv_cache = torch.zeros(
@@ -140,7 +140,7 @@ def build_attn_metadata(self, batch_size: int) -> AttentionMetadata:
                 dtype=self.kv_cache_dtype,
                 device=self.device,
             )
-        elif backend == _Backend.FLASHINFER:
+        elif backend == AttentionBackendEnum.FLASHINFER:
             kv_cache = torch.zeros(
                 num_blocks,
                 2,
@@ -244,8 +244,8 @@ def forward(self, q: torch.Tensor, k: torch.Tensor, v: torch.Tensor):
 MODELS_FP4: list[tuple[str, type]] = []
 HEADS: list[tuple[int, int]] = []
 SPLIT_ATTENTION: list[bool] = []
-BACKENDS_FP8: list[_Backend] = []
-BACKENDS_FP4: list[_Backend] = []
+BACKENDS_FP8: list[AttentionBackendEnum] = []
+BACKENDS_FP4: list[AttentionBackendEnum] = []
 
 if current_platform.is_cuda():
     HEADS = [(64, 8), (40, 8)]
@@ -261,8 +261,8 @@ def forward(self, q: torch.Tensor, k: torch.Tensor, v: torch.Tensor):
             TestAttentionNvfp4QuantPatternModel,
         )
     ]
-    BACKENDS_FP8 = [_Backend.TRITON_ATTN, _Backend.FLASHINFER]
-    BACKENDS_FP4 = [_Backend.FLASHINFER]
+    BACKENDS_FP8 = [AttentionBackendEnum.TRITON_ATTN, AttentionBackendEnum.FLASHINFER]
+    BACKENDS_FP4 = [AttentionBackendEnum.FLASHINFER]
 
 elif current_platform.is_rocm():
     HEADS = [(32, 8), (40, 8)]
@@ -270,9 +270,9 @@ def forward(self, q: torch.Tensor, k: torch.Tensor, v: torch.Tensor):
         ("amd/Llama-3.1-8B-Instruct-FP8-KV", TestAttentionFp8StaticQuantPatternModel)
     ]
     BACKENDS = [
-        _Backend.ROCM_AITER_UNIFIED_ATTN,
-        _Backend.ROCM_ATTN,
-        _Backend.TRITON_ATTN,
+        AttentionBackendEnum.ROCM_AITER_UNIFIED_ATTN,
+        AttentionBackendEnum.ROCM_ATTN,
+        AttentionBackendEnum.TRITON_ATTN,
     ]
 
 
@@ -302,11 +302,11 @@ def test_attention_quant_pattern(
     custom_ops: str,
     model_name: str,
     model_class: type[AttentionQuantPatternModel],
-    backend: _Backend,
+    backend: AttentionBackendEnum,
     dist_init,
 ):
     """Test AttentionStaticQuantPattern fusion pass"""
-    if backend == _Backend.FLASHINFER and (
+    if backend == AttentionBackendEnum.FLASHINFER and (
         not current_platform.is_device_capability((10, 0)) or not has_flashinfer()
     ):
         pytest.skip("FlashInfer attn fusion requires Blackwell and flashinfer")
@@ -314,6 +314,7 @@ def test_attention_quant_pattern(
     custom_ops_list = custom_ops.split(",") if custom_ops else []
 
     device = torch.device("cuda:0")
+    torch.set_default_dtype(dtype)
     torch.manual_seed(42)
 
     vllm_config = VllmConfig(
@@ -402,7 +403,7 @@ def test_attention_quant_pattern(
 
         result_fused_1 = model_compiled(q, k, v)
 
-        if backend == _Backend.FLASHINFER:
+        if backend == AttentionBackendEnum.FLASHINFER:
             # With the Flashinfer backend after the 1st round of the forward
             # pass, output quant scale should be loaded into the attn layer's
             # _o_scale_float, the 2nd round should reuse the loaded
diff --git a/tests/compile/test_fusions_e2e.py b/tests/compile/test_fusions_e2e.py
index 4b910bc28579..f67063cdf42e 100644
--- a/tests/compile/test_fusions_e2e.py
+++ b/tests/compile/test_fusions_e2e.py
@@ -11,7 +11,7 @@
 import pytest
 import regex as re
 
-from tests.v1.attention.utils import _Backend
+from tests.v1.attention.utils import AttentionBackendEnum
 from vllm import LLM, SamplingParams
 from vllm.config import CompilationConfig, CompilationMode, CUDAGraphMode, PassConfig
 from vllm.platforms import current_platform
@@ -24,7 +24,7 @@
 class ModelBackendTestCase(NamedTuple):
     model_name: str
     model_kwargs: dict[str, Any]
-    backend: _Backend
+    backend: AttentionBackendEnum
     attention_fusions: int
     allreduce_fusions: int | None = None
 
@@ -39,14 +39,14 @@ class ModelBackendTestCase(NamedTuple):
             # Use smaller model for L40s in CI
             model_name="RedHatAI/Meta-Llama-3.1-8B-Instruct-FP8",
             model_kwargs=dict(max_model_len=1024),
-            backend=_Backend.TRITON_ATTN,
+            backend=AttentionBackendEnum.TRITON_ATTN,
             attention_fusions=32,
             allreduce_fusions=65,
         ),
         ModelBackendTestCase(
             model_name="nvidia/Llama-4-Scout-17B-16E-Instruct-FP8",
             model_kwargs=dict(max_model_len=1024, kv_cache_dtype="fp8"),
-            backend=_Backend.FLASHINFER,
+            backend=AttentionBackendEnum.FLASHINFER,
             attention_fusions=48,
             allreduce_fusions=96,
         ),
@@ -56,7 +56,7 @@ class ModelBackendTestCase(NamedTuple):
         ModelBackendTestCase(
             model_name="nvidia/Llama-3.1-8B-Instruct-FP4",
             model_kwargs=dict(max_model_len=1024, kv_cache_dtype="fp8"),
-            backend=_Backend.FLASHINFER,
+            backend=AttentionBackendEnum.FLASHINFER,
             attention_fusions=32,
             allreduce_fusions=65,
         ),
@@ -67,7 +67,7 @@ class ModelBackendTestCase(NamedTuple):
         ModelBackendTestCase(
             model_name="meta-llama/Llama-3.1-8B-Instruct",
             model_kwargs=dict(max_model_len=1024),
-            backend=_Backend.TRITON_ATTN,
+            backend=AttentionBackendEnum.TRITON_ATTN,
             attention_fusions=0,
             allreduce_fusions=65,
         ),
@@ -85,19 +85,19 @@ class ModelBackendTestCase(NamedTuple):
         ModelBackendTestCase(
             model_name="amd/Llama-3.1-8B-Instruct-FP8-KV",
             model_kwargs=dict(max_model_len=1024),
-            backend=_Backend.TRITON_ATTN,
+            backend=AttentionBackendEnum.TRITON_ATTN,
             attention_fusions=32,
         ),
         ModelBackendTestCase(
             model_name="amd/Llama-3.1-8B-Instruct-FP8-KV",
             model_kwargs=dict(max_model_len=1024),
-            backend=_Backend.ROCM_ATTN,
+            backend=AttentionBackendEnum.ROCM_ATTN,
             attention_fusions=32,
         ),
         ModelBackendTestCase(
             model_name="amd/Llama-3.1-8B-Instruct-FP8-KV",
             model_kwargs=dict(max_model_len=1024),
-            backend=_Backend.ROCM_AITER_UNIFIED_ATTN,
+            backend=AttentionBackendEnum.ROCM_AITER_UNIFIED_ATTN,
             attention_fusions=32,
         ),
     ]
@@ -117,7 +117,7 @@ class ModelBackendTestCase(NamedTuple):
 def test_attn_quant(
     model_name: str,
     model_kwargs: dict[str, Any],
-    backend: _Backend,
+    backend: AttentionBackendEnum,
     attention_fusions: int,
     allreduce_fusions: int,
     custom_ops: str,
@@ -125,7 +125,7 @@ def test_attn_quant(
     caplog_mp_spawn,
     monkeypatch,
 ):
-    if backend == _Backend.FLASHINFER and (
+    if backend == AttentionBackendEnum.FLASHINFER and (
         not current_platform.is_device_capability((10, 0)) or not has_flashinfer()
     ):
         pytest.skip("FlashInfer attn fusion requires Blackwell and flashinfer")
@@ -208,7 +208,7 @@ def custom_ops_product(*custom_ops_lists: list[str]) -> Iterable[str]:
 def test_tp2_attn_quant_allreduce_rmsnorm(
     model_name: str,
     model_kwargs: dict,
-    backend: _Backend,
+    backend: AttentionBackendEnum,
     attention_fusions: int,
     allreduce_fusions: int,
     custom_ops: str,
diff --git a/tests/config/test_multimodal_config.py b/tests/config/test_multimodal_config.py
index b1a09d88ed9d..3d02893e52f1 100644
--- a/tests/config/test_multimodal_config.py
+++ b/tests/config/test_multimodal_config.py
@@ -3,13 +3,13 @@
 
 import pytest
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config.multimodal import MultiModalConfig
 
 
 def test_mm_encoder_attn_backend_str_conversion():
     config = MultiModalConfig(mm_encoder_attn_backend="FLASH_ATTN")
-    assert config.mm_encoder_attn_backend == _Backend.FLASH_ATTN
+    assert config.mm_encoder_attn_backend == AttentionBackendEnum.FLASH_ATTN
 
 
 def test_mm_encoder_attn_backend_invalid():
@@ -20,6 +20,6 @@ def test_mm_encoder_attn_backend_invalid():
 def test_mm_encoder_attn_backend_hash_updates():
     base_hash = MultiModalConfig().compute_hash()
     overridden_hash = MultiModalConfig(
-        mm_encoder_attn_backend=_Backend.FLASH_ATTN
+        mm_encoder_attn_backend=AttentionBackendEnum.FLASH_ATTN
     ).compute_hash()
     assert base_hash != overridden_hash
diff --git a/tests/kernels/attention/test_attention_selector.py b/tests/kernels/attention/test_attention_selector.py
index 8149ce7672cd..29cc81be12e4 100644
--- a/tests/kernels/attention/test_attention_selector.py
+++ b/tests/kernels/attention/test_attention_selector.py
@@ -120,12 +120,13 @@ def test_env(
 
         elif device == "cuda":
             with patch("vllm.platforms.current_platform", CudaPlatform()):
+                capability = torch.cuda.get_device_capability()
                 if use_mla:
                     # CUDA MLA backend logic:
                     # - CUTLASS_MLA: only supported with block_size == 128
-                    #   and Blackwell GPUs (SM 10.0), V1 only
+                    #   and Blackwell GPUs (SM 10.x), V1 only
                     # - FLASHINFER_MLA: only supported on Blackwell GPUs
-                    #   (SM 10.0+), V1 only
+                    #   (SM 10.x), V1 only
                     # - FLASHMLA: only supported with block_size == 64
                     # - FLASH_ATTN_MLA: V1 only
                     # - TRITON_MLA: fallback for other cases
@@ -134,58 +135,72 @@ def test_env(
                         if block_size != 128:
                             # CUTLASS_MLA only supports block_size == 128
                             pytest.skip("CUTLASS_MLA only supports block_size 128")
-                        else:
-                            backend = get_attn_backend(
-                                16, torch.float16, None, block_size, use_mla=use_mla
-                            )
-                            expected = "CUTLASS_MLA"
-                            assert backend.get_name() == expected
+                        if capability[0] != 10:
+                            pytest.skip("CUTLASS MLA is not supported on this platform")
+                        backend = get_attn_backend(
+                            576, torch.float16, None, block_size, use_mla=use_mla
+                        )
+                        expected = "CUTLASS_MLA"
+                        assert backend.get_name() == expected
                     elif name == "FLASHINFER_MLA":
+                        if capability[0] != 10:
+                            pytest.skip(
+                                "FlashInfer MLA is not supported on this platform"
+                            )
                         if block_size not in [32, 64]:
                             # FlashInfer MLA only supports block_size 32 or 64
                             pytest.skip(
                                 "FlashInfer MLA only supports block_size 32 or 64"
                             )
-                        else:
-                            backend = get_attn_backend(
-                                16, torch.float16, None, block_size, use_mla=use_mla
-                            )
-                            expected = "FLASHINFER_MLA"
-                            assert backend.get_name() == expected
+                        backend = get_attn_backend(
+                            576, torch.float16, None, block_size, use_mla=use_mla
+                        )
+                        expected = "FLASHINFER_MLA"
+                        assert backend.get_name() == expected
                     elif name == "FLASHMLA":
                         if block_size != 64:
                             # FlashMLA only supports block_size == 64
                             pytest.skip("FlashMLA only supports block_size 64")
-                        else:
-                            from vllm.v1.attention.backends.mla.flashmla import (
-                                is_flashmla_dense_supported,
-                            )
+                        from vllm.v1.attention.backends.mla.flashmla import (
+                            is_flashmla_dense_supported,
+                        )
 
-                            is_supported, _ = is_flashmla_dense_supported()
-                            if not is_supported:
-                                pytest.skip("FlashMLA not supported on this platform")
-                            else:
-                                backend = get_attn_backend(
-                                    16, torch.float16, None, block_size, use_mla=use_mla
-                                )
-                                expected = name
-                                assert backend.get_name() == expected
+                        is_supported, _ = is_flashmla_dense_supported()
+                        if not is_supported:
+                            pytest.skip("FlashMLA not supported on this platform")
+                        backend = get_attn_backend(
+                            576,
+                            torch.float16,
+                            None,
+                            block_size,
+                            use_mla=use_mla,
+                        )
+                        expected = name
+                        assert backend.get_name() == expected
                     elif name == "FLASH_ATTN_MLA":
+                        from vllm.attention.utils.fa_utils import (
+                            flash_attn_supports_mla,
+                        )
+
+                        if not flash_attn_supports_mla():
+                            pytest.skip(
+                                "FlashAttention MLA not supported on this platform"
+                            )
                         backend = get_attn_backend(
-                            16, torch.float16, None, block_size, use_mla=use_mla
+                            576, torch.float16, None, block_size, use_mla=use_mla
                         )
                         expected = "FLASH_ATTN_MLA"
                         assert backend.get_name() == expected
                     else:
                         # TRITON_MLA or other fallback
                         backend = get_attn_backend(
-                            16, torch.float16, None, block_size, use_mla=use_mla
+                            576, torch.float16, None, block_size, use_mla=use_mla
                         )
                         expected = "TRITON_MLA"
                         assert backend.get_name() == expected
                 elif name == "FLASHINFER":
                     backend = get_attn_backend(
-                        16, torch.float16, None, block_size, use_mla=use_mla
+                        64, torch.float16, None, block_size, use_mla=use_mla
                     )
                     expected = "FLASHINFER"
                     assert backend.get_name() == expected
diff --git a/tests/kernels/attention/test_mha_attn.py b/tests/kernels/attention/test_mha_attn.py
index 14d1618bca3c..183bbf3bf4e0 100644
--- a/tests/kernels/attention/test_mha_attn.py
+++ b/tests/kernels/attention/test_mha_attn.py
@@ -11,7 +11,7 @@
 import pytest
 import torch
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import MultiHeadAttention
 from vllm.attention.selector import _cached_get_attn_backend
 from vllm.platforms import current_platform
@@ -43,14 +43,14 @@ def test_mha_attn_platform(device: str):
             patch("vllm.model_executor.models.vision.current_platform", CpuPlatform()),
         ):
             attn = MultiHeadAttention(16, 64, scale=1)
-            assert attn.attn_backend == _Backend.TORCH_SDPA
+            assert attn.attn_backend == AttentionBackendEnum.TORCH_SDPA
     elif device == "hip":
         with (
             patch("vllm.attention.layer.current_platform", RocmPlatform()),
             patch("vllm.model_executor.models.vision.current_platform", RocmPlatform()),
         ):
             attn = MultiHeadAttention(16, 64, scale=1)
-            assert attn.attn_backend == _Backend.TORCH_SDPA
+            assert attn.attn_backend == AttentionBackendEnum.TORCH_SDPA
     else:
         # Test CUDA with head_size=64 (divisible by 32)
         # - should use vLLM's FlashAttention
@@ -59,7 +59,7 @@ def test_mha_attn_platform(device: str):
             patch("vllm.model_executor.models.vision.current_platform", CudaPlatform()),
         ):
             attn = MultiHeadAttention(16, 64, scale=1)
-            assert attn.attn_backend == _Backend.FLASH_ATTN
+            assert attn.attn_backend == AttentionBackendEnum.FLASH_ATTN
 
         # Test CUDA with head_size=72 (not divisible by 32)
         # - with upstream FA not available
@@ -73,7 +73,7 @@ def test_mha_attn_platform(device: str):
             ),
         ):
             attn = MultiHeadAttention(16, 72, scale=1)
-            assert attn.attn_backend == _Backend.XFORMERS
+            assert attn.attn_backend == AttentionBackendEnum.XFORMERS
 
         # Test CUDA with head_size=72 (not divisible by 32)
         # - with upstream FA available
@@ -96,7 +96,7 @@ def test_mha_attn_platform(device: str):
             ),
         ):
             attn = MultiHeadAttention(16, 72, scale=1)
-            assert attn.attn_backend == _Backend.FLASH_ATTN
+            assert attn.attn_backend == AttentionBackendEnum.FLASH_ATTN
 
 
 def ref_attention(
diff --git a/tests/models/test_initialization.py b/tests/models/test_initialization.py
index 48a6f34366cf..8c4bd6eaa2dd 100644
--- a/tests/models/test_initialization.py
+++ b/tests/models/test_initialization.py
@@ -93,6 +93,17 @@ def _initialize_kv_caches_v1(self, vllm_config):
             "pickle error when loading `transformers.models.auto.CONFIG_MAPPING`"
         )
 
+    if model_arch == "DeepseekV32ForCausalLM":
+        from vllm.platforms import current_platform
+
+        capability = current_platform.get_device_capability()
+        if capability and capability.major < 9:
+            pytest.skip(
+                f"DeepseekV32 requires Hopper (9.0+) or Blackwell (10.0+) "
+                f"for FLASHMLA_SPARSE backend. Current device has compute "
+                f"capability {capability.major}.{capability.minor}"
+            )
+
     with (
         patch.object(V1EngineCore, "_initialize_kv_caches", _initialize_kv_caches_v1),
         monkeypatch.context() as m,
diff --git a/tests/v1/attention/test_attention_backends.py b/tests/v1/attention/test_attention_backends.py
index 08aeb6f298f6..b46002c5fa8f 100644
--- a/tests/v1/attention/test_attention_backends.py
+++ b/tests/v1/attention/test_attention_backends.py
@@ -15,7 +15,7 @@
     create_vllm_config,
     try_get_attention_backend,
 )
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config import ModelConfig
 from vllm.platforms import current_platform
 from vllm.utils.math_utils import cdiv
@@ -27,11 +27,11 @@
 from vllm.v1.kv_cache_interface import FullAttentionSpec
 
 BACKENDS_TO_TEST = [
-    _Backend.FLASH_ATTN,
-    _Backend.FLASHINFER,
-    _Backend.FLEX_ATTENTION,
-    _Backend.TRITON_ATTN,
-    _Backend.TREE_ATTN,
+    AttentionBackendEnum.FLASH_ATTN,
+    AttentionBackendEnum.FLASHINFER,
+    AttentionBackendEnum.FLEX_ATTENTION,
+    AttentionBackendEnum.TRITON_ATTN,
+    AttentionBackendEnum.TREE_ATTN,
     "FLEX_ATTENTION_SLOW",
 ]
 
@@ -39,7 +39,7 @@
 try:
     import flashinfer  # noqa: F401
 except ImportError:
-    BACKENDS_TO_TEST.remove(_Backend.FLASHINFER)
+    BACKENDS_TO_TEST.remove(AttentionBackendEnum.FLASHINFER)
 
 
 def _convert_dtype_to_torch(dtype):
@@ -192,7 +192,7 @@ def __init__(self, device: torch.device):
 
 
 def run_attention_backend(
-    backend: _Backend,
+    backend: AttentionBackendEnum,
     kv_cache_spec: FullAttentionSpec,
     layer_names: list[str],
     vllm_config,
@@ -211,13 +211,13 @@ def run_attention_backend(
 
     use_direct_block_mask = is_torch_equal_or_newer("2.9.0.dev0")
     if backend == "FLEX_ATTENTION_SLOW":
-        actual_backend = _Backend.FLEX_ATTENTION
+        actual_backend = AttentionBackendEnum.FLEX_ATTENTION
         use_direct_block_mask = False
 
     builder_cls, impl_cls = try_get_attention_backend(actual_backend)
 
     # Mock flashinfer's get_per_layer_parameters if needed
-    if actual_backend == _Backend.FLASHINFER:
+    if actual_backend == AttentionBackendEnum.FLASHINFER:
         import unittest.mock
 
         from vllm.v1.attention.backends.utils import PerLayerParameters
@@ -246,7 +246,7 @@ def mock_get_per_layer_parameters(vllm_config, layer_names, impl_cls):
     else:
         # Build metadata
         builder = builder_cls(kv_cache_spec, layer_names, vllm_config, device)
-        if actual_backend == _Backend.FLEX_ATTENTION:
+        if actual_backend == AttentionBackendEnum.FLEX_ATTENTION:
             builder.direct_build = use_direct_block_mask
         attn_metadata = builder.build(
             common_prefix_len=0,
@@ -289,7 +289,7 @@ def mock_get_per_layer_parameters(vllm_config, layer_names, impl_cls):
 def _test_backend_correctness(
     batch_spec: BatchSpec,
     model: str,
-    backend_to_test: list[_Backend | str],
+    backend_to_test: list[AttentionBackendEnum | str],
     mask_mod,
     *,
     block_size: int = 16,
@@ -455,17 +455,20 @@ def _test_backend_correctness(
         # Select the appropriate KV cache format for each backend
         kv_cache_for_backend = kv_cache
         reset_kv_cache_layout = False
-        if backend_name in (_Backend.FLASHINFER, _Backend.TRITON_ATTN):
+        if backend_name in (
+            AttentionBackendEnum.FLASHINFER,
+            AttentionBackendEnum.TRITON_ATTN,
+        ):
             kv_cache_for_backend = kv_cache.transpose(0, 1)
 
-        if backend_name == _Backend.FLASHINFER:
+        if backend_name == AttentionBackendEnum.FLASHINFER:
             # For FlashInfer default to HND layout and
             kv_cache_for_backend = (
                 kv_cache_for_backend.transpose(2, 3).contiguous().transpose(2, 3)
             )
             set_kv_cache_layout("HND")
             reset_kv_cache_layout = True
-        elif backend_name == _Backend.TRITON_ATTN:
+        elif backend_name == AttentionBackendEnum.TRITON_ATTN:
             kv_cache_for_backend = kv_cache_for_backend.contiguous()
 
         try:
@@ -547,7 +550,9 @@ def causal_mask_mod(
 
     batch_spec = BATCH_SPECS[batch_spec_name]
     LARGE_BLOCK_BACKENDS = (
-        [_Backend.FLEX_ATTENTION] if is_torch_equal_or_newer("2.9.0.dev0") else []
+        [AttentionBackendEnum.FLEX_ATTENTION]
+        if is_torch_equal_or_newer("2.9.0.dev0")
+        else []
     )
     SMALL_BLOCK_BACKENDS = [
         x for x in BACKENDS_TO_TEST if x not in LARGE_BLOCK_BACKENDS
@@ -573,9 +578,9 @@ def causal_mask_mod(
 
 
 SLIDING_WINDOW_BACKENDS_TO_TEST = [
-    _Backend.FLASH_ATTN,
-    _Backend.FLEX_ATTENTION,
-    _Backend.TRITON_ATTN,
+    AttentionBackendEnum.FLASH_ATTN,
+    AttentionBackendEnum.FLEX_ATTENTION,
+    AttentionBackendEnum.TRITON_ATTN,
     "FLEX_ATTENTION_SLOW",
 ]
 
@@ -612,7 +617,9 @@ def sliding_window_mask_mod(
     )
 
     LARGE_BLOCK_BACKENDS = (
-        [_Backend.FLEX_ATTENTION] if is_torch_equal_or_newer("2.9.0.dev0") else []
+        [AttentionBackendEnum.FLEX_ATTENTION]
+        if is_torch_equal_or_newer("2.9.0.dev0")
+        else []
     )
     SMALL_BLOCK_BACKENDS = [
         x for x in SLIDING_WINDOW_BACKENDS_TO_TEST if x not in LARGE_BLOCK_BACKENDS
diff --git a/tests/v1/attention/test_mla_backends.py b/tests/v1/attention/test_mla_backends.py
index 5679fafe63ee..1bd05e6183dc 100644
--- a/tests/v1/attention/test_mla_backends.py
+++ b/tests/v1/attention/test_mla_backends.py
@@ -18,12 +18,11 @@
     try_get_attention_backend,
 )
 from vllm import _custom_ops as ops
-from vllm.attention.backends.registry import _Backend, backend_to_class_str
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.ops.flashmla import is_flashmla_dense_supported
 from vllm.attention.utils.fa_utils import flash_attn_supports_mla
 from vllm.config.vllm import set_current_vllm_config
 from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
-from vllm.utils.import_utils import resolve_obj_by_qualname
 from vllm.utils.math_utils import cdiv
 from vllm.utils.torch_utils import STR_DTYPE_TO_TORCH_DTYPE
 from vllm.v1.attention.backends.mla.common import QueryLenSupport
@@ -31,25 +30,25 @@
 from vllm.v1.kv_cache_interface import FullAttentionSpec
 
 BACKENDS_TO_TEST = [
-    _Backend.CUTLASS_MLA,
-    _Backend.FLASHMLA,
-    _Backend.FLASH_ATTN_MLA,
-    _Backend.FLASHINFER_MLA,
-    _Backend.TRITON_MLA,
+    AttentionBackendEnum.CUTLASS_MLA,
+    AttentionBackendEnum.FLASHMLA,
+    AttentionBackendEnum.FLASH_ATTN_MLA,
+    AttentionBackendEnum.FLASHINFER_MLA,
+    AttentionBackendEnum.TRITON_MLA,
 ]
 
 # Remove sm100 backends from the list if not using sm100
 if not torch.cuda.is_available() or torch.cuda.get_device_properties(0).major < 10:
-    BACKENDS_TO_TEST.remove(_Backend.CUTLASS_MLA)
-    BACKENDS_TO_TEST.remove(_Backend.FLASHINFER_MLA)
+    BACKENDS_TO_TEST.remove(AttentionBackendEnum.CUTLASS_MLA)
+    BACKENDS_TO_TEST.remove(AttentionBackendEnum.FLASHINFER_MLA)
 
 # Remove FLASH_ATTN_MLA from the list if not supported
 if not flash_attn_supports_mla():
-    BACKENDS_TO_TEST.remove(_Backend.FLASH_ATTN_MLA)
+    BACKENDS_TO_TEST.remove(AttentionBackendEnum.FLASH_ATTN_MLA)
 
 # Remove FLASHMLA from the list if not supported
 if not is_flashmla_dense_supported()[0]:
-    BACKENDS_TO_TEST.remove(_Backend.FLASHMLA)
+    BACKENDS_TO_TEST.remove(AttentionBackendEnum.FLASHMLA)
 
 SPEC_DECODE_BACKENDS = []
 for backend in BACKENDS_TO_TEST:
@@ -62,9 +61,7 @@
 
 BACKEND_BLOCK_SIZES = {}
 for backend in BACKENDS_TO_TEST:
-    backend_class_str = backend_to_class_str(backend)
-    backend_class = resolve_obj_by_qualname(backend_class_str)
-    supported_sizes = backend_class.get_supported_kernel_block_size()
+    supported_sizes = backend.get_class().supported_kernel_block_sizes
     if supported_sizes:
         default_size = supported_sizes[0]
         block_size = (
@@ -291,7 +288,7 @@ def get_kv_cache_spec(self, vllm_config):
 
 
 def run_attention_backend(
-    backend: _Backend,
+    backend: AttentionBackendEnum,
     kv_cache_spec: FullAttentionSpec,
     layer_names: list[str],
     vllm_config,
@@ -813,7 +810,7 @@ def test_backend_correctness(
         # Create a summary for the single-line failure message
         backend_names = []
         for f in failures:
-            if "[_Backend." in f:
+            if "[AttentionBackendEnum." in f:
                 backend_name = f.split("[")[1].split("]")[0]
                 backend_names.append(backend_name)
 
diff --git a/tests/v1/attention/utils.py b/tests/v1/attention/utils.py
index b166d9d4ff68..dea89babd4b4 100644
--- a/tests/v1/attention/utils.py
+++ b/tests/v1/attention/utils.py
@@ -8,7 +8,7 @@
 import torch
 
 from vllm.attention.backends.abstract import AttentionImpl
-from vllm.attention.backends.registry import _Backend, backend_to_class_str
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config import (
     CacheConfig,
     CompilationConfig,
@@ -20,7 +20,6 @@
     VllmConfig,
 )
 from vllm.config.model import ModelDType
-from vllm.utils.import_utils import resolve_obj_by_qualname
 from vllm.v1.attention.backends.utils import (
     AttentionMetadataBuilder,
     CommonAttentionMetadata,
@@ -120,15 +119,14 @@ def create_common_attn_metadata(
 
 
 def try_get_attention_backend(
-    backend: _Backend,
+    backend: AttentionBackendEnum,
 ) -> tuple[type[AttentionMetadataBuilder], type[AttentionImpl]]:
     """Try to get the attention backend class, skipping test if not found."""
-    backend_class_str = backend_to_class_str(backend)
     try:
-        backend_class = resolve_obj_by_qualname(backend_class_str)
+        backend_class = backend.get_class()
         return backend_class.get_builder_cls(), backend_class.get_impl_cls()
     except ImportError as e:
-        pytest.skip(f"{backend_class_str} not available: {e}")
+        pytest.skip(f"{backend.name} not available: {e}")
         raise AssertionError("unreachable") from None
 
 
diff --git a/tests/v1/spec_decode/test_eagle.py b/tests/v1/spec_decode/test_eagle.py
index 47d05a20a65d..89d0ec769ac0 100644
--- a/tests/v1/spec_decode/test_eagle.py
+++ b/tests/v1/spec_decode/test_eagle.py
@@ -13,7 +13,7 @@
     create_standard_kv_cache_spec,
     try_get_attention_backend,
 )
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config import (
     CacheConfig,
     DeviceConfig,
@@ -534,11 +534,17 @@ def create_deterministic_logits(token_ids):
     sampling_metadata = mock.MagicMock()
 
     if attn_backend == "FLASH_ATTN":
-        attn_metadata_builder_cls, _ = try_get_attention_backend(_Backend.FLASH_ATTN)
+        attn_metadata_builder_cls, _ = try_get_attention_backend(
+            AttentionBackendEnum.FLASH_ATTN
+        )
     elif attn_backend == "TRITON_ATTN":
-        attn_metadata_builder_cls, _ = try_get_attention_backend(_Backend.TRITON_ATTN)
+        attn_metadata_builder_cls, _ = try_get_attention_backend(
+            AttentionBackendEnum.TRITON_ATTN
+        )
     elif attn_backend == "TREE_ATTN":
-        attn_metadata_builder_cls, _ = try_get_attention_backend(_Backend.TREE_ATTN)
+        attn_metadata_builder_cls, _ = try_get_attention_backend(
+            AttentionBackendEnum.TREE_ATTN
+        )
     else:
         raise ValueError(f"Unsupported attention backend: {attn_backend}")
 
@@ -673,7 +679,9 @@ def create_deterministic_logits(token_ids, k: int):
     proposer.attn_layer_names = ["layer.0"]
 
     # Get the tree attention metadata builder.
-    attn_metadata_builder_cls, _ = try_get_attention_backend(_Backend.TREE_ATTN)
+    attn_metadata_builder_cls, _ = try_get_attention_backend(
+        AttentionBackendEnum.TREE_ATTN
+    )
     attn_metadata_builder = attn_metadata_builder_cls(
         kv_cache_spec=create_standard_kv_cache_spec(proposer.vllm_config),
         layer_names=proposer.attn_layer_names,
diff --git a/tests/v1/spec_decode/test_mtp.py b/tests/v1/spec_decode/test_mtp.py
index 9ca7cf9e3e0e..6d59b58e739e 100644
--- a/tests/v1/spec_decode/test_mtp.py
+++ b/tests/v1/spec_decode/test_mtp.py
@@ -12,7 +12,7 @@
     create_standard_kv_cache_spec,
     try_get_attention_backend,
 )
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config import (
     CacheConfig,
     DeviceConfig,
@@ -177,7 +177,9 @@ def create_deterministic_logits(batch_size, vocab_size, token_offset):
     sampling_metadata = mock.MagicMock()
 
     # Setup attention metadata
-    attn_metadata_builder_cls, _ = try_get_attention_backend(_Backend.FLASH_ATTN)
+    attn_metadata_builder_cls, _ = try_get_attention_backend(
+        AttentionBackendEnum.FLASH_ATTN
+    )
 
     attn_metadata_builder = attn_metadata_builder_cls(
         kv_cache_spec=create_standard_kv_cache_spec(proposer.vllm_config),
diff --git a/tests/v1/spec_decode/test_tree_attention.py b/tests/v1/spec_decode/test_tree_attention.py
index b365e75d5514..6958d62dc7e9 100644
--- a/tests/v1/spec_decode/test_tree_attention.py
+++ b/tests/v1/spec_decode/test_tree_attention.py
@@ -10,7 +10,7 @@
     create_vllm_config,
     try_get_attention_backend,
 )
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config import ParallelConfig, SpeculativeConfig
 from vllm.v1.attention.backends.utils import CommonAttentionMetadata
 
@@ -35,7 +35,7 @@ def forward_attention(
     block_table: torch.Tensor,
     slot_mapping: torch.Tensor,
     seqlen_k: int,
-    backend: _Backend,
+    backend: AttentionBackendEnum,
     spec_token_tree: str | None = None,
     num_spec_tokens: int = 0,
 ) -> torch.Tensor:
@@ -241,7 +241,7 @@ def test_tree_attn_correctness() -> None:
                         block_table=block_table,
                         slot_mapping=tree_slot_mapping,
                         seqlen_k=seqlen_k,
-                        backend=_Backend.TREE_ATTN,
+                        backend=AttentionBackendEnum.TREE_ATTN,
                         spec_token_tree=spec_token_tree,
                         num_spec_tokens=tree_size_q - 1,
                     ).view(batch_size, -1, num_heads, dim_per_head)
@@ -278,7 +278,7 @@ def test_tree_attn_correctness() -> None:
                             block_table=block_table,
                             slot_mapping=branch_slot_mapping,
                             seqlen_k=sequence_position + q_len,
-                            backend=_Backend.FLASH_ATTN,
+                            backend=AttentionBackendEnum.FLASH_ATTN,
                         ).view(batch_size, -1, num_heads, dim_per_head)
 
                         # Compare the outputs.
diff --git a/tests/v1/worker/test_gpu_model_runner.py b/tests/v1/worker/test_gpu_model_runner.py
index bc624658308b..b02d9a657407 100644
--- a/tests/v1/worker/test_gpu_model_runner.py
+++ b/tests/v1/worker/test_gpu_model_runner.py
@@ -185,9 +185,7 @@ def _make_mock_backend_for_kernel_block_size(
     supported_sizes: list[int | MultipleOf],
 ):
     class _MockBackend:
-        @staticmethod
-        def get_supported_kernel_block_size():
-            return supported_sizes
+        supported_kernel_block_sizes = supported_sizes
 
     return _MockBackend()
 
@@ -466,13 +464,20 @@ def test_kv_cache_stride_order(monkeypatch, model_runner):
     # This test checks if GPUModelRunner initializes correctly when an attention
     # backend enforces a non-default KV cache stride order.
     n_heads = model_runner.model_config.get_num_kv_heads(model_runner.parallel_config)
-    expected_kv_cache_shape = [
-        2,
-        NUM_BLOCKS,
-        BLOCK_SIZE,
-        n_heads,
-        model_runner.model_config.get_head_size(),
-    ]
+    head_size = model_runner.model_config.get_head_size()
+
+    # Get the expected shape from the backend's get_kv_cache_shape method
+    # to ensure compatibility with different backends (triton vs flexattention)
+    attn_backend = None
+    for attn_group in model_runner._attn_group_iterator():
+        attn_backend = attn_group.backend
+        break
+
+    assert attn_backend is not None, "No attention backend found"
+    expected_kv_cache_shape = list(
+        attn_backend.get_kv_cache_shape(NUM_BLOCKS, BLOCK_SIZE, n_heads, head_size)
+    )
+
     # TODO mla test
     default_stride = tuple(range(5))
     # Permutation that gets you back to expected kv shape
diff --git a/vllm/attention/backends/abstract.py b/vllm/attention/backends/abstract.py
index b54eaf4e2872..697beed91869 100644
--- a/vllm/attention/backends/abstract.py
+++ b/vllm/attention/backends/abstract.py
@@ -2,13 +2,18 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from abc import ABC, abstractmethod
-from typing import Generic, Protocol, TypeVar
+from typing import TYPE_CHECKING, ClassVar, Generic, Protocol, TypeVar, get_args
 
 import torch
 
 from vllm.model_executor.layers.linear import ColumnParallelLinear
 from vllm.model_executor.layers.quantization.utils.quant_utils import QuantKey
 
+if TYPE_CHECKING:
+    from vllm.config.cache import CacheDType
+    from vllm.platforms.interface import DeviceCapability
+    from vllm.v1.attention.backends.utils import KVCacheLayoutType
+
 
 class AttentionType:
     """
@@ -40,6 +45,9 @@ class AttentionBackend(ABC):
     # calling the custom op. When piecewise cudagraph is enabled, this
     # makes sure the output tensor is allocated inside the cudagraph.
     accept_output_buffer: bool = False
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(1)]
+    supported_kv_cache_dtypes: ClassVar[list["CacheDType"]] = ["auto"]
 
     @staticmethod
     @abstractmethod
@@ -51,10 +59,6 @@ def get_name() -> str:
     def get_impl_cls() -> type["AttentionImpl"]:
         raise NotImplementedError
 
-    @classmethod
-    def get_supported_kernel_block_size(cls) -> list[int | MultipleOf]:
-        return cls.get_impl_cls().get_supported_kernel_block_size()
-
     @staticmethod
     @abstractmethod
     def get_builder_cls():  # -> Type["AttentionMetadataBuilder"]:
@@ -79,6 +83,136 @@ def get_kv_cache_stride_order() -> tuple[int, ...]:
     def full_cls_name(cls) -> tuple[str, str]:
         return (cls.__module__, cls.__qualname__)
 
+    @classmethod
+    def get_supported_head_sizes(cls) -> list[int]:
+        return []
+
+    @classmethod
+    def supports_head_size(cls, head_size: int) -> bool:
+        supported_head_sizes = cls.get_supported_head_sizes()
+        return (not supported_head_sizes) or head_size in supported_head_sizes
+
+    @classmethod
+    def supports_dtype(cls, dtype: torch.dtype) -> bool:
+        return dtype in cls.supported_dtypes
+
+    @classmethod
+    def supports_kv_cache_dtype(cls, kv_cache_dtype: "CacheDType | None") -> bool:
+        if kv_cache_dtype is None:
+            return True
+        return (not cls.supported_kv_cache_dtypes) or (
+            kv_cache_dtype in cls.supported_kv_cache_dtypes
+        )
+
+    @classmethod
+    def supports_block_size(cls, block_size: int | None) -> bool:
+        from vllm.config.cache import BlockSize
+
+        if block_size is None:
+            return True
+
+        valid_sizes = get_args(BlockSize)
+        if block_size not in valid_sizes:
+            return False
+
+        if not cls.supported_kernel_block_sizes:
+            return True
+
+        for supported_size in cls.supported_kernel_block_sizes:
+            is_multiple_of = (
+                isinstance(supported_size, MultipleOf)
+                and block_size % supported_size.base == 0
+            )
+            is_int_equal = (
+                isinstance(supported_size, int) and block_size == supported_size
+            )
+            if is_multiple_of or is_int_equal:
+                return True
+        return False
+
+    @classmethod
+    def is_mla(cls) -> bool:
+        return False
+
+    @classmethod
+    def supports_sink(cls) -> bool:
+        return False
+
+    @classmethod
+    def is_sparse(cls) -> bool:
+        return False
+
+    @classmethod
+    def supports_compute_capability(cls, capability: "DeviceCapability") -> bool:
+        return True
+
+    @classmethod
+    def supports_combination(
+        cls,
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: "CacheDType | None",
+        block_size: int | None,
+        use_mla: bool,
+        has_sink: bool,
+        use_sparse: bool,
+        device_capability: "DeviceCapability",
+    ) -> str | None:
+        return None
+
+    @classmethod
+    def validate_configuration(
+        cls,
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: "CacheDType | None",
+        block_size: int | None,
+        use_mla: bool,
+        has_sink: bool,
+        use_sparse: bool,
+        device_capability: "DeviceCapability",
+    ) -> list[str]:
+        invalid_reasons = []
+        if not cls.supports_head_size(head_size):
+            invalid_reasons.append("head_size not supported")
+        if not cls.supports_dtype(dtype):
+            invalid_reasons.append("dtype not supported")
+        if not cls.supports_kv_cache_dtype(kv_cache_dtype):
+            invalid_reasons.append("kv_cache_dtype not supported")
+        if not cls.supports_block_size(block_size):
+            invalid_reasons.append("block_size not supported")
+        if use_mla != cls.is_mla():
+            if use_mla:
+                invalid_reasons.append("MLA not supported")
+            else:
+                invalid_reasons.append("non-MLA not supported")
+        if has_sink and not cls.supports_sink():
+            invalid_reasons.append("sink setting not supported")
+        if use_sparse != cls.is_sparse():
+            if use_sparse:
+                invalid_reasons.append("sparse not supported")
+            else:
+                invalid_reasons.append("non-sparse not supported")
+        if not cls.supports_compute_capability(device_capability):
+            invalid_reasons.append("compute capability not supported")
+        combination_reason = cls.supports_combination(
+            head_size,
+            dtype,
+            kv_cache_dtype,
+            block_size,
+            use_mla,
+            has_sink,
+            use_sparse,
+            device_capability,
+        )
+        if combination_reason is not None:
+            invalid_reasons.append(combination_reason)
+        return invalid_reasons
+
+    @classmethod
+    def get_required_kv_cache_layout(cls) -> "KVCacheLayoutType | None":
+        return None
+
 
 class AttentionMetadata:
     pass
@@ -151,11 +285,6 @@ def __init__(
     ) -> None:
         raise NotImplementedError
 
-    @staticmethod
-    def get_supported_kernel_block_size() -> list[int | MultipleOf]:
-        # TODO: implement this function for all backends.
-        return [MultipleOf(1)]
-
     @abstractmethod
     def forward(
         self,
diff --git a/vllm/attention/backends/registry.py b/vllm/attention/backends/registry.py
index 05d0159d0861..768d15cb9c82 100644
--- a/vllm/attention/backends/registry.py
+++ b/vllm/attention/backends/registry.py
@@ -3,108 +3,192 @@
 """Attention backend registry"""
 
 import enum
+from collections.abc import Callable
+from typing import TYPE_CHECKING, cast
 
+from vllm.logger import init_logger
 from vllm.utils.import_utils import resolve_obj_by_qualname
 
+if TYPE_CHECKING:
+    from vllm.attention.backends.abstract import AttentionBackend
 
-class _Backend(enum.Enum):
-    FLASH_ATTN = enum.auto()
-    TRITON_ATTN = enum.auto()
-    XFORMERS = enum.auto()
-    ROCM_ATTN = enum.auto()
-    ROCM_AITER_MLA = enum.auto()
-    ROCM_AITER_FA = enum.auto()  # used for ViT attn backend
-    TORCH_SDPA = enum.auto()
-    FLASHINFER = enum.auto()
-    FLASHINFER_MLA = enum.auto()
-    TRITON_MLA = enum.auto()
-    CUTLASS_MLA = enum.auto()
-    FLASHMLA = enum.auto()
-    FLASHMLA_SPARSE = enum.auto()
-    FLASH_ATTN_MLA = enum.auto()
-    PALLAS = enum.auto()
-    IPEX = enum.auto()
-    NO_ATTENTION = enum.auto()
-    FLEX_ATTENTION = enum.auto()
-    TREE_ATTN = enum.auto()
-    ROCM_AITER_UNIFIED_ATTN = enum.auto()
-
-
-BACKEND_MAP = {
-    _Backend.FLASH_ATTN: "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend",  # noqa: E501
-    _Backend.TRITON_ATTN: "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend",  # noqa: E501
-    _Backend.XFORMERS: "vllm.v1.attention.backends.xformers.XFormersAttentionBackend",  # noqa: E501
-    _Backend.ROCM_ATTN: "vllm.v1.attention.backends.rocm_attn.RocmAttentionBackend",  # noqa: E501
-    _Backend.ROCM_AITER_MLA: "vllm.v1.attention.backends.mla.rocm_aiter_mla.AiterMLABackend",  # noqa: E501
-    _Backend.ROCM_AITER_FA: "vllm.v1.attention.backends.rocm_aiter_fa.AiterFlashAttentionBackend",  # noqa: E501
-    _Backend.TORCH_SDPA: "vllm.v1.attention.backends.cpu_attn.TorchSDPABackend",  # noqa: E501
-    _Backend.FLASHINFER: "vllm.v1.attention.backends.flashinfer.FlashInferBackend",  # noqa: E501
-    _Backend.FLASHINFER_MLA: "vllm.v1.attention.backends.mla.flashinfer_mla.FlashInferMLABackend",  # noqa: E501
-    _Backend.TRITON_MLA: "vllm.v1.attention.backends.mla.triton_mla.TritonMLABackend",  # noqa: E501
-    _Backend.CUTLASS_MLA: "vllm.v1.attention.backends.mla.cutlass_mla.CutlassMLABackend",  # noqa: E501
-    _Backend.FLASHMLA: "vllm.v1.attention.backends.mla.flashmla.FlashMLABackend",  # noqa: E501
-    _Backend.FLASHMLA_SPARSE: "vllm.v1.attention.backends.mla.flashmla_sparse.FlashMLASparseBackend",  # noqa: E501
-    _Backend.FLASH_ATTN_MLA: "vllm.v1.attention.backends.mla.flashattn_mla.FlashAttnMLABackend",  # noqa: E501
-    _Backend.PALLAS: "vllm.v1.attention.backends.pallas.PallasAttentionBackend",  # noqa: E501
-    _Backend.FLEX_ATTENTION: "vllm.v1.attention.backends.flex_attention.FlexAttentionBackend",  # noqa: E501
-    _Backend.TREE_ATTN: "vllm.v1.attention.backends.tree_attn.TreeAttentionBackend",  # noqa: E501
-    _Backend.ROCM_AITER_UNIFIED_ATTN: "vllm.v1.attention.backends.rocm_aiter_unified_attn.RocmAiterUnifiedAttentionBackend",  # noqa: E501
-}
-
-
-def register_attn_backend(backend: _Backend, class_path: str | None = None):
-    """
-    Decorator: register a custom attention backend into BACKEND_MAPPING.
-    - If class_path is provided, use it.
-    - Otherwise, auto-generate from the class object.
-    Validation: only checks if 'backend' is a valid _Backend enum member.
-    Overwriting existing mappings is allowed. This enables other hardware
-    platforms to plug in custom out-of-tree backends.
-    """
-    if not isinstance(backend, _Backend):
-        raise ValueError(f"{backend} is not a valid _Backend enum value.")
+logger = init_logger(__name__)
 
-    def decorator(cls):
-        path = class_path or f"{cls.__module__}.{cls.__qualname__}"
-        BACKEND_MAP[backend] = path
-        return cls
 
-    return decorator
+class _AttentionBackendEnumMeta(enum.EnumMeta):
+    """Metaclass for AttentionBackendEnum to provide better error messages."""
 
+    def __getitem__(cls, name: str):
+        """Get backend by name with helpful error messages."""
+        try:
+            return super().__getitem__(name)
+        except KeyError:
+            members = cast("dict[str, AttentionBackendEnum]", cls.__members__).values()
+            valid_backends = ", ".join(m.name for m in members)
+            raise ValueError(
+                f"Unknown attention backend: '{name}'. "
+                f"Valid options are: {valid_backends}"
+            ) from None
 
-def backend_to_class_str(backend: _Backend) -> str:
-    """Get the backend class string
 
-    Args:
-        backend: The backend enum value
+class AttentionBackendEnum(enum.Enum, metaclass=_AttentionBackendEnumMeta):
+    """Enumeration of all supported attention backends.
 
-    Returns:
-        The backend class string
-    """
-    return BACKEND_MAP[backend]
+    The enum value is the default class path, but this can be overridden
+    at runtime using register_backend().
 
+    To get the actual backend class (respecting overrides), use:
+        backend.get_class()
+    """
 
-def backend_to_class(backend: _Backend) -> type:
-    """Get the backend class.
+    FLASH_ATTN = "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"
+    TRITON_ATTN = "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend"
+    XFORMERS = "vllm.v1.attention.backends.xformers.XFormersAttentionBackend"
+    ROCM_ATTN = "vllm.v1.attention.backends.rocm_attn.RocmAttentionBackend"
+    ROCM_AITER_MLA = "vllm.v1.attention.backends.mla.rocm_aiter_mla.AiterMLABackend"
+    ROCM_AITER_FA = (
+        "vllm.v1.attention.backends.rocm_aiter_fa.AiterFlashAttentionBackend"
+    )
+    TORCH_SDPA = "vllm.v1.attention.backends.cpu_attn.TorchSDPABackend"
+    FLASHINFER = "vllm.v1.attention.backends.flashinfer.FlashInferBackend"
+    FLASHINFER_MLA = (
+        "vllm.v1.attention.backends.mla.flashinfer_mla.FlashInferMLABackend"
+    )
+    TRITON_MLA = "vllm.v1.attention.backends.mla.triton_mla.TritonMLABackend"
+    CUTLASS_MLA = "vllm.v1.attention.backends.mla.cutlass_mla.CutlassMLABackend"
+    FLASHMLA = "vllm.v1.attention.backends.mla.flashmla.FlashMLABackend"
+    FLASHMLA_SPARSE = (
+        "vllm.v1.attention.backends.mla.flashmla_sparse.FlashMLASparseBackend"
+    )
+    FLASH_ATTN_MLA = "vllm.v1.attention.backends.mla.flashattn_mla.FlashAttnMLABackend"
+    PALLAS = "vllm.v1.attention.backends.pallas.PallasAttentionBackend"
+    IPEX = "vllm.v1.attention.backends.ipex.IpexAttentionBackend"
+    NO_ATTENTION = "vllm.v1.attention.backends.no_attention.NoAttentionBackend"
+    FLEX_ATTENTION = "vllm.v1.attention.backends.flex_attention.FlexAttentionBackend"
+    TREE_ATTN = "vllm.v1.attention.backends.tree_attn.TreeAttentionBackend"
+    ROCM_AITER_UNIFIED_ATTN = (
+        "vllm.v1.attention.backends.rocm_aiter_unified_attn."
+        "RocmAiterUnifiedAttentionBackend"
+    )
+    # Placeholder for third-party/custom backends - must be registered before use
+    CUSTOM = ""
+
+    def get_path(self, include_classname: bool = True) -> str:
+        """Get the class path for this backend (respects overrides).
+
+        Returns:
+            The fully qualified class path string
+
+        Raises:
+            ValueError: If Backend.CUSTOM is used without being registered
+        """
+        path = _OVERRIDES.get(self, self.value)
+        if not path:
+            raise ValueError(
+                f"Backend {self.name} must be registered before use. "
+                f"Use register_backend(Backend.{self.name}, 'your.module.YourClass')"
+            )
+        if not include_classname:
+            path = path.rsplit(".", 1)[0]
+        return path
+
+    def get_class(self) -> "type[AttentionBackend]":
+        """Get the backend class (respects overrides).
+
+        Returns:
+            The backend class
+
+        Raises:
+            ImportError: If the backend class cannot be imported
+            ValueError: If Backend.CUSTOM is used without being registered
+        """
+        return resolve_obj_by_qualname(self.get_path())
+
+    def is_overridden(self) -> bool:
+        """Check if this backend has been overridden.
+
+        Returns:
+            True if the backend has a registered override
+        """
+        return self in _OVERRIDES
+
+    def clear_override(self) -> None:
+        """Clear any override for this backend, reverting to the default."""
+        _OVERRIDES.pop(self, None)
+
+
+_OVERRIDES: dict[AttentionBackendEnum, str] = {}
+
+
+def register_backend(
+    backend: AttentionBackendEnum, class_path: str | None = None
+) -> Callable[[type], type]:
+    """Register or override a backend implementation.
 
     Args:
-        backend: The backend enum value
+        backend: The AttentionBackendEnum member to register
+        class_path: Optional class path. If not provided and used as
+            decorator, will be auto-generated from the class.
 
     Returns:
-        The backend class
+        Decorator function if class_path is None, otherwise a no-op
+
+    Examples:
+        # Override an existing backend
+        @register_backend(AttentionBackendEnum.FLASH_ATTN)
+        class MyCustomFlashAttn:
+            ...
+
+        # Register a custom third-party backend
+        @register_backend(AttentionBackendEnum.CUSTOM)
+        class MyCustomBackend:
+            ...
+
+        # Direct registration
+        register_backend(
+            AttentionBackendEnum.CUSTOM,
+            "my.module.MyCustomBackend"
+        )
     """
-    backend_class_name = backend_to_class_str(backend)
-    return resolve_obj_by_qualname(backend_class_name)
 
+    def decorator(cls: type) -> type:
+        _OVERRIDES[backend] = f"{cls.__module__}.{cls.__qualname__}"
+        return cls
 
-def backend_name_to_enum(backend_name: str) -> _Backend | None:
-    """
-    Convert a string backend name to a _Backend enum value.
+    if class_path is not None:
+        _OVERRIDES[backend] = class_path
+        return lambda x: x
 
-    Returns:
-        _Backend: enum value if backend_name is a valid in-tree type
-        None: otherwise it's an invalid in-tree type or an out-of-tree platform
-              is loaded.
+    return decorator
+
+
+# Backwards compatibility alias for plugins
+class _BackendMeta(type):
+    """Metaclass to provide deprecation warnings when accessing _Backend."""
+
+    def __getattribute__(cls, name: str):
+        if name not in ("__class__", "__mro__", "__name__"):
+            logger.warning(
+                "_Backend has been renamed to AttentionBackendEnum. "
+                "Please update your code to use AttentionBackendEnum instead. "
+                "_Backend will be removed in a future release."
+            )
+        return getattr(AttentionBackendEnum, name)
+
+    def __getitem__(cls, name: str):
+        logger.warning(
+            "_Backend has been renamed to AttentionBackendEnum. "
+            "Please update your code to use AttentionBackendEnum instead. "
+            "_Backend will be removed in a future release."
+        )
+        return AttentionBackendEnum[name]
+
+
+class _Backend(metaclass=_BackendMeta):
+    """Deprecated: Use AttentionBackendEnum instead.
+
+    This class is provided for backwards compatibility with plugins
+    and will be removed in a future release.
     """
-    assert backend_name is not None
-    return _Backend[backend_name] if backend_name in _Backend.__members__ else None
+
+    pass
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index acab0529f352..ec705126c710 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -12,7 +12,7 @@
 import vllm.envs as envs
 from vllm.attention import AttentionType
 from vllm.attention.backends.abstract import AttentionBackend, MLAAttentionImpl
-from vllm.attention.backends.registry import _Backend, backend_name_to_enum
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.selector import get_attn_backend
 from vllm.attention.utils.kv_sharing_utils import validate_kv_sharing_target
 from vllm.config import CacheConfig, get_current_vllm_config
@@ -99,40 +99,44 @@ def check_upstream_fa_availability(dtype: torch.dtype):
 
 
 def maybe_get_vit_flash_attn_backend(
-    attn_backend: _Backend,
+    attn_backend: AttentionBackendEnum,
     use_upstream_fa: bool,
-    attn_backend_override: _Backend | None = None,
-) -> tuple[_Backend, Callable | None]:
+    attn_backend_override: AttentionBackendEnum | None = None,
+) -> tuple[AttentionBackendEnum, Callable | None]:
     if current_platform.is_rocm():
         if envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MHA and on_gfx9():
-            attn_backend = _Backend.ROCM_AITER_FA
+            attn_backend = AttentionBackendEnum.ROCM_AITER_FA
 
         elif (
             check_upstream_fa_availability(torch.get_default_dtype())
             and on_gfx9()
             and attn_backend_override is None
         ):
-            attn_backend = _Backend.FLASH_ATTN
+            attn_backend = AttentionBackendEnum.FLASH_ATTN
             use_upstream_fa = True
         else:
-            return _Backend.TORCH_SDPA, None
+            return AttentionBackendEnum.TORCH_SDPA, None
 
     elif current_platform.is_cuda():
-        if attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
-            torch.get_default_dtype()
+        if (
+            attn_backend != AttentionBackendEnum.FLASH_ATTN
+            and check_upstream_fa_availability(torch.get_default_dtype())
         ):
-            attn_backend = _Backend.FLASH_ATTN
+            attn_backend = AttentionBackendEnum.FLASH_ATTN
             use_upstream_fa = True
     elif current_platform.is_xpu():
-        assert attn_backend == _Backend.FLASH_ATTN, (
+        assert attn_backend == AttentionBackendEnum.FLASH_ATTN, (
             "XPU platform only supports FLASH_ATTN as vision attention backend."
         )
         use_upstream_fa = False
     else:
-        return _Backend.TORCH_SDPA, None
+        return AttentionBackendEnum.TORCH_SDPA, None
 
-    if attn_backend in {_Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA}:
-        if attn_backend == _Backend.ROCM_AITER_FA:
+    if attn_backend in {
+        AttentionBackendEnum.FLASH_ATTN,
+        AttentionBackendEnum.ROCM_AITER_FA,
+    }:
+        if attn_backend == AttentionBackendEnum.ROCM_AITER_FA:
             from aiter import flash_attn_varlen_func
         else:
             if use_upstream_fa:
@@ -309,7 +313,7 @@ def __init__(
             kv_sharing_target_layer_name,
             **extra_impl_args,
         )
-        self.backend = backend_name_to_enum(self.attn_backend.get_name())
+        self.backend = AttentionBackendEnum[self.attn_backend.get_name()]
         self.dtype = dtype
 
         # For cuda-alike (CUDA and ROCM) and cpu platforms, we control how
@@ -530,13 +534,13 @@ def __init__(
             backend
             if backend
             in {
-                _Backend.TORCH_SDPA,
-                _Backend.XFORMERS,
-                _Backend.PALLAS,
-                _Backend.ROCM_AITER_FA,
-                _Backend.FLASH_ATTN,
+                AttentionBackendEnum.TORCH_SDPA,
+                AttentionBackendEnum.XFORMERS,
+                AttentionBackendEnum.PALLAS,
+                AttentionBackendEnum.ROCM_AITER_FA,
+                AttentionBackendEnum.FLASH_ATTN,
             }
-            else _Backend.TORCH_SDPA
+            else AttentionBackendEnum.TORCH_SDPA
         )
 
         self.attn_backend, self._flash_attn_varlen_func = (
@@ -547,17 +551,23 @@ def __init__(
             )
         )
 
-        if self.attn_backend == _Backend.XFORMERS and not check_xformers_availability():
-            self.attn_backend = _Backend.TORCH_SDPA
+        if (
+            self.attn_backend == AttentionBackendEnum.XFORMERS
+            and not check_xformers_availability()
+        ):
+            self.attn_backend = AttentionBackendEnum.TORCH_SDPA
 
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }
 
         # this condition is just to make sure that the
         # use_upstream_fa in the log is correct
-        if current_platform.is_rocm() and self.attn_backend == _Backend.FLASH_ATTN:
+        if (
+            current_platform.is_rocm()
+            and self.attn_backend == AttentionBackendEnum.FLASH_ATTN
+        ):
             use_upstream_fa = True
 
         logger.info_once(
@@ -606,17 +616,17 @@ def forward(
                 max_seqlen_k=kv_len,
                 softmax_scale=self.scale,
             )
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             from xformers import ops as xops
 
             out = xops.memory_efficient_attention_forward(
                 query, key, value, scale=self.scale
             )
-        elif self.attn_backend == _Backend.TORCH_SDPA:
+        elif self.attn_backend == AttentionBackendEnum.TORCH_SDPA:
             query, key, value = (x.transpose(1, 2) for x in (query, key, value))
             out = F.scaled_dot_product_attention(query, key, value, scale=self.scale)
             out = out.transpose(1, 2)
-        elif self.attn_backend == _Backend.PALLAS:
+        elif self.attn_backend == AttentionBackendEnum.PALLAS:
             query, key, value = (x.transpose(1, 2) for x in (query, key, value))
             from torch_xla.experimental.custom_kernel import flash_attention
 
diff --git a/vllm/attention/selector.py b/vllm/attention/selector.py
index 9c26a8d40eda..6e5fa854d35f 100644
--- a/vllm/attention/selector.py
+++ b/vllm/attention/selector.py
@@ -4,14 +4,15 @@
 import os
 from collections.abc import Generator
 from contextlib import contextmanager
-from dataclasses import dataclass
 from functools import cache
+from typing import cast, get_args
 
 import torch
 
 import vllm.envs as envs
 from vllm.attention.backends.abstract import AttentionBackend
-from vllm.attention.backends.registry import _Backend, backend_name_to_enum
+from vllm.attention.backends.registry import AttentionBackendEnum
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
 from vllm.utils import STR_BACKEND_ENV_VAR
 from vllm.utils.import_utils import resolve_obj_by_qualname
@@ -19,18 +20,18 @@
 logger = init_logger(__name__)
 
 
-def get_env_variable_attn_backend() -> _Backend | None:
+def get_env_variable_attn_backend() -> AttentionBackendEnum | None:
     """
     Get the backend override specified by the vLLM attention
     backend environment variable, if one is specified.
 
     Returns:
 
-    * _Backend enum value if an override is specified
+    * AttentionBackendEnum value if an override is specified
     * None otherwise
     """
     backend_name = os.environ.get(STR_BACKEND_ENV_VAR)
-    return None if backend_name is None else backend_name_to_enum(backend_name)
+    return None if backend_name is None else AttentionBackendEnum[backend_name]
 
 
 # Global state allows a particular choice of backend
@@ -40,10 +41,10 @@ def get_env_variable_attn_backend() -> _Backend | None:
 #
 # THIS SELECTION TAKES PRECEDENCE OVER THE
 # VLLM_ATTENTION_BACKEND ENVIRONMENT VARIABLE
-forced_attn_backend: _Backend | None = None
+forced_attn_backend: AttentionBackendEnum | None = None
 
 
-def global_force_attn_backend(attn_backend: _Backend | None) -> None:
+def global_force_attn_backend(attn_backend: AttentionBackendEnum | None) -> None:
     """
     Force all attention operations to use a specified backend.
 
@@ -58,7 +59,7 @@ def global_force_attn_backend(attn_backend: _Backend | None) -> None:
     forced_attn_backend = attn_backend
 
 
-def get_global_forced_attn_backend() -> _Backend | None:
+def get_global_forced_attn_backend() -> AttentionBackendEnum | None:
     """
     Get the currently-forced choice of attention backend,
     or None if auto-selection is currently enabled.
@@ -66,78 +67,28 @@ def get_global_forced_attn_backend() -> _Backend | None:
     return forced_attn_backend
 
 
-@dataclass(frozen=True)
-class _IsSupported:
-    can_import: bool
-    head_size: bool
-    dtype: bool
-
-    def __bool__(self) -> bool:
-        return self.can_import and self.head_size and self.dtype
-
-
-def is_attn_backend_supported(
-    attn_backend: str | type[AttentionBackend],
-    head_size: int,
-    dtype: torch.dtype,
-    *,
-    allow_import_error: bool = True,
-) -> _IsSupported:
-    if isinstance(attn_backend, str):
-        try:
-            attn_backend = resolve_obj_by_qualname(attn_backend)
-        except ImportError:
-            if not allow_import_error:
-                raise
-
-            return _IsSupported(can_import=False, head_size=False, dtype=False)
-
-    assert isinstance(attn_backend, type)
-
-    # TODO: Update the interface once V0 is removed
-    if get_supported_head_sizes := getattr(
-        attn_backend, "get_supported_head_sizes", None
-    ):
-        is_head_size_supported = head_size in get_supported_head_sizes()
-    elif validate_head_size := getattr(attn_backend, "validate_head_size", None):
-        try:
-            validate_head_size(head_size)
-            is_head_size_supported = True
-        except Exception:
-            is_head_size_supported = False
-    else:
-        raise NotImplementedError(
-            f"{attn_backend.__name__} does not support head size validation"
-        )
-
-    if get_supported_dtypes := getattr(attn_backend, "get_supported_dtypes", None):
-        is_dtype_supported = dtype in get_supported_dtypes()
-    else:
-        raise NotImplementedError(
-            f"{attn_backend.__name__} does not support dtype validation"
-        )
-
-    return _IsSupported(
-        can_import=True,
-        head_size=is_head_size_supported,
-        dtype=is_dtype_supported,
-    )
-
-
 def get_attn_backend(
     head_size: int,
     dtype: torch.dtype,
     kv_cache_dtype: str | None,
-    block_size: int,
+    block_size: int | None,
     use_mla: bool = False,
     has_sink: bool = False,
     use_sparse: bool = False,
 ) -> type[AttentionBackend]:
     """Selects which attention backend to use and lazily imports it."""
+
+    if kv_cache_dtype is not None:
+        valid_cache_dtypes = get_args(CacheDType)
+        assert kv_cache_dtype in valid_cache_dtypes, (
+            f"Invalid kv_cache_dtype: {kv_cache_dtype}. "
+            f"Valid values are: {valid_cache_dtypes}"
+        )
+
     return _cached_get_attn_backend(
         head_size=head_size,
         dtype=dtype,
-        kv_cache_dtype=kv_cache_dtype,
+        kv_cache_dtype=cast(CacheDType | None, kv_cache_dtype),
         block_size=block_size,
         use_mla=use_mla,
         has_sink=has_sink,
@@ -149,8 +100,8 @@ def get_attn_backend(
 def _cached_get_attn_backend(
     head_size: int,
     dtype: torch.dtype,
-    kv_cache_dtype: str | None,
-    block_size: int,
+    kv_cache_dtype: CacheDType | None,
+    block_size: int | None,
     use_mla: bool = False,
     has_sink: bool = False,
     use_sparse: bool = False,
@@ -161,7 +112,9 @@ def _cached_get_attn_backend(
     # THIS SELECTION OVERRIDES THE VLLM_ATTENTION_BACKEND
     # ENVIRONMENT VARIABLE.
     selected_backend = None
-    backend_by_global_setting: _Backend | None = get_global_forced_attn_backend()
+    backend_by_global_setting: AttentionBackendEnum | None = (
+        get_global_forced_attn_backend()
+    )
     if backend_by_global_setting is not None:
         selected_backend = backend_by_global_setting
     else:
@@ -177,12 +130,13 @@ def _cached_get_attn_backend(
                     STR_BACKEND_ENV_VAR,
                 )
                 backend_by_env_var = backend_by_env_var.removesuffix("_VLLM_V1")
-            selected_backend = backend_name_to_enum(backend_by_env_var)
-            if selected_backend is None:
+            try:
+                selected_backend = AttentionBackendEnum[backend_by_env_var]
+            except KeyError as e:
                 raise ValueError(
-                    f"Invalid attention backend: '{backend_by_env_var}'. "
-                    f"Valid backends are: {list(_Backend.__members__.keys())}"
-                )
+                    f"Invalid attention backend: '{backend_by_env_var}'. Valid "
+                    f"backends are: {list(AttentionBackendEnum.__members__.keys())}"
+                ) from e
 
     # get device-specific attn_backend
     from vllm.platforms import current_platform
@@ -202,12 +156,26 @@ def _cached_get_attn_backend(
         raise ValueError(
             f"Invalid attention backend for {current_platform.device_name}"
         )
-    return resolve_obj_by_qualname(attention_cls)
+    backend = resolve_obj_by_qualname(attention_cls)
+
+    # Adjust kv cache layout if the selected backend requires a specific one
+    required_layout = backend.get_required_kv_cache_layout()
+    if required_layout is not None:
+        from vllm.v1.attention.backends.utils import set_kv_cache_layout
+
+        set_kv_cache_layout(required_layout)
+        logger.info(
+            "Using %s KV cache layout for %s backend.",
+            required_layout,
+            backend.get_name(),
+        )
+
+    return backend
 
 
 @contextmanager
 def global_force_attn_backend_context_manager(
-    attn_backend: _Backend,
+    attn_backend: AttentionBackendEnum,
 ) -> Generator[None, None, None]:
     """
     Globally force a vLLM attention backend override within a
diff --git a/vllm/config/cache.py b/vllm/config/cache.py
index 031df3091f1c..864cf1be81b2 100644
--- a/vllm/config/cache.py
+++ b/vllm/config/cache.py
@@ -21,7 +21,15 @@
 logger = init_logger(__name__)
 
 BlockSize = Literal[1, 8, 16, 32, 64, 128, 256]
-CacheDType = Literal["auto", "bfloat16", "fp8", "fp8_e4m3", "fp8_e5m2", "fp8_inc"]
+CacheDType = Literal[
+    "auto",
+    "bfloat16",
+    "fp8",
+    "fp8_e4m3",
+    "fp8_e5m2",
+    "fp8_inc",
+    "fp8_ds_mla",
+]
 MambaDType = Literal["auto", "float32"]
 PrefixCachingHashAlgo = Literal["sha256", "sha256_cbor"]
 KVOffloadingBackend = Literal["native", "lmcache"]
diff --git a/vllm/config/model.py b/vllm/config/model.py
index 44c044c76168..6ce91ebb87b9 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -45,7 +45,7 @@
 
     import vllm.model_executor.layers.quantization as me_quant
     import vllm.model_executor.models as me_models
-    from vllm.attention.backends.registry import _Backend
+    from vllm.attention.backends.registry import AttentionBackendEnum
     from vllm.config.load import LoadConfig
     from vllm.config.parallel import ParallelConfig
     from vllm.model_executor.layers.quantization import QuantizationMethods
@@ -53,7 +53,7 @@
 else:
     PretrainedConfig = Any
 
-    _Backend = Any
+    AttentionBackendEnum = Any
     me_quant = LazyLoader(
         "model_executor", globals(), "vllm.model_executor.layers.quantization"
     )
@@ -302,7 +302,7 @@ class ModelConfig:
     mm_processor_cache_type: InitVar[MMCacheType | None] = None
     mm_shm_cache_max_object_size_mb: InitVar[int | None] = None
     mm_encoder_tp_mode: InitVar[MMEncoderTPMode | None] = None
-    mm_encoder_attn_backend: InitVar[_Backend | str | None] = None
+    mm_encoder_attn_backend: InitVar[AttentionBackendEnum | str | None] = None
     interleave_mm_strings: InitVar[bool | None] = None
     skip_mm_profiling: InitVar[bool | None] = None
     video_pruning_rate: InitVar[float | None] = None
@@ -420,7 +420,7 @@ def __post_init__(
         mm_processor_cache_type: MMCacheType | None,
         mm_shm_cache_max_object_size_mb: int | None,
         mm_encoder_tp_mode: MMEncoderTPMode | None,
-        mm_encoder_attn_backend: _Backend | str | None,
+        mm_encoder_attn_backend: AttentionBackendEnum | str | None,
         interleave_mm_strings: bool | None,
         skip_mm_profiling: bool | None,
         video_pruning_rate: float | None,
diff --git a/vllm/config/multimodal.py b/vllm/config/multimodal.py
index ef73720efe09..9348c1b2af8c 100644
--- a/vllm/config/multimodal.py
+++ b/vllm/config/multimodal.py
@@ -11,9 +11,9 @@
 from vllm.config.utils import config
 
 if TYPE_CHECKING:
-    from vllm.attention.backends.registry import _Backend
+    from vllm.attention.backends.registry import AttentionBackendEnum
 else:
-    _Backend = Any
+    AttentionBackendEnum = Any
 
 
 @dataclass
@@ -125,10 +125,10 @@ class MultiModalConfig:
         DP (which is controlled by `--data-parallel-size`).
         This is only supported on a per-model basis and falls back to
         `"weights"` if the encoder does not support DP."""
-    mm_encoder_attn_backend: _Backend | None = None
+    mm_encoder_attn_backend: AttentionBackendEnum | None = None
     """Optional override for the multi-modal encoder attention backend when
     using vision transformers. Accepts any value from
-    `vllm.attention.backends.registry._Backend` (e.g. `FLASH_ATTN`)."""
+    `vllm.attention.backends.registry.AttentionBackendEnum` (e.g. `FLASH_ATTN`)."""
     interleave_mm_strings: bool = False
     """Enable fully interleaved support for multimodal prompts, while using
     --chat-template-content-format=string."""
@@ -167,26 +167,16 @@ def _validate_limit_per_prompt(
 
     @field_validator("mm_encoder_attn_backend", mode="before")
     @classmethod
-    def _validate_mm_encoder_attn_backend(cls, value: object) -> _Backend | None:
-        from vllm.attention.backends.registry import (
-            _Backend as BackendEnum,
-        )
-        from vllm.attention.backends.registry import (
-            backend_name_to_enum,
-        )
-
-        if value is None or isinstance(value, BackendEnum):
+    def _validate_mm_encoder_attn_backend(
+        cls, value: str | AttentionBackendEnum | None
+    ) -> AttentionBackendEnum | None:
+        if value is None or isinstance(value, AttentionBackendEnum):
             return value
 
-        if isinstance(value, str):
-            candidate = backend_name_to_enum(value.upper())
-            if candidate is not None:
-                return candidate
-
-        valid_backends = ", ".join(sorted(BackendEnum.__members__.keys()))
-        raise ValueError(
-            f"Invalid mm encoder attention backend. Expected one of: {valid_backends}."
+        assert isinstance(value, str), (
+            "mm_encoder_attn_backend must be a string or an AttentionBackendEnum."
         )
+        return AttentionBackendEnum[value.upper()]
 
     @model_validator(mode="after")
     def _validate_multimodal_config(self):
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index ff9770b72bd3..6c20eee1ecbf 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -21,7 +21,7 @@
 import zmq
 
 from vllm import envs
-from vllm.attention.backends.registry import _Backend, backend_name_to_enum
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.selector import get_attn_backend
 from vllm.config import VllmConfig
 from vllm.distributed.kv_transfer.kv_connector.v1.base import (
@@ -876,9 +876,9 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
             use_mla=self.use_mla,
         )
         self.backend_name = backend.get_name()
-        attn_backend = backend_name_to_enum(self.backend_name)
-        self._use_flashinfer = attn_backend == _Backend.FLASHINFER
-        self._use_pallas = attn_backend == _Backend.PALLAS
+        attn_backend = AttentionBackendEnum[self.backend_name]
+        self._use_flashinfer = attn_backend == AttentionBackendEnum.FLASHINFER
+        self._use_pallas = attn_backend == AttentionBackendEnum.PALLAS
         self.kv_cache_layout = get_kv_cache_layout()
         self.host_buffer_kv_cache_layout = self.kv_cache_layout
         logger.debug("Detected attention backend %s", self.backend_name)
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index b12b7082af62..d3913553320f 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -32,7 +32,7 @@
 from typing_extensions import TypeIs, deprecated
 
 import vllm.envs as envs
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config import (
     CacheConfig,
     CompilationConfig,
@@ -462,7 +462,7 @@ class EngineArgs:
         MultiModalConfig.mm_shm_cache_max_object_size_mb
     )
     mm_encoder_tp_mode: MMEncoderTPMode = MultiModalConfig.mm_encoder_tp_mode
-    mm_encoder_attn_backend: _Backend | str | None = (
+    mm_encoder_attn_backend: AttentionBackendEnum | str | None = (
         MultiModalConfig.mm_encoder_attn_backend
     )
     io_processor_plugin: str | None = None
diff --git a/vllm/envs.py b/vllm/envs.py
index 52178e5f5250..52a9671bc46e 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -626,14 +626,14 @@ def get_vllm_port() -> int | None:
     # - "FLASH_ATTN_MLA": use FlashAttention for MLA
     # - "FLASHINFER_MLA": use FlashInfer for MLA
     # - "CUTLASS_MLA": use CUTLASS for MLA
-    # All possible options loaded dynamically from _Backend enum
+    # All possible options loaded dynamically from AttentionBackendEnum
     "VLLM_ATTENTION_BACKEND": env_with_choices(
         "VLLM_ATTENTION_BACKEND",
         None,
         lambda: list(
             __import__(
-                "vllm.attention.backends.registry", fromlist=["_Backend"]
-            )._Backend.__members__.keys()
+                "vllm.attention.backends.registry", fromlist=["AttentionBackendEnum"]
+            ).AttentionBackendEnum.__members__.keys()
         ),
     ),
     # If set, vllm will use flashinfer sampler
diff --git a/vllm/model_executor/models/dots_ocr.py b/vllm/model_executor/models/dots_ocr.py
index 6d462ad8ae62..1b2bb60a17c1 100644
--- a/vllm/model_executor/models/dots_ocr.py
+++ b/vllm/model_executor/models/dots_ocr.py
@@ -9,7 +9,7 @@
 from torch.nn import LayerNorm
 from transformers.models.qwen2_vl import Qwen2VLProcessor
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import (
     check_upstream_fa_availability,
     maybe_get_vit_flash_attn_backend,
@@ -256,7 +256,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
 
@@ -303,17 +303,17 @@ def __init__(
             )
         )
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.TORCH_SDPA,
-            _Backend.XFORMERS,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.TORCH_SDPA,
+            AttentionBackendEnum.XFORMERS,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"Unsupported vision attention backend: {self.attn_backend}"
             )
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }
 
     def forward(
@@ -361,7 +361,7 @@ def forward(
                 self.num_attention_heads_per_partition,
                 self.hidden_size_per_attention_head,
             )
-        elif self.attn_backend == _Backend.TORCH_SDPA:
+        elif self.attn_backend == AttentionBackendEnum.TORCH_SDPA:
             outputs = []
             for i in range(1, len(cu_seqlens)):
                 s = int(cu_seqlens[i - 1])
@@ -373,7 +373,7 @@ def forward(
                 out_i = out_i.permute(0, 2, 1, 3)
                 outputs.append(out_i)
             context_layer = torch.cat(outputs, dim=1) if outputs else q[:, :0]
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
@@ -514,7 +514,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
 
@@ -567,7 +567,7 @@ def __init__(
         require_post_norm: bool | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         self.config = config
@@ -582,10 +582,11 @@ def __init__(
             dtype=torch.get_default_dtype(),
             attn_backend_override=attn_backend_override,
         )
-        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
-            torch.get_default_dtype()
+        if (
+            self.attn_backend != AttentionBackendEnum.FLASH_ATTN
+            and check_upstream_fa_availability(torch.get_default_dtype())
         ):
-            self.attn_backend = _Backend.FLASH_ATTN
+            self.attn_backend = AttentionBackendEnum.FLASH_ATTN
         self.out_hidden_size = config.hidden_size
         # Keep blocks for compatibility with other vision towers
         num_layers = (
@@ -666,11 +667,11 @@ def compute_attn_mask_seqlen(
     ) -> tuple[int | None, list[int] | None]:
         max_seqlen, seqlens = None, None
         if (
-            self.attn_backend == _Backend.FLASH_ATTN
-            or self.attn_backend == _Backend.ROCM_AITER_FA
+            self.attn_backend == AttentionBackendEnum.FLASH_ATTN
+            or self.attn_backend == AttentionBackendEnum.ROCM_AITER_FA
         ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
         return max_seqlen, seqlens
 
diff --git a/vllm/model_executor/models/ernie45_vl.py b/vllm/model_executor/models/ernie45_vl.py
index f287cff12086..97182a25f82b 100644
--- a/vllm/model_executor/models/ernie45_vl.py
+++ b/vllm/model_executor/models/ernie45_vl.py
@@ -36,7 +36,7 @@
 from einops import rearrange, repeat
 from transformers import BatchFeature, PretrainedConfig
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import (
     check_upstream_fa_availability,
     maybe_get_vit_flash_attn_backend,
@@ -164,7 +164,7 @@ def __init__(
         projection_size: int,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         # Per attention head and per partition values.
@@ -211,17 +211,17 @@ def __init__(
         )
 
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.TORCH_SDPA,
-            _Backend.XFORMERS,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.TORCH_SDPA,
+            AttentionBackendEnum.XFORMERS,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"Ernie45-VL does not support {self.attn_backend} backend now."
             )
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }
 
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
@@ -291,7 +291,7 @@ def forward(
             context_layer = rearrange(
                 output, "(b s) h d -> s b (h d)", b=batch_size
             ).contiguous()
-        elif self.attn_backend == _Backend.TORCH_SDPA:
+        elif self.attn_backend == AttentionBackendEnum.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             outputs = []
             for i in range(1, len(cu_seqlens)):
@@ -310,7 +310,7 @@ def forward(
             context_layer = rearrange(
                 context_layer, "b s h d -> s b (h d)"
             ).contiguous()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
@@ -370,7 +370,7 @@ def __init__(
         norm_layer: Callable[[int], nn.Module] | None = None,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
 
@@ -463,7 +463,7 @@ def __init__(
         norm_eps: float = 1e-6,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         patch_size = vision_config.patch_size
@@ -515,10 +515,11 @@ def __init__(
             dtype=torch.get_default_dtype(),
             attn_backend_override=attn_backend_override,
         )
-        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
-            torch.get_default_dtype()
+        if (
+            self.attn_backend != AttentionBackendEnum.FLASH_ATTN
+            and check_upstream_fa_availability(torch.get_default_dtype())
         ):
-            self.attn_backend = _Backend.FLASH_ATTN
+            self.attn_backend = AttentionBackendEnum.FLASH_ATTN
 
     @property
     def dtype(self) -> torch.dtype:
@@ -565,11 +566,11 @@ def compute_attn_mask_seqlen(
     ) -> tuple[int | None, list[int] | None]:
         max_seqlen, seqlens = None, None
         if (
-            self.attn_backend == _Backend.FLASH_ATTN
-            or self.attn_backend == _Backend.ROCM_AITER_FA
+            self.attn_backend == AttentionBackendEnum.FLASH_ATTN
+            or self.attn_backend == AttentionBackendEnum.ROCM_AITER_FA
         ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
         return max_seqlen, seqlens
 
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index b9cd3545ec45..776527fdd973 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -46,7 +46,7 @@
 from transformers.models.glm4v.video_processing_glm4v import Glm4vVideoProcessor
 from transformers.video_utils import VideoMetadata
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import (
     check_upstream_fa_availability,
     maybe_get_vit_flash_attn_backend,
@@ -252,7 +252,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         # Per attention head and per partition values.
@@ -306,18 +306,18 @@ def __init__(
         )
 
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.TORCH_SDPA,
-            _Backend.XFORMERS,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.TORCH_SDPA,
+            AttentionBackendEnum.XFORMERS,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"GLM-4V does not support {self.attn_backend} backend now."
             )
 
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }
 
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
@@ -377,7 +377,7 @@ def forward(
             context_layer = rearrange(
                 output, "(b s) h d -> s b (h d)", b=batch_size
             ).contiguous()
-        elif self.attn_backend == _Backend.TORCH_SDPA:
+        elif self.attn_backend == AttentionBackendEnum.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             outputs = []
             for i in range(1, len(cu_seqlens)):
@@ -396,7 +396,7 @@ def forward(
             context_layer = rearrange(
                 context_layer, "b s h d -> s b (h d)"
             ).contiguous()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
@@ -425,7 +425,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         if norm_layer is None:
@@ -703,7 +703,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
 
@@ -772,10 +772,11 @@ def __init__(
             dtype=torch.get_default_dtype(),
             attn_backend_override=attn_backend_override,
         )
-        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
-            torch.get_default_dtype()
+        if (
+            self.attn_backend != AttentionBackendEnum.FLASH_ATTN
+            and check_upstream_fa_availability(torch.get_default_dtype())
         ):
-            self.attn_backend = _Backend.FLASH_ATTN
+            self.attn_backend = AttentionBackendEnum.FLASH_ATTN
 
     @property
     def dtype(self) -> torch.dtype:
@@ -824,8 +825,8 @@ def compute_attn_mask_seqlen(
         max_seqlen, seqlens = None, None
         seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
         if (
-            self.attn_backend == _Backend.FLASH_ATTN
-            or self.attn_backend == _Backend.ROCM_AITER_FA
+            self.attn_backend == AttentionBackendEnum.FLASH_ATTN
+            or self.attn_backend == AttentionBackendEnum.ROCM_AITER_FA
         ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         return max_seqlen, seqlens
diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index 42f16ad9f3b3..80d7e6c5b0cd 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -16,7 +16,7 @@
 from transformers.modeling_outputs import BaseModelOutput, BaseModelOutputWithPooling
 from transformers.utils import torch_int
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import (
     maybe_get_vit_flash_attn_backend,
 )
@@ -360,7 +360,7 @@ def __init__(
         config: PretrainedConfig,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.config = config
@@ -414,17 +414,17 @@ def __init__(
         )
 
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.XFORMERS,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.XFORMERS,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"Keye-VL does not support {self.attn_backend} backend now."
             )
 
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }
 
     def forward(
@@ -489,7 +489,7 @@ def forward(
                 softmax_scale=self.scale,
             )
             context_layer = rearrange(output, "(b s) ... -> b s ...", b=batch_size)
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
@@ -536,7 +536,7 @@ def __init__(
         config: PretrainedConfig,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.embed_dim = config.hidden_size
@@ -590,7 +590,7 @@ def __init__(
         config: PretrainedConfig,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.config = config
@@ -685,7 +685,7 @@ def __init__(
         config: PretrainedConfig,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.config = config
@@ -768,7 +768,7 @@ def __init__(
         config: PretrainedConfig,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
 
diff --git a/vllm/model_executor/models/ovis2_5.py b/vllm/model_executor/models/ovis2_5.py
index f6461ae9a412..9a4d69dea096 100644
--- a/vllm/model_executor/models/ovis2_5.py
+++ b/vllm/model_executor/models/ovis2_5.py
@@ -10,7 +10,7 @@
 import torch.nn as nn
 from transformers import BaseImageProcessor, BatchFeature, PretrainedConfig
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.linear import ReplicatedLinear
@@ -106,7 +106,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.config = config
@@ -135,7 +135,7 @@ def _init_backbone(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         model_type = config.model_type
         if model_type == "siglip2_navit":
diff --git a/vllm/model_executor/models/paddleocr_vl.py b/vllm/model_executor/models/paddleocr_vl.py
index 12ae15699e7d..86d7d1c11ffe 100644
--- a/vllm/model_executor/models/paddleocr_vl.py
+++ b/vllm/model_executor/models/paddleocr_vl.py
@@ -31,7 +31,7 @@
 )
 from transformers.utils import torch_int
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import (
     check_upstream_fa_availability,
     maybe_get_vit_flash_attn_backend,
@@ -580,8 +580,8 @@ def __init__(
         projection_size: int,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend: _Backend = _Backend.TORCH_SDPA,
-        attn_backend_override: _Backend | None = None,
+        attn_backend: AttentionBackendEnum = AttentionBackendEnum.TORCH_SDPA,
+        attn_backend_override: AttentionBackendEnum | None = None,
         use_upstream_fa: bool = False,
     ) -> None:
         super().__init__()
@@ -621,8 +621,8 @@ def __init__(
             )
         )
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }
 
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
@@ -680,10 +680,10 @@ def forward(
                 cu_seqlens,
                 max_seqlen,
                 batch_size,
-                self.attn_backend == _Backend.ROCM_AITER_FA,
+                self.attn_backend == AttentionBackendEnum.ROCM_AITER_FA,
                 self.use_upstream_fa,
             )
-        elif self.attn_backend == _Backend.TORCH_SDPA:
+        elif self.attn_backend == AttentionBackendEnum.TORCH_SDPA:
             outputs = []
             for i in range(1, len(cu_seqlens)):
                 start_idx = cu_seqlens[i - 1]
@@ -702,7 +702,7 @@ def forward(
             context_layer = rearrange(
                 context_layer, "b s h d -> s b (h d)"
             ).contiguous()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             if seqlens is None:
                 raise ValueError("xFormers attention backend requires seqlens tensor.")
             context_layer = vit_xformers_attn_wrapper(q, k, v, seqlens)
@@ -786,8 +786,8 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         *,
-        attn_backend: _Backend = _Backend.TORCH_SDPA,
-        attn_backend_override: _Backend | None = None,
+        attn_backend: AttentionBackendEnum = AttentionBackendEnum.TORCH_SDPA,
+        attn_backend_override: AttentionBackendEnum | None = None,
         use_upstream_fa: bool = False,
     ):
         super().__init__()
@@ -847,7 +847,7 @@ def __init__(
         config: PretrainedConfig,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.config = config
@@ -861,16 +861,16 @@ def __init__(
         )
         self.use_upstream_fa = False
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         } and check_upstream_fa_availability(torch.get_default_dtype()):
-            self.attn_backend = _Backend.FLASH_ATTN
+            self.attn_backend = AttentionBackendEnum.FLASH_ATTN
             self.use_upstream_fa = True
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.TORCH_SDPA,
-            _Backend.XFORMERS,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.TORCH_SDPA,
+            AttentionBackendEnum.XFORMERS,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"PaddleOCR-VL does not support {self.attn_backend} backend now."
@@ -943,9 +943,12 @@ def forward(
 
         max_seqlen = None
         seqlens = None
-        if self.attn_backend in {_Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA}:
+        if self.attn_backend in {
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
+        }:
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             seqlens = cu_seqlens[1:] - cu_seqlens[:-1]
 
         hidden_states = inputs_embeds
@@ -966,7 +969,7 @@ def __init__(
         config: PretrainedConfig,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.config = config
@@ -1016,7 +1019,7 @@ def __init__(
         config,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
 
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index 48834ba699e4..3292cf8220ff 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -42,7 +42,7 @@
     Qwen2_5_VLVisionConfig,
 )
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import maybe_get_vit_flash_attn_backend
 from vllm.attention.ops.vit_attn_wrappers import (
     vit_flash_attn_wrapper,
@@ -315,9 +315,9 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend: _Backend = _Backend.TORCH_SDPA,
+        attn_backend: AttentionBackendEnum = AttentionBackendEnum.TORCH_SDPA,
         use_upstream_fa: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         # Per attention head and per partition values.
@@ -364,13 +364,16 @@ def __init__(
         # On ROCm with FLASH_ATTN backend, upstream flash_attn is used
         from vllm.platforms import current_platform
 
-        if current_platform.is_rocm() and self.attn_backend == _Backend.FLASH_ATTN:
+        if (
+            current_platform.is_rocm()
+            and self.attn_backend == AttentionBackendEnum.FLASH_ATTN
+        ):
             self.use_upstream_fa = True
         if current_platform.is_xpu():
             self.use_upstream_fa = False
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }
 
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
@@ -431,10 +434,10 @@ def forward(
                 cu_seqlens,
                 max_seqlen,
                 batch_size,
-                self.attn_backend == _Backend.ROCM_AITER_FA,
+                self.attn_backend == AttentionBackendEnum.ROCM_AITER_FA,
                 self.use_upstream_fa,
             )
-        elif self.attn_backend == _Backend.TORCH_SDPA:
+        elif self.attn_backend == AttentionBackendEnum.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             from vllm.platforms import current_platform
 
@@ -450,7 +453,7 @@ def forward(
                 v,
                 cu_seqlens,
             )
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             context_layer = vit_xformers_attn_wrapper(q, k, v, seqlens)
 
         output, _ = self.proj(context_layer)
@@ -478,9 +481,9 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend: _Backend = _Backend.TORCH_SDPA,
+        attn_backend: AttentionBackendEnum = AttentionBackendEnum.TORCH_SDPA,
         use_upstream_fa: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         if norm_layer is None:
@@ -656,7 +659,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
 
@@ -708,10 +711,10 @@ def __init__(
         )
 
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.TORCH_SDPA,
-            _Backend.XFORMERS,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.TORCH_SDPA,
+            AttentionBackendEnum.XFORMERS,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"Qwen2.5-VL does not support {self.attn_backend} backend now."
@@ -850,9 +853,12 @@ def compute_attn_mask_seqlen(
     ) -> tuple[torch.Tensor, torch.Tensor]:
         max_seqlen = torch.zeros([], device=cu_seqlens.device)
         seqlens = torch.zeros(1, device=cu_seqlens.device)
-        if self.attn_backend in {_Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA}:
+        if self.attn_backend in {
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
+        }:
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             seqlens = cu_seqlens[1:] - cu_seqlens[:-1]
         return max_seqlen, seqlens
 
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index b3999e6c934e..61057fa145f4 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -43,7 +43,7 @@
 from transformers.models.qwen2_vl.image_processing_qwen2_vl import smart_resize
 from transformers.models.qwen2_vl.video_processing_qwen2_vl import Qwen2VLVideoProcessor
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import (
     check_upstream_fa_availability,
     maybe_get_vit_flash_attn_backend,
@@ -329,7 +329,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         # Per attention head and per partition values.
@@ -378,18 +378,18 @@ def __init__(
         )
 
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.TORCH_SDPA,
-            _Backend.XFORMERS,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.TORCH_SDPA,
+            AttentionBackendEnum.XFORMERS,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"Qwen2-VL does not support {self.attn_backend} backend now."
             )
 
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }
 
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
@@ -460,7 +460,7 @@ def forward(
             context_layer = rearrange(
                 output, "(b s) h d -> s b (h d)", b=batch_size
             ).contiguous()
-        elif self.attn_backend == _Backend.TORCH_SDPA:
+        elif self.attn_backend == AttentionBackendEnum.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             from vllm.platforms import current_platform
 
@@ -485,7 +485,7 @@ def forward(
             context_layer = rearrange(
                 context_layer, "b s h d -> s b (h d)"
             ).contiguous()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
@@ -515,7 +515,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         if norm_layer is None:
@@ -679,7 +679,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
 
@@ -739,10 +739,11 @@ def __init__(
             dtype=torch.get_default_dtype(),
             attn_backend_override=attn_backend_override,
         )
-        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
-            torch.get_default_dtype()
+        if (
+            self.attn_backend != AttentionBackendEnum.FLASH_ATTN
+            and check_upstream_fa_availability(torch.get_default_dtype())
         ):
-            self.attn_backend = _Backend.FLASH_ATTN
+            self.attn_backend = AttentionBackendEnum.FLASH_ATTN
 
     @property
     def dtype(self) -> torch.dtype:
@@ -789,9 +790,12 @@ def compute_attn_mask_seqlen(
         self, cu_seqlens: torch.Tensor
     ) -> tuple[int | None, list[int] | None]:
         max_seqlen, seqlens = None, None
-        if self.attn_backend in {_Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA}:
+        if self.attn_backend in {
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
+        }:
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
         return max_seqlen, seqlens
 
diff --git a/vllm/model_executor/models/qwen3_omni_moe_thinker.py b/vllm/model_executor/models/qwen3_omni_moe_thinker.py
index da489a812f55..468b25220154 100755
--- a/vllm/model_executor/models/qwen3_omni_moe_thinker.py
+++ b/vllm/model_executor/models/qwen3_omni_moe_thinker.py
@@ -47,7 +47,7 @@
 )
 from transformers.models.whisper import WhisperFeatureExtractor
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import VllmConfig
@@ -301,7 +301,7 @@ def __init__(
         norm_eps: float = 1e-6,
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         self.hidden_size = vision_config.hidden_size
@@ -377,10 +377,11 @@ def __init__(
             dtype=torch.get_default_dtype(),
             attn_backend_override=attn_backend_override,
         )
-        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
-            torch.get_default_dtype()
+        if (
+            self.attn_backend != AttentionBackendEnum.FLASH_ATTN
+            and check_upstream_fa_availability(torch.get_default_dtype())
         ):
-            self.attn_backend = _Backend.FLASH_ATTN
+            self.attn_backend = AttentionBackendEnum.FLASH_ATTN
 
     @property
     def dtype(self) -> torch.dtype:
@@ -490,9 +491,9 @@ def compute_attn_mask_seqlen(
     ) -> tuple[torch.Tensor, torch.Tensor]:
         max_seqlen = torch.zeros([], device=cu_seqlens.device)
         seqlens = torch.zeros(1, device=cu_seqlens.device)
-        if self.attn_backend == _Backend.FLASH_ATTN:
+        if self.attn_backend == AttentionBackendEnum.FLASH_ATTN:
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             seqlens = cu_seqlens[1:] - cu_seqlens[:-1]
         return max_seqlen, seqlens
 
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index 1cd34bf54a35..1be35cde7dbd 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -49,7 +49,7 @@
 )
 from transformers.video_utils import VideoMetadata
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import VllmConfig
@@ -198,7 +198,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend: _Backend = _Backend.TORCH_SDPA,
+        attn_backend: AttentionBackendEnum = AttentionBackendEnum.TORCH_SDPA,
         use_upstream_fa: bool = False,
     ) -> None:
         super().__init__()
@@ -306,7 +306,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ) -> None:
         super().__init__()
         self.hidden_size = vision_config.hidden_size
@@ -372,18 +372,18 @@ def __init__(
         )
         use_upstream_fa = False
         if (
-            self.attn_backend != _Backend.FLASH_ATTN
-            and self.attn_backend != _Backend.ROCM_AITER_FA
+            self.attn_backend != AttentionBackendEnum.FLASH_ATTN
+            and self.attn_backend != AttentionBackendEnum.ROCM_AITER_FA
             and check_upstream_fa_availability(torch.get_default_dtype())
         ):
-            self.attn_backend = _Backend.FLASH_ATTN
+            self.attn_backend = AttentionBackendEnum.FLASH_ATTN
             use_upstream_fa = True
 
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.TORCH_SDPA,
-            _Backend.XFORMERS,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.TORCH_SDPA,
+            AttentionBackendEnum.XFORMERS,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"Qwen3-VL does not support {self.attn_backend} backend now."
@@ -510,11 +510,11 @@ def compute_attn_mask_seqlen(
         max_seqlen = torch.zeros([], device=cu_seqlens.device)
         seqlens = torch.zeros(1, device=cu_seqlens.device)
         if (
-            self.attn_backend == _Backend.FLASH_ATTN
-            or self.attn_backend == _Backend.ROCM_AITER_FA
+            self.attn_backend == AttentionBackendEnum.FLASH_ATTN
+            or self.attn_backend == AttentionBackendEnum.ROCM_AITER_FA
         ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max()
-        elif self.attn_backend == _Backend.XFORMERS:
+        elif self.attn_backend == AttentionBackendEnum.XFORMERS:
             seqlens = cu_seqlens[1:] - cu_seqlens[:-1]
         return max_seqlen, seqlens
 
diff --git a/vllm/model_executor/models/siglip2navit.py b/vllm/model_executor/models/siglip2navit.py
index bab5c1d82ded..c20bcd975ca3 100644
--- a/vllm/model_executor/models/siglip2navit.py
+++ b/vllm/model_executor/models/siglip2navit.py
@@ -12,7 +12,7 @@
 from transformers import Siglip2VisionConfig
 from transformers.configuration_utils import PretrainedConfig
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import maybe_get_vit_flash_attn_backend
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
@@ -208,7 +208,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.config = config
@@ -264,14 +264,14 @@ def __init__(
         )
 
         if self.attn_backend not in {
-            _Backend.FLASH_ATTN,
-            _Backend.TORCH_SDPA,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.TORCH_SDPA,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }:
-            self.attn_backend = _Backend.TORCH_SDPA
+            self.attn_backend = AttentionBackendEnum.TORCH_SDPA
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN,
-            _Backend.ROCM_AITER_FA,
+            AttentionBackendEnum.FLASH_ATTN,
+            AttentionBackendEnum.ROCM_AITER_FA,
         }
 
     def forward(
@@ -308,7 +308,7 @@ def forward(
             attn_output = self.flash_attn_varlen_func(
                 queries, keys, values, cu_seqlens, cu_seqlens, max_seqlen, max_seqlen
             ).reshape(seq_length, -1)
-        elif self.attn_backend == _Backend.TORCH_SDPA:
+        elif self.attn_backend == AttentionBackendEnum.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             batch_size = cu_seqlens.shape[0] - 1
             outputs = []
@@ -376,7 +376,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.embed_dim = config.hidden_size
@@ -440,7 +440,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.config = config
@@ -626,7 +626,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
         self.config = config
@@ -667,7 +667,7 @@ def __init__(
         quant_config: QuantizationConfig | None = None,
         prefix: str = "",
         use_data_parallel: bool = False,
-        attn_backend_override: _Backend | None = None,
+        attn_backend_override: AttentionBackendEnum | None = None,
     ):
         super().__init__()
 
diff --git a/vllm/model_executor/models/vision.py b/vllm/model_executor/models/vision.py
index 9f94387c700d..0e814e5c86ad 100644
--- a/vllm/model_executor/models/vision.py
+++ b/vllm/model_executor/models/vision.py
@@ -10,7 +10,7 @@
 import torch
 from transformers import PretrainedConfig
 
-from vllm.attention.backends.registry import _Backend
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config import VllmConfig
 from vllm.distributed import (
     get_tensor_model_parallel_rank,
@@ -83,8 +83,8 @@ def get_vit_attn_backend(
     head_size: int,
     dtype: torch.dtype,
     *,
-    attn_backend_override: _Backend | None = None,
-) -> _Backend:
+    attn_backend_override: AttentionBackendEnum | None = None,
+) -> AttentionBackendEnum:
     """
     Get the available attention backend for Vision Transformer.
     """
@@ -94,7 +94,7 @@ def get_vit_attn_backend(
     # Lazy import to avoid circular dependency
     from vllm.attention.selector import get_env_variable_attn_backend
 
-    selected_backend: _Backend | None = get_env_variable_attn_backend()
+    selected_backend: AttentionBackendEnum | None = get_env_variable_attn_backend()
     if selected_backend is not None:
         return selected_backend
 
diff --git a/vllm/platforms/cpu.py b/vllm/platforms/cpu.py
index ee904535ffe8..3dec6da89702 100644
--- a/vllm/platforms/cpu.py
+++ b/vllm/platforms/cpu.py
@@ -23,10 +23,10 @@
 logger = init_logger(__name__)
 
 if TYPE_CHECKING:
-    from vllm.attention.backends.registry import _Backend
+    from vllm.attention.backends.registry import AttentionBackendEnum
     from vllm.config import VllmConfig
 else:
-    _Backend = None
+    AttentionBackendEnum = None
     VllmConfig = None
 
 
@@ -127,7 +127,7 @@ def get_device_name(cls, device_id: int = 0) -> str:
     @classmethod
     def get_attn_backend_cls(
         cls,
-        selected_backend: "_Backend",
+        selected_backend: "AttentionBackendEnum",
         head_size: int,
         dtype: torch.dtype,
         kv_cache_dtype: str | None,
@@ -137,9 +137,9 @@ def get_attn_backend_cls(
         has_sink: bool,
         use_sparse: bool,
     ) -> str:
-        from vllm.attention.backends.registry import _Backend
+        from vllm.attention.backends.registry import AttentionBackendEnum
 
-        if selected_backend and selected_backend != _Backend.TORCH_SDPA:
+        if selected_backend and selected_backend != AttentionBackendEnum.TORCH_SDPA:
             logger.info("Cannot use %s backend on CPU.", selected_backend)
         if use_mla:
             raise NotImplementedError("MLA is not supported on CPU.")
@@ -148,7 +148,7 @@ def get_attn_backend_cls(
         logger.info("Using Torch SDPA backend.")
         if not use_v1:
             raise ValueError("CPU backend only supports V1.")
-        return "vllm.v1.attention.backends.cpu_attn.TorchSDPABackend"
+        return AttentionBackendEnum.TORCH_SDPA.get_path()
 
     @classmethod
     def get_device_total_memory(cls, device_id: int = 0) -> int:
diff --git a/vllm/platforms/cuda.py b/vllm/platforms/cuda.py
index 32734c3aba5e..43daf5e75b66 100644
--- a/vllm/platforms/cuda.py
+++ b/vllm/platforms/cuda.py
@@ -22,10 +22,13 @@
 from .interface import DeviceCapability, Platform, PlatformEnum
 
 if TYPE_CHECKING:
-    from vllm.attention.backends.registry import _Backend
+    from vllm.attention.backends.registry import AttentionBackendEnum
     from vllm.config import VllmConfig
+    from vllm.config.cache import CacheDType
 else:
-    _Backend = None
+    AttentionBackendEnum = None
+    VllmConfig = None
+    CacheDType = None
 
 logger = init_logger(__name__)
 
@@ -39,6 +42,49 @@
 torch.backends.cuda.enable_cudnn_sdp(False)
 
 
+@cache
+def _get_backend_priorities(
+    use_mla: bool,
+    device_capability: DeviceCapability,
+) -> list[AttentionBackendEnum]:
+    """Get backend priorities with lazy import to avoid circular dependency."""
+    from vllm.attention.backends.registry import AttentionBackendEnum
+
+    if use_mla:
+        if device_capability.major == 10:
+            return [
+                AttentionBackendEnum.CUTLASS_MLA,
+                AttentionBackendEnum.FLASHINFER_MLA,
+                AttentionBackendEnum.FLASHMLA,
+                AttentionBackendEnum.FLASH_ATTN_MLA,
+                AttentionBackendEnum.TRITON_MLA,
+                AttentionBackendEnum.FLASHMLA_SPARSE,
+            ]
+        else:
+            return [
+                AttentionBackendEnum.FLASHMLA,
+                AttentionBackendEnum.FLASH_ATTN_MLA,
+                AttentionBackendEnum.FLASHINFER_MLA,
+                AttentionBackendEnum.TRITON_MLA,
+                AttentionBackendEnum.FLASHMLA_SPARSE,
+            ]
+    else:
+        if device_capability.major == 10:
+            return [
+                AttentionBackendEnum.FLASHINFER,
+                AttentionBackendEnum.FLASH_ATTN,
+                AttentionBackendEnum.TRITON_ATTN,
+                AttentionBackendEnum.FLEX_ATTENTION,
+            ]
+        else:
+            return [
+                AttentionBackendEnum.FLASH_ATTN,
+                AttentionBackendEnum.FLASHINFER,
+                AttentionBackendEnum.TRITON_ATTN,
+                AttentionBackendEnum.FLEX_ATTENTION,
+            ]
+
+
 def with_nvml_context(fn: Callable[_P, _R]) -> Callable[_P, _R]:
     @wraps(fn)
     def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> _R:
@@ -216,217 +262,171 @@ def get_current_memory_usage(
         return torch.cuda.max_memory_allocated(device)
 
     @classmethod
-    def get_vit_attn_backend(cls, head_size: int, dtype: torch.dtype) -> "_Backend":
-        from vllm.attention.backends.registry import _Backend
+    def get_vit_attn_backend(
+        cls, head_size: int, dtype: torch.dtype
+    ) -> "AttentionBackendEnum":
+        from vllm.attention.backends.registry import AttentionBackendEnum
 
         # For Blackwell GPUs, force TORCH_SDPA for now.
         # See https://github.com/facebookresearch/xformers/issues/1317#issuecomment-3199392579 # noqa: E501
         if cls.has_device_capability(100):
-            return _Backend.TORCH_SDPA
+            return AttentionBackendEnum.TORCH_SDPA
 
         if dtype not in (torch.float16, torch.bfloat16):
-            return _Backend.XFORMERS
+            return AttentionBackendEnum.XFORMERS
 
         if cls.has_device_capability(80):
-            FLASH_ATTN_V1 = (
-                "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"  # noqa: E501
-            )
-            from vllm.attention.selector import is_attn_backend_supported
-
-            is_default_fa_supported = is_attn_backend_supported(
-                FLASH_ATTN_V1, head_size, dtype, allow_import_error=False
-            )
-            if is_default_fa_supported:
-                return _Backend.FLASH_ATTN
+            backend_class = AttentionBackendEnum.FLASH_ATTN.get_class()
+            if backend_class.supports_head_size(
+                head_size
+            ) and backend_class.supports_dtype(dtype):
+                return AttentionBackendEnum.FLASH_ATTN
             else:
-                # Fallback to XFORMERS
-                return _Backend.XFORMERS
+                return AttentionBackendEnum.XFORMERS
         else:
             # Fallback for Volta/Turing GPUs or FA not supported
-            return _Backend.XFORMERS
+            return AttentionBackendEnum.XFORMERS
 
     @classmethod
-    def get_attn_backend_cls(
+    def get_valid_backends(
         cls,
-        selected_backend,
         head_size,
         dtype,
         kv_cache_dtype,
         block_size,
-        use_v1,
         use_mla,
         has_sink,
         use_sparse,
-    ) -> str:
-        from vllm.attention.backends.registry import _Backend
-
-        if use_mla:
-            # explicitly reject non-MLA backends when MLA is enabled to avoid
-            # silently selecting an incompatible backend (e.g., FLASHINFER).
-            if selected_backend in {
-                _Backend.FLASHINFER,
-                _Backend.FLASH_ATTN,
-                _Backend.TRITON_ATTN,
-                _Backend.TREE_ATTN,
-                _Backend.XFORMERS,
-            }:
-                raise ValueError(
-                    f"Attention backend {selected_backend} incompatible with MLA. "
-                    "Please use one of the MLA backends: FLASHINFER_MLA, CUTLASS_MLA, "
-                    "FLASHMLA, FLASH_ATTN_MLA, or TRITON_MLA. Alternatively, set "
-                    "VLLM_MLA_DISABLE=1 to disable MLA for this model."
+        device_capability,
+    ) -> tuple[
+        list[tuple["AttentionBackendEnum", int]],
+        dict["AttentionBackendEnum", list[str]],
+    ]:
+        valid_backends_priorities = []
+        invalid_reasons = {}
+
+        backend_priorities = _get_backend_priorities(use_mla, device_capability)
+        for priority, backend in enumerate(backend_priorities):
+            try:
+                backend_class = backend.get_class()
+                invalid_reasons_i = backend_class.validate_configuration(
+                    head_size,
+                    dtype,
+                    kv_cache_dtype,
+                    block_size,
+                    use_mla,
+                    has_sink,
+                    use_sparse,
+                    device_capability,
                 )
+            except ImportError:
+                invalid_reasons_i = ["ImportError"]
+            if invalid_reasons_i:
+                invalid_reasons[backend] = invalid_reasons_i
+            else:
+                valid_backends_priorities.append((backend, priority))
 
-            from vllm.attention.ops.flashmla import is_flashmla_dense_supported
-            from vllm.attention.utils.fa_utils import flash_attn_supports_mla
+        return valid_backends_priorities, invalid_reasons
 
-            if use_sparse:
-                logger.info_once("Using Sparse MLA backend.")
-                return (
-                    "vllm.v1.attention.backends.mla.flashmla_sparse."
-                    "FlashMLASparseBackend"
-                )
-
-            use_cutlassmla = selected_backend == _Backend.CUTLASS_MLA or (
-                selected_backend is None
-                and cls.is_device_capability(100)
-                and block_size % 128 == 0
-            )
-            use_flashinfermla = selected_backend == _Backend.FLASHINFER_MLA or (
-                selected_backend is None
-                and cls.is_device_capability(100)
-                and (block_size == 32 or block_size % 64 == 0)
-            )
-            use_flashmla = selected_backend == _Backend.FLASHMLA or (
-                selected_backend is None and is_flashmla_dense_supported()[0]
-            )
-            use_flashattn = selected_backend == _Backend.FLASH_ATTN_MLA or (
-                selected_backend is None and flash_attn_supports_mla()
-            )
-            use_triton = selected_backend == _Backend.TRITON_MLA or (
-                selected_backend is None
+    @classmethod
+    def get_attn_backend_cls(
+        cls,
+        selected_backend: "AttentionBackendEnum",
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: "CacheDType | None",
+        block_size: int | None,
+        use_v1: bool,
+        use_mla: bool,
+        has_sink: bool,
+        use_sparse: bool,
+    ) -> str:
+        if not use_v1:
+            raise RuntimeError(
+                "V0 attention backends have been removed. Set VLLM_USE_V1=1 "
+                "to select a supported backend."
             )
 
-            if use_cutlassmla:
-                logger.info_once("Using Cutlass MLA backend.", scope="local")
-                return "vllm.v1.attention.backends.mla.cutlass_mla.CutlassMLABackend"
-            if use_flashinfermla:
-                from vllm.v1.attention.backends.utils import set_kv_cache_layout
-
-                set_kv_cache_layout("HND")
-                logger.info_once("Using FlashInfer MLA backend.")
-                return (
-                    "vllm.v1.attention.backends.mla.flashinfer_mla.FlashInferMLABackend"
+        device_capability = cls.get_device_capability()
+        assert device_capability is not None
+
+        # First try checking just the selected backend, if there is one.
+        if selected_backend is not None:
+            try:
+                backend_class = selected_backend.get_class()
+                invalid_reasons = backend_class.validate_configuration(
+                    head_size,
+                    dtype,
+                    kv_cache_dtype,
+                    None,
+                    use_mla,
+                    has_sink,
+                    use_sparse,
+                    device_capability,
                 )
-            if use_flashmla:
-                if block_size % 64 != 0:
-                    logger.warning(
-                        "FlashMLA backend is not supported for block size %d"
-                        " (currently only supports block size 64).",
-                        block_size,
-                    )
-                else:
-                    logger.info_once("Using FlashMLA backend.")
-                    return "vllm.v1.attention.backends.mla.flashmla.FlashMLABackend"
-            if use_flashattn:
-                logger.info_once("Using FlashAttention MLA backend.")
-                return (
-                    "vllm.v1.attention.backends.mla.flashattn_mla.FlashAttnMLABackend"
+            except ImportError:
+                invalid_reasons = ["ImportError"]
+            if invalid_reasons:
+                raise ValueError(
+                    f"Selected backend {selected_backend} is not valid for "
+                    f"this configuration. Reason: {invalid_reasons}"
                 )
-            if use_triton:
-                logger.info_once("Using Triton MLA backend.")
-                return "vllm.v1.attention.backends.mla.triton_mla.TritonMLABackend"
-
-        FLASHINFER_V1 = "vllm.v1.attention.backends.flashinfer.FlashInferBackend"  # noqa: E501
-        FLEX_ATTENTION_V1 = (
-            "vllm.v1.attention.backends.flex_attention.FlexAttentionBackend"  # noqa: E501
+            else:
+                logger.info("Using %s backend.", selected_backend)
+                return selected_backend.get_path()
+
+        # No selected backend or the selected backend is invalid,
+        # so we try finding a valid backend.
+        valid_backends_priorities, invalid_reasons = cls.get_valid_backends(
+            head_size,
+            dtype,
+            kv_cache_dtype,
+            None,
+            use_mla,
+            has_sink,
+            use_sparse,
+            device_capability,
         )
-        TRITON_ATTN = "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend"  # noqa: E501
-        FLASH_ATTN_V1 = "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"  # noqa: E501
-        TREE_ATTN_V1 = "vllm.v1.attention.backends.tree_attn.TreeAttentionBackend"  # noqa: E501
-        XFORMERS_V1 = "vllm.v1.attention.backends.xformers.XFormersAttentionBackend"  # noqa: E501
-
-        use_fp8_kv_cache = kv_cache_dtype is not None and kv_cache_dtype.startswith(
-            "fp8"
+        reasons_str = (
+            "{"
+            + ", ".join(
+                f"{backend.name}: [{', '.join(reasons)}]"
+                for backend, reasons in invalid_reasons.items()
+            )
+            + "}"
         )
+        config_str = (
+            f"head_size: {head_size}, dtype: {dtype}, "
+            f"kv_cache_dtype: {kv_cache_dtype}, block_size: {block_size}, "
+            f"use_mla: {use_mla}, has_sink: {has_sink}, use_sparse: {use_sparse}"
+        )
+        logger.debug_once(
+            f"Some attention backends are not valid for {cls.device_name} with "
+            f"{config_str}. Reasons: {reasons_str}."
+        )
+        if len(valid_backends_priorities) == 0:
+            raise ValueError(
+                f"No valid attention backend found for {cls.device_name} "
+                f"with {config_str}. Reasons: {reasons_str}."
+            )
 
-        if selected_backend == _Backend.FLASHINFER:
-            logger.info_once("Using FlashInfer backend.")
-            if cls.has_device_capability(100):
-                from vllm.v1.attention.backends.utils import set_kv_cache_layout
-
-                set_kv_cache_layout("HND")
-            return FLASHINFER_V1
-        elif selected_backend == _Backend.FLEX_ATTENTION:
-            logger.info_once("Using FlexAttention backend.")
-            return FLEX_ATTENTION_V1
-        elif selected_backend == _Backend.TRITON_ATTN:
-            logger.info_once("Using Triton backend.")
-            return TRITON_ATTN
-        elif selected_backend == _Backend.FLASH_ATTN:
-            logger.info_once("Using Flash Attention backend.")
-            return FLASH_ATTN_V1
-        elif selected_backend == _Backend.TREE_ATTN:
-            logger.info_once("Using Tree Attention backend.")
-            return TREE_ATTN_V1
-        elif selected_backend == _Backend.XFORMERS:
-            logger.info_once("Using XFormers backend.")
-            return XFORMERS_V1
-
-        from vllm.attention.selector import is_attn_backend_supported
-
-        # Default backends for V1 engine
-        # Prefer FlashInfer for Blackwell GPUs if installed
-        if cls.is_device_capability(100):
-            if is_default_backend_supported := is_attn_backend_supported(
-                FLASHINFER_V1, head_size, dtype
-            ):
-                from vllm.v1.attention.backends.utils import set_kv_cache_layout
-
-                logger.info_once(
-                    "Using FlashInfer backend with HND KV cache layout on "
-                    "V1 engine by default for Blackwell (SM 10.0) GPUs."
-                )
-                set_kv_cache_layout("HND")
-
-                return FLASHINFER_V1
-
-            if not is_default_backend_supported.can_import:
-                logger.warning_once(
-                    "FlashInfer failed to import on Blackwell (SM 10.0) GPUs; "
-                    "it is recommended to install FlashInfer for better "
-                    "performance."
-                )
-
-        # FlashAttention is the default for SM 8.0+ GPUs
-        if cls.has_device_capability(80):
-            if (has_sink or use_fp8_kv_cache) and not cls.is_device_capability(90):
-                logger.info_once("Using Triton backend.")
-                return TRITON_ATTN
-            elif is_default_backend_supported := is_attn_backend_supported(
-                FLASH_ATTN_V1, head_size, dtype, allow_import_error=False
-            ):
-                logger.info_once("Using Flash Attention backend.")
-                return FLASH_ATTN_V1
-
-        # FlexAttention is the default for older GPUs
-        else:
-            logger.info_once("Using FlexAttention backend.")
-            return FLEX_ATTENTION_V1
-
-        assert not is_default_backend_supported
-
-        use_flex_attention_reason = {}
-        if not is_default_backend_supported.head_size:
-            use_flex_attention_reason["head_size"] = head_size
-        if not is_default_backend_supported.dtype:
-            use_flex_attention_reason["dtype"] = dtype
-
-        logger.info_once(
-            "Using FlexAttention backend for %s.",
-            ", ".join(f"{k}={v}" for k, v in use_flex_attention_reason.items()),
+        # We have found some valid backends. Select the one with the
+        # highest priority.
+        logger.info(
+            "Valid backends: %s", [b[0].name for b in valid_backends_priorities]
         )
-        return FLEX_ATTENTION_V1
+        sorted_indices = sorted(
+            range(len(valid_backends_priorities)),
+            key=lambda i: valid_backends_priorities[i][1],
+        )
+        selected_index = sorted_indices[0]
+        selected_backend = valid_backends_priorities[selected_index][0]
+        logger.info(
+            "Using %s backend.",
+            selected_backend.name,
+        )
+
+        return selected_backend.get_path()
 
     @classmethod
     def get_punica_wrapper(cls) -> str:
diff --git a/vllm/platforms/interface.py b/vllm/platforms/interface.py
index 15e3b3a22bde..4969bcf116a4 100644
--- a/vllm/platforms/interface.py
+++ b/vllm/platforms/interface.py
@@ -17,8 +17,9 @@
 if TYPE_CHECKING:
     from torch.distributed import PrefixStore, ProcessGroup
 
-    from vllm.attention.backends.registry import _Backend
+    from vllm.attention.backends.registry import AttentionBackendEnum
     from vllm.config import VllmConfig
+    from vllm.config.cache import CacheDType
     from vllm.inputs import ProcessorInputs, PromptType
     from vllm.pooling_params import PoolingParams
     from vllm.sampling_params import SamplingParams
@@ -58,6 +59,31 @@ class DeviceCapability(NamedTuple):
     major: int
     minor: int
 
+    def __lt__(self, other: Any) -> bool:
+        if not isinstance(other, DeviceCapability):
+            return NotImplemented
+        return (self.major, self.minor) < (other.major, other.minor)
+
+    def __le__(self, other: Any) -> bool:
+        if not isinstance(other, DeviceCapability):
+            return NotImplemented
+        return (self.major, self.minor) <= (other.major, other.minor)
+
+    def __eq__(self, other: Any) -> bool:
+        if not isinstance(other, DeviceCapability):
+            return NotImplemented
+        return (self.major, self.minor) == (other.major, other.minor)
+
+    def __ge__(self, other: Any) -> bool:
+        if not isinstance(other, DeviceCapability):
+            return NotImplemented
+        return (self.major, self.minor) >= (other.major, other.minor)
+
+    def __gt__(self, other: Any) -> bool:
+        if not isinstance(other, DeviceCapability):
+            return NotImplemented
+        return (self.major, self.minor) > (other.major, other.minor)
+
     def as_version_str(self) -> str:
         return f"{self.major}.{self.minor}"
 
@@ -173,19 +199,21 @@ def import_kernels(cls) -> None:
             import vllm._moe_C  # noqa: F401
 
     @classmethod
-    def get_vit_attn_backend(cls, head_size: int, dtype: torch.dtype) -> "_Backend":
-        # Import _Backend here to avoid circular import.
-        from vllm.attention.backends.registry import _Backend
+    def get_vit_attn_backend(
+        cls, head_size: int, dtype: torch.dtype
+    ) -> "AttentionBackendEnum":
+        # Import AttentionBackendEnum here to avoid circular import.
+        from vllm.attention.backends.registry import AttentionBackendEnum
 
-        return _Backend.TORCH_SDPA
+        return AttentionBackendEnum.TORCH_SDPA
 
     @classmethod
     def get_attn_backend_cls(
         cls,
-        selected_backend: "_Backend",
+        selected_backend: "AttentionBackendEnum",
         head_size: int,
         dtype: torch.dtype,
-        kv_cache_dtype: str | None,
+        kv_cache_dtype: "CacheDType | None",
         block_size: int,
         use_v1: bool,
         use_mla: bool,
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index e6536a02a73d..5318bdb8b36c 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -14,10 +14,10 @@
 from .interface import DeviceCapability, Platform, PlatformEnum
 
 if TYPE_CHECKING:
-    from vllm.attention.backends.registry import _Backend
+    from vllm.attention.backends.registry import AttentionBackendEnum
     from vllm.config import VllmConfig
 else:
-    _Backend = None
+    AttentionBackendEnum = None
 
 logger = init_logger(__name__)
 
@@ -204,21 +204,23 @@ class RocmPlatform(Platform):
     ]
 
     @classmethod
-    def get_vit_attn_backend(cls, head_size: int, dtype: torch.dtype) -> _Backend:
+    def get_vit_attn_backend(
+        cls, head_size: int, dtype: torch.dtype
+    ) -> AttentionBackendEnum:
         from importlib.util import find_spec
 
         from vllm._aiter_ops import rocm_aiter_ops
-        from vllm.attention.backends.registry import _Backend
+        from vllm.attention.backends.registry import AttentionBackendEnum
 
         if rocm_aiter_ops.is_mha_enabled():
             # Note: AITER FA is only supported for Qwen-VL models.
             # TODO: Add support for other VL models in their model class.
-            return _Backend.ROCM_AITER_FA
+            return AttentionBackendEnum.ROCM_AITER_FA
 
         if on_gfx9() and find_spec("flash_attn") is not None:
-            return _Backend.FLASH_ATTN
+            return AttentionBackendEnum.FLASH_ATTN
 
-        return _Backend.TORCH_SDPA
+        return AttentionBackendEnum.TORCH_SDPA
 
     @classmethod
     def get_attn_backend_cls(
@@ -234,7 +236,7 @@ def get_attn_backend_cls(
         use_sparse,
     ) -> str:
         from vllm._aiter_ops import rocm_aiter_ops
-        from vllm.attention.backends.registry import _Backend
+        from vllm.attention.backends.registry import AttentionBackendEnum
 
         if use_sparse:
             raise NotImplementedError("Sparse Attention is not supported on ROCm.")
@@ -248,55 +250,52 @@ def get_attn_backend_cls(
         if use_mla:
             if selected_backend is None:
                 selected_backend = (
-                    _Backend.ROCM_AITER_MLA
+                    AttentionBackendEnum.ROCM_AITER_MLA
                     if rocm_aiter_ops.is_mla_enabled() or block_size == 1
-                    else _Backend.TRITON_MLA
+                    else AttentionBackendEnum.TRITON_MLA
                 )
 
-            if selected_backend == _Backend.TRITON_MLA:
+            if selected_backend == AttentionBackendEnum.TRITON_MLA:
                 if block_size != 1:
                     logger.info_once("Using Triton MLA backend.")
-                    return "vllm.v1.attention.backends.mla.triton_mla.TritonMLABackend"
+                    return AttentionBackendEnum.TRITON_MLA.get_path()
                 raise ValueError(
                     f" The selected backend, {selected_backend.name},"
                     f"does not support block size {block_size}."
                 )
-            if selected_backend == _Backend.ROCM_AITER_MLA:
+            if selected_backend == AttentionBackendEnum.ROCM_AITER_MLA:
                 logger.info("Using AITER MLA backend.")
-                return "vllm.v1.attention.backends.mla.rocm_aiter_mla.AiterMLABackend"  # noqa: E501
+                return AttentionBackendEnum.ROCM_AITER_MLA.get_path()
 
             raise ValueError(
                 f" The selected backend, {selected_backend.name},"
                 f"is not MLA type while requested for MLA backend."
             )
 
-        if selected_backend == _Backend.FLEX_ATTENTION:
+        if selected_backend == AttentionBackendEnum.FLEX_ATTENTION:
             logger.info("Using FlexAttention backend.")
             return "vllm.v1.attention.backends.flex_attention.FlexAttentionBackend"
         if (
             rocm_aiter_ops.is_mha_enabled()
-        ) or selected_backend == _Backend.ROCM_AITER_FA:
+        ) or selected_backend == AttentionBackendEnum.ROCM_AITER_FA:
             logger.info("Using Aiter Flash Attention backend.")
-            return "vllm.v1.attention.backends.rocm_aiter_fa.AiterFlashAttentionBackend"
+            return AttentionBackendEnum.ROCM_AITER_FA.get_path()
         if (
             rocm_aiter_ops.is_triton_unified_attn_enabled()
-        ) or selected_backend == _Backend.ROCM_AITER_UNIFIED_ATTN:
+        ) or selected_backend == AttentionBackendEnum.ROCM_AITER_UNIFIED_ATTN:
             logger.info("Using Aiter Unified Attention backend.")
-            return (
-                "vllm.v1.attention.backends."
-                "rocm_aiter_unified_attn.RocmAiterUnifiedAttentionBackend"
-            )
+            return AttentionBackendEnum.ROCM_AITER_UNIFIED_ATTN.get_path()
         if (
             envs.VLLM_V1_USE_PREFILL_DECODE_ATTENTION
-            or selected_backend == _Backend.ROCM_ATTN
+            or selected_backend == AttentionBackendEnum.ROCM_ATTN
         ):
             # rocm specific backend, with aiter and/or
             #   triton prefix-prefill
             logger.info("Using Rocm Attention backend.")
-            return "vllm.v1.attention.backends.rocm_attn.RocmAttentionBackend"
+            return AttentionBackendEnum.ROCM_ATTN.get_path()
         # default case, using triton unified attention
         logger.info("Using Triton Attention backend.")
-        return "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend"
+        return AttentionBackendEnum.TRITON_ATTN.get_path()
 
     @classmethod
     def set_device(cls, device: torch.device) -> None:
diff --git a/vllm/platforms/tpu.py b/vllm/platforms/tpu.py
index 1a4b67a1762f..575a9892c211 100644
--- a/vllm/platforms/tpu.py
+++ b/vllm/platforms/tpu.py
@@ -15,16 +15,15 @@
 from .interface import Platform, PlatformEnum
 
 if TYPE_CHECKING:
-    from vllm.attention.backends.registry import _Backend
-    from vllm.config import ModelConfig, VllmConfig
+    from vllm.attention.backends.registry import AttentionBackendEnum
+    from vllm.config import VllmConfig
     from vllm.config.cache import BlockSize
     from vllm.pooling_params import PoolingParams
 else:
     BlockSize = None
-    ModelConfig = None
     VllmConfig = None
     PoolingParams = None
-    _Backend = None
+    AttentionBackendEnum = None
 
 logger = init_logger(__name__)
 
@@ -54,7 +53,7 @@ def import_kernels(cls) -> None:
     @classmethod
     def get_attn_backend_cls(
         cls,
-        selected_backend: "_Backend",
+        selected_backend: "AttentionBackendEnum",
         head_size: int,
         dtype: torch.dtype,
         kv_cache_dtype: str | None,
@@ -64,17 +63,17 @@ def get_attn_backend_cls(
         has_sink,
         use_sparse,
     ) -> str:
-        from vllm.attention.backends.registry import _Backend
+        from vllm.attention.backends.registry import AttentionBackendEnum
 
         if use_sparse:
             raise NotImplementedError("Sparse Attention is not supported on TPU.")
-        if selected_backend != _Backend.PALLAS:
+        if selected_backend != AttentionBackendEnum.PALLAS:
             logger.info("Cannot use %s backend on TPU.", selected_backend)
 
         if not use_v1:
             raise ValueError("TPU backend only supports V1.")
         logger.info("Using Pallas V1 backend.")
-        return "vllm.v1.attention.backends.pallas.PallasAttentionBackend"
+        return AttentionBackendEnum.PALLAS.get_path()
 
     @classmethod
     def set_device(cls, device: torch.device) -> None:
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index e4ecd0c807da..684d6d9a6b57 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -14,12 +14,11 @@
 from .interface import DeviceCapability, Platform, PlatformEnum
 
 if TYPE_CHECKING:
-    from vllm.attention.backends.registry import _Backend
-    from vllm.config import ModelConfig, VllmConfig
+    from vllm.attention.backends.registry import AttentionBackendEnum
+    from vllm.config import VllmConfig
 else:
-    ModelConfig = None
     VllmConfig = None
-    _Backend = None
+    AttentionBackendEnum = None
 
 logger = init_logger(__name__)
 
@@ -44,7 +43,7 @@ def import_kernels(cls) -> None:
     @classmethod
     def get_attn_backend_cls(
         cls,
-        selected_backend: "_Backend",
+        selected_backend: "AttentionBackendEnum",
         head_size: int,
         dtype: torch.dtype,
         kv_cache_dtype: str | None,
@@ -62,18 +61,19 @@ def get_attn_backend_cls(
             "only NHD layout is supported by XPU attention kernels."
         )
 
-        from vllm.attention.backends.registry import _Backend
+        from vllm.attention.backends.registry import AttentionBackendEnum
 
         if use_sparse:
             raise NotImplementedError("Sparse Attention is not supported on XPU.")
-        TRITON_ATTN = "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend"  # noqa: E501
-        FLASH_ATTN = "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"  # noqa: E501
-        if selected_backend == _Backend.TRITON_ATTN:
+        use_v1 = envs.VLLM_USE_V1
+        if not use_v1:
+            raise ValueError("XPU backend only supports V1.")
+        if selected_backend == AttentionBackendEnum.TRITON_ATTN:
             logger.info_once("Using Triton backend.")
-            return TRITON_ATTN
-        elif selected_backend == _Backend.FLASH_ATTN:
+            return AttentionBackendEnum.TRITON_ATTN.get_path()
+        elif selected_backend == AttentionBackendEnum.FLASH_ATTN:
             logger.info_once("Using Flash Attention backend.")
-            return FLASH_ATTN
+            return AttentionBackendEnum.FLASH_ATTN.get_path()
         elif selected_backend:
             raise ValueError(
                 f"Invalid attention backend for {cls.device_name}, "
@@ -81,7 +81,7 @@ def get_attn_backend_cls(
             )
 
         logger.info("Using Flash Attention backend.")
-        return "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"
+        return AttentionBackendEnum.FLASH_ATTN.get_path()
 
     @classmethod
     def set_device(cls, device: torch.device) -> None:
@@ -113,10 +113,10 @@ def get_device_total_memory(cls, device_id: int = 0) -> int:
         return device_props.total_memory
 
     @classmethod
-    def get_vit_attn_backend(cls, head_size: int, dtype: torch.dtype) -> _Backend:
-        from vllm.attention.backends.registry import _Backend
-
-        return _Backend.FLASH_ATTN
+    def get_vit_attn_backend(
+        cls, head_size: int, dtype: torch.dtype
+    ) -> AttentionBackendEnum:
+        return AttentionBackendEnum.FLASH_ATTN
 
     @classmethod
     def inference_mode(cls):
diff --git a/vllm/v1/attention/backends/cpu_attn.py b/vllm/v1/attention/backends/cpu_attn.py
index 20d987fa2de3..0057a7e22882 100644
--- a/vllm/v1/attention/backends/cpu_attn.py
+++ b/vllm/v1/attention/backends/cpu_attn.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from dataclasses import dataclass
-from typing import Optional
+from typing import ClassVar, Optional
 
 import numpy as np
 import torch
@@ -40,23 +40,16 @@
 
 class TorchSDPABackend(AttentionBackend):
     accept_output_buffer: bool = False
+    supported_dtypes: ClassVar[list[torch.dtype]] = [
+        torch.float16,
+        torch.bfloat16,
+        torch.float32,
+    ]
 
     @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16, torch.float32]
-
-    @classmethod
-    def validate_head_size(cls, head_size: int) -> None:
+    def get_supported_head_sizes(cls) -> list[int]:
         attn_impl = _get_paged_attn_impl()
-        is_valid, supported_head_sizes = attn_impl.validate_head_size(head_size)
-        if not is_valid:
-            attn_type = cls.__name__.removesuffix("Backend")
-            raise ValueError(
-                f"Head size {head_size} is not supported by {attn_type}. "
-                f"Supported head sizes are: {supported_head_sizes}. "
-                "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes."
-            )
+        return attn_impl.get_supported_head_sizes()
 
     @staticmethod
     def get_name() -> str:
@@ -759,9 +752,8 @@ def _make_sliding_window_bias(
 
 class _PagedAttention:
     @staticmethod
-    def validate_head_size(head_size: int) -> tuple[bool, list[int]]:
-        SUPPORT_HS = [32, 64, 80, 96, 112, 128, 192, 256]
-        return head_size in SUPPORT_HS, SUPPORT_HS
+    def get_supported_head_sizes() -> list[int]:
+        return [32, 64, 80, 96, 112, 128, 192, 256]
 
     @staticmethod
     def get_kv_cache_shape(
@@ -861,8 +853,8 @@ def forward_decode(
 
 class _IPEXPagedAttention(_PagedAttention):
     @staticmethod
-    def validate_head_size(head_size: int) -> tuple[bool, list[int]]:
-        return True, []
+    def get_supported_head_sizes() -> list[int]:
+        return []
 
     @staticmethod
     def split_kv_cache(
diff --git a/vllm/v1/attention/backends/flash_attn.py b/vllm/v1/attention/backends/flash_attn.py
index 15bb2f4a40ac..9cec623814c9 100755
--- a/vllm/v1/attention/backends/flash_attn.py
+++ b/vllm/v1/attention/backends/flash_attn.py
@@ -3,6 +3,7 @@
 """Attention layer with FlashAttention."""
 
 from dataclasses import dataclass
+from typing import ClassVar
 
 import numpy as np
 import torch
@@ -32,11 +33,13 @@
         reshape_and_cache_flash,
     )
 from vllm.config import VllmConfig, get_layers_from_vllm_config
+from vllm.config.cache import CacheDType
 from vllm.distributed.parallel_state import get_dcp_group
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
     vllm_is_batch_invariant,
 )
+from vllm.platforms.interface import DeviceCapability
 from vllm.utils.math_utils import cdiv
 from vllm.v1.attention.backends.utils import (
     AttentionCGSupport,
@@ -52,34 +55,12 @@
 
 class FlashAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
-
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16]
-
-    @classmethod
-    def get_supported_head_sizes(cls) -> list[int]:
-        return [32, 64, 96, 128, 160, 192, 224, 256]
-
-    @staticmethod
-    def get_supported_kernel_block_size() -> list[int | MultipleOf]:
-        # NOTE(tdoublep): while in principle, FA supports
-        # MultipleOf(16), these are the block sizes that do not
-        # suffer from the NaN propagation problem described here:
-        # https://github.com/Dao-AILab/flash-attention/issues/1974
-        return [16, 32, 64]
-
-    @classmethod
-    def validate_head_size(cls, head_size: int) -> None:
-        supported_head_sizes = cls.get_supported_head_sizes()
-        if head_size not in supported_head_sizes:
-            attn_type = cls.__name__.removesuffix("Backend")
-            raise ValueError(
-                f"Head size {head_size} is not supported by {attn_type}. "
-                f"Supported head sizes are: {supported_head_sizes}. "
-                "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes."
-            )
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    # NOTE(tdoublep): while in principle, FA supports
+    # MultipleOf(16), these are the block sizes that do not
+    # suffer from the NaN propagation problem described here:
+    # https://github.com/Dao-AILab/flash-attention/issues/1974
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [16, 32, 64]
 
     @staticmethod
     def get_name() -> str:
@@ -125,6 +106,38 @@ def get_fp8_dtype_for_flashattn(kv_cache_dtype: str) -> torch.dtype:
         else:
             raise ValueError(f"Unrecognized FP8 dtype: {kv_cache_dtype}")
 
+    @classmethod
+    def get_supported_head_sizes(cls) -> list[int]:
+        return [32, 64, 96, 128, 160, 192, 224, 256]
+
+    @classmethod
+    def supports_kv_cache_dtype(cls, kv_cache_dtype: CacheDType | None) -> bool:
+        if kv_cache_dtype is None:
+            return True
+        if kv_cache_dtype.startswith("fp8"):
+            return flash_attn_supports_fp8()
+        return kv_cache_dtype in ["auto"]
+
+    @classmethod
+    def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
+        return capability >= DeviceCapability(8, 0)
+
+    @classmethod
+    def supports_combination(
+        cls,
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: CacheDType | None,
+        block_size: int,
+        use_mla: bool,
+        has_sink: bool,
+        use_sparse: bool,
+        device_capability: DeviceCapability,
+    ) -> str | None:
+        if has_sink and device_capability < DeviceCapability(9, 0):
+            return "sink not supported on compute capability < 9.0"
+        return None
+
 
 @dataclass
 class FlashAttentionMetadata:
@@ -481,8 +494,6 @@ def __init__(
 
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
 
-        FlashAttentionBackend.validate_head_size(head_size)
-
         self.attn_type = attn_type
         self.vllm_flash_attn_version = get_flash_attn_version()
         # Cache the batch invariant result for use in forward passes
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 683725b95819..07a0ab41a9e0 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -23,6 +23,7 @@
     MultipleOf,
 )
 from vllm.config import CUDAGraphMode, VllmConfig
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
     vllm_is_batch_invariant,
@@ -33,6 +34,7 @@
     kNvfp4Quant,
 )
 from vllm.platforms import current_platform
+from vllm.platforms.interface import DeviceCapability
 from vllm.triton_utils import tl, triton
 from vllm.utils.flashinfer import (
     can_use_trtllm_attention,
@@ -45,6 +47,7 @@
     AttentionCGSupport,
     AttentionMetadataBuilder,
     CommonAttentionMetadata,
+    KVCacheLayoutType,
     get_kv_cache_layout,
     get_per_layer_parameters,
     infer_global_hyperparameters,
@@ -158,34 +161,17 @@ def trtllm_prefill_attn_kvfp8_dequant(
 
 class FlashInferBackend(AttentionBackend):
     accept_output_buffer: bool = True
-
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16]
-
-    @classmethod
-    def get_supported_head_sizes(cls) -> list[int]:
-        # https://github.com/flashinfer-ai/flashinfer/blob/3d55c71a62052c590c130897d3a3db49b14fcc34/include/flashinfer/utils.cuh#L157
-        return [64, 128, 256]
-
-    @staticmethod
-    def get_supported_kernel_block_size() -> list[int | MultipleOf]:
-        # Note: Not sure for all platforms,
-        # but on Blackwell, only support a page size of
-        # 16, 32, 64
-        return [16, 32, 64]
-
-    @classmethod
-    def validate_head_size(cls, head_size: int) -> None:
-        supported_head_sizes = cls.get_supported_head_sizes()
-        if head_size not in supported_head_sizes:
-            attn_type = cls.__name__.removesuffix("Backend")
-            raise ValueError(
-                f"Head size {head_size} is not supported by {attn_type}. "
-                f"Supported head sizes are: {supported_head_sizes}. "
-                "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes."
-            )
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    # Note: Not sure for all platforms,
+    # but on Blackwell, only support a page size of
+    # 16, 32, 64
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [16, 32, 64]
+    supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
+        "auto",
+        "fp8",
+        "fp8_e4m3",
+        "fp8_e5m2",
+    ]
 
     @staticmethod
     def get_name() -> str:
@@ -231,6 +217,26 @@ def get_fp8_dtype_for_flashinfer(kv_cache_dtype: str) -> torch.dtype:
         else:
             raise ValueError(f"Unrecognized FP8 dtype: {kv_cache_dtype}")
 
+    @classmethod
+    def get_supported_head_sizes(cls) -> list[int]:
+        # https://github.com/flashinfer-ai/flashinfer/blob/3d55c71a62052c590c130897d3a3db49b14fcc34/include/flashinfer/utils.cuh#L157
+        return [64, 128, 256]
+
+    @classmethod
+    def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
+        return capability >= DeviceCapability(7, 5) and capability <= DeviceCapability(
+            12, 1
+        )
+
+    @classmethod
+    def get_required_kv_cache_layout(cls) -> KVCacheLayoutType | None:
+        from vllm.platforms import current_platform
+
+        capability = current_platform.get_device_capability()
+        if capability is not None and capability.major == 10:
+            return "HND"
+        return None
+
 
 @dataclass
 class FlashInferMetadata:
@@ -328,7 +334,6 @@ def __init__(
         )
         self.num_kv_heads = self.kv_cache_spec.num_kv_heads
         self.head_dim = self.kv_cache_spec.head_size
-        FlashInferBackend.validate_head_size(self.head_dim)
         self.page_size = self.kv_cache_spec.block_size
 
         self.cache_dtype = self.cache_config.cache_dtype
diff --git a/vllm/v1/attention/backends/flex_attention.py b/vllm/v1/attention/backends/flex_attention.py
index 9af63831cecb..e53cd0d8af4f 100644
--- a/vllm/v1/attention/backends/flex_attention.py
+++ b/vllm/v1/attention/backends/flex_attention.py
@@ -4,6 +4,7 @@
 
 import math
 from dataclasses import dataclass
+from typing import ClassVar
 
 import torch
 import torch._dynamo.decorators
@@ -24,6 +25,7 @@
     is_quantized_kv_cache,
 )
 from vllm.config import VllmConfig
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
     vllm_is_batch_invariant,
@@ -71,14 +73,12 @@ def pad_to_multiple(x: torch.Tensor, multiple: int, dim: int):
 
 class FlexAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
-
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16, torch.float32]
-
-    @classmethod
-    def validate_head_size(cls, head_size: int) -> None:
-        return  # FlexAttention supports any head size
+    supported_dtypes: ClassVar[list[torch.dtype]] = [
+        torch.float16,
+        torch.bfloat16,
+        torch.float32,
+    ]
+    supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = ["auto"]
 
     @staticmethod
     def get_name() -> str:
@@ -106,6 +106,10 @@ def get_builder_cls() -> type["FlexAttentionMetadataBuilder"]:
     def use_cascade_attention(*args, **kwargs) -> bool:
         return False
 
+    @classmethod
+    def get_supported_head_sizes(cls) -> list[int]:
+        return []
+
 
 # @torch.compile(fullgraph=True, mode="reduce-overhead")
 def physical_to_logical_mapping(
@@ -720,7 +724,6 @@ def __init__(
         if kv_sharing_target_layer_name is not None:
             raise NotImplementedError("FlexAttention does not support kv sharing yet.")
 
-        FlexAttentionBackend.validate_head_size(head_size)
         if is_quantized_kv_cache(self.kv_cache_dtype):
             raise NotImplementedError(
                 "FlexAttention does not support quantized kv-cache. Yet"
diff --git a/vllm/v1/attention/backends/mla/common.py b/vllm/v1/attention/backends/mla/common.py
index e38f7bcfa44e..b4cb5c200da3 100755
--- a/vllm/v1/attention/backends/mla/common.py
+++ b/vllm/v1/attention/backends/mla/common.py
@@ -308,25 +308,13 @@ def get_kv_cache_shape(
     ) -> tuple[int, ...]:
         return (num_blocks, block_size, head_size)
 
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16]
-
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
         return [576]
 
     @classmethod
-    def validate_head_size(cls, head_size: int) -> None:
-        supported_head_sizes = cls.get_supported_head_sizes()
-        if head_size not in supported_head_sizes:
-            attn_type = cls.__name__.removesuffix("Backend")
-            raise ValueError(
-                f"Head size {head_size} is not supported by {attn_type}. "
-                f"Supported head sizes are: {supported_head_sizes}. "
-                "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes."
-            )
+    def is_mla(cls) -> bool:
+        return True
 
 
 @dataclass
@@ -425,8 +413,10 @@ class MLACommonMetadata(Generic[D]):
     ) = None
 
     def __post_init__(self):
-        if self.head_dim is not None:
-            MLACommonBackend.validate_head_size(self.head_dim)
+        if self.head_dim is not None and not MLACommonBackend.supports_head_size(
+            self.head_dim
+        ):
+            raise ValueError(f"Head dimension {self.head_dim} is not supported by MLA.")
 
 
 M = TypeVar("M", bound=MLACommonMetadata)
diff --git a/vllm/v1/attention/backends/mla/cutlass_mla.py b/vllm/v1/attention/backends/mla/cutlass_mla.py
index c35e238eac4c..0a10ce74cd1d 100644
--- a/vllm/v1/attention/backends/mla/cutlass_mla.py
+++ b/vllm/v1/attention/backends/mla/cutlass_mla.py
@@ -13,7 +13,9 @@
     MultipleOf,
     is_quantized_kv_cache,
 )
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
+from vllm.platforms.interface import DeviceCapability
 from vllm.v1.attention.backends.mla.common import (
     MLACommonBackend,
     MLACommonImpl,
@@ -33,6 +35,14 @@ class CutlassMLAMetadataBuilder(MLACommonMetadataBuilder[MLACommonMetadata]):
 
 
 class CutlassMLABackend(MLACommonBackend):
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [128]
+    supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
+        "auto",
+        "fp8",
+        "fp8_e4m3",
+    ]
+
     @staticmethod
     def get_name() -> str:
         return "CUTLASS_MLA"
@@ -45,9 +55,9 @@ def get_impl_cls() -> type["CutlassMLAImpl"]:
     def get_builder_cls() -> type["CutlassMLAMetadataBuilder"]:
         return CutlassMLAMetadataBuilder
 
-    @staticmethod
-    def get_supported_kernel_block_size() -> list[int | MultipleOf]:
-        return [128]
+    @classmethod
+    def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
+        return capability.major == 10
 
 
 class SM100Workspace:
diff --git a/vllm/v1/attention/backends/mla/flashattn_mla.py b/vllm/v1/attention/backends/mla/flashattn_mla.py
index 79b89c7890a2..5662acbe32c2 100644
--- a/vllm/v1/attention/backends/mla/flashattn_mla.py
+++ b/vllm/v1/attention/backends/mla/flashattn_mla.py
@@ -10,6 +10,7 @@
 from vllm.attention.backends.abstract import (
     AttentionLayer,
     AttentionType,
+    MultipleOf,
     is_quantized_kv_cache,
 )
 from vllm.attention.utils.fa_utils import (
@@ -17,10 +18,12 @@
     get_flash_attn_version,
 )
 from vllm.config import VllmConfig
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
     vllm_is_batch_invariant,
 )
+from vllm.platforms.interface import DeviceCapability
 from vllm.v1.attention.backends.mla.common import (
     MLACommonBackend,
     MLACommonDecodeMetadata,
@@ -37,6 +40,10 @@
 
 
 class FlashAttnMLABackend(MLACommonBackend):
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
+    supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = ["auto"]
+
     @staticmethod
     def get_name() -> str:
         return "FLASH_ATTN_MLA"
@@ -49,6 +56,26 @@ def get_builder_cls() -> type["FlashAttnMLAMetadataBuilder"]:
     def get_impl_cls() -> type["FlashAttnMLAImpl"]:
         return FlashAttnMLAImpl
 
+    @classmethod
+    def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
+        return capability.major == 9
+
+    @classmethod
+    def supports_combination(
+        cls,
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: CacheDType | None,
+        block_size: int,
+        use_mla: bool,
+        has_sink: bool,
+        use_sparse: bool,
+        device_capability: DeviceCapability,
+    ) -> str | None:
+        if not flash_attn_supports_mla():
+            return "FlashAttention MLA not supported on this device"
+        return None
+
 
 @dataclass
 class FlashAttnMLADecodeMetadata(MLACommonDecodeMetadata):
diff --git a/vllm/v1/attention/backends/mla/flashinfer_mla.py b/vllm/v1/attention/backends/mla/flashinfer_mla.py
index ebbcfd0eaa2f..b0f514ba4451 100644
--- a/vllm/v1/attention/backends/mla/flashinfer_mla.py
+++ b/vllm/v1/attention/backends/mla/flashinfer_mla.py
@@ -6,8 +6,14 @@
 import torch
 from flashinfer.decode import trtllm_batch_decode_with_kv_cache_mla
 
-from vllm.attention.backends.abstract import AttentionLayer, AttentionType, MultipleOf
+from vllm.attention.backends.abstract import (
+    AttentionLayer,
+    AttentionType,
+    MultipleOf,
+)
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
+from vllm.platforms.interface import DeviceCapability
 from vllm.v1.attention.backends.mla.common import (
     MLACommonBackend,
     MLACommonImpl,
@@ -15,7 +21,7 @@
     MLACommonMetadataBuilder,
     QueryLenSupport,
 )
-from vllm.v1.attention.backends.utils import AttentionCGSupport
+from vllm.v1.attention.backends.utils import AttentionCGSupport, KVCacheLayoutType
 
 logger = init_logger(__name__)
 
@@ -28,6 +34,14 @@ class FlashInferMLAMetadataBuilder(MLACommonMetadataBuilder[MLACommonMetadata]):
 
 
 class FlashInferMLABackend(MLACommonBackend):
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [32, 64]
+    supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
+        "auto",
+        "fp8",
+        "fp8_e4m3",
+    ]
+
     @staticmethod
     def get_name() -> str:
         return "FLASHINFER_MLA"
@@ -41,8 +55,12 @@ def get_builder_cls() -> type["FlashInferMLAMetadataBuilder"]:
         return FlashInferMLAMetadataBuilder
 
     @classmethod
-    def get_supported_kernel_block_size(cls) -> list[int | MultipleOf]:
-        return [32, 64]
+    def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
+        return capability.major == 10
+
+    @classmethod
+    def get_required_kv_cache_layout(cls) -> "KVCacheLayoutType | None":
+        return "HND"
 
 
 g_fi_workspace = torch.zeros(
diff --git a/vllm/v1/attention/backends/mla/flashmla.py b/vllm/v1/attention/backends/mla/flashmla.py
index 708bb9d63839..8f0364cd58de 100644
--- a/vllm/v1/attention/backends/mla/flashmla.py
+++ b/vllm/v1/attention/backends/mla/flashmla.py
@@ -13,10 +13,12 @@
     is_flashmla_dense_supported,
 )
 from vllm.config import VllmConfig
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
     vllm_is_batch_invariant,
 )
+from vllm.platforms.interface import DeviceCapability
 from vllm.v1.attention.backends.mla.common import (
     MLACommonBackend,
     MLACommonDecodeMetadata,
@@ -36,6 +38,14 @@
 
 
 class FlashMLABackend(MLACommonBackend):
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [64]
+    supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
+        "auto",
+        "fp8",
+        "fp8_e4m3",
+    ]
+
     @staticmethod
     def get_name() -> str:
         return "FLASHMLA"
@@ -48,9 +58,30 @@ def get_builder_cls() -> type["FlashMLAMetadataBuilder"]:
     def get_impl_cls() -> type["FlashMLAImpl"]:
         return FlashMLAImpl
 
-    @staticmethod
-    def get_supported_kernel_block_size() -> list[int | MultipleOf]:
-        return [64]
+    @classmethod
+    def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
+        return capability.major in [9, 10]
+
+    @classmethod
+    def supports_combination(
+        cls,
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: CacheDType | None,
+        block_size: int,
+        use_mla: bool,
+        has_sink: bool,
+        use_sparse: bool,
+        device_capability: DeviceCapability,
+    ) -> str | None:
+        if use_sparse:
+            from vllm.attention.ops.flashmla import is_flashmla_sparse_supported
+
+            return is_flashmla_sparse_supported()[1]
+        else:
+            from vllm.attention.ops.flashmla import is_flashmla_dense_supported
+
+            return is_flashmla_dense_supported()[1]
 
 
 @dataclass
diff --git a/vllm/v1/attention/backends/mla/flashmla_sparse.py b/vllm/v1/attention/backends/mla/flashmla_sparse.py
index bf76549de1ce..4794312eb96e 100644
--- a/vllm/v1/attention/backends/mla/flashmla_sparse.py
+++ b/vllm/v1/attention/backends/mla/flashmla_sparse.py
@@ -10,6 +10,7 @@
 from vllm.attention.backends.abstract import (
     AttentionBackend,
     AttentionLayer,
+    MultipleOf,
 )
 from vllm.attention.backends.utils import get_mla_dims
 from vllm.attention.ops.flashmla import (
@@ -18,8 +19,10 @@
     get_mla_metadata,
 )
 from vllm.config import VllmConfig
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
+from vllm.platforms.interface import DeviceCapability
 from vllm.triton_utils import tl, triton
 from vllm.utils.math_utils import cdiv
 from vllm.v1.attention.backends.mla.common import MLACommonBaseImpl
@@ -51,6 +54,9 @@
 
 class FlashMLASparseBackend(AttentionBackend):
     accept_output_buffer: bool = True
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.bfloat16]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [64]
+    supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = ["auto", "fp8_ds_mla"]
 
     @staticmethod
     def get_name() -> str:
@@ -64,6 +70,22 @@ def get_builder_cls() -> type["FlashMLASparseMetadataBuilder"]:
     def get_impl_cls() -> type["FlashMLASparseImpl"]:
         return FlashMLASparseImpl
 
+    @classmethod
+    def get_supported_head_sizes(cls) -> list[int]:
+        return [576]
+
+    @classmethod
+    def is_mla(cls) -> bool:
+        return True
+
+    @classmethod
+    def is_sparse(cls) -> bool:
+        return True
+
+    @classmethod
+    def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
+        return capability.major in [9, 10]
+
     @staticmethod
     def get_kv_cache_shape(
         num_blocks: int,
@@ -79,14 +101,6 @@ def get_kv_cache_shape(
         else:
             return (num_blocks, block_size, head_size)
 
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.bfloat16]
-
-    @classmethod
-    def get_supported_head_sizes(cls) -> list[int]:
-        return [576]
-
 
 @dataclass
 class FlashMLASparseMetadata:
diff --git a/vllm/v1/attention/backends/mla/indexer.py b/vllm/v1/attention/backends/mla/indexer.py
index f3c5bb732871..4f071145625f 100644
--- a/vllm/v1/attention/backends/mla/indexer.py
+++ b/vllm/v1/attention/backends/mla/indexer.py
@@ -23,6 +23,8 @@
 
 
 class DeepseekV32IndexerBackend(AttentionBackend):
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [64]
+
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
         return [32, 64, 128]
@@ -46,10 +48,6 @@ def get_kv_cache_shape(
     def get_kv_cache_stride_order() -> tuple[int, ...]:
         return (0, 1, 2)
 
-    @classmethod
-    def get_supported_kernel_block_size(cls) -> list[int | MultipleOf]:
-        return [64]
-
 
 @dataclass
 class DeepseekV32IndexerPrefillChunkMetadata:
diff --git a/vllm/v1/attention/backends/mla/triton_mla.py b/vllm/v1/attention/backends/mla/triton_mla.py
index 781f77e96319..0149639e8c0b 100644
--- a/vllm/v1/attention/backends/mla/triton_mla.py
+++ b/vllm/v1/attention/backends/mla/triton_mla.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+from typing import ClassVar
 
 import torch
 
@@ -12,11 +13,13 @@
 )
 from vllm.attention.ops.triton_decode_attention import decode_attention_fwd
 from vllm.attention.ops.triton_flash_attention import triton_attention
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
     vllm_is_batch_invariant,
 )
 from vllm.platforms import current_platform
+from vllm.platforms.interface import DeviceCapability
 from vllm.triton_utils import HAS_TRITON
 from vllm.v1.attention.backends.mla.common import (
     MLACommonBackend,
@@ -28,6 +31,9 @@
 
 
 class TritonMLABackend(MLACommonBackend):
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = ["auto"]
+
     @staticmethod
     def get_name() -> str:
         return "TRITON_MLA"
@@ -36,6 +42,10 @@ def get_name() -> str:
     def get_impl_cls() -> type["TritonMLAImpl"]:
         return TritonMLAImpl
 
+    @classmethod
+    def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
+        return True
+
 
 class TritonMLAImpl(MLACommonImpl[MLACommonMetadata]):
     can_return_lse_for_decode: bool = True
diff --git a/vllm/v1/attention/backends/rocm_aiter_fa.py b/vllm/v1/attention/backends/rocm_aiter_fa.py
index e8d3758a6395..81991244f5d9 100644
--- a/vllm/v1/attention/backends/rocm_aiter_fa.py
+++ b/vllm/v1/attention/backends/rocm_aiter_fa.py
@@ -3,6 +3,7 @@
 """Attention layer with AiterFlashAttention."""
 
 from dataclasses import dataclass
+from typing import ClassVar
 
 import torch
 
@@ -445,31 +446,13 @@ def use_cascade_attention(self, *args, **kwargs) -> bool:
 
 class AiterFlashAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
-
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16]
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
 
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
         return [64, 128, 256]
 
-    @staticmethod
-    def get_supported_kernel_block_size() -> list[int | MultipleOf]:
-        return [MultipleOf(16)]
-
-    @classmethod
-    def validate_head_size(cls, head_size: int) -> None:
-        supported_head_sizes = cls.get_supported_head_sizes()
-        if head_size not in supported_head_sizes:
-            attn_type = cls.__name__.removesuffix("Backend")
-            raise ValueError(
-                f"Head size {head_size} is not supported by {attn_type}. "
-                f"Supported head sizes are: {supported_head_sizes}. "
-                "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes."
-            )
-
     @staticmethod
     def get_name() -> str:
         return "FLASH_ATTN"
@@ -531,8 +514,6 @@ def __init__(
         assert self.num_heads % self.num_kv_heads == 0
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
 
-        AiterFlashAttentionBackend.validate_head_size(head_size)
-
         if attn_type != AttentionType.DECODER:
             raise NotImplementedError(
                 "Encoder self-attention and "
diff --git a/vllm/v1/attention/backends/rocm_attn.py b/vllm/v1/attention/backends/rocm_attn.py
index 57ba4dc78d9f..1d2c70f65d0f 100644
--- a/vllm/v1/attention/backends/rocm_attn.py
+++ b/vllm/v1/attention/backends/rocm_attn.py
@@ -152,10 +152,7 @@ def build(
 
 class RocmAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
-
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16]
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
 
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
@@ -163,12 +160,11 @@ def get_supported_head_sizes(cls) -> list[int]:
 
     @classmethod
     def validate_head_size(cls, head_size: int) -> None:
-        supported_head_sizes = cls.get_supported_head_sizes()
-        if head_size not in supported_head_sizes:
+        if not cls.supports_head_size(head_size):
             attn_type = cls.__name__.removesuffix("Backend")
             raise ValueError(
                 f"Head size {head_size} is not supported by {attn_type}. "
-                f"Supported head sizes are: {supported_head_sizes}. "
+                f"Supported head sizes are: {cls.get_supported_head_sizes()}. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
                 "FlexAttention backend which supports all head sizes."
             )
diff --git a/vllm/v1/attention/backends/tree_attn.py b/vllm/v1/attention/backends/tree_attn.py
index 0c0222d6152f..1bf38ed225a4 100644
--- a/vllm/v1/attention/backends/tree_attn.py
+++ b/vllm/v1/attention/backends/tree_attn.py
@@ -4,7 +4,7 @@
 
 import ast
 from dataclasses import dataclass
-from typing import Optional
+from typing import ClassVar, Optional
 
 import torch
 
@@ -30,31 +30,13 @@
 
 class TreeAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
-
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16]
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
 
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
         return [32, 64, 96, 128, 160, 192, 224, 256]
 
-    @staticmethod
-    def get_supported_kernel_block_size() -> list[int | MultipleOf]:
-        return [MultipleOf(16)]
-
-    @classmethod
-    def validate_head_size(cls, head_size: int) -> None:
-        supported_head_sizes = cls.get_supported_head_sizes()
-        if head_size not in supported_head_sizes:
-            attn_type = cls.__name__.removesuffix("Backend")
-            raise ValueError(
-                f"Head size {head_size} is not supported by {attn_type}. "
-                f"Supported head sizes are: {supported_head_sizes}. "
-                "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes."
-            )
-
     @staticmethod
     def get_name() -> str:
         return "TREE_ATTN"
@@ -331,8 +313,6 @@ def __init__(
         else:
             self.sliding_window = (sliding_window - 1, 0)
 
-        TreeAttentionBackend.validate_head_size(head_size)
-
         if attn_type != AttentionType.DECODER:
             raise NotImplementedError(
                 "Encoder self-attention and "
diff --git a/vllm/v1/attention/backends/triton_attn.py b/vllm/v1/attention/backends/triton_attn.py
index 0590a87bf8e5..37c0ae61e65d 100644
--- a/vllm/v1/attention/backends/triton_attn.py
+++ b/vllm/v1/attention/backends/triton_attn.py
@@ -18,12 +18,14 @@
 )
 from vllm.attention.ops.triton_unified_attention import unified_attention
 from vllm.config import VllmConfig
+from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
     QuantKey,
     kFp8StaticTensorSym,
 )
 from vllm.platforms import current_platform
+from vllm.platforms.interface import DeviceCapability
 from vllm.v1.attention.backends.utils import (
     AttentionCGSupport,
     AttentionMetadataBuilder,
@@ -147,25 +149,18 @@ def build(
 
 class TritonAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
-
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16, torch.float32]
-
-    @staticmethod
-    def get_supported_kernel_block_size() -> list[int | MultipleOf]:
-        return [MultipleOf(16)]
-
-    @classmethod
-    def validate_head_size(cls, head_size: int) -> None:
-        # Triton Attention supports any head size above 32
-        if head_size < 32:
-            raise ValueError(
-                f"Head size {head_size} is not supported by TritonAttention."
-                f"Head sizes need to be larger or equal 32 for this backend. "
-                "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes."
-            )
+    supported_dtypes: ClassVar[list[torch.dtype]] = [
+        torch.float16,
+        torch.bfloat16,
+        torch.float32,
+    ]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
+    supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
+        "auto",
+        "fp8",
+        "fp8_e4m3",
+        "fp8_e5m2",
+    ]
 
     @staticmethod
     def get_name() -> str:
@@ -195,6 +190,18 @@ def use_cascade_attention(*args, **kwargs) -> bool:
     def get_builder_cls() -> type["TritonAttentionMetadataBuilder"]:
         return TritonAttentionMetadataBuilder
 
+    @classmethod
+    def supports_head_size(cls, head_size: int) -> bool:
+        return head_size >= 32
+
+    @classmethod
+    def supports_sink(cls) -> bool:
+        return True
+
+    @classmethod
+    def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
+        return True
+
 
 class TritonAttentionImpl(AttentionImpl):
     def fused_output_quant_supported(self, quant_key: QuantKey):
@@ -237,8 +244,6 @@ def __init__(
 
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
 
-        TritonAttentionBackend.validate_head_size(head_size)
-
         if attn_type != AttentionType.DECODER:
             raise NotImplementedError(
                 "Encoder self-attention and "
diff --git a/vllm/v1/attention/backends/xformers.py b/vllm/v1/attention/backends/xformers.py
index 81bdbd641429..d15d79417cc6 100644
--- a/vllm/v1/attention/backends/xformers.py
+++ b/vllm/v1/attention/backends/xformers.py
@@ -3,7 +3,7 @@
 """Attention layer with XFormersAttention."""
 
 from dataclasses import dataclass
-from typing import Optional
+from typing import ClassVar, Optional
 
 import torch
 
@@ -41,10 +41,8 @@
 
 class XFormersAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
-
-    @classmethod
-    def get_supported_dtypes(cls) -> list[torch.dtype]:
-        return [torch.float16, torch.bfloat16]
+    supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
+    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
 
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
@@ -80,22 +78,6 @@ def get_supported_head_sizes(cls) -> list[int]:
             256,
         ]
 
-    @staticmethod
-    def get_supported_kernel_block_size() -> list[int | MultipleOf]:
-        return [MultipleOf(16)]
-
-    @classmethod
-    def validate_head_size(cls, head_size: int) -> None:
-        supported_head_sizes = cls.get_supported_head_sizes()
-        if head_size not in supported_head_sizes:
-            attn_type = cls.__name__.removesuffix("Backend")
-            raise ValueError(
-                f"Head size {head_size} is not supported by {attn_type}. "
-                f"Supported head sizes are: {supported_head_sizes}. "
-                "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes."
-            )
-
     @staticmethod
     def get_name() -> str:
         return "XFORMERS"
@@ -305,8 +287,6 @@ def __init__(
             logits_soft_cap = 0
         self.logits_soft_cap = logits_soft_cap
 
-        XFormersAttentionBackend.validate_head_size(head_size)
-
         if attn_type != AttentionType.DECODER:
             raise NotImplementedError(
                 "Encoder self-attention and "
diff --git a/vllm/v1/spec_decode/eagle.py b/vllm/v1/spec_decode/eagle.py
index 75a4140fd655..55b04949ceb2 100644
--- a/vllm/v1/spec_decode/eagle.py
+++ b/vllm/v1/spec_decode/eagle.py
@@ -150,11 +150,15 @@ def __init__(
         )
 
         # Determine allowed attention backends once during initialization.
+        from vllm.attention.backends.registry import AttentionBackendEnum
+
         self.allowed_attn_types: tuple | None = None
         if current_platform.is_rocm():
             rocm_types = [TritonAttentionMetadata, FlashAttentionMetadata]
-            # vllm.v1.attention.backends.rocm_aiter_fa is an optional backend
-            if find_spec("vllm.v1.attention.backends.rocm_aiter_fa"):
+            # ROCM_AITER_FA is an optional backend
+            if find_spec(
+                AttentionBackendEnum.ROCM_AITER_FA.get_path(include_classname=False)
+            ):
                 from vllm.v1.attention.backends.rocm_aiter_fa import (
                     AiterFlashAttentionMetadata,
                 )
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 6fccf2ea2f47..790649b69e5c 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -4371,7 +4371,7 @@ def block_size_is_supported(
             """
             for backend in backends:
                 is_supported = False
-                for supported_size in backend.get_supported_kernel_block_size():
+                for supported_size in backend.supported_kernel_block_sizes:
                     if isinstance(supported_size, int):
                         if block_size == supported_size:
                             is_supported = True
@@ -4402,7 +4402,7 @@ def block_size_is_supported(
         all_int_supported_sizes = set(
             supported_size
             for backend in backends
-            for supported_size in backend.get_supported_kernel_block_size()
+            for supported_size in backend.supported_kernel_block_sizes
             if isinstance(supported_size, int)
         )
 

From 7dbe6d81d6f17abe93389d97d417e4886467546f Mon Sep 17 00:00:00 2001
From: Chaojun Zhang <chaojun.zhang@intel.com>
Date: Tue, 11 Nov 2025 20:46:47 +0800
Subject: [PATCH 053/183] Fix Fused MoE LoRA Triton kernel bug (#28450)

Signed-off-by: chaojun-zhang <chaojun.zhang@intel.com>
---
 vllm/lora/ops/triton_ops/fused_moe_lora_op.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/vllm/lora/ops/triton_ops/fused_moe_lora_op.py b/vllm/lora/ops/triton_ops/fused_moe_lora_op.py
index 6d6de2529de3..893972144e99 100644
--- a/vllm/lora/ops/triton_ops/fused_moe_lora_op.py
+++ b/vllm/lora/ops/triton_ops/fused_moe_lora_op.py
@@ -26,7 +26,7 @@ def _get_ptr(lora_weights: list[torch.Tensor], device: torch.device):
     tensor_ptrs = []
     for lora_weight in lora_weights:
         tensor_ptrs.append(lora_weight.data_ptr())
-    ptr_tensor = torch.tensor(tensor_ptrs, device=device)
+    ptr_tensor = torch.tensor(tensor_ptrs, device=device, dtype=torch.uint64)
 
     _LORA_PTR_DICT[key] = ptr_tensor
     return _LORA_PTR_DICT.get(key)
@@ -85,6 +85,7 @@ def _fused_moe_lora_kernel(
     GROUP_SIZE_M: tl.constexpr,
     SPLIT_K: tl.constexpr,
     USE_GDC: tl.constexpr,
+    launch_pdl: tl.constexpr,
     IS_PRIMARY: tl.constexpr,
 ):
     pid = tl.program_id(axis=0)

From afffd3cc8a99ce1cf0f6f1687852e5519d725a3b Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Tue, 11 Nov 2025 21:14:48 +0800
Subject: [PATCH 054/183] [Model] Pass `mm_features` directly into
 `get_mrope_input_positions` (#28399)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 vllm/model_executor/models/ernie45_vl.py      | 35 +++++-------
 vllm/model_executor/models/glm4_1v.py         | 32 +++++------
 vllm/model_executor/models/glm4v.py           | 32 +++++------
 vllm/model_executor/models/interfaces.py      | 22 ++------
 vllm/model_executor/models/keye.py            | 29 ++++------
 vllm/model_executor/models/keye_vl1_5.py      | 29 ++++------
 vllm/model_executor/models/paddleocr_vl.py    | 29 ++++------
 .../models/qwen2_5_omni_thinker.py            | 46 +++++++++-------
 vllm/model_executor/models/qwen2_5_vl.py      | 36 ++++++------
 vllm/model_executor/models/qwen2_vl.py        | 37 +++++--------
 .../models/qwen3_omni_moe_thinker.py          | 55 +++++++++++--------
 vllm/model_executor/models/qwen3_vl.py        | 30 ++++------
 .../models/transformers/multimodal.py         | 39 +++++++++----
 vllm/multimodal/inputs.py                     | 13 +++++
 vllm/v1/worker/gpu_model_runner.py            | 33 ++---------
 15 files changed, 225 insertions(+), 272 deletions(-)

diff --git a/vllm/model_executor/models/ernie45_vl.py b/vllm/model_executor/models/ernie45_vl.py
index 97182a25f82b..c040b19bba20 100644
--- a/vllm/model_executor/models/ernie45_vl.py
+++ b/vllm/model_executor/models/ernie45_vl.py
@@ -34,7 +34,7 @@
 import torch.nn as nn
 import torch.nn.functional as F
 from einops import rearrange, repeat
-from transformers import BatchFeature, PretrainedConfig
+from transformers import BatchFeature
 
 from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.layer import (
@@ -58,6 +58,7 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (
     MultiModalDataDict,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalKwargsItems,
 )
@@ -1433,15 +1434,16 @@ def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor,
-        video_grid_thw: list[list[int]] | torch.Tensor,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        """Get mrope input positions and delta value for Ernie VL."""
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {"image_grid_thw", "video_grid_thw"},
+        )
+        image_grid_thw = [item.tolist() for item in kwargs.get("image_grid_thw", [])]
+        video_grid_thw = [item.tolist() for item in kwargs.get("video_grid_thw", [])]
 
+        hf_config = self.config
         image_token_id = hf_config.im_patch_id
         video_start_token_id = hf_config.video_start_token_id
         video_end_token_id = hf_config.video_end_token_id
@@ -1449,10 +1451,7 @@ def get_mrope_input_positions(
         temporal_conv_size = hf_config.temporal_conv_size
         llm_pos_ids_list: list = []
 
-        if not (image_grid_thw is None and video_grid_thw is None):
-            if isinstance(image_grid_thw, torch.Tensor):
-                image_grid_thw = image_grid_thw.tolist()
-
+        if image_grid_thw or video_grid_thw:
             input_token_type: list[str] = []
             video_check_flg = False
             for token in input_tokens:
@@ -1484,11 +1483,7 @@ def get_mrope_input_positions(
                     llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
                 )
                 if modality_type == "image":
-                    t, h, w = (
-                        image_grid_thw[mm_data_idx][0],
-                        image_grid_thw[mm_data_idx][1],
-                        image_grid_thw[mm_data_idx][2],
-                    )
+                    t, h, w = image_grid_thw[mm_data_idx]
                     llm_grid_t, llm_grid_h, llm_grid_w = (
                         t,
                         h // spatial_conv_size,
@@ -1519,11 +1514,7 @@ def get_mrope_input_positions(
                     mm_data_idx += 1
 
                 elif modality_type == "video":
-                    t, h, w = (
-                        video_grid_thw[mm_data_idx][0],
-                        video_grid_thw[mm_data_idx][1],
-                        video_grid_thw[mm_data_idx][2],
-                    )
+                    t, h, w = video_grid_thw[mm_data_idx]
                     llm_grid_t, llm_grid_h, llm_grid_w = (
                         t // temporal_conv_size,
                         h // spatial_conv_size,
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index 776527fdd973..60cad2e2907f 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -37,7 +37,7 @@
 import torch.nn as nn
 import torch.nn.functional as F
 from einops import rearrange
-from transformers import BatchFeature, PretrainedConfig
+from transformers import BatchFeature
 from transformers.models.glm4v.configuration_glm4v import Glm4vVisionConfig
 from transformers.models.glm4v.image_processing_glm4v import (
     Glm4vImageProcessor,
@@ -70,6 +70,7 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (
     MultiModalDataDict,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalKwargsItems,
     VideoItem,
@@ -1619,25 +1620,23 @@ def get_multimodal_embeddings(
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: "PretrainedConfig",
-        image_grid_thw: list[list[int]] | torch.Tensor | None,
-        video_grid_thw: list[list[int]] | torch.Tensor | None,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        """Get mrope input positions and delta value for GLM4V."""
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {"image_grid_thw", "video_grid_thw"},
+        )
+        image_grid_thw = [item.tolist() for item in kwargs.get("image_grid_thw", [])]
+        video_grid_thw = [item.tolist() for item in kwargs.get("video_grid_thw", [])]
 
+        hf_config = self.config
         image_token_id = hf_config.image_token_id
         video_start_token_id = hf_config.video_start_token_id
         video_end_token_id = hf_config.video_end_token_id
         spatial_merge_size = hf_config.vision_config.spatial_merge_size
         llm_pos_ids_list: list = []
 
-        if not (image_grid_thw is None and video_grid_thw is None):
-            if isinstance(image_grid_thw, torch.Tensor):
-                image_grid_thw = image_grid_thw.tolist()
-
+        if image_grid_thw or video_grid_thw:
             input_token_type: list[str] = []
             video_check_flg = False
             for token in input_tokens:
@@ -1669,11 +1668,7 @@ def get_mrope_input_positions(
                     llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
                 )
                 if modality_type == "image":
-                    t, h, w = (
-                        image_grid_thw[mm_data_idx][0],
-                        image_grid_thw[mm_data_idx][1],
-                        image_grid_thw[mm_data_idx][2],
-                    )
+                    t, h, w = image_grid_thw[mm_data_idx]
                     llm_grid_t, llm_grid_h, llm_grid_w = (
                         t,
                         h // spatial_merge_size,
@@ -1706,8 +1701,7 @@ def get_mrope_input_positions(
                 elif modality_type == "video":
                     t, h, w = (
                         video_frame_num,
-                        image_grid_thw[mm_data_idx][1],
-                        image_grid_thw[mm_data_idx][2],
+                        *image_grid_thw[mm_data_idx][1:],
                     )
                     llm_grid_t, llm_grid_h, llm_grid_w = (
                         t,
diff --git a/vllm/model_executor/models/glm4v.py b/vllm/model_executor/models/glm4v.py
index ebf6934dddea..899797a51053 100644
--- a/vllm/model_executor/models/glm4v.py
+++ b/vllm/model_executor/models/glm4v.py
@@ -15,7 +15,7 @@
 from torch.nn import LayerNorm
 from torchvision import transforms
 from torchvision.transforms import InterpolationMode
-from transformers import BatchFeature, PretrainedConfig, PreTrainedTokenizer, TensorType
+from transformers import BatchFeature, PreTrainedTokenizer, TensorType
 from transformers.image_utils import ImageInput
 from transformers.tokenization_utils_base import TextInput
 
@@ -36,6 +36,7 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (
     MultiModalDataDict,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalKwargsItems,
 )
@@ -622,25 +623,23 @@ def _process_image_input(self, image_input: GLMVImagePixelInputs) -> torch.Tenso
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor,
-        video_grid_thw: list[list[int]] | torch.Tensor,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        """Get mrope input positions and delta value for GLM4V."""
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {"image_grid_thw", "video_grid_thw"},
+        )
+        image_grid_thw = [item.tolist() for item in kwargs.get("image_grid_thw", [])]
+        video_grid_thw = [item.tolist() for item in kwargs.get("video_grid_thw", [])]
 
+        hf_config = self.config
         image_token_id = hf_config.image_token_id
         video_start_token_id = hf_config.video_start_token_id
         video_end_token_id = hf_config.video_end_token_id
         spatial_merge_size = hf_config.vision_config.spatial_merge_size
         llm_pos_ids_list: list = []
 
-        if not (image_grid_thw is None and video_grid_thw is None):
-            if isinstance(image_grid_thw, torch.Tensor):
-                image_grid_thw = image_grid_thw.tolist()
-
+        if image_grid_thw or video_grid_thw:
             input_token_type: list[str] = []
             video_check_flg = False
             for token in input_tokens:
@@ -672,11 +671,7 @@ def get_mrope_input_positions(
                     llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
                 )
                 if modality_type == "image":
-                    t, h, w = (
-                        image_grid_thw[mm_data_idx][0],
-                        image_grid_thw[mm_data_idx][1],
-                        image_grid_thw[mm_data_idx][2],
-                    )
+                    t, h, w = image_grid_thw[mm_data_idx]
                     llm_grid_t, llm_grid_h, llm_grid_w = (
                         t,
                         h // spatial_merge_size,
@@ -709,8 +704,7 @@ def get_mrope_input_positions(
                 elif modality_type == "video":
                     t, h, w = (
                         video_frame_num,
-                        image_grid_thw[mm_data_idx][1],
-                        image_grid_thw[mm_data_idx][2],
+                        *image_grid_thw[mm_data_idx][1:],
                     )
                     llm_grid_t, llm_grid_h, llm_grid_w = (
                         t,
diff --git a/vllm/model_executor/models/interfaces.py b/vllm/model_executor/models/interfaces.py
index d6a8f86d998b..88b45bf07c0d 100644
--- a/vllm/model_executor/models/interfaces.py
+++ b/vllm/model_executor/models/interfaces.py
@@ -16,7 +16,6 @@
 import torch
 import torch.nn as nn
 from torch import Tensor
-from transformers import PretrainedConfig
 from transformers.models.whisper.tokenization_whisper import LANGUAGES
 from typing_extensions import Self, TypeIs
 
@@ -32,10 +31,12 @@
 if TYPE_CHECKING:
     from vllm.config import VllmConfig
     from vllm.model_executor.models.utils import WeightsMapper
+    from vllm.multimodal.inputs import MultiModalFeatureSpec
     from vllm.sequence import IntermediateTensors
 else:
     VllmConfig = object
     WeightsMapper = object
+    MultiModalFeatureSpec = object
     IntermediateTensors = object
 
 logger = init_logger(__name__)
@@ -991,12 +992,7 @@ class SupportsMRoPE(Protocol):
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor | None,
-        video_grid_thw: list[list[int]] | torch.Tensor | None,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list["MultiModalFeatureSpec"],
     ) -> tuple[torch.Tensor, int]:
         """
         Get M-RoPE input positions and delta value for this specific model.
@@ -1006,17 +1002,11 @@ def get_mrope_input_positions(
 
         Args:
             input_tokens: List of input token IDs
-            hf_config: HuggingFace model configuration
-            image_grid_thw: Image grid dimensions (t, h, w)
-            video_grid_thw: Video grid dimensions (t, h, w)
-            second_per_grid_ts: Seconds per grid timestep for videos
-            audio_feature_lengths: Audio feature lengths for multimodal models
-            use_audio_in_video: Whether to use audio in video for interleaving
+            mm_features: Information about each multi-modal data item
 
         Returns:
-            Tuple of (llm_positions, mrope_position_delta)
-            - llm_positions: Tensor of shape [3, num_tokens]
-                with T/H/W positions
+            Tuple of `(llm_positions, mrope_position_delta)`
+            - llm_positions: Tensor of shape `[3, num_tokens]` with T/H/W positions
             - mrope_position_delta: Delta for position calculations
         """
         ...
diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index 80d7e6c5b0cd..aa0134badc40 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -40,6 +40,7 @@
     ImageItem,
     ModalityData,
     MultiModalDataDict,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalKwargsItems,
     VideoItem,
@@ -1627,16 +1628,17 @@ def _process_video_input(
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor,
-        video_grid_thw: list[list[int]] | torch.Tensor,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {"image_grid_thw", "video_grid_thw"},
+        )
+        image_grid_thw = [item.tolist() for item in kwargs.get("image_grid_thw", [])]
+        video_grid_thw = [item.tolist() for item in kwargs.get("video_grid_thw", [])]
+
         if isinstance(video_grid_thw, list) and len(video_grid_thw) > 0:
             video_grid_thw = video_grid_thw[0]
-        """Get mrope input positions and delta value (Keye series)."""
 
         def split_thw(grid_thw: torch.Tensor | list[int]) -> list[list[int]]:
             """
@@ -1662,6 +1664,7 @@ def split_thw(grid_thw: torch.Tensor | list[int]) -> list[list[int]]:
 
         video_grid_thw = split_thw(video_grid_thw)
 
+        hf_config = self.config
         image_token_id = hf_config.image_token_id
         video_token_id = hf_config.video_token_id
         spatial_merge_size = hf_config.vision_config.spatial_merge_size
@@ -1691,20 +1694,12 @@ def split_thw(grid_thw: torch.Tensor | list[int]) -> list[list[int]]:
                 ed_video = len(input_tokens) + 1
 
             if ed_image < ed_video:
-                t, h, w = (
-                    image_grid_thw[image_index][0],
-                    image_grid_thw[image_index][1],
-                    image_grid_thw[image_index][2],
-                )
+                t, h, w = image_grid_thw[image_index]
                 image_index += 1
                 remain_images -= 1
                 ed = ed_image
             else:
-                t, h, w = (
-                    video_grid_thw[video_index][0],
-                    video_grid_thw[video_index][1],
-                    video_grid_thw[video_index][2],
-                )
+                t, h, w = video_grid_thw[video_index]
                 video_index += 1
                 remain_frames -= 1
                 ed = ed_video
diff --git a/vllm/model_executor/models/keye_vl1_5.py b/vllm/model_executor/models/keye_vl1_5.py
index 6f95a59d36d2..124e9c2afa21 100644
--- a/vllm/model_executor/models/keye_vl1_5.py
+++ b/vllm/model_executor/models/keye_vl1_5.py
@@ -21,6 +21,7 @@
 from vllm.multimodal.inputs import (
     ImageItem,
     ModalityData,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalKwargsItems,
     VideoItem,
@@ -597,16 +598,17 @@ def _process_video_input(
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor,
-        video_grid_thw: list[list[int]] | torch.Tensor,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {"image_grid_thw", "video_grid_thw"},
+        )
+        image_grid_thw = [item.tolist() for item in kwargs.get("image_grid_thw", [])]
+        video_grid_thw = [item.tolist() for item in kwargs.get("video_grid_thw", [])]
+
         if isinstance(video_grid_thw, list) and len(video_grid_thw) > 0:
             video_grid_thw = video_grid_thw[0]
-        """Get mrope input positions and delta value (Keye series)."""
 
         def split_thw(grid_thw: torch.Tensor | list[int]) -> list[list[int]]:
             """
@@ -632,6 +634,7 @@ def split_thw(grid_thw: torch.Tensor | list[int]) -> list[list[int]]:
 
         video_grid_thw = split_thw(video_grid_thw)
 
+        hf_config = self.config
         image_token_id = hf_config.image_token_id
         video_token_id = hf_config.video_token_id
         spatial_merge_size = hf_config.vision_config.spatial_merge_size
@@ -661,20 +664,12 @@ def split_thw(grid_thw: torch.Tensor | list[int]) -> list[list[int]]:
                 ed_video = len(input_tokens) + 1
 
             if ed_image < ed_video:
-                t, h, w = (
-                    image_grid_thw[image_index][0],
-                    image_grid_thw[image_index][1],
-                    image_grid_thw[image_index][2],
-                )
+                t, h, w = image_grid_thw[image_index]
                 image_index += 1
                 remain_images -= 1
                 ed = ed_image
             else:
-                t, h, w = (
-                    video_grid_thw[video_index][0],
-                    video_grid_thw[video_index][1],
-                    video_grid_thw[video_index][2],
-                )
+                t, h, w = video_grid_thw[video_index]
                 video_index += 1
                 remain_frames -= 1
                 ed = ed_video
diff --git a/vllm/model_executor/models/paddleocr_vl.py b/vllm/model_executor/models/paddleocr_vl.py
index 86d7d1c11ffe..62994abe8e31 100644
--- a/vllm/model_executor/models/paddleocr_vl.py
+++ b/vllm/model_executor/models/paddleocr_vl.py
@@ -61,6 +61,7 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (
     MultiModalDataDict,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalKwargs,
 )
@@ -1184,15 +1185,17 @@ def compute_logits(
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor,
-        video_grid_thw: list[list[int]] | torch.Tensor,
-        second_per_grid_ts: list[float],
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        """Get mrope input positions and delta value."""
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {"image_grid_thw", "video_grid_thw", "second_per_grid_ts"},
+        )
+        image_grid_thw = [item.tolist() for item in kwargs.get("image_grid_thw", [])]
+        video_grid_thw = [item.tolist() for item in kwargs.get("video_grid_thw", [])]
+        second_per_grid_ts = kwargs.get("second_per_grid_ts", [])
 
+        hf_config = self.config
         image_token_id = hf_config.image_token_id
         video_token_id = hf_config.video_token_id
         vision_start_token_id = hf_config.vision_start_token_id
@@ -1229,20 +1232,12 @@ def get_mrope_input_positions(
             else:
                 ed_video = len(input_tokens) + 1
             if ed_image < ed_video:
-                t, h, w = (
-                    image_grid_thw[image_index][0],
-                    image_grid_thw[image_index][1],
-                    image_grid_thw[image_index][2],
-                )
+                t, h, w = image_grid_thw[image_index]
                 image_index += 1
                 remain_images -= 1
                 ed = ed_image
             else:
-                t, h, w = (
-                    video_grid_thw[video_index][0],
-                    video_grid_thw[video_index][1],
-                    video_grid_thw[video_index][2],
-                )
+                t, h, w = video_grid_thw[video_index]
                 video_second_per_grid_t = 1.0
                 if second_per_grid_ts:
                     video_second_per_grid_t = second_per_grid_ts[video_index]
diff --git a/vllm/model_executor/models/qwen2_5_omni_thinker.py b/vllm/model_executor/models/qwen2_5_omni_thinker.py
index fac281d2caf4..8f74cab0534d 100644
--- a/vllm/model_executor/models/qwen2_5_omni_thinker.py
+++ b/vllm/model_executor/models/qwen2_5_omni_thinker.py
@@ -68,6 +68,7 @@
     ImageItem,
     ModalityData,
     MultiModalDataDict,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalKwargsItems,
     NestedTensors,
@@ -923,21 +924,9 @@ def get_language_model(self) -> torch.nn.Module:
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor,
-        video_grid_thw: list[list[int]] | torch.Tensor,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        """Get mrope input positions and delta value (Qwen2.5-Omni version).
-
-        Differences from MRotaryEmbedding:
-            1. Add audio support (and related `audio_feature_lengths`).
-            2. Add `use_audio_in_video` option to read audio from video inputs.
-                In this case, audio and vision position ids will be split into
-                chunks and interleaved.
-
+        """
         Example:
 
             (V_i are vision position ids, A_i are audio position ids)
@@ -945,11 +934,33 @@ def get_mrope_input_positions(
             |V_1 ...    V_n|A_1 ...   A_n|V_n+1 ... V_2n|A_n+1 ... A_2n|...
             |vision chunk 1|audio chunk 1|vision chunk 2|audio chunk 2 |...
         """
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {
+                "image_grid_thw",
+                "video_grid_thw",
+                "second_per_grid_ts",
+                "audio_feature_lengths",
+                "use_audio_in_video",
+            },
+        )
+        image_grid_thw = kwargs.get("image_grid_thw", [])
+        video_grid_thw = kwargs.get("video_grid_thw", [])
+        second_per_grid_ts = kwargs.get("second_per_grid_ts", [])
+        audio_feature_lengths = kwargs.get("audio_feature_lengths", [])
+        use_audio_in_video = any(kwargs.get("use_audio_in_video", []))
+
+        image_grid_thw = (torch.stack if image_grid_thw else torch.tensor)(
+            image_grid_thw
+        )
+        video_grid_thw = (torch.stack if video_grid_thw else torch.tensor)(
+            video_grid_thw
+        )
 
         # TODO(fyabc): refactor and share more code with
         #  _vl_get_input_positions_tensor.
 
-        thinker_config = hf_config.thinker_config
+        thinker_config = self.config
         audio_token_id = thinker_config.audio_token_index
         image_token_id = thinker_config.image_token_index
         video_token_id = thinker_config.video_token_index
@@ -963,11 +974,6 @@ def get_mrope_input_positions(
             thinker_config.vision_config, "tokens_per_second", 25
         )
 
-        if isinstance(image_grid_thw, list):
-            image_grid_thw = torch.tensor(image_grid_thw)
-        if isinstance(video_grid_thw, list):
-            video_grid_thw = torch.tensor(video_grid_thw)
-
         src_item = input_tokens
         audio_seqlens = audio_feature_lengths
         if not second_per_grid_ts:
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index 3292cf8220ff..4662176a1cc5 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -35,7 +35,7 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
-from transformers import BatchFeature, PretrainedConfig
+from transformers import BatchFeature
 from transformers.models.qwen2_5_vl import Qwen2_5_VLProcessor
 from transformers.models.qwen2_5_vl.configuration_qwen2_5_vl import (
     Qwen2_5_VLConfig,
@@ -75,7 +75,11 @@
     compute_retention_mask,
     recompute_mrope_positions,
 )
-from vllm.multimodal.inputs import MultiModalFieldConfig, MultiModalKwargs
+from vllm.multimodal.inputs import (
+    MultiModalFeatureSpec,
+    MultiModalFieldConfig,
+    MultiModalKwargs,
+)
 from vllm.multimodal.parse import MultiModalDataItems
 from vllm.multimodal.processing import PromptReplacement, PromptUpdate
 from vllm.sequence import IntermediateTensors
@@ -1120,15 +1124,17 @@ class Qwen2_5_VLForConditionalGeneration(
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor,
-        video_grid_thw: list[list[int]] | torch.Tensor,
-        second_per_grid_ts: list[float],
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        """Get mrope input positions and delta value."""
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {"image_grid_thw", "video_grid_thw", "second_per_grid_ts"},
+        )
+        image_grid_thw = [item.tolist() for item in kwargs.get("image_grid_thw", [])]
+        video_grid_thw = [item.tolist() for item in kwargs.get("video_grid_thw", [])]
+        second_per_grid_ts = kwargs.get("second_per_grid_ts", [])
 
+        hf_config = self.config
         image_token_id = hf_config.image_token_id
         video_token_id = hf_config.video_token_id
         vision_start_token_id = hf_config.vision_start_token_id
@@ -1165,20 +1171,12 @@ def get_mrope_input_positions(
             else:
                 ed_video = len(input_tokens) + 1
             if ed_image < ed_video:
-                t, h, w = (
-                    image_grid_thw[image_index][0],
-                    image_grid_thw[image_index][1],
-                    image_grid_thw[image_index][2],
-                )
+                t, h, w = image_grid_thw[image_index]
                 image_index += 1
                 remain_images -= 1
                 ed = ed_image
             else:
-                t, h, w = (
-                    video_grid_thw[video_index][0],
-                    video_grid_thw[video_index][1],
-                    video_grid_thw[video_index][2],
-                )
+                t, h, w = video_grid_thw[video_index]
                 video_second_per_grid_t = 1.0
                 if second_per_grid_ts:
                     video_second_per_grid_t = second_per_grid_ts[video_index]
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index 61057fa145f4..bbebe7c0f928 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -34,7 +34,7 @@
 import torch.nn as nn
 import torch.nn.functional as F
 from einops import rearrange, repeat
-from transformers import BatchFeature, PretrainedConfig
+from transformers import BatchFeature
 from transformers.models.qwen2_vl import Qwen2VLImageProcessor, Qwen2VLProcessor
 from transformers.models.qwen2_vl.configuration_qwen2_vl import (
     Qwen2VLConfig,
@@ -70,6 +70,7 @@
     ImageItem,
     ModalityData,
     MultiModalDataDict,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalKwargsItems,
     VideoItem,
@@ -1240,21 +1241,17 @@ class Qwen2VLForConditionalGeneration(
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor | None,
-        video_grid_thw: list[list[int]] | torch.Tensor | None,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        """Get M-RoPE input positions for Qwen2-VL model."""
-        if image_grid_thw is None:
-            image_grid_thw = []
-        if video_grid_thw is None:
-            video_grid_thw = []
-        if second_per_grid_ts is None:
-            second_per_grid_ts = []
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {"image_grid_thw", "video_grid_thw", "second_per_grid_ts"},
+        )
+        image_grid_thw = [item.tolist() for item in kwargs.get("image_grid_thw", [])]
+        video_grid_thw = [item.tolist() for item in kwargs.get("video_grid_thw", [])]
+        second_per_grid_ts = kwargs.get("second_per_grid_ts", [])
 
+        hf_config = self.config
         image_token_id = hf_config.image_token_id
         video_token_id = hf_config.video_token_id
         vision_start_token_id = hf_config.vision_start_token_id
@@ -1291,20 +1288,12 @@ def get_mrope_input_positions(
             else:
                 ed_video = len(input_tokens) + 1
             if ed_image < ed_video:
-                t, h, w = (
-                    image_grid_thw[image_index][0],
-                    image_grid_thw[image_index][1],
-                    image_grid_thw[image_index][2],
-                )
+                t, h, w = image_grid_thw[image_index]
                 image_index += 1
                 remain_images -= 1
                 ed = ed_image
             else:
-                t, h, w = (
-                    video_grid_thw[video_index][0],
-                    video_grid_thw[video_index][1],
-                    video_grid_thw[video_index][2],
-                )
+                t, h, w = video_grid_thw[video_index]
                 video_second_per_grid_t = 1.0
                 if second_per_grid_ts:
                     video_second_per_grid_t = second_per_grid_ts[video_index]
diff --git a/vllm/model_executor/models/qwen3_omni_moe_thinker.py b/vllm/model_executor/models/qwen3_omni_moe_thinker.py
index 468b25220154..e6cb4442e2be 100755
--- a/vllm/model_executor/models/qwen3_omni_moe_thinker.py
+++ b/vllm/model_executor/models/qwen3_omni_moe_thinker.py
@@ -65,7 +65,7 @@
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.qwen2_audio import Qwen2AudioProcessingInfo
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import MultiModalKwargsItems
+from vllm.multimodal.inputs import MultiModalFeatureSpec, MultiModalKwargsItems
 from vllm.multimodal.parse import AudioProcessorItems, MultiModalDataItems
 from vllm.multimodal.processing import (
     BaseMultiModalProcessor,
@@ -1414,39 +1414,48 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor | None,
-        video_grid_thw: list[list[int]] | torch.Tensor | None,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        config = hf_config.thinker_config
-        if isinstance(image_grid_thw, list):
-            image_grid_thw = torch.tensor(image_grid_thw)
-        if isinstance(video_grid_thw, list):
-            video_grid_thw = torch.tensor(video_grid_thw)
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {
+                "image_grid_thw",
+                "video_grid_thw",
+                "second_per_grid_ts",
+                "audio_feature_lengths",
+                "use_audio_in_video",
+            },
+        )
+        image_grid_thw = kwargs.get("image_grid_thw", [])
+        video_grid_thw = kwargs.get("video_grid_thw", [])
+        second_per_grid_ts = kwargs.get("second_per_grid_ts", [])
+        audio_feature_lengths = kwargs.get("audio_feature_lengths", [])
+        use_audio_in_video = any(kwargs.get("use_audio_in_video", []))
+
+        image_grid_thw = (torch.stack if image_grid_thw else torch.tensor)(
+            image_grid_thw
+        )
+        video_grid_thw = (torch.stack if video_grid_thw else torch.tensor)(
+            video_grid_thw
+        )
+
         input_ids = torch.tensor(input_tokens)
         if input_ids is None or input_ids.ndim != 1:
             raise ValueError("_omni3_get_input_positions_tensor expects 1D input_ids")
 
         seq_len = input_ids.shape[0]
-        if audio_feature_lengths is not None and not isinstance(
-            audio_feature_lengths, torch.Tensor
-        ):
-            audio_feature_lengths = torch.as_tensor(
+
+        if isinstance(audio_feature_lengths, list):
+            audio_feature_lengths = torch.tensor(
                 audio_feature_lengths, dtype=torch.long
             )
-        if second_per_grid_ts is None:
-            if video_grid_thw is not None and video_grid_thw.numel() > 0:
-                second_per_grids = torch.ones(
-                    video_grid_thw.shape[0], dtype=torch.float32
-                )
-            else:
-                second_per_grids = torch.tensor([], dtype=torch.float32)
+
+        if not len(second_per_grid_ts) and len(video_grid_thw):
+            second_per_grids = torch.ones(len(video_grid_thw), dtype=torch.float32)
         else:
             second_per_grids = torch.tensor(second_per_grid_ts, dtype=torch.float32)
 
+        config = self.config
         spatial_merge_size = config.vision_config.spatial_merge_size
         image_token_id = config.image_token_id
         video_token_id = config.video_token_id
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index 1be35cde7dbd..97d4667d82e9 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -34,7 +34,7 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
-from transformers import BatchFeature, PretrainedConfig
+from transformers import BatchFeature
 from transformers.models.qwen2_vl import Qwen2VLImageProcessorFast
 from transformers.models.qwen2_vl.image_processing_qwen2_vl import (
     smart_resize as image_smart_resize,
@@ -70,6 +70,7 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (
     MultiModalDataDict,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalKwargsItem,
     MultiModalKwargsItems,
@@ -1416,17 +1417,18 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: PretrainedConfig,
-        image_grid_thw: list[list[int]] | torch.Tensor,
-        video_grid_thw: list[list[int]] | torch.Tensor,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        """Get mrope input positions and delta value."""
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {"image_grid_thw", "video_grid_thw"},
+        )
+        image_grid_thw = [item.tolist() for item in kwargs.get("image_grid_thw", [])]
+        video_grid_thw = [item.tolist() for item in kwargs.get("video_grid_thw", [])]
 
         video_grid_thw = [[1, h, w] for t, h, w in video_grid_thw for _ in range(t)]
 
+        hf_config = self.config
         image_token_id = hf_config.image_token_id
         video_token_id = hf_config.video_token_id
         vision_start_token_id = hf_config.vision_start_token_id
@@ -1455,20 +1457,12 @@ def get_mrope_input_positions(
             else:
                 ed_video = len(input_tokens) + 1
             if ed_image < ed_video:
-                t, h, w = (
-                    image_grid_thw[image_index][0],
-                    image_grid_thw[image_index][1],
-                    image_grid_thw[image_index][2],
-                )
+                t, h, w = image_grid_thw[image_index]
                 image_index += 1
                 remain_images -= 1
                 ed = ed_image
             else:
-                t, h, w = (
-                    video_grid_thw[video_index][0],
-                    video_grid_thw[video_index][1],
-                    video_grid_thw[video_index][2],
-                )
+                t, h, w = video_grid_thw[video_index]
                 video_index += 1
                 remain_videos -= 1
                 ed = ed_video
diff --git a/vllm/model_executor/models/transformers/multimodal.py b/vllm/model_executor/models/transformers/multimodal.py
index 476074542e6a..2efcef68d1c7 100644
--- a/vllm/model_executor/models/transformers/multimodal.py
+++ b/vllm/model_executor/models/transformers/multimodal.py
@@ -27,6 +27,7 @@
 from vllm.multimodal import MultiModalKwargsItems
 from vllm.multimodal.inputs import (
     MultiModalDataDict,
+    MultiModalFeatureSpec,
     MultiModalFieldConfig,
     MultiModalInputs,
     MultiModalUUIDDict,
@@ -38,7 +39,7 @@
 from vllm.sequence import IntermediateTensors
 
 if TYPE_CHECKING:
-    from transformers import BatchFeature, PretrainedConfig
+    from transformers import BatchFeature
 
     from vllm.config import VllmConfig
     from vllm.config.multimodal import BaseDummyOptions
@@ -367,20 +368,34 @@ def get_multimodal_embeddings(self, **kwargs):
     def get_mrope_input_positions(
         self,
         input_tokens: list[int],
-        hf_config: "PretrainedConfig",
-        image_grid_thw: list[list[int]] | torch.Tensor | None,
-        video_grid_thw: list[list[int]] | torch.Tensor | None,
-        second_per_grid_ts: list[float] | None = None,
-        audio_feature_lengths: torch.Tensor | None = None,
-        use_audio_in_video: bool = False,
+        mm_features: list[MultiModalFeatureSpec],
     ) -> tuple[torch.Tensor, int]:
-        if any((second_per_grid_ts, audio_feature_lengths, use_audio_in_video)):
+        kwargs = MultiModalFeatureSpec.gather_kwargs(
+            mm_features,
+            {
+                "image_grid_thw",
+                "video_grid_thw",
+                "second_per_grid_ts",
+                "audio_feature_lengths",
+                "use_audio_in_video",
+            },
+        )
+        if any(
+            v
+            for k, v in kwargs.items()
+            if k not in {"image_grid_thw", "video_grid_thw"}
+        ):
             raise NotImplementedError("Transformers backend only supports images.")
 
-        if isinstance(image_grid_thw, list):
-            image_grid_thw = torch.tensor(image_grid_thw)
-        if isinstance(video_grid_thw, list):
-            video_grid_thw = torch.tensor(video_grid_thw)
+        image_grid_thw = kwargs.get("image_grid_thw", [])
+        video_grid_thw = kwargs.get("video_grid_thw", [])
+
+        image_grid_thw = (torch.stack if image_grid_thw else torch.tensor)(
+            image_grid_thw
+        )
+        video_grid_thw = (torch.stack if video_grid_thw else torch.tensor)(
+            video_grid_thw
+        )
 
         mrope_positions, mrope_position_delta = self.model.get_rope_index(
             input_ids=torch.tensor(input_tokens).unsqueeze(0),
diff --git a/vllm/multimodal/inputs.py b/vllm/multimodal/inputs.py
index a05f54191f04..7518a023c5f5 100644
--- a/vllm/multimodal/inputs.py
+++ b/vllm/multimodal/inputs.py
@@ -249,6 +249,19 @@ class MultiModalFeatureSpec:
     mm_position: PlaceholderRange
     """e.g., PlaceholderRange(offset=2, length=336)"""
 
+    @staticmethod
+    def gather_kwargs(features: list["MultiModalFeatureSpec"], keys: set[str]):
+        kwargs = defaultdict[str, list[NestedTensors]](list)
+
+        for f in features:
+            item = f.data
+            if item is not None:
+                for k in keys:
+                    if k in item:
+                        kwargs[k].append(item[k].data)
+
+        return dict(kwargs)
+
 
 @dataclass
 class MultiModalFieldElem:
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 790649b69e5c..fbd3e5f31316 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -892,38 +892,13 @@ def _update_states_after_model_execute(
             self.input_batch.num_accepted_tokens_cpu[i] = num_tokens
 
     def _init_mrope_positions(self, req_state: CachedRequestState):
-        image_grid_thw = []
-        video_grid_thw = []
-        second_per_grid_ts = []
-        audio_feature_lengths = []
-        use_audio_in_video = False
-        for mm_feature in req_state.mm_features:
-            mm_item = mm_feature.data
-            if mm_item is None:
-                continue
-            mm_input = mm_item.get_data()
-            if (t := mm_input.get("image_grid_thw")) is not None:
-                image_grid_thw.append(t.tolist())
-            if (t := mm_input.get("video_grid_thw")) is not None:
-                video_grid_thw.append(t.tolist())
-            if (t := mm_input.get("second_per_grid_ts")) is not None:
-                second_per_grid_ts.append(t)
-            if (t := mm_input.get("audio_feature_lengths")) is not None:
-                audio_feature_lengths.append(t)
-            if mm_input.get("use_audio_in_video") is True:
-                use_audio_in_video = True
-
-        assert supports_mrope(self.get_model()), "M-RoPE support is not implemented."
+        model = self.get_model()
+        assert supports_mrope(model), "M-RoPE support is not implemented."
 
         req_state.mrope_positions, req_state.mrope_position_delta = (
-            self.model.get_mrope_input_positions(
+            model.get_mrope_input_positions(
                 req_state.prompt_token_ids,
-                hf_config=self.model_config.hf_config,
-                image_grid_thw=image_grid_thw,
-                video_grid_thw=video_grid_thw,
-                second_per_grid_ts=second_per_grid_ts,
-                audio_feature_lengths=audio_feature_lengths,
-                use_audio_in_video=use_audio_in_video,
+                req_state.mm_features,
             )
         )
 

From 3380543b2075abd6f3e6e283f4eacb307354e33a Mon Sep 17 00:00:00 2001
From: Ido Segev <segevido@gmail.com>
Date: Tue, 11 Nov 2025 15:41:18 +0200
Subject: [PATCH 055/183] Add request timeout override for multi-turn
 benchmarks (#28386)

Signed-off-by: Ido Segev <idos@pliops.com>
---
 .../benchmark_serving_multi_turn.py           | 40 ++++++++++++++++---
 1 file changed, 35 insertions(+), 5 deletions(-)

diff --git a/benchmarks/multi_turn/benchmark_serving_multi_turn.py b/benchmarks/multi_turn/benchmark_serving_multi_turn.py
index 5d2ac66e5ab9..2c1a051cc9c9 100644
--- a/benchmarks/multi_turn/benchmark_serving_multi_turn.py
+++ b/benchmarks/multi_turn/benchmark_serving_multi_turn.py
@@ -63,6 +63,7 @@ class RequestArgs(NamedTuple):
     stream: bool
     limit_min_tokens: int  # Use negative value for no limit
     limit_max_tokens: int  # Use negative value for no limit
+    timeout_sec: int
 
 
 class BenchmarkArgs(NamedTuple):
@@ -214,6 +215,7 @@ async def send_request(
     stream: bool = True,
     min_tokens: int | None = None,
     max_tokens: int | None = None,
+    timeout_sec: int = 120,
 ) -> ServerResponse:
     payload = {
         "model": model,
@@ -235,10 +237,16 @@ async def send_request(
     headers = {"Content-Type": "application/json"}
 
     # Calculate the timeout for the request
-    timeout_sec = 120
     if max_tokens is not None:
         # Assume TPOT of 200ms and use max_tokens to determine timeout
-        timeout_sec = max(timeout_sec, int(max_tokens * 0.2))
+        token_based_timeout = int(max_tokens * 0.2)
+        if token_based_timeout > timeout_sec:
+            timeout_sec = token_based_timeout
+            logger.info(
+                "Using timeout of %ds based on max_tokens %d",
+                timeout_sec,
+                max_tokens,
+            )
     timeout = aiohttp.ClientTimeout(total=timeout_sec)
 
     valid_response = True
@@ -409,6 +417,7 @@ async def send_turn(
         req_args.stream,
         min_tokens,
         max_tokens,
+        req_args.timeout_sec,
     )
 
     if response.valid is False:
@@ -676,8 +685,18 @@ async def client_main(
 
             except asyncio.exceptions.TimeoutError:
                 num_failures += 1
-                logger.exception(
-                    f"{Color.RED}Client {client_id} - Timeout during conversation ID {conv_id} (turn: {current_turn}){Color.RESET}"  # noqa: E501
+                logger.error(
+                    "%sClient %d - Timeout during conversation ID %s (turn: %d). "
+                    "Base timeout is %ss (set with --request-timeout-sec), but the "
+                    "effective timeout may be longer based on max_tokens. If this "
+                    "is unexpected, consider increasing the timeout or checking "
+                    "model performance.%s",
+                    Color.RED,
+                    client_id,
+                    conv_id,
+                    current_turn,
+                    req_args.timeout_sec,
+                    Color.RESET,
                 )
                 break  # Exit gracefully instead of raising an error
 
@@ -815,6 +834,9 @@ def get_client_config(
                 "Invalid min/max tokens limits (min should not be larger than max)"
             )
 
+    if args.request_timeout_sec <= 0:
+        raise ValueError("Request timeout must be a positive number")
+
     # Arguments for API requests
     chat_url = f"{args.url}/v1/chat/completions"
     model_name = args.served_model_name if args.served_model_name else args.model
@@ -825,6 +847,7 @@ def get_client_config(
         stream=not args.no_stream,
         limit_min_tokens=args.limit_min_tokens,
         limit_max_tokens=args.limit_max_tokens,
+        timeout_sec=args.request_timeout_sec,
     )
 
     return client_args, req_args
@@ -968,7 +991,7 @@ async def main_mp(
             f"(is alive: {client.is_alive()}){Color.RESET}"
         )
 
-        client.join(timeout=120)
+        client.join(timeout=req_args.timeout_sec + 1)
 
         if client.is_alive():
             logger.warning(
@@ -1351,6 +1374,13 @@ async def main() -> None:
         action="store_true",
         help="Verify the LLM output (compare to the answers in the input JSON file)",
     )
+    parser.add_argument(
+        "--request-timeout-sec",
+        type=int,
+        default=120,
+        help="Timeout in seconds for each API request (default: 120). "
+        "Automatically increased if max tokens imply longer decoding.",
+    )
 
     parser.add_argument(
         "--no-stream",

From fa1970201d2efae6db48ca808ba50b63390457db Mon Sep 17 00:00:00 2001
From: Maryam Tahhan <mtahhan@redhat.com>
Date: Tue, 11 Nov 2025 14:01:11 +0000
Subject: [PATCH 056/183] [Docs] Fix grammar in CPU installation guide (#28461)

Signed-off-by: Maryam Tahhan <mtahhan@redhat.com>
---
 docs/getting_started/installation/cpu.md | 14 +++++++-------
 1 file changed, 7 insertions(+), 7 deletions(-)

diff --git a/docs/getting_started/installation/cpu.md b/docs/getting_started/installation/cpu.md
index 2369eaed1802..dbfefa9a1fe5 100644
--- a/docs/getting_started/installation/cpu.md
+++ b/docs/getting_started/installation/cpu.md
@@ -93,7 +93,7 @@ Currently, there are no pre-built CPU wheels.
 
 ## Related runtime environment variables
 
-- `VLLM_CPU_KVCACHE_SPACE`: specify the KV Cache size (e.g, `VLLM_CPU_KVCACHE_SPACE=40` means 40 GiB space for KV cache), larger setting will allow vLLM running more requests in parallel. This parameter should be set based on the hardware configuration and memory management pattern of users. Default value is `0`.
+- `VLLM_CPU_KVCACHE_SPACE`: specify the KV Cache size (e.g, `VLLM_CPU_KVCACHE_SPACE=40` means 40 GiB space for KV cache), larger setting will allow vLLM to run more requests in parallel. This parameter should be set based on the hardware configuration and memory management pattern of users. Default value is `0`.
 - `VLLM_CPU_OMP_THREADS_BIND`: specify the CPU cores dedicated to the OpenMP threads, can be set as CPU id lists, `auto` (by default), or `nobind` (to disable binding to individual CPU cores and to inherit user-defined OpenMP variables). For example, `VLLM_CPU_OMP_THREADS_BIND=0-31` means there will be 32 OpenMP threads bound on 0-31 CPU cores. `VLLM_CPU_OMP_THREADS_BIND=0-31|32-63` means there will be 2 tensor parallel processes, 32 OpenMP threads of rank0 are bound on 0-31 CPU cores, and the OpenMP threads of rank1 are bound on 32-63 CPU cores. By setting to `auto`, the OpenMP threads of each rank are bound to the CPU cores in each NUMA node respectively. If set to `nobind`, the number of OpenMP threads is determined by the standard `OMP_NUM_THREADS` environment variable.
 - `VLLM_CPU_NUM_OF_RESERVED_CPU`: specify the number of CPU cores which are not dedicated to the OpenMP threads for each rank. The variable only takes effect when VLLM_CPU_OMP_THREADS_BIND is set to `auto`. Default value is `None`. If the value is not set and use `auto` thread binding, no CPU will be reserved for `world_size == 1`, 1 CPU per rank will be reserved for `world_size > 1`.
 - `CPU_VISIBLE_MEMORY_NODES`: specify visible NUMA memory nodes for vLLM CPU workers, similar to ```CUDA_VISIBLE_DEVICES```. The variable only takes effect when VLLM_CPU_OMP_THREADS_BIND is set to `auto`. The variable provides more control for the auto thread-binding feature, such as masking nodes and changing nodes binding sequence.
@@ -128,7 +128,7 @@ Note, it is recommended to manually reserve 1 CPU for vLLM front-end process whe
 
 ### How to decide `VLLM_CPU_OMP_THREADS_BIND`?
 
-- Default `auto` thread-binding is recommended for most cases. Ideally, each OpenMP thread will be bound to a dedicated physical core respectively, threads of each rank will be bound to a same NUMA node respectively, and 1 CPU per rank will be reserved for other vLLM components when `world_size > 1`. If have any performance problems or unexpected binding behaviours, please try to bind threads as following.
+- Default `auto` thread-binding is recommended for most cases. Ideally, each OpenMP thread will be bound to a dedicated physical core respectively, threads of each rank will be bound to the same NUMA node respectively, and 1 CPU per rank will be reserved for other vLLM components when `world_size > 1`. If you have any performance problems or unexpected binding behaviours, please try to bind threads as following.
 
 - On a hyper-threading enabled platform with 16 logical CPU cores / 8 physical CPU cores:
 
@@ -156,12 +156,12 @@ Note, it is recommended to manually reserve 1 CPU for vLLM front-end process whe
     14   0      0    6 6:6:6:0          yes 2401.0000 800.0000  800.000
     15   0      0    7 7:7:7:0          yes 2401.0000 800.0000  800.000
 
-    # On this platform, it is recommend to only bind openMP threads on logical CPU cores 0-7 or 8-15
+    # On this platform, it is recommended to only bind openMP threads on logical CPU cores 0-7 or 8-15
     $ export VLLM_CPU_OMP_THREADS_BIND=0-7
     $ python examples/offline_inference/basic/basic.py
     ```
 
-- When deploy vLLM CPU backend on a multi-socket machine with NUMA and enable tensor parallel or pipeline parallel, each NUMA node is treated as a TP/PP rank. So be aware to set CPU cores of a single rank on a same NUMA node to avoid cross NUMA node memory access.
+- When deploying vLLM CPU backend on a multi-socket machine with NUMA and enable tensor parallel or pipeline parallel, each NUMA node is treated as a TP/PP rank. So be aware to set CPU cores of a single rank on the same NUMA node to avoid cross NUMA node memory access.
 
 ### How to decide `VLLM_CPU_KVCACHE_SPACE`?
 
@@ -171,7 +171,7 @@ This value is 4GB by default. Larger space can support more concurrent requests,
 
 First of all, please make sure the thread-binding and KV cache space are properly set and take effect. You can check the thread-binding by running a vLLM benchmark and observing CPU cores usage via `htop`.
 
-Inference batch size is an important parameter for the performance. Larger batch usually provides higher throughput, smaller batch provides lower latency. Tuning max batch size starts from default value to balance throughput and latency is an effective way to improve vLLM CPU performance on specific platforms. There are two important related parameters in vLLM:
+Inference batch size is an important parameter for the performance. A larger batch usually provides higher throughput, a smaller batch provides lower latency. Tuning the max batch size starting from the default value to balance throughput and latency is an effective way to improve vLLM CPU performance on specific platforms. There are two important related parameters in vLLM:
 
 - `--max-num-batched-tokens`, defines the limit of token numbers in a single batch, has more impacts on the first token performance. The default value is set as:
     - Offline Inference: `4096 * world_size`
@@ -192,8 +192,8 @@ vLLM CPU supports data parallel (DP), tensor parallel (TP) and pipeline parallel
 ### (x86 only) What is the purpose of `VLLM_CPU_MOE_PREPACK` and `VLLM_CPU_SGL_KERNEL`?
 
 - Both of them require `amx` CPU flag.
-    - `VLLM_CPU_MOE_PREPACK` can provides better performance for MoE models
-    - `VLLM_CPU_SGL_KERNEL` can provides better performance for MoE models and small-batch scenarios.
+    - `VLLM_CPU_MOE_PREPACK` can provide better performance for MoE models
+    - `VLLM_CPU_SGL_KERNEL` can provide better performance for MoE models and small-batch scenarios.
 
 ### Why do I see `get_mempolicy: Operation not permitted` when running in Docker?
 

From a1448b4b69b15c33b4fbc9a883c4f3b9559ee7db Mon Sep 17 00:00:00 2001
From: bnellnm <49004751+bnellnm@users.noreply.github.com>
Date: Tue, 11 Nov 2025 09:29:02 -0500
Subject: [PATCH 057/183] [Kernels] Split up fused_moe/layer.py, isolate more
 modular kernel code (#28064)

---
 .../moe/modular_kernel_tools/mk_objects.py    |   9 +-
 vllm/lora/layers/fused_moe.py                 |   4 +-
 .../layers/fused_moe/__init__.py              |   4 +-
 .../layers/fused_moe/all2all_utils.py         | 160 +++
 .../layers/fused_moe/fused_moe_method_base.py | 112 +++
 .../fused_moe/fused_moe_modular_method.py     | 164 +++
 vllm/model_executor/layers/fused_moe/layer.py | 950 +-----------------
 .../layers/fused_moe/shared_fused_moe.py      |   2 +-
 .../fused_moe/unquantized_fused_moe_method.py | 578 +++++++++++
 .../layers/quantization/mxfp4.py              |  29 +-
 10 files changed, 1064 insertions(+), 948 deletions(-)
 create mode 100644 vllm/model_executor/layers/fused_moe/all2all_utils.py
 create mode 100644 vllm/model_executor/layers/fused_moe/fused_moe_method_base.py
 create mode 100644 vllm/model_executor/layers/fused_moe/fused_moe_modular_method.py
 create mode 100644 vllm/model_executor/layers/fused_moe/unquantized_fused_moe_method.py

diff --git a/tests/kernels/moe/modular_kernel_tools/mk_objects.py b/tests/kernels/moe/modular_kernel_tools/mk_objects.py
index 21eeffb1c726..d79fdfbe07af 100644
--- a/tests/kernels/moe/modular_kernel_tools/mk_objects.py
+++ b/tests/kernels/moe/modular_kernel_tools/mk_objects.py
@@ -6,6 +6,10 @@
 
 # Fused experts and PrepareFinalize imports
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
+from vllm.model_executor.layers.fused_moe import TritonExperts
+from vllm.model_executor.layers.fused_moe.all2all_utils import (
+    maybe_make_prepare_finalize,
+)
 from vllm.model_executor.layers.fused_moe.batched_deep_gemm_moe import (
     BatchedDeepGemmExperts,
 )
@@ -21,7 +25,6 @@
     BatchedTritonExperts,
     NaiveBatchedExperts,
 )
-from vllm.model_executor.layers.fused_moe.layer import FusedMoEMethodBase, TritonExperts
 from vllm.model_executor.layers.fused_moe.prepare_finalize import (
     MoEPrepareAndFinalizeNoEP,
 )
@@ -399,9 +402,7 @@ def make_prepare_finalize(
     quant_config: FusedMoEQuantConfig,
 ) -> mk.FusedMoEPrepareAndFinalize:
     if backend != "naive" and backend is not None:
-        prepare_finalize = FusedMoEMethodBase._maybe_make_prepare_finalize(
-            moe, quant_config
-        )
+        prepare_finalize = maybe_make_prepare_finalize(moe, quant_config)
         assert prepare_finalize is not None
         return prepare_finalize
     elif prepare_finalize_type == FlashInferCutlassMoEPrepareAndFinalize:
diff --git a/vllm/lora/layers/fused_moe.py b/vllm/lora/layers/fused_moe.py
index dadb9e25ba2f..8fb3efa220f6 100644
--- a/vllm/lora/layers/fused_moe.py
+++ b/vllm/lora/layers/fused_moe.py
@@ -25,7 +25,9 @@
     modular_triton_fused_moe,
     try_get_optimal_moe_config,
 )
-from vllm.model_executor.layers.fused_moe.layer import FusedMoEModularMethod
+from vllm.model_executor.layers.fused_moe.fused_moe_modular_method import (
+    FusedMoEModularMethod,
+)
 
 
 class FusedMoEWithLoRA(BaseLayerWithLoRA):
diff --git a/vllm/model_executor/layers/fused_moe/__init__.py b/vllm/model_executor/layers/fused_moe/__init__.py
index cb31045971bd..53d98d0650b4 100644
--- a/vllm/model_executor/layers/fused_moe/__init__.py
+++ b/vllm/model_executor/layers/fused_moe/__init__.py
@@ -5,9 +5,11 @@
 from typing import Any
 
 from vllm.model_executor.layers.fused_moe.config import FusedMoEConfig
+from vllm.model_executor.layers.fused_moe.fused_moe_method_base import (
+    FusedMoEMethodBase,
+)
 from vllm.model_executor.layers.fused_moe.layer import (
     FusedMoE,
-    FusedMoEMethodBase,
     FusedMoeWeightScaleSupported,
 )
 from vllm.model_executor.layers.fused_moe.modular_kernel import (
diff --git a/vllm/model_executor/layers/fused_moe/all2all_utils.py b/vllm/model_executor/layers/fused_moe/all2all_utils.py
new file mode 100644
index 000000000000..2dd625054339
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/all2all_utils.py
@@ -0,0 +1,160 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+
+import torch
+
+from vllm.distributed import (
+    get_ep_group,
+)
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEParallelConfig,
+    FusedMoEQuantConfig,
+)
+from vllm.model_executor.layers.fused_moe.modular_kernel import (
+    FusedMoEPrepareAndFinalize,
+)
+from vllm.platforms import current_platform
+from vllm.utils.import_utils import has_deep_ep, has_pplx
+
+if current_platform.is_cuda_alike():
+    if has_pplx():
+        from .pplx_prepare_finalize import (
+            PplxPrepareAndFinalize,
+            pplx_hidden_dim_scale_bytes,
+        )
+    if has_deep_ep():
+        from .deepep_ht_prepare_finalize import DeepEPHTPrepareAndFinalize
+        from .deepep_ll_prepare_finalize import (
+            DEEPEP_QUANT_BLOCK_SHAPE,
+            DeepEPLLPrepareAndFinalize,
+        )
+
+
+def maybe_roundup_layer_hidden_size(
+    hidden_size: int,
+    act_dtype: torch.dtype,
+    moe_parallel_config: FusedMoEParallelConfig,
+) -> int:
+    """
+    Given layer hidden size and MoE configurations, round up hidden_size
+    if necessary.
+
+    Args:
+        hidden_size: Layer hidden-size
+        act_dtype: Data type of the layer activations.
+        moe_parallel_config: Fused MoE parallelization strategy configuration.
+
+    Return:
+        Rounded up hidden_size if rounding up is required based on the configs
+        and all2all backend.
+        Original hidden size otherwise.
+    """
+    if moe_parallel_config.use_deepep_ht_kernels:
+        hidden_size = DeepEPHTPrepareAndFinalize.maybe_roundup_layer_hidden_size(
+            hidden_size, act_dtype
+        )
+
+    if moe_parallel_config.use_deepep_ll_kernels:
+        hidden_size = DeepEPLLPrepareAndFinalize.maybe_roundup_layer_hidden_size(
+            hidden_size
+        )
+
+    return hidden_size
+
+
+def maybe_make_prepare_finalize(
+    moe: FusedMoEConfig,
+    quant_config: FusedMoEQuantConfig | None,
+) -> FusedMoEPrepareAndFinalize | None:
+    if not moe.moe_parallel_config.use_all2all_kernels:
+        return None
+
+    all2all_manager = get_ep_group().device_communicator.all2all_manager
+    assert all2all_manager is not None
+
+    prepare_finalize: FusedMoEPrepareAndFinalize | None = None
+
+    # TODO: could allow this now
+    assert not moe.use_flashinfer_cutlass_kernels, "Must be created in modelopt.py"
+
+    if moe.use_pplx_kernels:
+        assert quant_config is not None
+
+        hidden_dim_bytes, hidden_scale_bytes = pplx_hidden_dim_scale_bytes(
+            moe.max_num_tokens,
+            moe.hidden_dim,
+            moe.in_dtype,
+            quant_config.quant_dtype,
+            per_act_token_quant=quant_config.per_act_token_quant,
+            block_shape=quant_config.block_shape,
+        )
+
+        all_to_all_args = dict(
+            max_num_tokens=moe.max_num_tokens,
+            num_experts=moe.num_experts,
+            experts_per_token=moe.experts_per_token,  # topk
+            rank=all2all_manager.rank,
+            world_size=all2all_manager.world_size,
+            # dp_size actually means tp_size, bug in pplx kernels
+            dp_size=all2all_manager.tp_group.world_size,
+            hidden_dim=moe.hidden_dim,
+            hidden_dim_bytes=hidden_dim_bytes,
+            hidden_dim_scale_bytes=hidden_scale_bytes,
+        )
+
+        num_dispatchers = (
+            all2all_manager.world_size // all2all_manager.tp_group.world_size
+        )
+
+        # Intranode pplx a2a takes a group name while internode does not.
+        if not all2all_manager.internode:
+            all_to_all_args["group_name"] = all2all_manager.cpu_group.group_name
+
+        handle = all2all_manager.get_handle(all_to_all_args)
+
+        prepare_finalize = PplxPrepareAndFinalize(
+            handle,
+            max_num_tokens=moe.max_num_tokens,
+            num_local_experts=moe.num_local_experts,
+            num_dispatchers=num_dispatchers,
+        )
+    elif moe.use_deepep_ht_kernels:
+        assert moe.dp_size == all2all_manager.dp_world_size
+
+        all_to_all_args = dict()
+        handle = all2all_manager.get_handle(all_to_all_args)
+        prepare_finalize = DeepEPHTPrepareAndFinalize(
+            handle,
+            num_dispatchers=all2all_manager.world_size,
+            dp_size=all2all_manager.dp_world_size,
+            rank_expert_offset=all2all_manager.rank * moe.num_local_experts,
+        )
+
+    elif moe.use_deepep_ll_kernels:
+        assert quant_config is not None
+        all_to_all_args = dict(
+            max_num_tokens_per_dp_rank=moe.max_num_tokens,
+            token_hidden_size=moe.hidden_dim,
+            num_ep_ranks=all2all_manager.world_size,
+            num_global_experts=moe.num_experts,
+            num_local_experts=moe.num_experts // all2all_manager.world_size,
+        )
+        handle = all2all_manager.get_handle(all_to_all_args)
+
+        # Note: We may want to use FP8 dispatch just to reduce
+        # data movement.
+        use_fp8_dispatch = (
+            quant_config.quant_dtype == current_platform.fp8_dtype()
+            and quant_config.block_shape == DEEPEP_QUANT_BLOCK_SHAPE
+        )
+
+        prepare_finalize = DeepEPLLPrepareAndFinalize(
+            handle,
+            max_tokens_per_rank=moe.max_num_tokens,
+            num_dispatchers=all2all_manager.world_size,
+            use_fp8_dispatch=use_fp8_dispatch,
+        )
+
+    return prepare_finalize
diff --git a/vllm/model_executor/layers/fused_moe/fused_moe_method_base.py b/vllm/model_executor/layers/fused_moe/fused_moe_method_base.py
new file mode 100644
index 000000000000..87f8c8d75a9b
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/fused_moe_method_base.py
@@ -0,0 +1,112 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from abc import abstractmethod
+from collections.abc import Callable
+
+import torch
+
+from vllm.logger import init_logger
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+)
+from vllm.model_executor.layers.fused_moe.modular_kernel import (
+    FusedMoEPermuteExpertsUnpermute,
+    FusedMoEPrepareAndFinalize,
+)
+from vllm.model_executor.layers.quantization.base_config import (
+    QuantizeMethodBase,
+)
+
+logger = init_logger(__name__)
+
+
+class FusedMoEMethodBase(QuantizeMethodBase):
+    def __init__(self, moe: FusedMoEConfig):
+        super().__init__()
+        self.moe: FusedMoEConfig = moe
+        self.moe_quant_config: FusedMoEQuantConfig | None = None
+
+    @abstractmethod
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
+        raise NotImplementedError
+
+    def uses_weight_scale_2_pattern(self) -> bool:
+        """
+        Returns True if this quantization method uses 'weight_scale_2' pattern
+        for per-tensor weight scales (e.g., FP4 variants), False otherwise.
+
+        This method should be overridden by subclasses that use the
+        'weight_scale_2' pattern instead of the standard 'weight_scale' pattern.
+        """
+        return False
+
+    def maybe_make_prepare_finalize(self) -> FusedMoEPrepareAndFinalize | None:
+        from .all2all_utils import maybe_make_prepare_finalize
+
+        return maybe_make_prepare_finalize(self.moe, self.moe_quant_config)
+
+    def select_gemm_impl(
+        self,
+        prepare_finalize: FusedMoEPrepareAndFinalize,
+        layer: torch.nn.Module,
+    ) -> FusedMoEPermuteExpertsUnpermute:
+        # based on the all2all implementation, select the appropriate
+        # gemm implementation
+        raise NotImplementedError(
+            f"{self.__class__.__name__} must select appropriate gemm "
+            "implementation based on the prepare_finalize"
+        )
+
+    @abstractmethod
+    def get_fused_moe_quant_config(
+        self, layer: torch.nn.Module
+    ) -> FusedMoEQuantConfig | None:
+        raise NotImplementedError
+
+    @property
+    def topk_indices_dtype(self) -> torch.dtype | None:
+        return None
+
+    @property
+    def supports_eplb(self) -> bool:
+        return False
+
+    @property
+    def allow_inplace(self) -> bool:
+        return False
+
+    @abstractmethod
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        router_logits: torch.Tensor,
+        top_k: int,
+        renormalize: bool,
+        use_grouped_topk: bool = False,
+        topk_group: int | None = None,
+        num_expert_group: int | None = None,
+        global_num_experts: int = -1,
+        expert_map: torch.Tensor | None = None,
+        custom_routing_function: Callable | None = None,
+        scoring_func: str = "softmax",
+        routed_scaling_factor: float = 1.0,
+        e_score_correction_bias: torch.Tensor | None = None,
+        apply_router_weight_on_input: bool = False,
+        activation: str = "silu",
+        enable_eplb: bool = False,
+        expert_load_view: torch.Tensor | None = None,
+        logical_to_physical_map: torch.Tensor | None = None,
+        logical_replica_count: torch.Tensor | None = None,
+    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
+        raise NotImplementedError
diff --git a/vllm/model_executor/layers/fused_moe/fused_moe_modular_method.py b/vllm/model_executor/layers/fused_moe/fused_moe_modular_method.py
new file mode 100644
index 000000000000..43974ba917e4
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/fused_moe_modular_method.py
@@ -0,0 +1,164 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from collections.abc import Callable
+
+import torch
+
+from vllm.logger import init_logger
+from vllm.model_executor.custom_op import CustomOp
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEQuantConfig,
+)
+from vllm.model_executor.layers.fused_moe.fused_moe_method_base import (
+    FusedMoEMethodBase,
+)
+from vllm.model_executor.layers.fused_moe.modular_kernel import (
+    FusedMoEModularKernel,
+    FusedMoEPrepareAndFinalize,
+)
+
+logger = init_logger(__name__)
+
+
+@CustomOp.register("modular_fused_moe")
+class FusedMoEModularMethod(FusedMoEMethodBase, CustomOp):
+    def __init__(
+        self, old_quant_method: FusedMoEMethodBase, experts: FusedMoEModularKernel
+    ):
+        super().__init__(old_quant_method.moe)
+        self.moe_quant_config = old_quant_method.moe_quant_config
+        self.fused_experts = experts
+        self.disable_expert_map = getattr(
+            old_quant_method,
+            "disable_expert_map",
+            not self.fused_experts.supports_expert_map(),
+        )
+        self.old_quant_method = old_quant_method
+        logger.debug("Swapping out %s", self.old_quant_method.__class__.__name__)
+
+    @staticmethod
+    def make(
+        moe_layer: torch.nn.Module,
+        old_quant_method: FusedMoEMethodBase,
+        prepare_finalize: FusedMoEPrepareAndFinalize,
+        shared_experts: torch.nn.Module | None,
+    ) -> "FusedMoEModularMethod":
+        return FusedMoEModularMethod(
+            old_quant_method,
+            FusedMoEModularKernel(
+                prepare_finalize,
+                old_quant_method.select_gemm_impl(prepare_finalize, moe_layer),
+                shared_experts,
+            ),
+        )
+
+    @property
+    def topk_indices_dtype(self) -> torch.dtype | None:
+        return self.fused_experts.prepare_finalize.topk_indices_dtype()
+
+    @property
+    def supports_eplb(self) -> bool:
+        return self.old_quant_method.supports_eplb
+
+    @property
+    def allow_inplace(self) -> bool:
+        return self.old_quant_method.allow_inplace
+
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
+        raise NotImplementedError
+
+    def get_fused_moe_quant_config(
+        self, layer: torch.nn.Module
+    ) -> FusedMoEQuantConfig | None:
+        return self.moe_quant_config
+
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        router_logits: torch.Tensor,
+        top_k: int,
+        renormalize: bool,
+        use_grouped_topk: bool = False,
+        topk_group: int | None = None,
+        num_expert_group: int | None = None,
+        global_num_experts: int = -1,
+        expert_map: torch.Tensor | None = None,
+        custom_routing_function: Callable | None = None,
+        scoring_func: str = "softmax",
+        routed_scaling_factor: float = 1.0,
+        e_score_correction_bias: torch.Tensor | None = None,
+        apply_router_weight_on_input: bool = False,
+        activation: str = "silu",
+        enable_eplb: bool = False,
+        expert_load_view: torch.Tensor | None = None,
+        logical_to_physical_map: torch.Tensor | None = None,
+        logical_replica_count: torch.Tensor | None = None,
+    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
+        # Is getattr needed?
+        zero_expert_num = getattr(layer, "zero_expert_num", 0)
+        zero_expert_type = getattr(layer, "zero_expert_type", None)
+
+        if enable_eplb:
+            if self.supports_eplb:
+                assert expert_load_view is not None
+                assert logical_to_physical_map is not None
+                assert logical_replica_count is not None
+            else:
+                raise NotImplementedError(
+                    "EPLB is not supported for "
+                    f"{self.old_quant_method.__class__.__name__}."
+                )
+
+        topk_weights, topk_ids, zero_expert_result = layer.select_experts(
+            hidden_states=x,
+            router_logits=router_logits,
+            use_grouped_topk=use_grouped_topk,
+            top_k=top_k,
+            renormalize=renormalize,
+            topk_group=topk_group,
+            num_expert_group=num_expert_group,
+            custom_routing_function=custom_routing_function,
+            scoring_func=scoring_func,
+            routed_scaling_factor=routed_scaling_factor,
+            e_score_correction_bias=e_score_correction_bias,
+            indices_type=self.topk_indices_dtype,
+            enable_eplb=enable_eplb,
+            expert_map=expert_map,
+            expert_load_view=expert_load_view,
+            logical_to_physical_map=logical_to_physical_map,
+            logical_replica_count=logical_replica_count,
+            global_num_experts=global_num_experts,
+            zero_expert_num=zero_expert_num,
+            zero_expert_type=zero_expert_type,
+        )
+
+        result = self.fused_experts(
+            hidden_states=x,
+            w1=layer.w13_weight,
+            w2=layer.w2_weight,
+            topk_weights=topk_weights,
+            topk_ids=topk_ids,
+            inplace=self.allow_inplace,
+            activation=activation,
+            global_num_experts=global_num_experts,
+            apply_router_weight_on_input=apply_router_weight_on_input,
+            expert_map=None if self.disable_expert_map else expert_map,
+        )
+
+        if zero_expert_num != 0 and zero_expert_type is not None:
+            assert not isinstance(result, tuple), (
+                "Shared + zero experts are mutually exclusive not yet supported"
+            )
+            return result, zero_expert_result
+        else:
+            return result
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index 39547cc83c7b..e198322ba7a8 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from abc import abstractmethod
 from collections.abc import Callable, Iterable
 from contextlib import nullcontext
 from enum import Enum
@@ -27,17 +26,13 @@
 from vllm.logger import init_logger
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.layers.fused_moe.config import (
-    FUSED_MOE_UNQUANTIZED_CONFIG,
     FusedMoEConfig,
     FusedMoEParallelConfig,
     FusedMoEQuantConfig,
     RoutingMethodType,
-    biased_moe_quant_config,
 )
 from vllm.model_executor.layers.fused_moe.fused_moe import zero_experts_compute_triton
 from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEActivationFormat,
-    FusedMoEModularKernel,
     FusedMoEPermuteExpertsUnpermute,
     FusedMoEPrepareAndFinalize,
 )
@@ -47,35 +42,17 @@
 from vllm.model_executor.layers.fused_moe.routing_simulator import RoutingSimulator
 from vllm.model_executor.layers.quantization.base_config import (
     QuantizationConfig,
-    QuantizeMethodBase,
 )
 from vllm.model_executor.layers.quantization.utils.flashinfer_utils import (
     is_flashinfer_supporting_global_sf,
 )
-from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
-from vllm.platforms.interface import CpuArchEnum
-from vllm.utils.flashinfer import has_flashinfer_cutlass_fused_moe
-from vllm.utils.import_utils import has_deep_ep, has_pplx
 from vllm.utils.math_utils import cdiv, round_up
 from vllm.utils.torch_utils import current_stream, direct_register_custom_op
 from vllm.v1.worker.ubatching import dbo_current_ubatch_id
 
 if current_platform.is_cuda_alike():
-    from .fused_batched_moe import BatchedTritonExperts
-    from .fused_moe import TritonExperts, eplb_map_to_physical_and_record, fused_experts
-
-    if has_pplx():
-        from .pplx_prepare_finalize import (
-            PplxPrepareAndFinalize,
-            pplx_hidden_dim_scale_bytes,
-        )
-    if has_deep_ep():
-        from .deepep_ht_prepare_finalize import DeepEPHTPrepareAndFinalize
-        from .deepep_ll_prepare_finalize import (
-            DEEPEP_QUANT_BLOCK_SHAPE,
-            DeepEPLLPrepareAndFinalize,
-        )
+    from .fused_moe import eplb_map_to_physical_and_record, fused_experts
 else:
     fused_experts = None  # type: ignore
     FusedMoEPermuteExpertsUnpermute = object  # type: ignore
@@ -102,6 +79,16 @@ def _eplb_map_to_physical_and_record(
 else:
     fused_moe_pallas = None  # type: ignore
 
+from vllm.model_executor.layers.fused_moe.fused_moe_method_base import (
+    FusedMoEMethodBase,
+)
+from vllm.model_executor.layers.fused_moe.fused_moe_modular_method import (
+    FusedMoEModularMethod,
+)
+from vllm.model_executor.layers.fused_moe.unquantized_fused_moe_method import (
+    UnquantizedFusedMoEMethod,
+)
+
 logger = init_logger(__name__)
 
 
@@ -112,885 +99,6 @@ class FusedMoeWeightScaleSupported(Enum):
     BLOCK = "block"
 
 
-class FusedMoEMethodBase(QuantizeMethodBase):
-    def __init__(self, moe: FusedMoEConfig):
-        super().__init__()
-        self.moe: FusedMoEConfig = moe
-        self.moe_quant_config: FusedMoEQuantConfig | None = None
-
-    @abstractmethod
-    def create_weights(
-        self,
-        layer: torch.nn.Module,
-        num_experts: int,
-        hidden_size: int,
-        intermediate_size_per_partition: int,
-        params_dtype: torch.dtype,
-        **extra_weight_attrs,
-    ):
-        raise NotImplementedError
-
-    def uses_weight_scale_2_pattern(self) -> bool:
-        """
-        Returns True if this quantization method uses 'weight_scale_2' pattern
-        for per-tensor weight scales (e.g., FP4 variants), False otherwise.
-
-        This method should be overridden by subclasses that use the
-        'weight_scale_2' pattern instead of the standard 'weight_scale' pattern.
-        """
-        return False
-
-    @staticmethod
-    def _maybe_make_prepare_finalize(
-        moe: FusedMoEConfig,
-        quant_config: FusedMoEQuantConfig | None,
-    ) -> FusedMoEPrepareAndFinalize | None:
-        all2all_manager = get_ep_group().device_communicator.all2all_manager
-        assert all2all_manager is not None
-
-        prepare_finalize: FusedMoEPrepareAndFinalize | None = None
-
-        # TODO: could allow this now
-        assert not moe.use_flashinfer_cutlass_kernels, "Must be created in modelopt.py"
-
-        if moe.use_pplx_kernels:
-            assert quant_config is not None
-
-            hidden_dim_bytes, hidden_scale_bytes = pplx_hidden_dim_scale_bytes(
-                moe.max_num_tokens,
-                moe.hidden_dim,
-                moe.in_dtype,
-                quant_config.quant_dtype,
-                per_act_token_quant=quant_config.per_act_token_quant,
-                block_shape=quant_config.block_shape,
-            )
-
-            all_to_all_args = dict(
-                max_num_tokens=moe.max_num_tokens,
-                num_experts=moe.num_experts,
-                experts_per_token=moe.experts_per_token,  # topk
-                rank=all2all_manager.rank,
-                world_size=all2all_manager.world_size,
-                # dp_size actually means tp_size, bug in pplx kernels
-                dp_size=all2all_manager.tp_group.world_size,
-                hidden_dim=moe.hidden_dim,
-                hidden_dim_bytes=hidden_dim_bytes,
-                hidden_dim_scale_bytes=hidden_scale_bytes,
-            )
-
-            num_dispatchers = (
-                all2all_manager.world_size // all2all_manager.tp_group.world_size
-            )
-
-            # Intranode pplx a2a takes a group name while internode does not.
-            if not all2all_manager.internode:
-                all_to_all_args["group_name"] = all2all_manager.cpu_group.group_name
-
-            handle = all2all_manager.get_handle(all_to_all_args)
-
-            prepare_finalize = PplxPrepareAndFinalize(
-                handle,
-                max_num_tokens=moe.max_num_tokens,
-                num_local_experts=moe.num_local_experts,
-                num_dispatchers=num_dispatchers,
-            )
-        elif moe.use_deepep_ht_kernels:
-            assert moe.dp_size == all2all_manager.dp_world_size
-
-            all_to_all_args = dict()
-            handle = all2all_manager.get_handle(all_to_all_args)
-            prepare_finalize = DeepEPHTPrepareAndFinalize(
-                handle,
-                num_dispatchers=all2all_manager.world_size,
-                dp_size=all2all_manager.dp_world_size,
-                rank_expert_offset=all2all_manager.rank * moe.num_local_experts,
-            )
-
-        elif moe.use_deepep_ll_kernels:
-            assert quant_config is not None
-            all_to_all_args = dict(
-                max_num_tokens_per_dp_rank=moe.max_num_tokens,
-                token_hidden_size=moe.hidden_dim,
-                num_ep_ranks=all2all_manager.world_size,
-                num_global_experts=moe.num_experts,
-                num_local_experts=moe.num_experts // all2all_manager.world_size,
-            )
-            handle = all2all_manager.get_handle(all_to_all_args)
-
-            # Note: We may want to use FP8 dispatch just to reduce
-            # data movement.
-            use_fp8_dispatch = (
-                quant_config.quant_dtype == current_platform.fp8_dtype()
-                and quant_config.block_shape == DEEPEP_QUANT_BLOCK_SHAPE
-            )
-
-            prepare_finalize = DeepEPLLPrepareAndFinalize(
-                handle,
-                max_tokens_per_rank=moe.max_num_tokens,
-                num_dispatchers=all2all_manager.world_size,
-                use_fp8_dispatch=use_fp8_dispatch,
-            )
-
-        return prepare_finalize
-
-    def maybe_make_prepare_finalize(self) -> FusedMoEPrepareAndFinalize | None:
-        if self.moe.moe_parallel_config.use_all2all_kernels:
-            return FusedMoEMethodBase._maybe_make_prepare_finalize(
-                self.moe, self.moe_quant_config
-            )
-        else:
-            return None
-
-    def maybe_init_modular_kernel(
-        self, layer: torch.nn.Module
-    ) -> FusedMoEModularKernel | None:
-        assert self.moe is not None
-
-        # We must get the quant config here so that the layer is
-        # completely initialized, i.e. all weights loaded and post
-        # processed.
-        self.moe_quant_config = self.get_fused_moe_quant_config(layer)
-
-        prepare_finalize = self.maybe_make_prepare_finalize()
-
-        if prepare_finalize is not None:
-            logger.debug(
-                "%s for %s(%s)", prepare_finalize.__class__.__name__, self, id(self)
-            )
-            experts = self.select_gemm_impl(prepare_finalize, layer)
-            return FusedMoEModularKernel(
-                prepare_finalize,
-                experts,
-                layer.shared_experts,
-            )
-        else:
-            return None
-
-    def select_gemm_impl(
-        self,
-        prepare_finalize: FusedMoEPrepareAndFinalize,
-        layer: torch.nn.Module,
-    ) -> FusedMoEPermuteExpertsUnpermute:
-        # based on the all2all implementation, select the appropriate
-        # gemm implementation
-        raise NotImplementedError(
-            f"{self.__class__.__name__} must select appropriate gemm "
-            "implementation based on the prepare_finalize"
-        )
-
-    @abstractmethod
-    def get_fused_moe_quant_config(
-        self, layer: torch.nn.Module
-    ) -> FusedMoEQuantConfig | None:
-        raise NotImplementedError
-
-    @property
-    def topk_indices_dtype(self) -> torch.dtype | None:
-        return None
-
-    @property
-    def supports_eplb(self) -> bool:
-        return False
-
-    @property
-    def allow_inplace(self) -> bool:
-        return False
-
-    @abstractmethod
-    def apply(
-        self,
-        layer: torch.nn.Module,
-        x: torch.Tensor,
-        router_logits: torch.Tensor,
-        top_k: int,
-        renormalize: bool,
-        use_grouped_topk: bool = False,
-        topk_group: int | None = None,
-        num_expert_group: int | None = None,
-        global_num_experts: int = -1,
-        expert_map: torch.Tensor | None = None,
-        custom_routing_function: Callable | None = None,
-        scoring_func: str = "softmax",
-        routed_scaling_factor: float = 1.0,
-        e_score_correction_bias: torch.Tensor | None = None,
-        apply_router_weight_on_input: bool = False,
-        activation: str = "silu",
-        enable_eplb: bool = False,
-        expert_load_view: torch.Tensor | None = None,
-        logical_to_physical_map: torch.Tensor | None = None,
-        logical_replica_count: torch.Tensor | None = None,
-    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
-        raise NotImplementedError
-
-
-@CustomOp.register("modular_fused_moe")
-class FusedMoEModularMethod(FusedMoEMethodBase, CustomOp):
-    def __init__(
-        self,
-        old_quant_method: FusedMoEMethodBase,
-        fused_experts: FusedMoEModularKernel,
-    ):
-        super().__init__(old_quant_method.moe)
-        # Find better way to copy attributes?  Should we even copy attributes?
-        # self.__dict__.update(old_quant_method.__dict__)
-        self.moe_quant_config = old_quant_method.moe_quant_config
-        self.fused_experts = fused_experts
-        self.disable_expert_map = getattr(
-            old_quant_method,
-            "disable_expert_map",
-            not fused_experts.supports_expert_map(),
-        )
-        self.old_quant_method = old_quant_method
-        logger.debug("Swapping out %s", self.old_quant_method.__class__.__name__)
-
-    @property
-    def topk_indices_dtype(self) -> torch.dtype | None:
-        return self.fused_experts.prepare_finalize.topk_indices_dtype()
-
-    @property
-    def supports_eplb(self) -> bool:
-        return self.old_quant_method.supports_eplb
-
-    @property
-    def allow_inplace(self) -> bool:
-        return self.old_quant_method.allow_inplace
-
-    def create_weights(
-        self,
-        layer: torch.nn.Module,
-        num_experts: int,
-        hidden_size: int,
-        intermediate_size_per_partition: int,
-        params_dtype: torch.dtype,
-        **extra_weight_attrs,
-    ):
-        raise NotImplementedError
-
-    def get_fused_moe_quant_config(
-        self, layer: torch.nn.Module
-    ) -> FusedMoEQuantConfig | None:
-        return self.moe_quant_config
-
-    def apply(
-        self,
-        layer: torch.nn.Module,
-        x: torch.Tensor,
-        router_logits: torch.Tensor,
-        top_k: int,
-        renormalize: bool,
-        use_grouped_topk: bool = False,
-        topk_group: int | None = None,
-        num_expert_group: int | None = None,
-        global_num_experts: int = -1,
-        expert_map: torch.Tensor | None = None,
-        custom_routing_function: Callable | None = None,
-        scoring_func: str = "softmax",
-        routed_scaling_factor: float = 1.0,
-        e_score_correction_bias: torch.Tensor | None = None,
-        apply_router_weight_on_input: bool = False,
-        activation: str = "silu",
-        enable_eplb: bool = False,
-        expert_load_view: torch.Tensor | None = None,
-        logical_to_physical_map: torch.Tensor | None = None,
-        logical_replica_count: torch.Tensor | None = None,
-    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
-        # Is getattr needed?
-        zero_expert_num = getattr(layer, "zero_expert_num", 0)
-        zero_expert_type = getattr(layer, "zero_expert_type", None)
-
-        if enable_eplb:
-            if self.supports_eplb:
-                assert expert_load_view is not None
-                assert logical_to_physical_map is not None
-                assert logical_replica_count is not None
-                assert isinstance(layer, FusedMoE)
-            else:
-                raise NotImplementedError(
-                    "EPLB is not supported for "
-                    f"{self.old_quant_method.__class__.__name__}."
-                )
-
-        topk_weights, topk_ids, zero_expert_result = FusedMoE.select_experts(
-            hidden_states=x,
-            router_logits=router_logits,
-            use_grouped_topk=use_grouped_topk,
-            top_k=top_k,
-            renormalize=renormalize,
-            topk_group=topk_group,
-            num_expert_group=num_expert_group,
-            custom_routing_function=custom_routing_function,
-            scoring_func=scoring_func,
-            routed_scaling_factor=routed_scaling_factor,
-            e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype,
-            enable_eplb=enable_eplb,
-            expert_map=expert_map,
-            expert_load_view=expert_load_view,
-            logical_to_physical_map=logical_to_physical_map,
-            logical_replica_count=logical_replica_count,
-            global_num_experts=global_num_experts,
-            zero_expert_num=zero_expert_num,
-            zero_expert_type=zero_expert_type,
-        )
-
-        result = self.fused_experts(
-            hidden_states=x,
-            w1=layer.w13_weight,
-            w2=layer.w2_weight,
-            topk_weights=topk_weights,
-            topk_ids=topk_ids,
-            inplace=self.allow_inplace,
-            activation=activation,
-            global_num_experts=global_num_experts,
-            apply_router_weight_on_input=apply_router_weight_on_input,
-            expert_map=None if self.disable_expert_map else expert_map,
-        )
-
-        if zero_expert_num != 0 and zero_expert_type is not None:
-            assert not isinstance(result, tuple), (
-                "Shared + zero experts are mutually exclusive not yet supported"
-            )
-            return result, zero_expert_result
-        else:
-            return result
-
-
-@CustomOp.register("unquantized_fused_moe")
-class UnquantizedFusedMoEMethod(FusedMoEMethodBase, CustomOp):
-    """MoE method without quantization."""
-
-    def __init__(self, moe: FusedMoEConfig):
-        super().__init__(moe)
-
-        self.rocm_aiter_moe_enabled = rocm_aiter_ops.is_fused_moe_enabled()
-        if self.rocm_aiter_moe_enabled:
-            from .rocm_aiter_fused_moe import rocm_aiter_fused_experts
-
-            self.rocm_aiter_fused_experts = rocm_aiter_fused_experts
-        else:
-            self.rocm_aiter_fused_experts = None  # type: ignore
-
-        # FlashInfer CUTLASS MoE is only supported on Hopper and later GPUS
-        self.flashinfer_cutlass_moe_enabled = (
-            has_flashinfer_cutlass_fused_moe()
-            and envs.VLLM_USE_FLASHINFER_MOE_FP16
-            and self.moe.moe_parallel_config.use_ep
-            and self.moe.moe_parallel_config.dp_size == 1
-            and current_platform.get_device_capability()[0] >= 9
-        )
-        if self.flashinfer_cutlass_moe_enabled:
-            logger.info_once(
-                "Enabling FlashInfer CUTLASS MoE for UnquantizedFusedMoEMethod"
-            )
-            from functools import partial
-
-            from .flashinfer_cutlass_moe import flashinfer_cutlass_moe
-
-            self.flashinfer_cutlass_moe = partial(
-                flashinfer_cutlass_moe,
-                quant_config=FUSED_MOE_UNQUANTIZED_CONFIG,
-                tp_rank=self.moe.moe_parallel_config.tp_rank,
-                tp_size=self.moe.moe_parallel_config.tp_size,
-                ep_rank=self.moe.moe_parallel_config.ep_rank,
-                ep_size=self.moe.moe_parallel_config.ep_size,
-            )
-        else:
-            if (
-                self.moe.moe_parallel_config.use_ep
-                and self.moe.moe_parallel_config.dp_size == 1
-            ):
-                logger.info_once(
-                    "FlashInfer CUTLASS MoE is available for EP"
-                    " but not enabled, consider setting"
-                    " VLLM_USE_FLASHINFER_MOE_FP16=1 to enable it.",
-                    scope="local",
-                )
-            elif self.moe.moe_parallel_config.dp_size > 1:
-                logger.info_once(
-                    "FlashInfer CUTLASS MoE is currently not available for DP.",
-                    scope="local",
-                )
-            self.flashinfer_cutlass_moe = None  # type: ignore
-
-    @property
-    def supports_eplb(self) -> bool:
-        return True
-
-    @property
-    def allow_inplace(self) -> bool:
-        return True
-
-    def maybe_make_prepare_finalize(self) -> FusedMoEPrepareAndFinalize | None:
-        if self.rocm_aiter_moe_enabled:
-            return None
-        else:
-            return super().maybe_make_prepare_finalize()
-
-    def select_gemm_impl(
-        self,
-        prepare_finalize: FusedMoEPrepareAndFinalize,
-        layer: torch.nn.Module,
-    ) -> FusedMoEPermuteExpertsUnpermute:
-        assert self.moe_quant_config is not None
-        if (
-            prepare_finalize.activation_format
-            == FusedMoEActivationFormat.BatchedExperts
-        ):
-            logger.debug("BatchedTritonExperts %s", self.moe)
-            return BatchedTritonExperts(
-                max_num_tokens=self.moe.max_num_tokens,
-                num_dispatchers=prepare_finalize.num_dispatchers(),
-                quant_config=self.moe_quant_config,
-            )
-        else:
-            logger.debug("TritonExperts %s", self.moe)
-            return TritonExperts(self.moe_quant_config)
-
-    def create_weights(
-        self,
-        layer: torch.nn.Module,
-        num_experts: int,
-        hidden_size: int,
-        intermediate_size_per_partition: int,
-        params_dtype: torch.dtype,
-        **extra_weight_attrs,
-    ):
-        if self.moe.is_act_and_mul:
-            w13_up_dim = 2 * intermediate_size_per_partition
-        else:
-            w13_up_dim = intermediate_size_per_partition
-        # Fused gate_up_proj (column parallel)
-        w13_weight = torch.nn.Parameter(
-            torch.empty(
-                num_experts,
-                w13_up_dim,
-                hidden_size,
-                dtype=params_dtype,
-            ),
-            requires_grad=False,
-        )
-        layer.register_parameter("w13_weight", w13_weight)
-        set_weight_attrs(w13_weight, extra_weight_attrs)
-        if self.moe.has_bias:
-            w13_bias = torch.nn.Parameter(
-                torch.zeros(num_experts, w13_up_dim, dtype=params_dtype),
-                requires_grad=False,
-            )
-            layer.register_parameter("w13_bias", w13_bias)
-            set_weight_attrs(w13_bias, extra_weight_attrs)
-        # down_proj (row parallel)
-        w2_weight = torch.nn.Parameter(
-            torch.empty(
-                num_experts,
-                hidden_size,
-                intermediate_size_per_partition,
-                dtype=params_dtype,
-            ),
-            requires_grad=False,
-        )
-        layer.register_parameter("w2_weight", w2_weight)
-        set_weight_attrs(w2_weight, extra_weight_attrs)
-        if self.moe.has_bias:
-            w2_bias = torch.nn.Parameter(
-                torch.zeros(num_experts, hidden_size, dtype=params_dtype),
-                requires_grad=False,
-            )
-            layer.register_parameter("w2_bias", w2_bias)
-            set_weight_attrs(w2_bias, extra_weight_attrs)
-
-    def _maybe_pad_weight(self, weight: torch.Tensor) -> torch.Tensor:
-        # Pad the weight tensor. This is an optimization on ROCm platform, which
-        # can benefit from tensors located far enough from one another in memory
-        if (
-            envs.VLLM_ROCM_MOE_PADDING
-            and current_platform.is_rocm()
-            and weight.stride(-1) == 1
-            and (weight.stride(-2) * weight.element_size()) % 512 == 0
-        ):
-            num_pad = 256 // weight.element_size()
-            weight = F.pad(weight, (0, num_pad), "constant", 0)[..., :-num_pad]
-            torch.cuda.empty_cache()
-
-        return weight
-
-    def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
-        super().process_weights_after_loading(layer)
-
-        # Padding the weight for better performance on ROCm
-        layer.w13_weight.data = self._maybe_pad_weight(layer.w13_weight.data)
-        layer.w2_weight.data = self._maybe_pad_weight(layer.w2_weight.data)
-
-        if self.rocm_aiter_moe_enabled:
-            shuffled_w13, shuffled_w2 = rocm_aiter_ops.shuffle_weights(
-                layer.w13_weight.data, layer.w2_weight.data
-            )
-
-            layer.w13_weight.data = shuffled_w13
-            layer.w2_weight.data = shuffled_w2
-
-        if self.flashinfer_cutlass_moe_enabled:
-            # Swap halves to arrange as [w3; w1] (kernel expectation)
-            w1_w, w3_w = torch.chunk(layer.w13_weight.data, 2, dim=1)
-            w13_weight_swapped = torch.cat([w3_w, w1_w], dim=1)
-            layer.w13_weight.data = w13_weight_swapped.contiguous()
-
-        if current_platform.is_xpu():
-            import intel_extension_for_pytorch as ipex
-
-            ep_rank_start = self.moe.ep_rank * self.moe.num_local_experts
-            layer.ipex_fusion = ipex.llm.modules.GatedMLPMOE(
-                layer.w13_weight,
-                layer.w2_weight,
-                use_prepack=True,
-                experts_start_id=ep_rank_start,
-            )
-        elif current_platform.is_cpu():
-            from vllm.model_executor.layers.fused_moe import cpu_fused_moe
-
-            if current_platform.get_cpu_architecture() == CpuArchEnum.X86:
-                from vllm.model_executor.layers.utils import check_cpu_sgl_kernel
-
-                dtype_w13 = layer.w13_weight.dtype
-                _, n_w13, k_w13 = layer.w13_weight.size()
-                dtype_w2 = layer.w2_weight.dtype
-                _, n_w2, k_w2 = layer.w2_weight.size()
-                if (
-                    envs.VLLM_CPU_SGL_KERNEL
-                    and check_cpu_sgl_kernel(n_w13, k_w13, dtype_w13)
-                    and check_cpu_sgl_kernel(n_w2, k_w2, dtype_w2)
-                ):
-                    packed_w13_weight = torch.ops._C.convert_weight_packed(
-                        layer.w13_weight
-                    )
-                    assert packed_w13_weight.size() == layer.w13_weight.size()
-                    layer.w13_weight.copy_(packed_w13_weight)
-                    del packed_w13_weight
-                    packed_w2_weight = torch.ops._C.convert_weight_packed(
-                        layer.w2_weight
-                    )
-                    assert packed_w2_weight.size() == layer.w2_weight.size()
-                    layer.w2_weight.copy_(packed_w2_weight)
-                    layer.cpu_fused_moe = cpu_fused_moe.SGLFusedMOE(layer)
-                else:
-                    layer.cpu_fused_moe = cpu_fused_moe.IPEXFusedMOE(layer)
-            else:
-                layer.cpu_fused_moe = cpu_fused_moe.CPUFusedMOE(layer)
-
-    def apply(
-        self,
-        layer: torch.nn.Module,
-        x: torch.Tensor,
-        router_logits: torch.Tensor,
-        top_k: int,
-        renormalize: bool,
-        use_grouped_topk: bool = False,
-        topk_group: int | None = None,
-        num_expert_group: int | None = None,
-        global_num_experts: int = -1,
-        expert_map: torch.Tensor | None = None,
-        custom_routing_function: Callable | None = None,
-        scoring_func: str = "softmax",
-        routed_scaling_factor: float = 1.0,
-        e_score_correction_bias: torch.Tensor | None = None,
-        apply_router_weight_on_input: bool = False,
-        activation: str = "silu",
-        enable_eplb: bool = False,
-        expert_load_view: torch.Tensor | None = None,
-        logical_to_physical_map: torch.Tensor | None = None,
-        logical_replica_count: torch.Tensor | None = None,
-    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
-        if enable_eplb:
-            assert expert_load_view is not None
-            assert logical_to_physical_map is not None
-            assert logical_replica_count is not None
-            assert isinstance(layer, FusedMoE)
-
-        return self.forward(
-            x=x,
-            layer=layer,
-            router_logits=router_logits,
-            top_k=top_k,
-            renormalize=renormalize,
-            use_grouped_topk=use_grouped_topk,
-            topk_group=topk_group,
-            num_expert_group=num_expert_group,
-            global_num_experts=global_num_experts,
-            expert_map=expert_map,
-            custom_routing_function=custom_routing_function,
-            scoring_func=scoring_func,
-            routed_scaling_factor=routed_scaling_factor,
-            e_score_correction_bias=e_score_correction_bias,
-            activation=activation,
-            apply_router_weight_on_input=apply_router_weight_on_input,
-            enable_eplb=enable_eplb,
-            expert_load_view=expert_load_view,
-            logical_to_physical_map=logical_to_physical_map,
-            logical_replica_count=logical_replica_count,
-        )
-
-    def get_fused_moe_quant_config(
-        self, layer: torch.nn.Module
-    ) -> FusedMoEQuantConfig | None:
-        if self.moe.has_bias:
-            return biased_moe_quant_config(
-                layer.w13_bias,
-                layer.w2_bias,
-            )
-        else:
-            return FUSED_MOE_UNQUANTIZED_CONFIG
-
-    def forward_cuda(
-        self,
-        layer: torch.nn.Module,
-        x: torch.Tensor,
-        use_grouped_topk: bool,
-        top_k: int,
-        router_logits: torch.Tensor,
-        renormalize: bool,
-        topk_group: int | None = None,
-        num_expert_group: int | None = None,
-        global_num_experts: int = -1,
-        expert_map: torch.Tensor | None = None,
-        custom_routing_function: Callable | None = None,
-        scoring_func: str = "softmax",
-        routed_scaling_factor: float = 1.0,
-        e_score_correction_bias: torch.Tensor | None = None,
-        apply_router_weight_on_input: bool = False,
-        activation: str = "silu",
-        enable_eplb: bool = False,
-        expert_load_view: torch.Tensor | None = None,
-        logical_to_physical_map: torch.Tensor | None = None,
-        logical_replica_count: torch.Tensor | None = None,
-    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
-        zero_expert_num = getattr(layer, "zero_expert_num", 0)
-        zero_expert_type = getattr(layer, "zero_expert_type", None)
-
-        topk_weights, topk_ids, zero_expert_result = FusedMoE.select_experts(
-            hidden_states=x,
-            router_logits=router_logits,
-            use_grouped_topk=use_grouped_topk,
-            top_k=top_k,
-            renormalize=renormalize,
-            topk_group=topk_group,
-            num_expert_group=num_expert_group,
-            custom_routing_function=custom_routing_function,
-            scoring_func=scoring_func,
-            routed_scaling_factor=routed_scaling_factor,
-            e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype,
-            enable_eplb=enable_eplb,
-            expert_map=expert_map,
-            expert_load_view=expert_load_view,
-            logical_to_physical_map=logical_to_physical_map,
-            logical_replica_count=logical_replica_count,
-            global_num_experts=global_num_experts,
-            zero_expert_num=zero_expert_num,
-            zero_expert_type=zero_expert_type,
-            num_fused_shared_experts=layer.num_fused_shared_experts,
-        )
-
-        if self.rocm_aiter_moe_enabled:
-            result = self.rocm_aiter_fused_experts(
-                hidden_states=x,
-                w1=layer.w13_weight,
-                w2=layer.w2_weight,
-                topk_weights=topk_weights,
-                topk_ids=topk_ids,
-                expert_map=expert_map,
-                activation=activation,
-                apply_router_weight_on_input=apply_router_weight_on_input,
-            )
-        elif self.flashinfer_cutlass_moe_enabled:
-            return self.flashinfer_cutlass_moe(
-                hidden_states=x,
-                w1=layer.w13_weight,
-                w2=layer.w2_weight,
-                topk_weights=topk_weights,
-                topk_ids=topk_ids,
-                activation=activation,
-                apply_router_weight_on_input=apply_router_weight_on_input,
-            )
-        else:
-            result = fused_experts(
-                hidden_states=x,
-                w1=layer.w13_weight,
-                w2=layer.w2_weight,
-                topk_weights=topk_weights,
-                topk_ids=topk_ids,
-                inplace=True,
-                activation=activation,
-                quant_config=self.moe_quant_config,
-                apply_router_weight_on_input=apply_router_weight_on_input,
-                global_num_experts=global_num_experts,
-                expert_map=expert_map,
-            )
-
-        if zero_expert_num != 0 and zero_expert_type is not None:
-            assert not isinstance(result, tuple), (
-                "Shared + zero experts are mutually exclusive not yet supported"
-            )
-            return result, zero_expert_result
-        else:
-            return result
-
-    def forward_cpu(
-        self,
-        layer: torch.nn.Module,
-        x: torch.Tensor,
-        use_grouped_topk: bool,
-        top_k: int,
-        router_logits: torch.Tensor,
-        renormalize: bool,
-        topk_group: int | None = None,
-        num_expert_group: int | None = None,
-        global_num_experts: int = -1,
-        expert_map: torch.Tensor | None = None,
-        custom_routing_function: Callable | None = None,
-        scoring_func: str = "softmax",
-        routed_scaling_factor: float = 1.0,
-        e_score_correction_bias: torch.Tensor | None = None,
-        apply_router_weight_on_input: bool = False,
-        activation: str = "silu",
-        enable_eplb: bool = False,
-        expert_load_view: torch.Tensor | None = None,
-        logical_to_physical_map: torch.Tensor | None = None,
-        logical_replica_count: torch.Tensor | None = None,
-    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
-        if (
-            enable_eplb is not False
-            or expert_load_view is not None
-            or logical_to_physical_map is not None
-            or logical_replica_count is not None
-        ):
-            raise NotImplementedError("Expert load balancing is not supported for CPU.")
-        return layer.cpu_fused_moe(
-            layer,
-            x,
-            use_grouped_topk,
-            top_k,
-            router_logits,
-            renormalize,
-            topk_group,
-            num_expert_group,
-            global_num_experts,
-            expert_map,
-            custom_routing_function,
-            scoring_func,
-            routed_scaling_factor,
-            e_score_correction_bias,
-            apply_router_weight_on_input,
-            activation,
-        )
-
-    def forward_xpu(
-        self,
-        layer: torch.nn.Module,
-        x: torch.Tensor,
-        use_grouped_topk: bool,
-        top_k: int,
-        router_logits: torch.Tensor,
-        renormalize: bool,
-        topk_group: int | None = None,
-        num_expert_group: int | None = None,
-        global_num_experts: int = -1,
-        expert_map: torch.Tensor | None = None,
-        custom_routing_function: Callable | None = None,
-        scoring_func: str = "softmax",
-        routed_scaling_factor: float = 1.0,
-        e_score_correction_bias: torch.Tensor | None = None,
-        apply_router_weight_on_input: bool = False,
-        activation: str = "silu",
-        enable_eplb: bool = False,
-        expert_load_view: torch.Tensor | None = None,
-        logical_to_physical_map: torch.Tensor | None = None,
-        logical_replica_count: torch.Tensor | None = None,
-    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
-        if (
-            enable_eplb is not False
-            or expert_load_view is not None
-            or logical_to_physical_map is not None
-            or logical_replica_count is not None
-        ):
-            raise NotImplementedError("Expert load balancing is not supported for XPU.")
-        return layer.ipex_fusion(
-            x,
-            use_grouped_topk,
-            top_k,
-            router_logits,
-            renormalize,
-            topk_group,
-            num_expert_group,
-            custom_routing_function=custom_routing_function,
-        )
-
-    def forward_tpu(
-        self,
-        layer: torch.nn.Module,
-        x: torch.Tensor,
-        use_grouped_topk: bool,
-        top_k: int,
-        router_logits: torch.Tensor,
-        renormalize: bool,
-        topk_group: int | None = None,
-        num_expert_group: int | None = None,
-        global_num_experts: int = -1,
-        expert_map: torch.Tensor | None = None,
-        custom_routing_function: Callable | None = None,
-        scoring_func: str = "softmax",
-        routed_scaling_factor: float = 1.0,
-        e_score_correction_bias: torch.Tensor | None = None,
-        apply_router_weight_on_input: bool = False,
-        activation: str = "silu",
-        enable_eplb: bool = False,
-        expert_load_view: torch.Tensor | None = None,
-        logical_to_physical_map: torch.Tensor | None = None,
-        logical_replica_count: torch.Tensor | None = None,
-    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
-        assert not use_grouped_topk
-        assert num_expert_group is None
-        assert topk_group is None
-        assert custom_routing_function is None
-        assert apply_router_weight_on_input is False
-        if scoring_func != "softmax":
-            raise NotImplementedError(
-                "Only softmax scoring function is supported for TPU."
-            )
-        if e_score_correction_bias is not None:
-            raise NotImplementedError(
-                "Expert score correction bias is not supported for TPU."
-            )
-        assert activation == "silu", f"{activation} is not supported for TPU."
-        assert routed_scaling_factor == 1.0, (
-            f"routed_scaling_factor {routed_scaling_factor} is not supported for TPU."
-        )
-        if (
-            enable_eplb is not False
-            or expert_load_view is not None
-            or logical_to_physical_map is not None
-            or logical_replica_count is not None
-        ):
-            raise NotImplementedError("Expert load balancing is not supported for TPU.")
-        return fused_moe_pallas(
-            hidden_states=x,
-            w1=layer.w13_weight,
-            w2=layer.w2_weight,
-            topk=top_k,
-            gating_output=router_logits,
-            global_num_experts=global_num_experts,
-            expert_map=expert_map,
-            renormalize=renormalize,
-        )
-
-    if current_platform.is_tpu():
-        forward_native = forward_tpu
-    elif current_platform.is_cpu():
-        forward_native = forward_cpu
-    elif current_platform.is_xpu():
-        forward_native = forward_xpu
-    else:
-        forward_native = forward_cuda
-
-
 def determine_expert_map(
     ep_size: int,
     ep_rank: int,
@@ -1125,16 +233,13 @@ def maybe_roundup_hidden_size(
         Rounded up hidden_size if rounding up is required based on the configs.
         Original hidden size otherwise.
     """
+    from vllm.model_executor.layers.fused_moe.all2all_utils import (
+        maybe_roundup_layer_hidden_size,
+    )
 
-    if moe_parallel_config.use_deepep_ht_kernels:
-        hidden_size = DeepEPHTPrepareAndFinalize.maybe_roundup_layer_hidden_size(
-            hidden_size, act_dtype
-        )
-
-    if moe_parallel_config.use_deepep_ll_kernels:
-        hidden_size = DeepEPLLPrepareAndFinalize.maybe_roundup_layer_hidden_size(
-            hidden_size
-        )
+    hidden_size = maybe_roundup_layer_hidden_size(
+        hidden_size, act_dtype, moe_parallel_config
+    )
 
     # we are padding globally so EP buffer allocation works
     if quant_config and quant_config.get_name() == "mxfp4":
@@ -1430,7 +535,6 @@ def __init__(
             is_lora_enabled=vllm_config.lora_config is not None,
         )
 
-        self.moe_quant_config: FusedMoEQuantConfig | None = None
         self.quant_config = quant_config
 
         def _get_quant_method() -> FusedMoEMethodBase:
@@ -1508,9 +612,15 @@ def _get_quant_method() -> FusedMoEMethodBase:
     # This is called after all weight loading and post-processing, so it
     # should be safe to swap out the quant_method.
     def maybe_init_modular_kernel(self) -> None:
-        mk = self.quant_method.maybe_init_modular_kernel(self)
-        if mk is not None:
-            self.quant_method = FusedMoEModularMethod(self.quant_method, mk)
+        self.ensure_moe_quant_config_init()
+        prepare_finalize = self.quant_method.maybe_make_prepare_finalize()
+        if prepare_finalize is not None:
+            logger.debug(
+                "%s for %s(%s)", prepare_finalize.__class__.__name__, self, id(self)
+            )
+            self.quant_method = FusedMoEModularMethod.make(
+                self, self.quant_method, prepare_finalize, self.shared_experts
+            )
 
     @property
     def shared_experts(self) -> torch.nn.Module | None:
@@ -2142,12 +1252,16 @@ def set_eplb_state(
 
     def ensure_moe_quant_config_init(self):
         if self.quant_method.moe_quant_config is None:
+            # Note: the moe_quant_config can't be constructed until after
+            # weight loading post processing.
             self.quant_method.moe_quant_config = (
                 self.quant_method.get_fused_moe_quant_config(self)
             )
 
-        if self.moe_quant_config is None:
-            self.moe_quant_config = self.quant_method.moe_quant_config
+    @property
+    def moe_quant_config(self) -> FusedMoEQuantConfig | None:
+        self.ensure_moe_quant_config_init()
+        return self.quant_method.moe_quant_config
 
     def ensure_dp_chunking_init(self):
         if not self.use_dp_chunking or self.batched_hidden_states is not None:
diff --git a/vllm/model_executor/layers/fused_moe/shared_fused_moe.py b/vllm/model_executor/layers/fused_moe/shared_fused_moe.py
index 3d0c5636d6c0..06112ca51b6d 100644
--- a/vllm/model_executor/layers/fused_moe/shared_fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/shared_fused_moe.py
@@ -38,7 +38,7 @@ def __init__(
             and not (
                 # TODO(wentao): find the root cause and remove this condition
                 self.enable_eplb
-                or (self.use_flashinfer_cutlass_kernels and self.dp_size > 1)
+                or (self.moe_config.use_flashinfer_cutlass_kernels and self.dp_size > 1)
             )
             and self._shared_experts is not None
         )
diff --git a/vllm/model_executor/layers/fused_moe/unquantized_fused_moe_method.py b/vllm/model_executor/layers/fused_moe/unquantized_fused_moe_method.py
new file mode 100644
index 000000000000..ce56887f1c26
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/unquantized_fused_moe_method.py
@@ -0,0 +1,578 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from collections.abc import Callable
+
+import torch
+import torch.nn.functional as F
+
+import vllm.envs as envs
+from vllm._aiter_ops import rocm_aiter_ops
+from vllm.logger import init_logger
+from vllm.model_executor.custom_op import CustomOp
+from vllm.model_executor.layers.fused_moe.config import (
+    FUSED_MOE_UNQUANTIZED_CONFIG,
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+    biased_moe_quant_config,
+)
+from vllm.model_executor.layers.fused_moe.fused_moe_method_base import (
+    FusedMoEMethodBase,
+)
+from vllm.model_executor.layers.fused_moe.modular_kernel import (
+    FusedMoEActivationFormat,
+    FusedMoEPermuteExpertsUnpermute,
+    FusedMoEPrepareAndFinalize,
+)
+from vllm.model_executor.utils import set_weight_attrs
+from vllm.platforms import current_platform
+from vllm.platforms.interface import CpuArchEnum
+from vllm.utils.flashinfer import has_flashinfer_cutlass_fused_moe
+
+if current_platform.is_cuda_alike():
+    from .fused_batched_moe import BatchedTritonExperts
+    from .fused_moe import TritonExperts, fused_experts
+else:
+    fused_experts = None  # type: ignore
+
+if current_platform.is_tpu():
+    from .moe_pallas import fused_moe as fused_moe_pallas
+else:
+    fused_moe_pallas = None  # type: ignore
+
+logger = init_logger(__name__)
+
+
+@CustomOp.register("unquantized_fused_moe")
+class UnquantizedFusedMoEMethod(FusedMoEMethodBase, CustomOp):
+    """MoE method without quantization."""
+
+    def __init__(self, moe: FusedMoEConfig):
+        super().__init__(moe)
+
+        self.rocm_aiter_moe_enabled = rocm_aiter_ops.is_fused_moe_enabled()
+        if self.rocm_aiter_moe_enabled:
+            from .rocm_aiter_fused_moe import rocm_aiter_fused_experts
+
+            self.rocm_aiter_fused_experts = rocm_aiter_fused_experts
+        else:
+            self.rocm_aiter_fused_experts = None  # type: ignore
+
+        # FlashInfer CUTLASS MoE is only supported on Hopper and later GPUS
+        self.flashinfer_cutlass_moe_enabled = (
+            has_flashinfer_cutlass_fused_moe()
+            and envs.VLLM_USE_FLASHINFER_MOE_FP16
+            and self.moe.moe_parallel_config.use_ep
+            and self.moe.moe_parallel_config.dp_size == 1
+            and current_platform.get_device_capability()[0] >= 9
+        )
+        if self.flashinfer_cutlass_moe_enabled:
+            logger.info_once(
+                "Enabling FlashInfer CUTLASS MoE for UnquantizedFusedMoEMethod"
+            )
+            from functools import partial
+
+            from .flashinfer_cutlass_moe import flashinfer_cutlass_moe
+
+            self.flashinfer_cutlass_moe = partial(
+                flashinfer_cutlass_moe,
+                quant_config=FUSED_MOE_UNQUANTIZED_CONFIG,
+                tp_rank=self.moe.moe_parallel_config.tp_rank,
+                tp_size=self.moe.moe_parallel_config.tp_size,
+                ep_rank=self.moe.moe_parallel_config.ep_rank,
+                ep_size=self.moe.moe_parallel_config.ep_size,
+            )
+        else:
+            if (
+                self.moe.moe_parallel_config.use_ep
+                and self.moe.moe_parallel_config.dp_size == 1
+            ):
+                logger.info_once(
+                    "FlashInfer CUTLASS MoE is available for EP"
+                    " but not enabled, consider setting"
+                    " VLLM_USE_FLASHINFER_MOE_FP16=1 to enable it.",
+                    scope="local",
+                )
+            elif self.moe.moe_parallel_config.dp_size > 1:
+                logger.info_once(
+                    "FlashInfer CUTLASS MoE is currently not available for DP.",
+                    scope="local",
+                )
+            self.flashinfer_cutlass_moe = None  # type: ignore
+
+    @property
+    def supports_eplb(self) -> bool:
+        return True
+
+    @property
+    def allow_inplace(self) -> bool:
+        return True
+
+    def maybe_make_prepare_finalize(self) -> FusedMoEPrepareAndFinalize | None:
+        if self.rocm_aiter_moe_enabled:
+            return None
+        else:
+            return super().maybe_make_prepare_finalize()
+
+    def select_gemm_impl(
+        self,
+        prepare_finalize: FusedMoEPrepareAndFinalize,
+        layer: torch.nn.Module,
+    ) -> FusedMoEPermuteExpertsUnpermute:
+        assert self.moe_quant_config is not None
+        if (
+            prepare_finalize.activation_format
+            == FusedMoEActivationFormat.BatchedExperts
+        ):
+            logger.debug("BatchedTritonExperts %s", self.moe)
+            return BatchedTritonExperts(
+                max_num_tokens=self.moe.max_num_tokens,
+                num_dispatchers=prepare_finalize.num_dispatchers(),
+                quant_config=self.moe_quant_config,
+            )
+        else:
+            logger.debug("TritonExperts %s", self.moe)
+            return TritonExperts(self.moe_quant_config)
+
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
+        if self.moe.is_act_and_mul:
+            w13_up_dim = 2 * intermediate_size_per_partition
+        else:
+            w13_up_dim = intermediate_size_per_partition
+        # Fused gate_up_proj (column parallel)
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                w13_up_dim,
+                hidden_size,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
+        layer.register_parameter("w13_weight", w13_weight)
+        set_weight_attrs(w13_weight, extra_weight_attrs)
+        if self.moe.has_bias:
+            w13_bias = torch.nn.Parameter(
+                torch.zeros(num_experts, w13_up_dim, dtype=params_dtype),
+                requires_grad=False,
+            )
+            layer.register_parameter("w13_bias", w13_bias)
+            set_weight_attrs(w13_bias, extra_weight_attrs)
+        # down_proj (row parallel)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
+        layer.register_parameter("w2_weight", w2_weight)
+        set_weight_attrs(w2_weight, extra_weight_attrs)
+        if self.moe.has_bias:
+            w2_bias = torch.nn.Parameter(
+                torch.zeros(num_experts, hidden_size, dtype=params_dtype),
+                requires_grad=False,
+            )
+            layer.register_parameter("w2_bias", w2_bias)
+            set_weight_attrs(w2_bias, extra_weight_attrs)
+
+    def _maybe_pad_weight(self, weight: torch.Tensor) -> torch.Tensor:
+        # Pad the weight tensor. This is an optimization on ROCm platform, which
+        # can benefit from tensors located far enough from one another in memory
+        if (
+            envs.VLLM_ROCM_MOE_PADDING
+            and current_platform.is_rocm()
+            and weight.stride(-1) == 1
+            and (weight.stride(-2) * weight.element_size()) % 512 == 0
+        ):
+            num_pad = 256 // weight.element_size()
+            weight = F.pad(weight, (0, num_pad), "constant", 0)[..., :-num_pad]
+            torch.cuda.empty_cache()
+
+        return weight
+
+    def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
+        super().process_weights_after_loading(layer)
+
+        # Padding the weight for better performance on ROCm
+        layer.w13_weight.data = self._maybe_pad_weight(layer.w13_weight.data)
+        layer.w2_weight.data = self._maybe_pad_weight(layer.w2_weight.data)
+
+        if self.rocm_aiter_moe_enabled:
+            shuffled_w13, shuffled_w2 = rocm_aiter_ops.shuffle_weights(
+                layer.w13_weight.data, layer.w2_weight.data
+            )
+
+            layer.w13_weight.data = shuffled_w13
+            layer.w2_weight.data = shuffled_w2
+
+        if self.flashinfer_cutlass_moe_enabled:
+            # Swap halves to arrange as [w3; w1] (kernel expectation)
+            w1_w, w3_w = torch.chunk(layer.w13_weight.data, 2, dim=1)
+            w13_weight_swapped = torch.cat([w3_w, w1_w], dim=1)
+            layer.w13_weight.data = w13_weight_swapped.contiguous()
+
+        if current_platform.is_xpu():
+            import intel_extension_for_pytorch as ipex
+
+            ep_rank_start = self.moe.ep_rank * self.moe.num_local_experts
+            layer.ipex_fusion = ipex.llm.modules.GatedMLPMOE(
+                layer.w13_weight,
+                layer.w2_weight,
+                use_prepack=True,
+                experts_start_id=ep_rank_start,
+            )
+        elif current_platform.is_cpu():
+            from vllm.model_executor.layers.fused_moe import cpu_fused_moe
+
+            if current_platform.get_cpu_architecture() == CpuArchEnum.X86:
+                from vllm.model_executor.layers.utils import check_cpu_sgl_kernel
+
+                dtype_w13 = layer.w13_weight.dtype
+                _, n_w13, k_w13 = layer.w13_weight.size()
+                dtype_w2 = layer.w2_weight.dtype
+                _, n_w2, k_w2 = layer.w2_weight.size()
+                if (
+                    envs.VLLM_CPU_SGL_KERNEL
+                    and check_cpu_sgl_kernel(n_w13, k_w13, dtype_w13)
+                    and check_cpu_sgl_kernel(n_w2, k_w2, dtype_w2)
+                ):
+                    packed_w13_weight = torch.ops._C.convert_weight_packed(
+                        layer.w13_weight
+                    )
+                    assert packed_w13_weight.size() == layer.w13_weight.size()
+                    layer.w13_weight.copy_(packed_w13_weight)
+                    del packed_w13_weight
+                    packed_w2_weight = torch.ops._C.convert_weight_packed(
+                        layer.w2_weight
+                    )
+                    assert packed_w2_weight.size() == layer.w2_weight.size()
+                    layer.w2_weight.copy_(packed_w2_weight)
+                    layer.cpu_fused_moe = cpu_fused_moe.SGLFusedMOE(layer)
+                else:
+                    layer.cpu_fused_moe = cpu_fused_moe.IPEXFusedMOE(layer)
+            else:
+                layer.cpu_fused_moe = cpu_fused_moe.CPUFusedMOE(layer)
+
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        router_logits: torch.Tensor,
+        top_k: int,
+        renormalize: bool,
+        use_grouped_topk: bool = False,
+        topk_group: int | None = None,
+        num_expert_group: int | None = None,
+        global_num_experts: int = -1,
+        expert_map: torch.Tensor | None = None,
+        custom_routing_function: Callable | None = None,
+        scoring_func: str = "softmax",
+        routed_scaling_factor: float = 1.0,
+        e_score_correction_bias: torch.Tensor | None = None,
+        apply_router_weight_on_input: bool = False,
+        activation: str = "silu",
+        enable_eplb: bool = False,
+        expert_load_view: torch.Tensor | None = None,
+        logical_to_physical_map: torch.Tensor | None = None,
+        logical_replica_count: torch.Tensor | None = None,
+    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
+        if enable_eplb:
+            assert expert_load_view is not None
+            assert logical_to_physical_map is not None
+            assert logical_replica_count is not None
+
+        return self.forward(
+            x=x,
+            layer=layer,
+            router_logits=router_logits,
+            top_k=top_k,
+            renormalize=renormalize,
+            use_grouped_topk=use_grouped_topk,
+            topk_group=topk_group,
+            num_expert_group=num_expert_group,
+            global_num_experts=global_num_experts,
+            expert_map=expert_map,
+            custom_routing_function=custom_routing_function,
+            scoring_func=scoring_func,
+            routed_scaling_factor=routed_scaling_factor,
+            e_score_correction_bias=e_score_correction_bias,
+            activation=activation,
+            apply_router_weight_on_input=apply_router_weight_on_input,
+            enable_eplb=enable_eplb,
+            expert_load_view=expert_load_view,
+            logical_to_physical_map=logical_to_physical_map,
+            logical_replica_count=logical_replica_count,
+        )
+
+    def get_fused_moe_quant_config(
+        self, layer: torch.nn.Module
+    ) -> FusedMoEQuantConfig | None:
+        if self.moe.has_bias:
+            return biased_moe_quant_config(
+                layer.w13_bias,
+                layer.w2_bias,
+            )
+        else:
+            return FUSED_MOE_UNQUANTIZED_CONFIG
+
+    def forward_cuda(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        use_grouped_topk: bool,
+        top_k: int,
+        router_logits: torch.Tensor,
+        renormalize: bool,
+        topk_group: int | None = None,
+        num_expert_group: int | None = None,
+        global_num_experts: int = -1,
+        expert_map: torch.Tensor | None = None,
+        custom_routing_function: Callable | None = None,
+        scoring_func: str = "softmax",
+        routed_scaling_factor: float = 1.0,
+        e_score_correction_bias: torch.Tensor | None = None,
+        apply_router_weight_on_input: bool = False,
+        activation: str = "silu",
+        enable_eplb: bool = False,
+        expert_load_view: torch.Tensor | None = None,
+        logical_to_physical_map: torch.Tensor | None = None,
+        logical_replica_count: torch.Tensor | None = None,
+    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
+        zero_expert_num = getattr(layer, "zero_expert_num", 0)
+        zero_expert_type = getattr(layer, "zero_expert_type", None)
+
+        topk_weights, topk_ids, zero_expert_result = layer.select_experts(
+            hidden_states=x,
+            router_logits=router_logits,
+            use_grouped_topk=use_grouped_topk,
+            top_k=top_k,
+            renormalize=renormalize,
+            topk_group=topk_group,
+            num_expert_group=num_expert_group,
+            custom_routing_function=custom_routing_function,
+            scoring_func=scoring_func,
+            routed_scaling_factor=routed_scaling_factor,
+            e_score_correction_bias=e_score_correction_bias,
+            indices_type=self.topk_indices_dtype,
+            enable_eplb=enable_eplb,
+            expert_map=expert_map,
+            expert_load_view=expert_load_view,
+            logical_to_physical_map=logical_to_physical_map,
+            logical_replica_count=logical_replica_count,
+            global_num_experts=global_num_experts,
+            zero_expert_num=zero_expert_num,
+            zero_expert_type=zero_expert_type,
+            num_fused_shared_experts=layer.num_fused_shared_experts,
+        )
+
+        if self.rocm_aiter_moe_enabled:
+            result = self.rocm_aiter_fused_experts(
+                hidden_states=x,
+                w1=layer.w13_weight,
+                w2=layer.w2_weight,
+                topk_weights=topk_weights,
+                topk_ids=topk_ids,
+                expert_map=expert_map,
+                activation=activation,
+                apply_router_weight_on_input=apply_router_weight_on_input,
+            )
+        elif self.flashinfer_cutlass_moe_enabled:
+            return self.flashinfer_cutlass_moe(
+                hidden_states=x,
+                w1=layer.w13_weight,
+                w2=layer.w2_weight,
+                topk_weights=topk_weights,
+                topk_ids=topk_ids,
+                activation=activation,
+                apply_router_weight_on_input=apply_router_weight_on_input,
+            )
+        else:
+            result = fused_experts(
+                hidden_states=x,
+                w1=layer.w13_weight,
+                w2=layer.w2_weight,
+                topk_weights=topk_weights,
+                topk_ids=topk_ids,
+                inplace=True,
+                activation=activation,
+                quant_config=self.moe_quant_config,
+                apply_router_weight_on_input=apply_router_weight_on_input,
+                global_num_experts=global_num_experts,
+                expert_map=expert_map,
+            )
+
+        if zero_expert_num != 0 and zero_expert_type is not None:
+            assert not isinstance(result, tuple), (
+                "Shared + zero experts are mutually exclusive not yet supported"
+            )
+            return result, zero_expert_result
+        else:
+            return result
+
+    def forward_cpu(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        use_grouped_topk: bool,
+        top_k: int,
+        router_logits: torch.Tensor,
+        renormalize: bool,
+        topk_group: int | None = None,
+        num_expert_group: int | None = None,
+        global_num_experts: int = -1,
+        expert_map: torch.Tensor | None = None,
+        custom_routing_function: Callable | None = None,
+        scoring_func: str = "softmax",
+        routed_scaling_factor: float = 1.0,
+        e_score_correction_bias: torch.Tensor | None = None,
+        apply_router_weight_on_input: bool = False,
+        activation: str = "silu",
+        enable_eplb: bool = False,
+        expert_load_view: torch.Tensor | None = None,
+        logical_to_physical_map: torch.Tensor | None = None,
+        logical_replica_count: torch.Tensor | None = None,
+    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
+        if (
+            enable_eplb is not False
+            or expert_load_view is not None
+            or logical_to_physical_map is not None
+            or logical_replica_count is not None
+        ):
+            raise NotImplementedError("Expert load balancing is not supported for CPU.")
+        return layer.cpu_fused_moe(
+            layer,
+            x,
+            use_grouped_topk,
+            top_k,
+            router_logits,
+            renormalize,
+            topk_group,
+            num_expert_group,
+            global_num_experts,
+            expert_map,
+            custom_routing_function,
+            scoring_func,
+            routed_scaling_factor,
+            e_score_correction_bias,
+            apply_router_weight_on_input,
+            activation,
+        )
+
+    def forward_xpu(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        use_grouped_topk: bool,
+        top_k: int,
+        router_logits: torch.Tensor,
+        renormalize: bool,
+        topk_group: int | None = None,
+        num_expert_group: int | None = None,
+        global_num_experts: int = -1,
+        expert_map: torch.Tensor | None = None,
+        custom_routing_function: Callable | None = None,
+        scoring_func: str = "softmax",
+        routed_scaling_factor: float = 1.0,
+        e_score_correction_bias: torch.Tensor | None = None,
+        apply_router_weight_on_input: bool = False,
+        activation: str = "silu",
+        enable_eplb: bool = False,
+        expert_load_view: torch.Tensor | None = None,
+        logical_to_physical_map: torch.Tensor | None = None,
+        logical_replica_count: torch.Tensor | None = None,
+    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
+        if (
+            enable_eplb is not False
+            or expert_load_view is not None
+            or logical_to_physical_map is not None
+            or logical_replica_count is not None
+        ):
+            raise NotImplementedError("Expert load balancing is not supported for XPU.")
+        return layer.ipex_fusion(
+            x,
+            use_grouped_topk,
+            top_k,
+            router_logits,
+            renormalize,
+            topk_group,
+            num_expert_group,
+            custom_routing_function=custom_routing_function,
+        )
+
+    def forward_tpu(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        use_grouped_topk: bool,
+        top_k: int,
+        router_logits: torch.Tensor,
+        renormalize: bool,
+        topk_group: int | None = None,
+        num_expert_group: int | None = None,
+        global_num_experts: int = -1,
+        expert_map: torch.Tensor | None = None,
+        custom_routing_function: Callable | None = None,
+        scoring_func: str = "softmax",
+        routed_scaling_factor: float = 1.0,
+        e_score_correction_bias: torch.Tensor | None = None,
+        apply_router_weight_on_input: bool = False,
+        activation: str = "silu",
+        enable_eplb: bool = False,
+        expert_load_view: torch.Tensor | None = None,
+        logical_to_physical_map: torch.Tensor | None = None,
+        logical_replica_count: torch.Tensor | None = None,
+    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
+        assert not use_grouped_topk
+        assert num_expert_group is None
+        assert topk_group is None
+        assert custom_routing_function is None
+        assert apply_router_weight_on_input is False
+        if scoring_func != "softmax":
+            raise NotImplementedError(
+                "Only softmax scoring function is supported for TPU."
+            )
+        if e_score_correction_bias is not None:
+            raise NotImplementedError(
+                "Expert score correction bias is not supported for TPU."
+            )
+        assert activation == "silu", f"{activation} is not supported for TPU."
+        assert routed_scaling_factor == 1.0, (
+            f"routed_scaling_factor {routed_scaling_factor} is not supported for TPU."
+        )
+        if (
+            enable_eplb is not False
+            or expert_load_view is not None
+            or logical_to_physical_map is not None
+            or logical_replica_count is not None
+        ):
+            raise NotImplementedError("Expert load balancing is not supported for TPU.")
+        return fused_moe_pallas(
+            hidden_states=x,
+            w1=layer.w13_weight,
+            w2=layer.w2_weight,
+            topk=top_k,
+            gating_output=router_logits,
+            global_num_experts=global_num_experts,
+            expert_map=expert_map,
+            renormalize=renormalize,
+        )
+
+    if current_platform.is_tpu():
+        forward_native = forward_tpu
+    elif current_platform.is_cpu():
+        forward_native = forward_cpu
+    elif current_platform.is_xpu():
+        forward_native = forward_xpu
+    else:
+        forward_native = forward_cuda
diff --git a/vllm/model_executor/layers/quantization/mxfp4.py b/vllm/model_executor/layers/quantization/mxfp4.py
index e339f15510d7..4e51249f2d25 100644
--- a/vllm/model_executor/layers/quantization/mxfp4.py
+++ b/vllm/model_executor/layers/quantization/mxfp4.py
@@ -741,15 +741,10 @@ def _interleave_mxfp4_cutlass_sm90(w):
                 weight_scale=w2_scale, flex_ctx=FlexCtx(rhs_data=w2_flex)
             )
 
-            self.w13_weight_triton_tensor = w13_weight
-            self.w2_weight_triton_tensor = w2_weight
-
-            # need to delete the original weights to save memory on single GPU
-            del layer.w13_weight
-            del layer.w2_weight
-            layer.w13_weight = None
-            layer.w2_weight = None
-            torch.cuda.empty_cache()
+            self.w13_weight = w13_weight
+            self.w2_weight = w2_weight
+            layer.w13_weight = w13_weight
+            layer.w2_weight = w2_weight
         else:
             raise ValueError(f"Unsupported backend: {self.mxfp4_backend}")
 
@@ -824,18 +819,6 @@ def select_gemm_impl(
                     "EP batched experts format"
                 )
         else:
-            layer.w13_weight = (
-                self.w13_weight_triton_tensor
-                if layer.w13_weight is None
-                else layer.w13_weight
-            )
-            layer.w2_weight = (
-                self.w2_weight_triton_tensor
-                if layer.w2_weight is None
-                else layer.w2_weight
-            )
-            assert all([w is not None for w in [layer.w13_weight, layer.w2_weight]])
-
             assert self.moe_quant_config is not None
             if (
                 self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
@@ -1070,8 +1053,8 @@ def apply(
 
             return triton_kernel_moe_forward(
                 hidden_states=x,
-                w1=self.w13_weight_triton_tensor,
-                w2=self.w2_weight_triton_tensor,
+                w1=self.w13_weight,
+                w2=self.w2_weight,
                 gating_output=router_logits,
                 topk=top_k,
                 renormalize=renormalize,

From 533b018f725fb9c2421e2c4b5a48d62fa5f1d844 Mon Sep 17 00:00:00 2001
From: jvlunteren <161835099+jvlunteren@users.noreply.github.com>
Date: Tue, 11 Nov 2025 15:41:43 +0100
Subject: [PATCH 058/183] [BugFix] Fix Failing Ruff Check (#28469)

Signed-off-by: Jan van Lunteren <jvl@zurich.ibm.com>
---
 tests/compile/test_fusions_e2e.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/tests/compile/test_fusions_e2e.py b/tests/compile/test_fusions_e2e.py
index f67063cdf42e..e1560efb3f24 100644
--- a/tests/compile/test_fusions_e2e.py
+++ b/tests/compile/test_fusions_e2e.py
@@ -74,7 +74,7 @@ class ModelBackendTestCase(NamedTuple):
         ModelBackendTestCase(
             model_name="Qwen/Qwen3-30B-A3B",
             model_kwargs=dict(max_model_len=1024),
-            backend=_Backend.TRITON_ATTN,
+            backend=AttentionBackendEnum.TRITON_ATTN,
             attention_fusions=0,
             allreduce_fusions=97,
         ),

From a90ad7d838b446cfc2dd7b4252086e13c3a8abbf Mon Sep 17 00:00:00 2001
From: Mark McLoughlin <markmc@redhat.com>
Date: Tue, 11 Nov 2025 15:03:22 +0000
Subject: [PATCH 059/183] Add @markmc to CODEOWNERS for Observability (#28457)

Signed-off-by: Mark McLoughlin <markmc@redhat.com>
---
 .github/CODEOWNERS | 10 ++++++++++
 1 file changed, 10 insertions(+)

diff --git a/.github/CODEOWNERS b/.github/CODEOWNERS
index 23def076cf88..f26c782bccf2 100644
--- a/.github/CODEOWNERS
+++ b/.github/CODEOWNERS
@@ -61,6 +61,16 @@ CMakeLists.txt @tlrmchlsmth @LucasWilkinson
 /vllm/model_executor/models/transformers @hmellor
 /tests/models/test_transformers.py @hmellor
 
+# Observability
+/vllm/config/observability.py @markmc
+/vllm/v1/metrics @markmc
+/tests/v1/metrics @markmc
+/vllm/tracing.py @markmc
+/tests/v1/tracing/test_tracing.py @markmc
+/vllm/config/kv_events.py @markmc
+/vllm/distributed/kv_events.py @markmc
+/tests/distributed/test_events.py @markmc
+
 # Docs
 /docs/mkdocs @hmellor
 /docs/**/*.yml @hmellor

From b886068056a05857f796909d2f8573b36fc668a5 Mon Sep 17 00:00:00 2001
From: Fanli Lin <fanli.lin@intel.com>
Date: Tue, 11 Nov 2025 23:29:33 +0800
Subject: [PATCH 060/183] [BugFix] Fix RuntimeError in PixtralHFAttention on
 CPU/XPU (#28444)

Signed-off-by: Lin, Fanli <fanli.lin@intel.com>
---
 vllm/model_executor/models/pixtral.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/models/pixtral.py b/vllm/model_executor/models/pixtral.py
index 0555717017cd..dfe5f0c52a50 100644
--- a/vllm/model_executor/models/pixtral.py
+++ b/vllm/model_executor/models/pixtral.py
@@ -1109,7 +1109,7 @@ def forward(
             )
             out = out.transpose(1, 2)
 
-        out = out.view(batch, patches, self.n_heads * self.head_dim)
+        out = out.reshape(batch, patches, self.n_heads * self.head_dim)
         attn_output, _ = self.o_proj(out)
 
         return attn_output, None

From 3143eb23fc4e017bc31d11a9756d5a788d6f7e33 Mon Sep 17 00:00:00 2001
From: usberkeley <150880684+usberkeley@users.noreply.github.com>
Date: Wed, 12 Nov 2025 00:01:30 +0800
Subject: [PATCH 061/183] [BugFix] Add test_outputs.py to CI pipeline (#28466)

Signed-off-by: Bradley <bradley.b.pitt@gmail.com>
Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
---
 .buildkite/test-amd.yaml      | 1 +
 .buildkite/test-pipeline.yaml | 1 +
 2 files changed, 2 insertions(+)

diff --git a/.buildkite/test-amd.yaml b/.buildkite/test-amd.yaml
index bb5ef5d62463..5fd048c2ad0c 100644
--- a/.buildkite/test-amd.yaml
+++ b/.buildkite/test-amd.yaml
@@ -348,6 +348,7 @@ steps:
     - pytest -v -s -m 'not cpu_test' v1/metrics
     - pytest -v -s v1/test_oracle.py
     - pytest -v -s v1/test_request.py
+    - pytest -v -s v1/test_outputs.py
     # Integration test for streaming correctness (requires special branch).
     - pip install -U git+https://github.com/robertgshaw2-redhat/lm-evaluation-harness.git@streaming-api
     - pytest -v -s entrypoints/openai/correctness/test_lmeval.py::test_lm_eval_accuracy_v1_engine
diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 83a7df3b093f..25f711dd60b3 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -329,6 +329,7 @@ steps:
     - pytest -v -s -m 'not cpu_test' v1/metrics
     - pytest -v -s v1/test_oracle.py
     - pytest -v -s v1/test_request.py
+    - pytest -v -s v1/test_outputs.py
     # Integration test for streaming correctness (requires special branch).
     - pip install -U git+https://github.com/robertgshaw2-redhat/lm-evaluation-harness.git@streaming-api
     - pytest -v -s entrypoints/openai/correctness/test_lmeval.py::test_lm_eval_accuracy_v1_engine

From 287bbbeb067cd9e16ea9b834b35b47258a8ad43f Mon Sep 17 00:00:00 2001
From: the-codeboy <71213855+the-codeboy@users.noreply.github.com>
Date: Tue, 11 Nov 2025 17:45:49 +0100
Subject: [PATCH 062/183] [Doc] Fix typo in serving docs (#28474)

Signed-off-by: the-codeboy <71213855+the-codeboy@users.noreply.github.com>
---
 docs/serving/openai_compatible_server.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/docs/serving/openai_compatible_server.md b/docs/serving/openai_compatible_server.md
index e331b3422ea6..821628e6e317 100644
--- a/docs/serving/openai_compatible_server.md
+++ b/docs/serving/openai_compatible_server.md
@@ -77,11 +77,11 @@ In addition, we have the following custom APIs:
 
 In order for the language model to support chat protocol, vLLM requires the model to include
 a chat template in its tokenizer configuration. The chat template is a Jinja2 template that
-specifies how are roles, messages, and other chat-specific tokens are encoded in the input.
+specifies how roles, messages, and other chat-specific tokens are encoded in the input.
 
 An example chat template for `NousResearch/Meta-Llama-3-8B-Instruct` can be found [here](https://github.com/meta-llama/llama3?tab=readme-ov-file#instruction-tuned-models)
 
-Some models do not provide a chat template even though they are instruction/chat fine-tuned. For those model,
+Some models do not provide a chat template even though they are instruction/chat fine-tuned. For those models,
 you can manually specify their chat template in the `--chat-template` parameter with the file path to the chat
 template, or the template in string form. Without a chat template, the server will not be able to process chat
 and all chat requests will error.

From f9a4087182ffcd9404779fcda876f820b3b26d5f Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Tue, 11 Nov 2025 09:46:04 -0700
Subject: [PATCH 063/183] Remove weight_scale.T special case for SM90 Block FP8
 CUTLASS kernel (#28431)

Signed-off-by: mgoin <mgoin64@gmail.com>
---
 benchmarks/kernels/bench_block_fp8_gemm.py    | 43 +++++++++++++------
 .../scaled_mm_blockwise_sm90_fp8_dispatch.cuh |  3 +-
 .../schemes/compressed_tensors_w8a8_fp8.py    |  2 +-
 .../model_executor/layers/quantization/fp8.py |  2 +-
 .../layers/quantization/utils/fp8_utils.py    | 22 ++--------
 5 files changed, 36 insertions(+), 36 deletions(-)

diff --git a/benchmarks/kernels/bench_block_fp8_gemm.py b/benchmarks/kernels/bench_block_fp8_gemm.py
index f1e504499eaf..11e3ac7f0c1f 100644
--- a/benchmarks/kernels/bench_block_fp8_gemm.py
+++ b/benchmarks/kernels/bench_block_fp8_gemm.py
@@ -1,10 +1,18 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+import os
+
+# Disable DeepGEMM for this benchmark to use CUTLASS
+os.environ["VLLM_USE_DEEP_GEMM"] = "0"
+
 import torch
 
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    apply_w8a8_block_fp8_linear,
+    W8A8BlockFp8LinearOp,
+)
+from vllm.model_executor.layers.quantization.utils.quant_utils import (
+    GroupShape,
 )
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
     CUTLASS_BLOCK_FP8_SUPPORTED,
@@ -39,13 +47,14 @@ def build_w8a8_block_fp8_runner(M, N, K, block_size, device, use_cutlass):
     fp8_info = torch.finfo(torch.float8_e4m3fn)
     fp8_max, fp8_min = fp8_info.max, fp8_info.min
 
-    # Create random FP8 tensors
+    # Create random input tensor (bfloat16, will be quantized by W8A8BlockFp8LinearOp)
     A_ref = (torch.rand(M, K, dtype=torch.bfloat16, device=device) - 0.5) * 2 * fp8_max
 
+    # Create quantized weight tensor
     B_ref = (torch.rand(N, K, dtype=torch.bfloat16, device=device) - 0.5) * 2 * fp8_max
     B = B_ref.clamp(min=fp8_min, max=fp8_max).to(torch.float8_e4m3fn)
 
-    # Create scales
+    # Create weight scales
     block_n, block_k = block_size[0], block_size[1]
     n_tiles = (N + block_n - 1) // block_n
     k_tiles = (K + block_k - 1) // block_k
@@ -55,19 +64,25 @@ def build_w8a8_block_fp8_runner(M, N, K, block_size, device, use_cutlass):
         * factor_for_scale
     )
 
-    # SM90 CUTLASS requires row-major format for scales
-    if use_cutlass and current_platform.is_device_capability(90):
-        Bs = Bs.T.contiguous()
+    # Create W8A8BlockFp8LinearOp instance
+    weight_group_shape = GroupShape(block_n, block_k)
+    act_quant_group_shape = GroupShape(1, block_k)  # Per-token, per-group quantization
+
+    linear_op = W8A8BlockFp8LinearOp(
+        weight_group_shape=weight_group_shape,
+        act_quant_group_shape=act_quant_group_shape,
+        cutlass_block_fp8_supported=use_cutlass,
+        use_aiter_and_is_supported=False,
+    )
 
     def run():
-        if use_cutlass:
-            return apply_w8a8_block_fp8_linear(
-                A_ref, B, block_size, Bs, cutlass_block_fp8_supported=True
-            )
-        else:
-            return apply_w8a8_block_fp8_linear(
-                A_ref, B, block_size, Bs, cutlass_block_fp8_supported=False
-            )
+        return linear_op.apply(
+            input=A_ref,
+            weight=B,
+            weight_scale=Bs,
+            input_scale=None,
+            bias=None,
+        )
 
     return run
 
diff --git a/csrc/quantization/w8a8/cutlass/c3x/scaled_mm_blockwise_sm90_fp8_dispatch.cuh b/csrc/quantization/w8a8/cutlass/c3x/scaled_mm_blockwise_sm90_fp8_dispatch.cuh
index 147eb8efc077..c40d49966271 100644
--- a/csrc/quantization/w8a8/cutlass/c3x/scaled_mm_blockwise_sm90_fp8_dispatch.cuh
+++ b/csrc/quantization/w8a8/cutlass/c3x/scaled_mm_blockwise_sm90_fp8_dispatch.cuh
@@ -48,7 +48,8 @@ struct cutlass_3x_gemm_fp8_blockwise {
   using ElementBlockScale = float;
 
   using ScaleConfig = cutlass::detail::Sm90BlockwiseScaleConfig<
-        ScaleGranularityM, ScaleGranularityN, ScaleGranularityK>;
+        ScaleGranularityM, ScaleGranularityN, ScaleGranularityK,
+        cute::GMMA::Major::MN, cute::GMMA::Major::K>;
 
   using LayoutSFA = decltype(ScaleConfig::deduce_layoutSFA());
   using LayoutSFB = decltype(ScaleConfig::deduce_layoutSFB());
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
index 6da136cbc8f6..ee99572f5f49 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
@@ -173,7 +173,7 @@ def process_weights_after_loading(self, layer) -> None:
             layer.input_scale = None
 
         if self.strategy == QuantizationStrategy.BLOCK:
-            maybe_post_process_fp8_weight_block(layer, self.cutlass_block_fp8_supported)
+            maybe_post_process_fp8_weight_block(layer)
 
     def apply_weights(
         self,
diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index 83d136600b77..cb065eb68b66 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -540,7 +540,7 @@ def process_weights_after_loading(self, layer: Module) -> None:
             return
 
         if self.block_quant:
-            maybe_post_process_fp8_weight_block(layer, self.cutlass_block_fp8_supported)
+            maybe_post_process_fp8_weight_block(layer)
 
     def apply(
         self,
diff --git a/vllm/model_executor/layers/quantization/utils/fp8_utils.py b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
index c63196b89357..0c54cf4def00 100644
--- a/vllm/model_executor/layers/quantization/utils/fp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
@@ -55,17 +55,13 @@ def cutlass_scaled_mm(
     Bs: torch.Tensor,
     block_size: list[int],
     output_dtype: torch.dtype = torch.float16,
-    is_hopper: bool | None = None,
 ) -> torch.Tensor:
-    if is_hopper is None:
-        is_hopper = current_platform.is_device_capability(90)
     return ops.cutlass_scaled_mm(
         A,
         B.T,
         out_dtype=output_dtype,
         scale_a=As,
-        # SM90 block FP8 requires row-major scale_b, which we do ahead of time
-        scale_b=Bs if block_size is not None and is_hopper else Bs.T,
+        scale_b=Bs.T,
     )
 
 
@@ -130,7 +126,7 @@ def _padded_cutlass(
     padded_x_scale[0 : x_scale.shape[0], ...].copy_(x_scale)
 
     output = cutlass_scaled_mm(
-        padded_qx, weight, padded_x_scale, weight_scale, block_size, output_dtype, True
+        padded_qx, weight, padded_x_scale, weight_scale, block_size, output_dtype
     )
     return output[0 : qx.shape[0], ...]
 
@@ -303,7 +299,6 @@ def _run_cutlass(
                 weight_scale,
                 list(self.weight_group_shape),
                 input_2d.dtype,
-                False,
             )
 
     def _run_aiter(
@@ -1125,9 +1120,7 @@ def process_fp8_weight_block_strategy(
     return weight, weight_scale
 
 
-def maybe_post_process_fp8_weight_block(
-    layer: torch.nn.Module, cutlass_block_fp8_supported: bool
-):
+def maybe_post_process_fp8_weight_block(layer: torch.nn.Module):
     assert layer.weight_block_size is not None
 
     from vllm.utils.deep_gemm import (
@@ -1146,15 +1139,6 @@ def maybe_post_process_fp8_weight_block(
         requant_weight_ue8m0_inplace(
             layer.weight.data, layer.weight_scale.data, block_sz
         )
-    # SM90 Block FP8 CUTLASS requires row-major weight scales
-    elif (
-        current_platform.is_device_capability(90)
-        and cutlass_block_fp8_supported
-        and not should_use_deepgemm
-    ):
-        layer.weight_scale = torch.nn.Parameter(
-            layer.weight_scale.data.T.contiguous(), requires_grad=False
-        )
 
 
 def expert_weight_is_col_major(x: torch.Tensor) -> bool:

From a7ef3eb0cd03e729c7a29914400e0ca928767999 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Nicol=C3=B2=20Lucchesi?= <nlucches@redhat.com>
Date: Tue, 11 Nov 2025 17:57:43 +0100
Subject: [PATCH 064/183] [NIXL] Generalize block-first backend layouts
 (FlashInfer-like) (#28282)

---
 .../kv_connector/unit/test_nixl_connector.py  | 17 ++++++-
 .../kv_connector/v1/nixl_connector.py         | 47 +++++++++++++++----
 2 files changed, 52 insertions(+), 12 deletions(-)

diff --git a/tests/v1/kv_connector/unit/test_nixl_connector.py b/tests/v1/kv_connector/unit/test_nixl_connector.py
index 475cf2285e39..8e421717fea3 100644
--- a/tests/v1/kv_connector/unit/test_nixl_connector.py
+++ b/tests/v1/kv_connector/unit/test_nixl_connector.py
@@ -1096,7 +1096,8 @@ def _run_abort_timeout_test(llm: LLM, timeout: int):
     llm.llm_engine.engine_core.shutdown()
 
 
-def test_register_kv_caches(dist_init):
+@pytest.mark.parametrize("attn_backend", ["FLASH_ATTN", "TRITON_ATTN"])
+def test_register_kv_caches(dist_init, attn_backend, monkeypatch):
     """
     Test that register_kv_caches() properly calls nixl_wrapper methods with
     correct data.
@@ -1108,10 +1109,22 @@ def test_register_kv_caches(dist_init):
        block layout info
     """
 
+    monkeypatch.setenv("VLLM_ATTENTION_BACKEND", attn_backend)
+
     vllm_config = create_vllm_config()
 
+    # Import the appropriate backend based on the parameter
+    if attn_backend == "FLASH_ATTN":
+        from vllm.v1.attention.backends.flash_attn import FlashAttentionBackend
+
+        backend_cls = FlashAttentionBackend
+    else:  # TRITON_ATTN
+        from vllm.v1.attention.backends.triton_attn import TritonAttentionBackend
+
+        backend_cls = TritonAttentionBackend
+
     # Create test kv cache tensors using proper backend shape
-    kv_cache_shape = FlashAttentionBackend.get_kv_cache_shape(
+    kv_cache_shape = backend_cls.get_kv_cache_shape(
         num_blocks=2, block_size=16, num_kv_heads=4, head_size=64
     )
     shared_tensor = torch.zeros(*kv_cache_shape, dtype=torch.float16)
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index 6c20eee1ecbf..375ea79d0e81 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -21,6 +21,7 @@
 import zmq
 
 from vllm import envs
+from vllm.attention import AttentionBackend
 from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.selector import get_attn_backend
 from vllm.config import VllmConfig
@@ -669,6 +670,33 @@ class TpKVTopology:
         remote_tp_size: dict[EngineId, int]
         is_mla: bool
         total_num_kv_heads: int
+        attn_backend: type[AttentionBackend]
+
+        def __post_init__(self):
+            # Figure out whether the first dimension of the cache is K/V
+            # or num_blocks. This is used to register the memory regions correctly.
+            kv_cache_shape = self.attn_backend.get_kv_cache_shape(
+                num_blocks=1, block_size=16, num_kv_heads=1, head_size=1
+            )
+            # Non-MLA backends caches have 5 dims [2, num_blocks, H,N,D],
+            # we just mock num_blocks to 1 for the dimension check below.
+            self._is_kv_layout_blocks_first = (
+                len(kv_cache_shape) == 5 and kv_cache_shape[0] == 1
+            )
+
+            attn_backend = AttentionBackendEnum[self.attn_backend.get_name()]
+            self._use_pallas = attn_backend == AttentionBackendEnum.PALLAS
+
+        @property
+        def is_kv_layout_blocks_first(self) -> bool:
+            return self._is_kv_layout_blocks_first
+
+        @property
+        def split_k_and_v(self) -> bool:
+            # Whether to register regions for K and V separately (when present).
+            return not (
+                self.is_mla or self._use_pallas or self.is_kv_layout_blocks_first
+            )
 
         def tp_ratio(
             self,
@@ -876,9 +904,6 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
             use_mla=self.use_mla,
         )
         self.backend_name = backend.get_name()
-        attn_backend = AttentionBackendEnum[self.backend_name]
-        self._use_flashinfer = attn_backend == AttentionBackendEnum.FLASHINFER
-        self._use_pallas = attn_backend == AttentionBackendEnum.PALLAS
         self.kv_cache_layout = get_kv_cache_layout()
         self.host_buffer_kv_cache_layout = self.kv_cache_layout
         logger.debug("Detected attention backend %s", self.backend_name)
@@ -896,7 +921,9 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
             remote_tp_size=self._tp_size,  # shared state
             is_mla=self.use_mla,
             total_num_kv_heads=self.model_config.get_total_num_kv_heads(),
+            attn_backend=backend,
         )
+        self._use_pallas = self.kv_topo._use_pallas
 
     def _nixl_handshake(
         self,
@@ -1076,7 +1103,7 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
         # (roughly 8KB vs 5KB).
         # Conversely for FlashInfer, K and V are registered in the same region
         # to better exploit the memory layout (ie num_blocks is the first dim).
-        split_k_and_v = not (self.use_mla or self._use_pallas or self._use_flashinfer)
+        split_k_and_v = self.kv_topo.split_k_and_v
         tensor_size_bytes = None
         # Enable different block lengths for different layers when MLA is used.
         self.block_len_per_layer = list[int]()
@@ -1141,7 +1168,7 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
 
         self.device_kv_caches = kv_caches
         self.dst_num_blocks[self.engine_id] = self.num_blocks
-        if self._use_flashinfer:
+        if self.kv_topo.is_kv_layout_blocks_first:
             for i in range(len(self.slot_size_per_layer)):
                 assert self.slot_size_per_layer[i] % 2 == 0
                 self.slot_size_per_layer[i] //= 2
@@ -1169,7 +1196,7 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
                 # (addr, len, device id)
                 blocks_data.append((addr, kv_block_len, self.device_id))
 
-            if self._use_flashinfer:
+            if self.kv_topo.is_kv_layout_blocks_first:
                 # Separate and interleave K/V regions to maintain the same
                 # descs ordering. This is needed for selecting contiguous heads
                 # when split across TP ranks.
@@ -1331,7 +1358,7 @@ def add_remote_agent(
                 # (addr, len, device id)
                 blocks_data.append((addr, kv_block_len, nixl_agent_meta.device_id))
 
-            if self._use_flashinfer:
+            if self.kv_topo.is_kv_layout_blocks_first:
                 # With FlashInfer index V separately to allow head splitting.
                 for block_id in range(nixl_agent_meta.num_blocks):
                     block_offset = block_id * nixl_agent_meta.block_lens[i]
@@ -1414,7 +1441,7 @@ def _validate_remote_agent_handshake(
             remote_block_size = remote_block_len // (
                 self.slot_size_per_layer[0] * tp_ratio
             )
-            if self._use_flashinfer:
+            if self.kv_topo.is_kv_layout_blocks_first:
                 # With flashinfer, KV are sent in the same message.
                 remote_block_size //= 2
 
@@ -1494,7 +1521,7 @@ def permute_device_kv(self, block_ids: list[int]):
         - cache.index_copy_(0, indices, permuted_blocks) # copy permuted kv back
 
         """
-        split_k_and_v = not (self.use_mla or self._use_pallas or self._use_flashinfer)
+        split_k_and_v = self.kv_topo.split_k_and_v
         inv_order = [0, 2, 1, 3]
         sample_cache = list(self.device_kv_caches.values())[0][0]
         target_shape = list(sample_cache.shape)
@@ -1874,7 +1901,7 @@ def get_backend_aware_kv_block_len(self, layer_idx: int):
         For FlashInfer, this is half the length of the whole block, as K and V
         share the same region.
         """
-        if self._use_flashinfer:
+        if self.kv_topo.is_kv_layout_blocks_first:
             # For indexing only half (either just the K or V part).
             block_len = self.block_len_per_layer[layer_idx] // 2
         else:

From 68c09efc37e87032640cf8db571eaf486bd744ac Mon Sep 17 00:00:00 2001
From: zhrrr <43847754+izhuhaoran@users.noreply.github.com>
Date: Wed, 12 Nov 2025 01:00:31 +0800
Subject: [PATCH 065/183] [Kernel][Perf] fuse QK Norm and RoPE into one cuda
 kernel for Qwen Model (#27165)

Signed-off-by: zhuhaoran <zhuhaoran.zhr@alibaba-inc.com>
---
 .buildkite/test-pipeline.yaml                 |   1 +
 CMakeLists.txt                                |   1 +
 csrc/fused_qknorm_rope_kernel.cu              | 418 ++++++++++++++++++
 csrc/ops.h                                    |   6 +
 csrc/torch_bindings.cpp                       |  10 +
 csrc/type_convert.cuh                         |  60 ++-
 tests/compile/test_qk_norm_rope_fusion.py     | 195 ++++++++
 tests/kernels/core/test_fused_qk_norm_rope.py | 141 ++++++
 vllm/_custom_ops.py                           |  29 ++
 vllm/compilation/fix_functionalization.py     |  17 +
 vllm/compilation/fusion.py                    |   4 +
 vllm/compilation/matcher_utils.py             |  81 +++-
 vllm/compilation/pass_manager.py              |   4 +
 vllm/compilation/qk_norm_rope_fusion.py       | 238 ++++++++++
 vllm/config/compilation.py                    |  13 +
 .../layers/rotary_embedding/base.py           |  45 +-
 16 files changed, 1234 insertions(+), 29 deletions(-)
 create mode 100644 csrc/fused_qknorm_rope_kernel.cu
 create mode 100644 tests/compile/test_qk_norm_rope_fusion.py
 create mode 100644 tests/kernels/core/test_fused_qk_norm_rope.py
 create mode 100644 vllm/compilation/qk_norm_rope_fusion.py

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 25f711dd60b3..8d2a7bc5a802 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -451,6 +451,7 @@ steps:
     - pytest -v -s compile/test_decorator.py
     - pytest -v -s compile/test_noop_elimination.py
     - pytest -v -s compile/test_aot_compile.py
+    - pytest -v -s compile/test_qk_norm_rope_fusion.py
 
 - label: PyTorch Fullgraph Smoke Test # 15min
   timeout_in_minutes: 30
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 0e9fa63b178e..5cddf81a4b4a 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -265,6 +265,7 @@ set(VLLM_EXT_SRC
   "csrc/pos_encoding_kernels.cu"
   "csrc/activation_kernels.cu"
   "csrc/layernorm_kernels.cu"
+  "csrc/fused_qknorm_rope_kernel.cu"
   "csrc/layernorm_quant_kernels.cu"
   "csrc/sampler.cu"
   "csrc/cuda_view.cu"
diff --git a/csrc/fused_qknorm_rope_kernel.cu b/csrc/fused_qknorm_rope_kernel.cu
new file mode 100644
index 000000000000..cbd23975a773
--- /dev/null
+++ b/csrc/fused_qknorm_rope_kernel.cu
@@ -0,0 +1,418 @@
+/*
+ * Copyright (c) 2025, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include <cmath>
+#include <cuda_runtime.h>
+#include <type_traits>
+
+#include <torch/cuda.h>
+#include <c10/cuda/CUDAGuard.h>
+
+#include "cuda_compat.h"
+#include "dispatch_utils.h"
+#include "type_convert.cuh"
+
+#define CHECK_TYPE(x, st)                                              \
+  TORCH_CHECK(x.scalar_type() == st, #x " dtype is ", x.scalar_type(), \
+              ", while ", st, " is expected")
+#define CHECK_TH_CUDA(x) TORCH_CHECK(x.is_cuda(), #x " must be a CUDA tensor")
+#define CHECK_CONTIGUOUS(x) \
+  TORCH_CHECK(x.is_contiguous(), #x " must be contiguous")
+#define CHECK_INPUT(x) \
+  CHECK_TH_CUDA(x);    \
+  CHECK_CONTIGUOUS(x)
+
+#define FINAL_MASK 0xffffffff
+
+// TODO: suport for AMD ROCM platform
+#ifndef USE_ROCM
+namespace tensorrt_llm::common {
+template <typename T, int num>
+struct packed_as;
+// Specialization for packed_as used in this kernel.
+template <>
+struct packed_as<uint, 1> {
+  using type = uint;
+};
+
+template <>
+struct packed_as<uint, 2> {
+  using type = uint2;
+};
+
+template <>
+struct packed_as<uint, 4> {
+  using type = uint4;
+};
+
+template <typename T>
+__inline__ __device__ T warpReduceSum(T val) {
+  #pragma unroll
+  for (int mask = 16; mask > 0; mask >>= 1)
+    val += __shfl_xor_sync(FINAL_MASK, val, mask, 32);
+  return val;
+}
+
+template <typename T>
+inline __device__ __host__ T divUp(T m, T n) {
+  return (m + n - 1) / n;
+}
+
+}  // namespace tensorrt_llm::common
+
+namespace tensorrt_llm::kernels {
+// NOTE(zhuhaoran): This kernel is adapted from TensorRT-LLM implementation,
+// with added support for passing the cos_sin_cache as an input.
+// https://github.com/NVIDIA/TensorRT-LLM/blob/main/cpp/tensorrt_llm/kernels/fusedQKNormRopeKernel.cu
+
+// Perform per-head QK Norm and RoPE in a single kernel.
+// scalar_t_in: data type of QKV and RMSNorm weights
+// scalar_t_cache: data type of cos/sin cache
+// head_dim: the dimension of each head
+// interleave: interleave=!is_neox.
+template <typename scalar_t_in, typename scalar_t_cache, int head_dim,
+          bool interleave>
+__global__ void fusedQKNormRopeKernel(
+    void* qkv_void,                  // Combined QKV tensor
+    int const num_heads_q,           // Number of query heads
+    int const num_heads_k,           // Number of key heads
+    int const num_heads_v,           // Number of value heads
+    float const eps,                 // Epsilon for RMS normalization
+    void const* q_weight_void,       // RMSNorm weights for query
+    void const* k_weight_void,       // RMSNorm weights for key
+    void const* cos_sin_cache_void,  // Pre-computed cos/sin cache
+    int64_t const* position_ids,     // Position IDs for RoPE
+    int const num_tokens             // Number of tokens
+) {
+  #if !defined(__CUDA_ARCH__) || __CUDA_ARCH__ < 800
+  if constexpr ((std::is_same_v<scalar_t_in, c10::BFloat16>) ||
+                std::is_same_v<scalar_t_cache, c10::BFloat16>) {
+    return;
+  } else {
+  #endif
+
+    using Converter = vllm::_typeConvert<scalar_t_in>;
+    static_assert(Converter::exists,
+                  "Input QKV data type is not supported for this CUDA "
+                  "architecture or toolkit version.");
+    using T_in = typename Converter::hip_type;
+    using T2_in = typename Converter::packed_hip_type;
+
+    using CacheConverter = vllm::_typeConvert<scalar_t_cache>;
+    static_assert(CacheConverter::exists,
+                  "Cache data type is not supported for this CUDA architecture "
+                  "or toolkit version.");
+    using T_cache = typename CacheConverter::hip_type;
+
+    T_in* qkv = reinterpret_cast<T_in*>(qkv_void);
+    T_in const* q_weight = reinterpret_cast<T_in const*>(q_weight_void);
+    T_in const* k_weight = reinterpret_cast<T_in const*>(k_weight_void);
+    T_cache const* cos_sin_cache =
+        reinterpret_cast<T_cache const*>(cos_sin_cache_void);
+
+    int const warpsPerBlock = blockDim.x / 32;
+    int const warpId = threadIdx.x / 32;
+    int const laneId = threadIdx.x % 32;
+
+    // Calculate global warp index to determine which head/token this warp
+    // processes
+    int const globalWarpIdx = blockIdx.x * warpsPerBlock + warpId;
+
+    // Total number of attention heads (Q and K)
+    int const total_qk_heads = num_heads_q + num_heads_k;
+
+    // Determine which token and head type (Q or K) this warp processes
+    int const tokenIdx = globalWarpIdx / total_qk_heads;
+    int const localHeadIdx = globalWarpIdx % total_qk_heads;
+
+    // Skip if this warp is assigned beyond the number of tokens
+    if (tokenIdx >= num_tokens) return;
+
+    bool const isQ = localHeadIdx < num_heads_q;
+    int const headIdx = isQ ? localHeadIdx : localHeadIdx - num_heads_q;
+
+    int const num_heads = num_heads_q + num_heads_k + num_heads_v;
+
+    static_assert(head_dim % (32 * 2) == 0,
+                  "head_dim must be divisible by 64 (each warp processes one "
+                  "head, and each thread gets even number of "
+                  "elements)");
+    constexpr int numElemsPerThread = head_dim / 32;
+    float elements[numElemsPerThread];
+    constexpr int elemSizeBytes = numElemsPerThread * sizeof(__nv_bfloat16);
+    static_assert(elemSizeBytes % 4 == 0,
+                  "numSizeBytes must be a multiple of 4");
+    constexpr int vecSize =
+        elemSizeBytes /
+        4;  // Use packed_as<uint, vecSize> to perform loading/saving.
+    using vec_T = typename tensorrt_llm::common::packed_as<uint, vecSize>::type;
+
+    int offsetWarp;  // Offset for the warp
+    if (isQ) {
+      // Q segment: token offset + head offset within Q segment
+      offsetWarp = tokenIdx * num_heads * head_dim + headIdx * head_dim;
+    } else {
+      // K segment: token offset + entire Q segment + head offset within K
+      // segment
+      offsetWarp = tokenIdx * num_heads * head_dim + num_heads_q * head_dim +
+                   headIdx * head_dim;
+    }
+    int offsetThread = offsetWarp + laneId * numElemsPerThread;
+
+    // Sum of squares for RMSNorm
+    float sumOfSquares = 0.0f;
+
+    // Load.
+    {
+      vec_T vec = *reinterpret_cast<vec_T const*>(&qkv[offsetThread]);
+      constexpr int num_packed_elems = elemSizeBytes / sizeof(T2_in);
+  #pragma unroll
+      for (int i = 0; i < num_packed_elems; i++) {
+        // Interpret the generic vector chunk as the specific packed type
+        T2_in packed_val = *(reinterpret_cast<T2_in*>(&vec) + i);
+        // Convert to float2 for computation
+        float2 vals = Converter::convert(packed_val);
+        sumOfSquares += vals.x * vals.x;
+        sumOfSquares += vals.y * vals.y;
+
+        elements[2 * i] = vals.x;
+        elements[2 * i + 1] = vals.y;
+      }
+    }
+
+    // Reduce sum across warp using the utility function
+    sumOfSquares = tensorrt_llm::common::warpReduceSum(sumOfSquares);
+
+    // Compute RMS normalization factor
+    float rms_rcp = rsqrtf(sumOfSquares / static_cast<float>(head_dim) + eps);
+
+    // Normalize elements
+  #pragma unroll
+    for (int i = 0; i < numElemsPerThread; i++) {
+      int dim = laneId * numElemsPerThread + i;
+      float weight = isQ ? Converter::convert(q_weight[dim])
+                         : Converter::convert(k_weight[dim]);
+      elements[i] *= rms_rcp * weight;
+    }
+
+    // Apply RoPE to normalized elements
+    float elements2[numElemsPerThread];  // Additional buffer required for RoPE.
+
+    int64_t pos_id = position_ids[tokenIdx];
+
+    // Calculate cache pointer for this position - similar to
+    // pos_encoding_kernels.cu
+    T_cache const* cache_ptr = cos_sin_cache + pos_id * head_dim;
+    int const embed_dim = head_dim / 2;
+    T_cache const* cos_ptr = cache_ptr;
+    T_cache const* sin_ptr = cache_ptr + embed_dim;
+
+    if constexpr (interleave) {
+      // Perform interleaving. Use pre-computed cos/sin values.
+  #pragma unroll
+      for (int i = 0; i < numElemsPerThread / 2; ++i) {
+        int const idx0 = 2 * i;
+        int const idx1 = 2 * i + 1;
+
+        float const val0 = elements[idx0];
+        float const val1 = elements[idx1];
+
+        int const dim_idx = laneId * numElemsPerThread + idx0;
+        int const half_dim = dim_idx / 2;
+        float const cos_val =
+            CacheConverter::convert(VLLM_LDG(cos_ptr + half_dim));
+        float const sin_val =
+            CacheConverter::convert(VLLM_LDG(sin_ptr + half_dim));
+
+        elements[idx0] = val0 * cos_val - val1 * sin_val;
+        elements[idx1] = val0 * sin_val + val1 * cos_val;
+      }
+    } else {
+      // Before data exchange with in warp, we need to sync.
+      __syncwarp();
+      // Get the data from the other half of the warp. Use pre-computed cos/sin
+      // values.
+  #pragma unroll
+      for (int i = 0; i < numElemsPerThread; i++) {
+        elements2[i] = __shfl_xor_sync(0xffffffff, elements[i], 16);
+        if (laneId < 16) {
+          elements2[i] = -elements2[i];
+        }
+
+        int dim_idx = laneId * numElemsPerThread + i;
+        dim_idx = (dim_idx * 2) % head_dim;
+        int half_dim = dim_idx / 2;
+        // Use pre-computed cos/sin from cache
+        float cos_val = CacheConverter::convert(VLLM_LDG(cos_ptr + half_dim));
+        float sin_val = CacheConverter::convert(VLLM_LDG(sin_ptr + half_dim));
+
+        elements[i] = elements[i] * cos_val + elements2[i] * sin_val;
+      }
+      // __shfl_xor_sync does not provide memfence. Need to sync again.
+      __syncwarp();
+    }
+
+    // Store.
+    {
+      vec_T vec;
+      constexpr int num_packed_elems = elemSizeBytes / sizeof(T2_in);
+  #pragma unroll
+      for (int i = 0; i < num_packed_elems; i++) {
+        // Convert from float2 back to the specific packed type
+        T2_in packed_val = Converter::convert(
+            make_float2(elements[2 * i], elements[2 * i + 1]));
+        // Place it into the generic vector
+        *(reinterpret_cast<T2_in*>(&vec) + i) = packed_val;
+      }
+      *reinterpret_cast<vec_T*>(&qkv[offsetThread]) = vec;
+    }
+
+  #if !defined(__CUDA_ARCH__) || __CUDA_ARCH__ < 800
+  }
+  #endif
+}
+
+  // Borrowed from
+  // https://github.com/flashinfer-ai/flashinfer/blob/8125d079a43e9a0ba463a4ed1b639cefd084cec9/include/flashinfer/pos_enc.cuh#L568
+  #define DISPATCH_INTERLEAVE(interleave, INTERLEAVE, ...) \
+    if (interleave) {                                      \
+      const bool INTERLEAVE = true;                        \
+      __VA_ARGS__                                          \
+    } else {                                               \
+      const bool INTERLEAVE = false;                       \
+      __VA_ARGS__                                          \
+    }
+
+template <typename scalar_t_in, typename scalar_t_cache>
+void launchFusedQKNormRope(void* qkv, int const num_tokens,
+                           int const num_heads_q, int const num_heads_k,
+                           int const num_heads_v, int const head_dim,
+                           float const eps, void const* q_weight,
+                           void const* k_weight, void const* cos_sin_cache,
+                           bool const interleave, int64_t const* position_ids,
+                           cudaStream_t stream) {
+  constexpr int blockSize = 256;
+
+  int const warpsPerBlock = blockSize / 32;
+  int const totalQKHeads = num_heads_q + num_heads_k;
+  int const totalWarps = num_tokens * totalQKHeads;
+
+  int const gridSize = common::divUp(totalWarps, warpsPerBlock);
+  dim3 gridDim(gridSize);
+  dim3 blockDim(blockSize);
+
+  switch (head_dim) {
+    case 64:
+      DISPATCH_INTERLEAVE(interleave, INTERLEAVE, {
+        fusedQKNormRopeKernel<scalar_t_in, scalar_t_cache, 64, INTERLEAVE>
+            <<<gridDim, blockDim, 0, stream>>>(
+                qkv, num_heads_q, num_heads_k, num_heads_v, eps, q_weight,
+                k_weight, cos_sin_cache, position_ids, num_tokens);
+      });
+      break;
+    case 128:
+      DISPATCH_INTERLEAVE(interleave, INTERLEAVE, {
+        fusedQKNormRopeKernel<scalar_t_in, scalar_t_cache, 128, INTERLEAVE>
+            <<<gridDim, blockDim, 0, stream>>>(
+                qkv, num_heads_q, num_heads_k, num_heads_v, eps, q_weight,
+                k_weight, cos_sin_cache, position_ids, num_tokens);
+      });
+      break;
+    case 256:
+      DISPATCH_INTERLEAVE(interleave, INTERLEAVE, {
+        fusedQKNormRopeKernel<scalar_t_in, scalar_t_cache, 256, INTERLEAVE>
+            <<<gridDim, blockDim, 0, stream>>>(
+                qkv, num_heads_q, num_heads_k, num_heads_v, eps, q_weight,
+                k_weight, cos_sin_cache, position_ids, num_tokens);
+      });
+      break;
+    default:
+      TORCH_CHECK(false,
+                  "Unsupported head dimension for fusedQKNormRope: ", head_dim);
+  }
+}
+}  // namespace tensorrt_llm::kernels
+
+void fused_qk_norm_rope(
+    torch::Tensor& qkv,       // Combined QKV tensor [num_tokens,
+                              // (num_heads_q+num_heads_k+num_heads_v)*head_dim]
+    int64_t num_heads_q,      // Number of query heads
+    int64_t num_heads_k,      // Number of key heads
+    int64_t num_heads_v,      // Number of value heads
+    int64_t head_dim,         // Dimension per head
+    double eps,               // Epsilon for RMS normalization
+    torch::Tensor& q_weight,  // RMSNorm weights for query [head_dim]
+    torch::Tensor& k_weight,  // RMSNorm weights for key [head_dim]
+    torch::Tensor& cos_sin_cache,  // Cos/sin cache [max_position, head_dim]
+    bool is_neox,                  // Whether RoPE is applied in Neox style
+    torch::Tensor& position_ids    // Position IDs for RoPE [num_tokens]
+) {
+  // Input validation
+  CHECK_INPUT(qkv);
+  CHECK_INPUT(position_ids);
+  CHECK_INPUT(q_weight);
+  CHECK_INPUT(k_weight);
+  CHECK_INPUT(cos_sin_cache);
+  CHECK_TYPE(position_ids, torch::kInt64);
+
+  TORCH_CHECK(qkv.dim() == 2,
+              "QKV tensor must be 2D: [num_tokens, "
+              "(num_heads_q+num_heads_k+num_heads_v)*head_dim]");
+  TORCH_CHECK(position_ids.dim() == 1, "Position IDs must be 1D: [num_tokens]");
+  TORCH_CHECK(q_weight.dim() == 1, "Query weights must be 1D: [head_dim]");
+  TORCH_CHECK(k_weight.dim() == 1, "Key weights must be 1D: [head_dim]");
+  TORCH_CHECK(cos_sin_cache.dim() == 2,
+              "Cos/sin cache must be 2D: [max_position, head_dim]");
+  TORCH_CHECK(q_weight.size(0) == head_dim,
+              "Query weights size must match head dimension");
+  TORCH_CHECK(k_weight.size(0) == head_dim,
+              "Key weights size must match head dimension");
+  TORCH_CHECK(cos_sin_cache.size(1) == head_dim,
+              "Cos/sin cache dimension must match head_dim");
+  TORCH_CHECK(qkv.scalar_type() == q_weight.scalar_type() &&
+                  qkv.scalar_type() == k_weight.scalar_type(),
+              "qkv, q_weight and k_weight must have the same dtype");
+
+  int64_t num_tokens = qkv.size(0);
+  TORCH_CHECK(position_ids.size(0) == num_tokens,
+              "Number of tokens in position_ids must match QKV");
+
+  int64_t total_heads = num_heads_q + num_heads_k + num_heads_v;
+  TORCH_CHECK(
+      qkv.size(1) == total_heads * head_dim,
+      "QKV tensor size must match total number of heads and head dimension");
+
+  auto stream = at::cuda::getCurrentCUDAStream(qkv.get_device());
+
+  VLLM_DISPATCH_HALF_TYPES(qkv.scalar_type(), "fused_qk_norm_rope_kernel", [&] {
+    using qkv_scalar_t = scalar_t;
+    VLLM_DISPATCH_FLOATING_TYPES(
+        cos_sin_cache.scalar_type(), "fused_qk_norm_rope_kernel", [&] {
+          using cache_scalar_t = scalar_t;
+          tensorrt_llm::kernels::launchFusedQKNormRope<qkv_scalar_t,
+                                                       cache_scalar_t>(
+              qkv.data_ptr(), static_cast<int>(num_tokens),
+              static_cast<int>(num_heads_q), static_cast<int>(num_heads_k),
+              static_cast<int>(num_heads_v), static_cast<int>(head_dim),
+              static_cast<float>(eps), q_weight.data_ptr(), k_weight.data_ptr(),
+              cos_sin_cache.data_ptr(), !is_neox,
+              reinterpret_cast<int64_t const*>(position_ids.data_ptr()),
+              stream);
+        });
+  });
+}
+
+#endif  // not USE_ROCM
\ No newline at end of file
diff --git a/csrc/ops.h b/csrc/ops.h
index 3f5cb799b774..f8bdc61aaa8e 100644
--- a/csrc/ops.h
+++ b/csrc/ops.h
@@ -92,6 +92,12 @@ void rms_norm(torch::Tensor& out, torch::Tensor& input, torch::Tensor& weight,
 void fused_add_rms_norm(torch::Tensor& input, torch::Tensor& residual,
                         torch::Tensor& weight, double epsilon);
 
+void fused_qk_norm_rope(torch::Tensor& qkv, int64_t num_heads_q,
+                        int64_t num_heads_k, int64_t num_heads_v,
+                        int64_t head_dim, double eps, torch::Tensor& q_weight,
+                        torch::Tensor& k_weight, torch::Tensor& cos_sin_cache,
+                        bool is_neox, torch::Tensor& position_ids);
+
 void apply_repetition_penalties_(torch::Tensor& logits,
                                  const torch::Tensor& prompt_mask,
                                  const torch::Tensor& output_mask,
diff --git a/csrc/torch_bindings.cpp b/csrc/torch_bindings.cpp
index 9c0f524dcab1..d4a69cbe7971 100644
--- a/csrc/torch_bindings.cpp
+++ b/csrc/torch_bindings.cpp
@@ -175,6 +175,16 @@ TORCH_LIBRARY_EXPAND(TORCH_EXTENSION_NAME, ops) {
       "float epsilon) -> ()");
   ops.impl("fused_add_rms_norm", torch::kCUDA, &fused_add_rms_norm);
 
+#ifndef USE_ROCM
+  // Function for fused QK Norm and RoPE
+  ops.def(
+      "fused_qk_norm_rope(Tensor! qkv, int num_heads_q, "
+      "int num_heads_k, int num_heads_v, int head_dim, float eps, "
+      "Tensor q_weight, Tensor k_weight, Tensor cos_sin_cache, "
+      "bool is_neox, Tensor position_ids) -> ()");
+  ops.impl("fused_qk_norm_rope", torch::kCUDA, &fused_qk_norm_rope);
+#endif
+
   // Apply repetition penalties to logits in-place
   ops.def(
       "apply_repetition_penalties_(Tensor! logits, Tensor prompt_mask, "
diff --git a/csrc/type_convert.cuh b/csrc/type_convert.cuh
index 21b9d0ae515d..6da06f1e66cf 100644
--- a/csrc/type_convert.cuh
+++ b/csrc/type_convert.cuh
@@ -29,6 +29,22 @@ struct _typeConvert {
   static constexpr bool exists = false;
 };
 
+template <>
+struct _typeConvert<float> {
+  static constexpr bool exists = true;
+  using hip_type = float;
+  using packed_hip_type = float2;
+  using packed_hip_type4 = float4;  // For 128-bit vectorization
+
+  __device__ static __forceinline__ float convert(hip_type x) { return x; }
+  __device__ static __forceinline__ float2 convert(packed_hip_type x) {
+    return x;
+  }
+  __device__ static __forceinline__ float4 convert(packed_hip_type4 x) {
+    return x;
+  }
+};
+
 #if defined(USE_ROCM) || (defined(CUDA_VERSION) && (CUDA_VERSION >= 12000))
 // CUDA < 12.0 runs into issues with packed type conversion
 template <>
@@ -37,14 +53,16 @@ struct _typeConvert<c10::Half> {
   using hip_type = __half;
   using packed_hip_type = __half2;
 
-  __device__ static inline float convert(hip_type x) { return __half2float(x); }
-  __device__ static inline float2 convert(packed_hip_type x) {
+  __device__ static __forceinline__ float convert(hip_type x) {
+    return __half2float(x);
+  }
+  __device__ static __forceinline__ float2 convert(packed_hip_type x) {
     return __half22float2(x);
   }
-  __device__ static inline hip_type convert(float x) {
+  __device__ static __forceinline__ hip_type convert(float x) {
     return __float2half_rn(x);
   }
-  __device__ static inline packed_hip_type convert(float2 x) {
+  __device__ static __forceinline__ packed_hip_type convert(float2 x) {
     return __float22half2_rn(x);
   }
 };
@@ -58,16 +76,16 @@ struct _typeConvert<c10::BFloat16> {
   using hip_type = __nv_bfloat16;
   using packed_hip_type = __nv_bfloat162;
 
-  __device__ static inline float convert(hip_type x) {
+  __device__ static __forceinline__ float convert(hip_type x) {
     return __bfloat162float(x);
   }
-  __device__ static inline float2 convert(packed_hip_type x) {
+  __device__ static __forceinline__ float2 convert(packed_hip_type x) {
     return __bfloat1622float2(x);
   }
-  __device__ static inline hip_type convert(float x) {
+  __device__ static __forceinline__ hip_type convert(float x) {
     return __float2bfloat16(x);
   }
-  __device__ static inline packed_hip_type convert(float2 x) {
+  __device__ static __forceinline__ packed_hip_type convert(float2 x) {
     return __float22bfloat162_rn(x);
   }
 };
@@ -95,10 +113,15 @@ struct alignas(16) _f16Vec {
     if constexpr (width % 2 == 0) {
 #pragma unroll
       for (int i = 0; i < width; i += 2) {
-        T2 temp{data[i], data[i + 1]};
-        temp += T2{other.data[i], other.data[i + 1]};
-        data[i] = temp.x;
-        data[i + 1] = temp.y;
+        if constexpr (std::is_same_v<T2, float2>) {
+          data[i] += other.data[i];
+          data[i + 1] += other.data[i + 1];
+        } else {
+          T2 temp{data[i], data[i + 1]};
+          temp += T2{other.data[i], other.data[i + 1]};
+          data[i] = temp.x;
+          data[i + 1] = temp.y;
+        }
       }
     } else {
 #pragma unroll
@@ -111,10 +134,15 @@ struct alignas(16) _f16Vec {
     if constexpr (width % 2 == 0) {
 #pragma unroll
       for (int i = 0; i < width; i += 2) {
-        T2 temp{data[i], data[i + 1]};
-        temp *= T2{other.data[i], other.data[i + 1]};
-        data[i] = temp.x;
-        data[i + 1] = temp.y;
+        if constexpr (std::is_same_v<T2, float2>) {
+          data[i] *= other.data[i];
+          data[i + 1] *= other.data[i + 1];
+        } else {
+          T2 temp{data[i], data[i + 1]};
+          temp *= T2{other.data[i], other.data[i + 1]};
+          data[i] = temp.x;
+          data[i + 1] = temp.y;
+        }
       }
     } else {
 #pragma unroll
diff --git a/tests/compile/test_qk_norm_rope_fusion.py b/tests/compile/test_qk_norm_rope_fusion.py
new file mode 100644
index 000000000000..973123a3af92
--- /dev/null
+++ b/tests/compile/test_qk_norm_rope_fusion.py
@@ -0,0 +1,195 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import pytest
+import torch
+
+from tests.compile.backend import TestBackend
+from vllm.attention import Attention, AttentionType
+from vllm.compilation.matcher_utils import FLASHINFER_ROTARY_OP, RMS_OP, ROTARY_OP
+from vllm.compilation.noop_elimination import NoOpEliminationPass
+from vllm.compilation.post_cleanup import PostCleanupPass
+from vllm.compilation.qk_norm_rope_fusion import (
+    FUSED_QK_ROPE_OP,
+    QKNormRoPEFusionPass,
+)
+from vllm.config import (
+    CompilationConfig,
+    CompilationMode,
+    ModelConfig,
+    PassConfig,
+    VllmConfig,
+    set_current_vllm_config,
+)
+from vllm.model_executor.layers.layernorm import RMSNorm
+from vllm.model_executor.layers.rotary_embedding import RotaryEmbedding
+from vllm.platforms import current_platform
+
+RSQRT_OP = torch.ops.aten.rsqrt.default
+INDEX_SELECT_OP = torch.ops.aten.index.Tensor
+
+
+class QKNormRoPETestModel(torch.nn.Module):
+    def __init__(
+        self,
+        *,
+        num_heads: int,
+        num_kv_heads: int,
+        head_dim: int,
+        eps: float,
+        is_neox: bool,
+        vllm_config: VllmConfig,
+        dtype: torch.dtype,
+        prefix: str = "model.layers.0.self_attn.attn",
+    ) -> None:
+        super().__init__()
+        self.num_heads = num_heads
+        self.num_kv_heads = num_kv_heads
+        self.head_dim = head_dim
+        self.q_size = num_heads * head_dim
+        self.kv_size = num_kv_heads * head_dim
+        self.rotary_dim = head_dim
+        self.eps = eps
+        self.dtype = dtype
+
+        # Register layer metadata for the fusion pass via Attention.
+        self.attn = Attention(
+            num_heads=self.num_heads,
+            head_size=self.head_dim,
+            scale=1.0 / self.head_dim**0.5,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=vllm_config.cache_config,
+            prefix=prefix,
+            attn_type=AttentionType.DECODER,
+        )
+
+        self.q_norm = RMSNorm(self.head_dim, eps=self.eps)
+        self.k_norm = RMSNorm(self.head_dim, eps=self.eps)
+        self.rotary_emb = RotaryEmbedding(
+            self.head_dim,
+            rotary_dim=self.rotary_dim,
+            max_position_embeddings=4096,
+            base=10000,
+            is_neox_style=is_neox,
+            dtype=self.dtype,
+        )
+        self.enable_rms_norm_custom_op = self.q_norm.enabled()
+        self.enable_rope_custom_op = self.rotary_emb.enabled()
+
+    def forward(self, qkv: torch.Tensor, positions: torch.Tensor):
+        q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
+        q_by_head = q.view(*q.shape[:-1], q.shape[-1] // self.head_dim, self.head_dim)
+        q_by_head = self.q_norm(q_by_head)
+        q = q_by_head.view(q.shape)
+        k_by_head = k.view(*k.shape[:-1], k.shape[-1] // self.head_dim, self.head_dim)
+        k_by_head = self.k_norm(k_by_head)
+        k = k_by_head.view(k.shape)
+        q, k = self.rotary_emb(positions, q, k)
+        return q, k, v
+
+    def ops_in_model_before(self) -> list[torch._ops.OpOverload]:
+        ops = []
+        if self.enable_rms_norm_custom_op:
+            ops.append(RMS_OP)
+        else:
+            ops.append(RSQRT_OP)
+
+        if self.enable_rope_custom_op:
+            if self.rotary_emb.use_flashinfer:
+                ops.append(FLASHINFER_ROTARY_OP)
+            else:
+                ops.append(ROTARY_OP)
+        else:
+            ops.append(INDEX_SELECT_OP)
+        return ops
+
+    def ops_in_model_after(self) -> list[torch._ops.OpOverload]:
+        return [FUSED_QK_ROPE_OP]
+
+
+@pytest.mark.parametrize("eps", [1e-5, 1e-6])
+@pytest.mark.parametrize("is_neox", [True, False])
+@pytest.mark.parametrize("enable_rms_norm_custom_op", [True, False])
+@pytest.mark.parametrize("enable_rope_custom_op", [True])
+@pytest.mark.parametrize("dtype", [torch.bfloat16, torch.float16])
+@pytest.mark.skipif(
+    not current_platform.is_cuda(),
+    reason="Only test on cuda platform",
+)
+def test_qk_norm_rope_fusion(
+    eps, is_neox, enable_rms_norm_custom_op, enable_rope_custom_op, dtype
+):
+    if not hasattr(torch.ops._C, "fused_qk_norm_rope"):
+        pytest.skip("fused_qk_norm_rope custom op not available")
+
+    torch.set_default_device("cuda")
+    torch.set_default_dtype(dtype)
+    torch.manual_seed(0)
+
+    custom_ops: list[str] = []
+    if enable_rms_norm_custom_op:
+        custom_ops.append("+rms_norm")
+    if enable_rope_custom_op:
+        custom_ops.append("+rotary_embedding")
+
+    vllm_config = VllmConfig(
+        model_config=ModelConfig(dtype=dtype),
+        compilation_config=CompilationConfig(
+            mode=CompilationMode.VLLM_COMPILE,
+            custom_ops=custom_ops,
+            pass_config=PassConfig(
+                enable_qk_norm_rope_fusion=True,
+                enable_noop=True,
+            ),
+        ),
+    )
+
+    num_heads, num_kv_heads, head_dim = 16, 4, 128
+    T = 5
+
+    with set_current_vllm_config(vllm_config):
+        model = QKNormRoPETestModel(
+            num_heads=num_heads,
+            num_kv_heads=num_kv_heads,
+            head_dim=head_dim,
+            eps=eps,
+            is_neox=is_neox,
+            vllm_config=vllm_config,
+            dtype=dtype,
+        )
+
+        noop_pass = NoOpEliminationPass(vllm_config)
+        fusion_pass = QKNormRoPEFusionPass(vllm_config)
+        cleanup_pass = PostCleanupPass(vllm_config)
+
+        backend = TestBackend(noop_pass, fusion_pass, cleanup_pass)
+        backend_baseline = TestBackend(noop_pass, cleanup_pass)
+
+        qkv = torch.randn(T, model.q_size + 2 * model.kv_size)
+        pos = torch.arange(T, dtype=torch.long, device=qkv.device)
+        qkv_unfused = qkv.clone()
+        pos_unfused = pos.clone()
+
+        torch._dynamo.mark_dynamic(qkv, 0)
+        torch._dynamo.mark_dynamic(pos, 0)
+        model_fused = torch.compile(model, backend=backend)
+        q_fused, k_fused, v_fused = model_fused(qkv, pos)
+
+        torch._dynamo.mark_dynamic(qkv_unfused, 0)
+        torch._dynamo.mark_dynamic(pos_unfused, 0)
+        model_unfused = torch.compile(model, backend=backend_baseline)
+        q_unfused, k_unfused, v_unfused = model_unfused(qkv_unfused, pos_unfused)
+
+        if dtype == torch.float16:
+            ATOL, RTOL = (2e-3, 2e-3)
+        else:
+            ATOL, RTOL = (1e-2, 1e-2)
+
+        torch.testing.assert_close(q_unfused, q_fused, atol=ATOL, rtol=RTOL)
+        torch.testing.assert_close(k_unfused, k_fused, atol=ATOL, rtol=RTOL)
+        torch.testing.assert_close(v_unfused, v_fused, atol=ATOL, rtol=RTOL)
+
+        assert fusion_pass.matched_count == 1
+
+        backend.check_before_ops(model.ops_in_model_before())
+        backend.check_after_ops(model.ops_in_model_after())
diff --git a/tests/kernels/core/test_fused_qk_norm_rope.py b/tests/kernels/core/test_fused_qk_norm_rope.py
new file mode 100644
index 000000000000..88bb7691ec3b
--- /dev/null
+++ b/tests/kernels/core/test_fused_qk_norm_rope.py
@@ -0,0 +1,141 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import pytest
+import torch
+
+from tests.kernels.utils import opcheck
+from vllm.model_executor.layers.layernorm import RMSNorm
+from vllm.model_executor.layers.rotary_embedding import RotaryEmbedding
+from vllm.platforms import current_platform
+
+DTYPES = [torch.bfloat16, torch.float16]
+IS_NEOX = [True, False]
+EPS_VALUES = [1e-5, 1e-6]
+SEEDS = [13]
+CUDA_DEVICES = ["cuda:0"]
+
+
+def _apply_qk_norm_rope(
+    qkv: torch.Tensor,
+    positions: torch.Tensor,
+    q_norm: RMSNorm,
+    k_norm: RMSNorm,
+    rope: RotaryEmbedding,
+    num_heads_q: int,
+    num_heads_kv: int,
+    head_dim: int,
+) -> torch.Tensor:
+    q_size = num_heads_q * head_dim
+    kv_size = num_heads_kv * head_dim
+
+    q, k, v = qkv.split([q_size, kv_size, kv_size], dim=-1)
+
+    q_by_head = q.view(*q.shape[:-1], q.shape[-1] // head_dim, head_dim)
+    q_by_head = q_norm.forward_native(q_by_head)
+    q = q_by_head.view(q.shape)
+
+    k_by_head = k.view(*k.shape[:-1], k.shape[-1] // head_dim, head_dim)
+    k_by_head = k_norm.forward_native(k_by_head)
+    k = k_by_head.view(k.shape)
+
+    q, k = rope.forward_native(positions, q, k)
+    return torch.cat([q, k, v], dim=-1)
+
+
+@pytest.mark.skipif(
+    not current_platform.is_cuda(),
+    reason="fused_qk_norm_rope custom op requires cuda platform",
+)
+@pytest.mark.parametrize("device", CUDA_DEVICES)
+@pytest.mark.parametrize("dtype", DTYPES)
+@pytest.mark.parametrize("is_neox", IS_NEOX)
+@pytest.mark.parametrize("eps", EPS_VALUES)
+@pytest.mark.parametrize("seed", SEEDS)
+@torch.inference_mode()
+def test_fused_qk_norm_rope_matches_reference(
+    device: str,
+    dtype: torch.dtype,
+    is_neox: bool,
+    eps: float,
+    seed: int,
+):
+    torch.set_default_device(device)
+    current_platform.seed_everything(seed)
+    num_heads, num_kv_heads, head_dim = 16, 4, 128
+    num_tokens = 4
+
+    total_dim = (num_heads + 2 * num_kv_heads) * head_dim
+    qkv_base = torch.randn(num_tokens, total_dim, dtype=dtype, device=device)
+    qkv_fused = qkv_base.clone()
+    positions = torch.arange(num_tokens, dtype=torch.long, device=device)
+
+    q_norm = RMSNorm(head_dim, eps=eps).to(device=device, dtype=dtype)
+    k_norm = RMSNorm(head_dim, eps=eps).to(device=device, dtype=dtype)
+    q_norm.weight.data.normal_(mean=1.0, std=0.1)
+    k_norm.weight.data.normal_(mean=1.0, std=0.1)
+    q_weight = q_norm.weight.data
+    k_weight = k_norm.weight.data
+
+    rope = RotaryEmbedding(
+        head_size=head_dim,
+        rotary_dim=head_dim,
+        max_position_embeddings=4096,
+        base=10000.0,
+        is_neox_style=is_neox,
+        dtype=dtype,
+    ).to(device)
+
+    ref_result = _apply_qk_norm_rope(
+        qkv=qkv_base,
+        positions=positions,
+        q_norm=q_norm,
+        k_norm=k_norm,
+        rope=rope,
+        num_heads_q=num_heads,
+        num_heads_kv=num_kv_heads,
+        head_dim=head_dim,
+    )
+
+    opcheck(
+        torch.ops._C.fused_qk_norm_rope,
+        (
+            qkv_fused.clone(),
+            num_heads,
+            num_kv_heads,
+            num_kv_heads,
+            head_dim,
+            eps,
+            q_weight,
+            k_weight,
+            rope.cos_sin_cache,
+            is_neox,
+            positions.view(-1),
+        ),
+    )
+
+    torch.ops._C.fused_qk_norm_rope(
+        qkv_fused,
+        num_heads,
+        num_kv_heads,
+        num_kv_heads,
+        head_dim,
+        eps,
+        q_weight,
+        k_weight,
+        rope.cos_sin_cache,
+        is_neox,
+        positions.view(-1),
+    )
+
+    if dtype == torch.float16:
+        ATOL, RTOL = (2e-3, 2e-3)
+    else:
+        ATOL, RTOL = (1e-2, 1e-2)
+
+    torch.testing.assert_close(
+        qkv_fused,
+        ref_result,
+        atol=ATOL,
+        rtol=RTOL,
+    )
diff --git a/vllm/_custom_ops.py b/vllm/_custom_ops.py
index 36aab503dee7..136a3193efb5 100644
--- a/vllm/_custom_ops.py
+++ b/vllm/_custom_ops.py
@@ -329,6 +329,7 @@ def rms_norm(
     out: torch.Tensor, input: torch.Tensor, weight: torch.Tensor, epsilon: float
 ) -> None:
     # TODO: Remove this contiguous call when the kernel is updated to support non-contiguous input
+    # If removed, also need to remove contiguous in MatcherRMSNorm
     input_contiguous = input.contiguous()
     torch.ops._C.rms_norm(out, input_contiguous, weight, epsilon)
 
@@ -339,6 +340,34 @@ def fused_add_rms_norm(
     torch.ops._C.fused_add_rms_norm(input, residual, weight, epsilon)
 
 
+def fused_qk_norm_rope(
+    qkv: torch.Tensor,
+    num_heads_q: int,
+    num_heads_k: int,
+    num_heads_v: int,
+    head_dim: int,
+    eps: float,
+    q_weight: torch.Tensor,
+    k_weight: torch.Tensor,
+    cos_sin_cache: torch.Tensor,
+    is_neox: bool,
+    position_ids: torch.Tensor,
+) -> None:
+    torch.ops._C.fused_qk_norm_rope(
+        qkv,
+        num_heads_q,
+        num_heads_k,
+        num_heads_v,
+        head_dim,
+        eps,
+        q_weight,
+        k_weight,
+        cos_sin_cache,
+        is_neox,
+        position_ids,
+    )
+
+
 def apply_repetition_penalties_torch(
     logits: torch.Tensor,
     prompt_mask: torch.Tensor,
diff --git a/vllm/compilation/fix_functionalization.py b/vllm/compilation/fix_functionalization.py
index 29462d9ff0e5..126ad35e527a 100644
--- a/vllm/compilation/fix_functionalization.py
+++ b/vllm/compilation/fix_functionalization.py
@@ -132,6 +132,23 @@ def __call__(self, graph: torch.fx.Graph):
                         "input_global_scale",
                     ),
                 )
+            # Defunctionalize fused_qk_norm_rope to remove higher-order wrapper.
+            elif at_target == torch.ops._C.fused_qk_norm_rope.default:
+                mutated_args = {1: "qkv"}
+                args = (
+                    "qkv",
+                    "num_heads_q",
+                    "num_heads_k",
+                    "num_heads_v",
+                    "head_dim",
+                    "eps",
+                    "q_weight",
+                    "k_weight",
+                    "cos_sin_cache",
+                    "is_neox",
+                    "position_ids",
+                )
+                self.defunctionalize(graph, node, mutated_args=mutated_args, args=args)
             else:
                 continue  # skip the count
 
diff --git a/vllm/compilation/fusion.py b/vllm/compilation/fusion.py
index 8f0ad2d69fbe..1d6e297b495e 100644
--- a/vllm/compilation/fusion.py
+++ b/vllm/compilation/fusion.py
@@ -44,6 +44,10 @@ def empty_i32(*args, **kwargs):
     return torch.empty(*args, **kwargs, dtype=torch.int32, device="cuda")
 
 
+def empty_i64(*args, **kwargs):
+    return torch.empty(*args, **kwargs, dtype=torch.int64, device="cuda")
+
+
 RMS_OP = torch.ops._C.rms_norm.default
 RMS_ADD_OP = torch.ops._C.fused_add_rms_norm.default
 
diff --git a/vllm/compilation/matcher_utils.py b/vllm/compilation/matcher_utils.py
index 383fe6033a6d..38eb4e5301a1 100644
--- a/vllm/compilation/matcher_utils.py
+++ b/vllm/compilation/matcher_utils.py
@@ -18,10 +18,13 @@
     kFp8StaticTensorSym,
     kNvfp4Quant,
 )
+from vllm.model_executor.layers.rotary_embedding import RotaryEmbedding
 from vllm.platforms import current_platform
 
 RMS_OP = torch.ops._C.rms_norm.default
 RMS_ADD_OP = torch.ops._C.fused_add_rms_norm.default
+ROTARY_OP = torch.ops._C.rotary_embedding.default
+FLASHINFER_ROTARY_OP = torch.ops.vllm.flashinfer_rotary_embedding.default
 
 QUANT_OPS: dict[QuantKey, OpOverload] = {
     kFp8StaticTensorSym: torch.ops._C.static_scaled_fp8_quant.default,  # noqa: E501
@@ -58,6 +61,9 @@ def __call__(self, *args, **kws):
     def empty(self, *args, **kws):
         return torch.empty(*args, dtype=self.model_dtype, device=self.device, **kws)
 
+    def empty_int64(self, *args, **kws):
+        return torch.empty(*args, dtype=torch.int64, device=self.device, **kws)
+
     def empty_f32(self, *args, **kws):
         return torch.empty(*args, dtype=torch.float32, device=self.device, **kws)
 
@@ -66,6 +72,77 @@ def inputs(self) -> list[torch.Tensor]:
         raise NotImplementedError
 
 
+class MatcherRotaryEmbedding(MatcherCustomOp):
+    def __init__(
+        self,
+        is_neox: bool,
+        head_size: int,
+        num_heads: int,
+        num_kv_heads: int,
+        use_flashinfer: bool = False,
+        enabled: bool | None = None,
+    ) -> None:
+        if enabled is None:
+            enabled = RotaryEmbedding.enabled()
+
+        super().__init__(enabled)
+        self.is_neox = is_neox
+        self.head_size = head_size
+        self.num_heads = num_heads
+        self.num_kv_heads = num_kv_heads
+        self.q_size = self.num_heads * self.head_size
+        self.kv_size = self.num_kv_heads * self.head_size
+        self.rotary_dim = head_size
+        if use_flashinfer:
+            self.rotary_op = FLASHINFER_ROTARY_OP
+        else:
+            self.rotary_op = ROTARY_OP
+
+    def inputs(self) -> list[torch.Tensor]:
+        positions = self.empty_int64(5)
+        query = self.empty(5, self.q_size)
+        key = self.empty(5, self.kv_size)
+        cos_sin_cache = self.empty(4096, self.rotary_dim)
+        return [positions, query, key, cos_sin_cache]
+
+    def forward_custom(
+        self,
+        positions: torch.Tensor,
+        query: torch.Tensor,
+        key: torch.Tensor | None,
+        cos_sin_cache: torch.Tensor,
+    ) -> tuple[torch.Tensor, torch.Tensor | None]:
+        result = auto_functionalized(
+            self.rotary_op,
+            positions=positions,
+            query=query,
+            key=key,
+            head_size=self.head_size,
+            cos_sin_cache=cos_sin_cache,
+            is_neox=self.is_neox,
+        )
+        query_out = result[1]
+        key_out = result[2] if len(result) > 2 else None
+        return query_out, key_out
+
+    def forward_native(
+        self,
+        positions: torch.Tensor,
+        query: torch.Tensor,
+        key: torch.Tensor | None,
+        cos_sin_cache: torch.Tensor,
+    ) -> tuple[torch.Tensor, torch.Tensor | None]:
+        return RotaryEmbedding.forward_static(
+            positions,
+            query,
+            key,
+            self.head_size,
+            self.rotary_dim,
+            cos_sin_cache,
+            self.is_neox,
+        )
+
+
 class MatcherRMSNorm(MatcherCustomOp):
     def __init__(self, epsilon: float, enabled: bool | None = None):
         if enabled is None:
@@ -85,10 +162,12 @@ def forward_custom(
         weight: torch.Tensor,
     ) -> torch.Tensor:
         result = torch.empty_like(input)
+        # TODO: support non-contiguous input for RMSNorm and remove this
+        input_contiguous = input.contiguous()
         _, result = auto_functionalized(
             RMS_OP,
             result=result,
-            input=input,
+            input=input_contiguous,
             weight=weight,
             epsilon=self.epsilon,
         )
diff --git a/vllm/compilation/pass_manager.py b/vllm/compilation/pass_manager.py
index dfda2adf1d3b..0c2210d72ce0 100644
--- a/vllm/compilation/pass_manager.py
+++ b/vllm/compilation/pass_manager.py
@@ -17,6 +17,7 @@
     from .activation_quant_fusion import ActivationQuantFusionPass
     from .fusion import RMSNormQuantFusionPass
     from .fusion_attn import AttnFusionPass
+    from .qk_norm_rope_fusion import QKNormRoPEFusionPass
 
 if current_platform.is_cuda():
     from .collective_fusion import AllReduceFusionPass, AsyncTPPass
@@ -109,6 +110,9 @@ def configure(self, config: VllmConfig):
             if self.pass_config.enable_attn_fusion:
                 self.passes += [AttnFusionPass(config)]
 
+            if self.pass_config.enable_qk_norm_rope_fusion:
+                self.passes += [QKNormRoPEFusionPass(config)]
+
             # needs a functional graph
             self.post_cleanup = PostCleanupPass(config)
             self.fix_functionalization = FixFunctionalizationPass(config)
diff --git a/vllm/compilation/qk_norm_rope_fusion.py b/vllm/compilation/qk_norm_rope_fusion.py
new file mode 100644
index 000000000000..e3c399e07906
--- /dev/null
+++ b/vllm/compilation/qk_norm_rope_fusion.py
@@ -0,0 +1,238 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from collections.abc import Callable
+
+import torch
+import torch._inductor.pattern_matcher as pm
+from torch import fx
+from torch._higher_order_ops.auto_functionalize import auto_functionalized
+from torch._inductor.pattern_matcher import PatternMatcherPass
+
+from vllm.attention import Attention
+from vllm.config import VllmConfig, get_layers_from_vllm_config
+from vllm.logger import init_logger
+from vllm.model_executor.layers.rotary_embedding import RotaryEmbedding
+
+from .fusion import empty_bf16, empty_fp32, empty_i64
+from .inductor_pass import enable_fake_mode
+from .matcher_utils import MatcherRMSNorm, MatcherRotaryEmbedding
+from .vllm_inductor_pass import VllmInductorPass, VllmPatternMatcherPass
+
+logger = init_logger(__name__)
+
+FUSED_QK_ROPE_OP = torch.ops._C.fused_qk_norm_rope.default
+
+
+class QkNormRopePattern:
+    """
+    Match the unfused sequence in attention blocks and replace with the fused op.
+
+    Unfused (conceptually):
+      q, k, v = split(qkv, [qsz, kvsz, kvsz], -1)
+      qh = reshape(q, [-1, num_heads, head_dim])
+      kh = reshape(k, [-1, num_kv_heads, head_dim])
+      qn = rms_norm(qh, q_weight, eps)
+      kn = rms_norm(kh, k_weight, eps)
+      qf = reshape(qn, [-1, num_heads * head_dim])
+      kf = reshape(kn, [-1, num_kv_heads * head_dim])
+      qf, kf = rotary_embedding(positions, qf, kf, head_dim, cos_sin_cache, is_neox)
+      return qf, kf, v
+
+    Fused replacement:
+      fused_qk_norm_rope(qkv, num_heads, num_kv_heads, num_kv_heads, head_dim,
+                         eps, q_weight, k_weight, cos_sin_cache, is_neox,
+                         positions.view(-1))
+      return split(qkv, [qsz, kvsz, kvsz], -1)
+    """
+
+    def __init__(
+        self,
+        head_dim: int,
+        num_heads: int,
+        num_kv_heads: int,
+        eps: float,
+        is_neox: bool,
+        rope_flashinfer: bool = False,
+    ) -> None:
+        self.num_heads = num_heads
+        self.num_kv_heads = num_kv_heads
+        self.head_dim = head_dim
+        self.q_size = self.num_heads * self.head_dim
+        self.kv_size = self.num_kv_heads * self.head_dim
+        self.eps = eps
+        self.rmsnorm_matcher = MatcherRMSNorm(eps)
+        self.is_neox = is_neox
+        self.rope_flashinfer = rope_flashinfer
+        self.rope_matcher = MatcherRotaryEmbedding(
+            is_neox=is_neox,
+            head_size=self.head_dim,
+            num_heads=self.num_heads,
+            num_kv_heads=self.num_kv_heads,
+            use_flashinfer=self.rope_flashinfer,
+        )
+
+    def get_inputs(self):
+        # Sample inputs to help pattern tracing
+        T = 5
+        qkv = empty_bf16(T, self.q_size + 2 * self.kv_size)
+        positions = empty_i64(T)
+        q_weight = empty_bf16(1, self.head_dim)
+        k_weight = empty_bf16(1, self.head_dim)
+        if self.rope_flashinfer:
+            cos_sin_cache = empty_fp32(4096, self.head_dim)
+        else:
+            cos_sin_cache = empty_bf16(4096, self.head_dim)
+        return [
+            qkv,
+            positions,
+            q_weight,
+            k_weight,
+            cos_sin_cache,
+        ]
+
+    @staticmethod
+    def wrap_trace_fn(trace_fn, *process_fx_fns: Callable[[fx.GraphModule], None]):
+        def wrapped(*args, **kwargs):
+            gm = trace_fn(*args, **kwargs)
+            for process_fx in process_fx_fns:
+                process_fx(gm)
+
+            return gm
+
+        return wrapped
+
+    @staticmethod
+    def fx_view_to_reshape(gm: torch.fx.GraphModule):
+        from torch._inductor.fx_passes.post_grad import view_to_reshape
+
+        view_to_reshape(gm)
+
+    def register(self, pm_pass: PatternMatcherPass):
+        def pattern(
+            qkv: torch.Tensor,
+            positions: torch.Tensor,
+            q_weight: torch.Tensor,
+            k_weight: torch.Tensor,
+            cos_sin_cache: torch.Tensor,
+        ):
+            # split qkv -> q,k,v
+            q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
+
+            # Q path: view -> RMS -> view back to q.shape
+            q_by_head = q.view(
+                *q.shape[:-1], q.shape[-1] // self.head_dim, self.head_dim
+            )
+            q_normed_by_head = self.rmsnorm_matcher(q_by_head, q_weight)
+            q_flat = q_normed_by_head.view(q.shape)
+
+            # K path: view -> RMS -> view back to k.shape
+            k_by_head = k.view(
+                *k.shape[:-1], k.shape[-1] // self.head_dim, self.head_dim
+            )
+            k_normed_by_head = self.rmsnorm_matcher(k_by_head, k_weight)
+            k_flat = k_normed_by_head.view(k.shape)
+
+            # RoPE: apply to flattened q/k
+            q_rope, k_rope = self.rope_matcher(positions, q_flat, k_flat, cos_sin_cache)
+            return q_rope, k_rope, v
+
+        def replacement(
+            qkv: torch.Tensor,
+            positions: torch.Tensor,
+            q_weight: torch.Tensor,
+            k_weight: torch.Tensor,
+            cos_sin_cache: torch.Tensor,
+        ):
+            # Run fused qk_norm_rope op
+            result = auto_functionalized(
+                FUSED_QK_ROPE_OP,
+                qkv=qkv,
+                num_heads_q=self.num_heads,
+                num_heads_k=self.num_kv_heads,
+                num_heads_v=self.num_kv_heads,
+                head_dim=self.head_dim,
+                eps=self.eps,
+                q_weight=q_weight,
+                k_weight=k_weight,
+                cos_sin_cache=cos_sin_cache,
+                is_neox=self.is_neox,
+                position_ids=positions.view(-1),
+            )
+            result_qkv = result[1]
+
+            # Split back to q,k,v and return
+            return result_qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
+
+        # NOTE: use fx_view_to_reshape to unify view/reshape to simplify
+        # pattern and increase matching opportunities
+        pm.register_replacement(
+            pattern,
+            replacement,
+            self.get_inputs(),
+            QkNormRopePattern.wrap_trace_fn(
+                pm.fwd_only,
+                QkNormRopePattern.fx_view_to_reshape,
+            ),
+            pm_pass,
+        )
+
+
+class QKNormRoPEFusionPass(VllmPatternMatcherPass):
+    """Fuse Q/K RMSNorm + RoPE into fused_qk_norm_rope when the custom op exists."""
+
+    @enable_fake_mode
+    def __init__(self, config: VllmConfig):
+        super().__init__(config)
+        self.patterns: PatternMatcherPass = PatternMatcherPass(
+            pass_name="qk_norm_rope_fusion_pass"
+        )
+
+        dtype = config.model_config.dtype
+        if dtype not in (torch.bfloat16, torch.float16):
+            logger.warning_once(
+                "QK Norm+RoPE fusion not enabled: unsupported dtype %s", dtype
+            )
+            return
+
+        # use one attn layer to get meta (such as head_dim) for QkNormRopePattern
+        attn_layers: dict[str, Attention] = get_layers_from_vllm_config(
+            config, Attention
+        )
+        if len(attn_layers) == 0:
+            logger.warning_once(
+                "QK Norm+RoPE fusion enabled, but no Attention layers were discovered."
+            )
+            return
+        layer = next(iter(attn_layers.values()))
+
+        for epsilon in [1e-5, 1e-6]:
+            for neox in [True, False]:
+                if RotaryEmbedding.enabled():
+                    for rope_flashinfer in [False, True]:
+                        QkNormRopePattern(
+                            head_dim=layer.head_size,
+                            num_heads=layer.num_heads,
+                            num_kv_heads=layer.num_kv_heads,
+                            eps=epsilon,
+                            is_neox=neox,
+                            rope_flashinfer=rope_flashinfer,
+                        ).register(self.patterns)
+                else:
+                    QkNormRopePattern(
+                        head_dim=layer.head_size,
+                        num_heads=layer.num_heads,
+                        num_kv_heads=layer.num_kv_heads,
+                        eps=epsilon,
+                        is_neox=neox,
+                    ).register(self.patterns)
+
+        self.dump_patterns(config, self.patterns)
+
+    @VllmInductorPass.time_and_log
+    def __call__(self, graph: fx.Graph) -> None:
+        self.matched_count = self.patterns.apply(graph)
+        logger.debug("Fused QK Norm+RoPE on %s sites", self.matched_count)
+
+    def uuid(self):
+        return VllmInductorPass.hash_source(self, QkNormRopePattern)
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 92cf16f259fe..9c9557df4e73 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -129,6 +129,8 @@ class PassConfig:
                 8: 1,  # 1MB
             },
         }, where key is the device capability"""
+    enable_qk_norm_rope_fusion: bool = False
+    """Whether to enable the fused Q/K RMSNorm + RoPE pass."""
 
     # TODO(luka) better pass enabling system.
 
@@ -182,6 +184,12 @@ def __post_init__(self) -> None:
                     "Fusion enabled but reshape elimination disabled. "
                     "Allreduce + rms norm + quant (fp8) fusion might not work"
                 )
+        if self.enable_qk_norm_rope_fusion and not current_platform.is_cuda():
+            logger.warning_once(
+                "QK Norm + RoPE fusion enabled but the current platform is not "
+                "CUDA. The fusion will be disabled."
+            )
+            self.enable_qk_norm_rope_fusion = False
 
 
 @config
@@ -640,6 +648,11 @@ def __post_init__(self) -> None:
         if isinstance(self.pass_config, dict):
             self.pass_config = PassConfig(**self.pass_config)
 
+        if self.pass_config.enable_qk_norm_rope_fusion:
+            # TODO(zhuhaoran): support rope native forward match and remove this.
+            # Linked issue: https://github.com/vllm-project/vllm/issues/28042
+            self.custom_ops.append("+rotary_embedding")
+
         if (
             is_torch_equal_or_newer("2.9.0.dev")
             and "combo_kernels" not in self.inductor_compile_config
diff --git a/vllm/model_executor/layers/rotary_embedding/base.py b/vllm/model_executor/layers/rotary_embedding/base.py
index 2ef54e75df44..ce4f40680b0a 100644
--- a/vllm/model_executor/layers/rotary_embedding/base.py
+++ b/vllm/model_executor/layers/rotary_embedding/base.py
@@ -98,35 +98,56 @@ def __init__(
             head_size, rotary_dim, max_position_embeddings, base, is_neox_style, dtype
         )
 
-    def forward_native(
-        self,
+    @staticmethod
+    def forward_static(
         positions: torch.Tensor,
         query: torch.Tensor,
-        key: torch.Tensor | None = None,
+        key: torch.Tensor | None,
+        head_size: int,
+        rotary_dim: int,
+        cos_sin_cache: torch.Tensor,
+        is_neox_style: bool,
     ) -> tuple[torch.Tensor, torch.Tensor | None]:
         """A PyTorch-native implementation of forward()."""
         positions = positions.flatten()
         num_tokens = positions.shape[0]
-        cos_sin = self.cos_sin_cache.index_select(0, positions)
+        cos_sin = cos_sin_cache.index_select(0, positions)
         cos, sin = cos_sin.chunk(2, dim=-1)
 
         query_shape = query.shape
-        query = query.view(num_tokens, -1, self.head_size)
-        query_rot = query[..., : self.rotary_dim]
-        query_pass = query[..., self.rotary_dim :]
-        query_rot = apply_rotary_emb_torch(query_rot, cos, sin, self.is_neox_style)
+        query = query.view(num_tokens, -1, head_size)
+        query_rot = query[..., :rotary_dim]
+        query_pass = query[..., rotary_dim:]
+        query_rot = apply_rotary_emb_torch(query_rot, cos, sin, is_neox_style)
         query = torch.cat((query_rot, query_pass), dim=-1).reshape(query_shape)
 
         # key may be None in some cases, e.g. cross-layer KV sharing
         if key is not None:
             key_shape = key.shape
-            key = key.view(num_tokens, -1, self.head_size)
-            key_rot = key[..., : self.rotary_dim]
-            key_pass = key[..., self.rotary_dim :]
-            key_rot = apply_rotary_emb_torch(key_rot, cos, sin, self.is_neox_style)
+            key = key.view(num_tokens, -1, head_size)
+            key_rot = key[..., :rotary_dim]
+            key_pass = key[..., rotary_dim:]
+            key_rot = apply_rotary_emb_torch(key_rot, cos, sin, is_neox_style)
             key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
         return query, key
 
+    def forward_native(
+        self,
+        positions: torch.Tensor,
+        query: torch.Tensor,
+        key: torch.Tensor | None = None,
+    ) -> tuple[torch.Tensor, torch.Tensor | None]:
+        """A PyTorch-native implementation of forward()."""
+        return self.forward_static(
+            positions,
+            query,
+            key,
+            self.head_size,
+            self.rotary_dim,
+            self.cos_sin_cache,
+            self.is_neox_style,
+        )
+
     def forward_cuda(
         self,
         positions: torch.Tensor,

From 05576df85c5274ee3045d90b0779d4adeecc09b9 Mon Sep 17 00:00:00 2001
From: xuebwang-amd <xuebwang@amd.com>
Date: Wed, 12 Nov 2025 01:05:22 +0800
Subject: [PATCH 066/183] [ROCm][Quantization] extend AMD Quark to support
 mixed-precision quantized model (#24239)

Signed-off-by: xuebwang-amd <xuebwang@amd.com>
Co-authored-by: fxmarty-amd <felmarty@amd.com>
Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>
---
 docs/features/quantization/quark.md           | 34 ++++++++-
 tests/quantization/test_mixed_precision.py    | 69 +++++++++++++++++++
 .../layers/quantization/quark/quark.py        | 32 +++++++--
 3 files changed, 127 insertions(+), 8 deletions(-)
 create mode 100755 tests/quantization/test_mixed_precision.py

diff --git a/docs/features/quantization/quark.md b/docs/features/quantization/quark.md
index 385e3bbb8712..be0702f4c9e1 100644
--- a/docs/features/quantization/quark.md
+++ b/docs/features/quantization/quark.md
@@ -281,4 +281,36 @@ python quantize_quark.py --model_dir Qwen/Qwen1.5-MoE-A2.7B-Chat \
     --group_size 32
 ```
 
-The current integration supports [all combination of FP4, FP6_E3M2, FP6_E2M3](https://github.com/vllm-project/vllm/blob/main/vllm/model_executor/layers/quantization/utils/ocp_mx_utils.py) used for either weights or activations. Eventually, some target hardware support mixed precision GEMM, as AMD Instinct MI350/MI355, for example using FP6 for activations and FP4 for weights.
+The current integration supports [all combination of FP4, FP6_E3M2, FP6_E2M3](https://github.com/vllm-project/vllm/blob/main/vllm/model_executor/layers/quantization/utils/ocp_mx_utils.py) used for either weights or activations.
+
+## Using Quark Quantized layerwise Auto Mixed Precision (AMP) Models
+
+vLLM also supports loading layerwise mixed precision model quantized using AMD Quark. Currently, mixed scheme of {MXFP4, FP8} is supported, where FP8 here denotes for FP8 per-tensor scheme. More mixed precision schemes are planned to be supported in a near future, including
+
+- Unquantized Linear and/or MoE layer(s) as an option for each layer, i.e., mixed of {MXFP4, FP8, BF16/FP16}
+- MXFP6 quantization extension, i.e., {MXFP4, MXFP6, FP8, BF16/FP16}
+
+Although one can maximize serving throughput using the lowest precision supported on a given device (e.g. MXFP4 for AMD Instinct MI355, FP8 for AMD Instinct MI300), these aggressive schemes can be detrimental to accuracy recovering from quantization on target tasks. Mixed precision allows to strike a balance between maximizing accuracy and throughput.
+
+There are two steps to generate and deploy a mixed precision model quantized with AMD Quark, as shown below.
+
+### 1. Quantize a model using mixed precision in AMD Quark
+
+Firstly, the layerwise mixed-precision configuration for a given LLM model is searched and then quantized using AMD Quark. We will provide a detailed tutorial with Quark APIs later.
+
+As examples, we provide some ready-to-use quantized mixed precision model to show the usage in vLLM and the accuracy benifits. They are:
+
+- amd/Llama-2-70b-chat-hf-WMXFP4FP8-AMXFP4FP8-AMP-KVFP8
+- amd/Mixtral-8x7B-Instruct-v0.1-WMXFP4FP8-AMXFP4FP8-AMP-KVFP8
+- amd/Qwen3-8B-WMXFP4FP8-AMXFP4FP8-AMP-KVFP8
+
+### 2. inference the quantized mixed precision model in vLLM
+
+Models quantized with AMD Quark using mixed precision can natively be reload in vLLM, and e.g. evaluated using lm-evaluation-harness as follow:
+
+```bash
+lm_eval --model vllm \
+    --model_args pretrained=amd/Llama-2-70b-chat-hf-WMXFP4FP8-AMXFP4FP8-AMP-KVFP8,tensor_parallel_size=4,dtype=auto,gpu_memory_utilization=0.8,trust_remote_code=False \
+    --tasks mmlu \
+    --batch_size auto
+```
diff --git a/tests/quantization/test_mixed_precision.py b/tests/quantization/test_mixed_precision.py
new file mode 100755
index 000000000000..51526470b423
--- /dev/null
+++ b/tests/quantization/test_mixed_precision.py
@@ -0,0 +1,69 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""Test quark-quantized {MXFP4, FP8} mixed precision models.
+
+Run `pytest tests/quantization/test_mixed_precision.py`.
+
+"""
+
+import importlib
+import importlib.metadata
+from dataclasses import dataclass
+
+import lm_eval
+import pytest
+from packaging import version
+
+QUARK_MXFP4_AVAILABLE = importlib.util.find_spec("quark") is not None and version.parse(
+    importlib.metadata.version("amd-quark")
+) >= version.parse("0.8.99")
+
+
+@dataclass
+class ModelCase:
+    model_id: str
+    tp: int
+
+
+@dataclass
+class EvaluationConfig:
+    model_name: str
+
+    def get_model_args(self) -> str:
+        return (
+            f"pretrained={self.model_name},"
+            "tensor_parallel_size=4,dtype=auto,gpu_memory_utilization=0.8,trust_remote_code=False"
+        )
+
+
+TEST_CONFIGS = {
+    # Mixed-precision (AMP) model
+    # - Demonstrates end-to-end pipeline functionality
+    "amd/Qwen3-8B-WMXFP4FP8-AMXFP4FP8-AMP-KVFP8": {"arc_challenge": 0.52, "mmlu": 0.72},
+    # Non-mixed-precision (PTQ) model
+    # - Reference for pipeline compatibility verification -> No conflicts or breakings
+    "amd/Llama-2-70b-chat-hf-FP8-MLPerf-fp8_attn_quark_format": {
+        "arc_challenge": 0.53,
+        "mmlu": 0.61,
+    },
+}
+
+
+@pytest.mark.parametrize("model_name, accuracy_numbers", TEST_CONFIGS.items())
+@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE, reason="amd-quark>=0.9 is not available")
+def test_mixed_precision_model_accuracies(model_name: str, accuracy_numbers: dict):
+    results = lm_eval.simple_evaluate(
+        model="vllm",
+        model_args=EvaluationConfig(model_name).get_model_args(),
+        tasks=list(accuracy_numbers.keys()),
+        batch_size=8,
+    )
+
+    rtol = 0.05
+
+    for task, expect_accuracy in accuracy_numbers.items():
+        measured_accuracy = results["results"][task]["acc,none"]
+        assert (
+            measured_accuracy - rtol < expect_accuracy
+            and measured_accuracy + rtol > expect_accuracy
+        ), f"Expected: {expect_accuracy} |  Measured: {measured_accuracy}"
diff --git a/vllm/model_executor/layers/quantization/quark/quark.py b/vllm/model_executor/layers/quantization/quark/quark.py
index d5459594b798..095a66ef10f9 100644
--- a/vllm/model_executor/layers/quantization/quark/quark.py
+++ b/vllm/model_executor/layers/quantization/quark/quark.py
@@ -114,7 +114,14 @@ def from_config(cls, config: dict[str, Any]) -> "QuarkConfig":
             layer_quant_names = list(layer_quant_config.keys())
             layer_quant_set = set(layer_quant_names)
 
-            if not kv_cache_set.issubset(layer_quant_set):
+            if not (
+                kv_cache_set.issubset(layer_quant_set)
+                or any(
+                    fnmatch.fnmatchcase(layer_quant, pat)
+                    for layer_quant in list(layer_quant_set)
+                    for pat in list(kv_cache_set)
+                )
+            ):
                 raise ValueError(
                     "The Quark quantized model has the "
                     "kv_cache_group parameter setting, "
@@ -124,10 +131,15 @@ def from_config(cls, config: dict[str, Any]) -> "QuarkConfig":
                 )
 
             q_configs = [
-                cast(dict[str, Any], layer_quant_config.get(name))
-                for name in kv_cache_group
+                quant_cfg
+                for name, quant_cfg in layer_quant_config.items()
+                if any(fnmatch.fnmatchcase(name, pattern) for pattern in kv_cache_group)
             ]
-            if not all(deep_compare(q_config, q_configs[0]) for q_config in q_configs):
+
+            if not all(
+                deep_compare(q_config["output_tensors"], q_configs[0]["output_tensors"])
+                for q_config in q_configs
+            ):
                 raise ValueError(
                     "The quantization method used for kv_cache should "
                     "be the same, but the quantization method for the "
@@ -312,9 +324,15 @@ def _find_matched_config(
             layer_quant_config = cast(
                 dict[str, Any], self.quant_config.get("layer_quant_config")
             )
-            for name_pattern in layer_quant_config:
-                if fnmatch.fnmatch(layer_name, name_pattern):
-                    return layer_quant_config[name_pattern]
+
+            def _matches_pattern(layer_name, pattern):
+                if "*" not in pattern:
+                    return layer_name in pattern
+                return fnmatch.fnmatch(layer_name, pattern)
+
+            for name_pattern, config in layer_quant_config.items():
+                if _matches_pattern(layer_name, name_pattern):
+                    return config
 
             layer_type = cast(str, type(module))
             layer_type_quant_config = cast(

From 5a1271d83a65be5ed8dc3e4c990ed42074197db3 Mon Sep 17 00:00:00 2001
From: xuebwang-amd <xuebwang@amd.com>
Date: Wed, 12 Nov 2025 01:06:00 +0800
Subject: [PATCH 067/183] [Quantization] fix attention quantization of gpt_oss
 model (#27334)

Signed-off-by: xuebwang-amd <xuebwang@amd.com>
---
 .../test_gpt_oss_attn_quantization.py         | 80 +++++++++++++++++++
 .../layers/quantization/mxfp4.py              | 15 +++-
 vllm/model_executor/models/gpt_oss.py         | 10 ++-
 3 files changed, 101 insertions(+), 4 deletions(-)
 create mode 100644 tests/models/quantization/test_gpt_oss_attn_quantization.py

diff --git a/tests/models/quantization/test_gpt_oss_attn_quantization.py b/tests/models/quantization/test_gpt_oss_attn_quantization.py
new file mode 100644
index 000000000000..780165ea2ba7
--- /dev/null
+++ b/tests/models/quantization/test_gpt_oss_attn_quantization.py
@@ -0,0 +1,80 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""Test attention quantization of gpt-oss model.
+The qkv_proj and o_proj in self_attention can be either quantized or excluded.
+
+Run `pytest tests/models/quantization/test_gpt_oss_attn_quantization.py`.
+
+"""
+
+import importlib
+import importlib.metadata
+from dataclasses import dataclass
+
+import huggingface_hub
+import lm_eval
+import pytest
+from packaging import version
+
+MODEL_NAMES = ["amd/gpt-oss-20b-customized-attention-quantization"]
+
+QUARK_MXFP4_AVAILABLE = importlib.util.find_spec("quark") is not None and version.parse(
+    importlib.metadata.version("amd-quark")
+) >= version.parse("0.8.99")
+
+
+def has_huggingface_access(repo):
+    try:
+        huggingface_hub.list_repo_refs(repo)
+        return True
+    except huggingface_hub.errors.RepositoryNotFoundError:
+        return False
+
+
+HF_HUB_AMD_ORG_ACCESS = all(
+    [has_huggingface_access(model_name) for model_name in MODEL_NAMES]
+)
+
+
+@dataclass
+class ModelCase:
+    model_id: str
+    tp: int
+
+
+@dataclass
+class EvaluationConfig:
+    model_name: str
+
+    def get_model_args(self) -> str:
+        return (
+            f"pretrained={self.model_name},"
+            "tensor_parallel_size=4,dtype=auto,gpu_memory_utilization=0.9,trust_remote_code=False"
+        )
+
+
+EXPECTED_ACCURACIES = {"arc_challenge": 0.20}
+
+
+@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE, reason="amd-quark>=0.9 is not available")
+@pytest.mark.skipif(
+    not HF_HUB_AMD_ORG_ACCESS,
+    reason="Read access to huggingface.co/amd is required for this test.",
+)
+@pytest.mark.parametrize("model_name", MODEL_NAMES)
+@pytest.mark.parametrize("task_name, expected_accuracy", EXPECTED_ACCURACIES.items())
+def test_gpt_oss_attention_quantization(
+    model_name: str, task_name: str, expected_accuracy: float
+):
+    measured_accuracy = lm_eval.simple_evaluate(
+        model="vllm",
+        model_args=EvaluationConfig(model_name).get_model_args(),
+        tasks=task_name,
+        batch_size="auto",
+    )["results"][task_name]["acc,none"]
+
+    rtol = 0.05
+    assert (
+        measured_accuracy - rtol < expected_accuracy
+        and measured_accuracy + rtol > expected_accuracy
+    ), f"Expected: {expected_accuracy} |  Measured: {measured_accuracy}"
diff --git a/vllm/model_executor/layers/quantization/mxfp4.py b/vllm/model_executor/layers/quantization/mxfp4.py
index 4e51249f2d25..8d7297a0a1b3 100644
--- a/vllm/model_executor/layers/quantization/mxfp4.py
+++ b/vllm/model_executor/layers/quantization/mxfp4.py
@@ -190,14 +190,25 @@ def get_quant_method(
                 fused_mapping=self.packed_modules_mapping,
             ):
                 return UnquantizedLinearMethod()
-            raise NotImplementedError("Mxfp4 linear layer is not implemented")
+            # TODO: Add support for MXFP4 Linear Method.
+            # MXFP4 LinearMethod is available in AMD-Quark, refer to that implementation
+            # if you are interested in enabling MXFP4 here.
+            logger.warning_once(
+                "MXFP4 linear layer is not implemented - falling back to "
+                "UnquantizedLinearMethod."
+            )
+            return UnquantizedLinearMethod()
         elif isinstance(layer, FusedMoE):
             if current_platform.is_xpu():
                 return IpexMxfp4MoEMethod(layer.moe_config)
             else:
                 return Mxfp4MoEMethod(layer.moe_config)
         elif isinstance(layer, Attention):
-            raise NotImplementedError("Mxfp4 attention layer is not implemented")
+            # TODO: Add support for MXFP4 Attention.
+            logger.warning_once(
+                "MXFP4 attention layer is not implemented. "
+                "Skipping quantization for this layer."
+            )
         return None
 
 
diff --git a/vllm/model_executor/models/gpt_oss.py b/vllm/model_executor/models/gpt_oss.py
index 04038ae74882..291ac833f26a 100644
--- a/vllm/model_executor/models/gpt_oss.py
+++ b/vllm/model_executor/models/gpt_oss.py
@@ -198,6 +198,7 @@ class TransformerBlock(torch.nn.Module):
     def __init__(
         self,
         vllm_config: VllmConfig,
+        quant_config: QuantizationConfig,
         prefix: str = "",
     ):
         super().__init__()
@@ -207,7 +208,10 @@ def __init__(
 
         self.layer_idx = extract_layer_index(prefix)
         self.attn = OAIAttention(
-            config, prefix=f"{prefix}.attn", cache_config=cache_config
+            config,
+            prefix=f"{prefix}.attn",
+            quant_config=quant_config,
+            cache_config=cache_config,
         )
         self.mlp = MLPBlock(vllm_config, self.layer_idx, prefix=f"{prefix}.mlp")
         self.input_layernorm = RMSNorm(config.hidden_size, eps=1e-5)
@@ -243,6 +247,7 @@ def __init__(
     ):
         super().__init__()
         self.config = vllm_config.model_config.hf_config
+        self.quant_config = vllm_config.quant_config
         self.parallel_config = vllm_config.parallel_config
         self.config.hidden_size = self.config.hidden_size
         self.embedding = VocabParallelEmbedding(
@@ -254,6 +259,7 @@ def __init__(
             lambda prefix: TransformerBlock(
                 vllm_config,
                 prefix=prefix,
+                quant_config=self.quant_config,
             ),
             prefix=f"{prefix}.layers",
         )
@@ -645,7 +651,7 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
 
 
 class GptOssForCausalLM(nn.Module, SupportsPP, SupportsEagle3, SupportsLoRA):
-    packed_modules_mapping = {"qkv": ["q_proj", "k_proj", "v_proj"]}
+    packed_modules_mapping = {"qkv_proj": ["q_proj", "k_proj", "v_proj"]}
 
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_substr={

From e55342491968a56d39dc8e03e6cf39d12fef5dcd Mon Sep 17 00:00:00 2001
From: Zhewen Li <zhewenli@meta.com>
Date: Tue, 11 Nov 2025 09:09:47 -0800
Subject: [PATCH 068/183] [CI/Build] Refactor Attention backend for
 test_prefix_prefill from xformers to SDPA (#28424)

Signed-off-by: zhewenli <zhewenli@meta.com>
Signed-off-by: Roger Wang <hey@rogerw.io>
Co-authored-by: Roger Wang <hey@rogerw.io>
---
 .../kernels/attention/test_prefix_prefill.py  | 310 +++++++++++-------
 1 file changed, 194 insertions(+), 116 deletions(-)

diff --git a/tests/kernels/attention/test_prefix_prefill.py b/tests/kernels/attention/test_prefix_prefill.py
index 65972d02f2f6..78cdbbbf7379 100644
--- a/tests/kernels/attention/test_prefix_prefill.py
+++ b/tests/kernels/attention/test_prefix_prefill.py
@@ -8,10 +8,8 @@
 
 import pytest
 import torch
-from xformers import ops as xops
-from xformers.ops.fmha.attn_bias import BlockDiagonalCausalFromBottomRightMask
+import torch.nn.functional as F
 
-from tests.kernels.utils import make_alibi_bias
 from vllm.attention.ops.chunked_prefill_paged_decode import chunked_prefill_paged_decode
 from vllm.attention.ops.prefix_prefill import context_attention_fwd
 from vllm.platforms import current_platform
@@ -28,6 +26,74 @@
 OPS = [chunked_prefill_paged_decode, context_attention_fwd]
 
 
+def create_causal_attention_mask_for_sdpa(
+    query_lens: list[int],
+    seq_lens: list[int],
+    sliding_window: int = 0,
+    device: torch.device = None,
+    dtype: torch.dtype = None,
+) -> torch.Tensor:
+    total_queries = sum(query_lens)
+    total_keys = sum(seq_lens)
+
+    # Create a mask filled with -inf
+    mask = torch.full(
+        (total_queries, total_keys), float("-inf"), device=device, dtype=dtype
+    )
+
+    query_start = 0
+    key_start = 0
+
+    for query_len, seq_len in zip(query_lens, seq_lens):
+        query_end = query_start + query_len
+        key_end = key_start + seq_len
+        q_indices = torch.arange(query_len, device=device)
+        k_indices = torch.arange(seq_len, device=device)
+        q_pos_in_seq = seq_len - query_len + q_indices
+
+        valid_mask = k_indices[None, :] <= q_pos_in_seq[:, None]
+
+        if sliding_window > 0:
+            valid_mask &= k_indices[None, :] >= (
+                q_pos_in_seq[:, None] - sliding_window + 1
+            )
+
+        mask[query_start:query_end, key_start:key_end][valid_mask] = 0.0
+
+        query_start = query_end
+        key_start = key_end
+
+    return mask
+
+
+def create_alibi_causal_mask(
+    query_len: int,
+    seq_len: int,
+    alibi_slopes: torch.Tensor,
+    device: torch.device,
+    dtype: torch.dtype,
+) -> torch.Tensor:
+    query_pos = torch.arange(
+        seq_len - query_len, seq_len, device=device, dtype=torch.float32
+    )
+    key_pos = torch.arange(seq_len, device=device, dtype=torch.float32)
+
+    rel_pos = key_pos[None, :] - query_pos[:, None]
+
+    # Apply ALiBi slopes: [num_heads, query_len, seq_len]
+    alibi_bias = alibi_slopes[:, None, None] * rel_pos[None, :, :]
+    alibi_bias = alibi_bias.to(dtype)
+
+    # Apply causal mask: prevent attending to future positions
+    # causal_mask[i, j] = True if key_pos[j] <= query_pos[i]
+    causal_mask = key_pos[None, :] <= query_pos[:, None]
+    alibi_bias = alibi_bias.masked_fill(~causal_mask[None, :, :], float("-inf"))
+
+    # Add batch dimension: [1, num_heads, query_len, seq_len]
+    # SDPA expects batch dimension even for single sequences
+    return alibi_bias.unsqueeze(0)
+
+
 @pytest.mark.parametrize("num_heads", NUM_HEADS)
 @pytest.mark.parametrize("num_queries_per_kv", NUM_QUERIES_PER_KV)
 @pytest.mark.parametrize("head_size", HEAD_SIZES)
@@ -52,6 +118,13 @@ def test_contexted_kv_attention(
             "Triton limitation: fp8e4nv data type is not supported on CUDA arch < 89"
         )
 
+    if (
+        current_platform.is_rocm()
+        and op is chunked_prefill_paged_decode
+        and kv_cache_dtype == "fp8_e5m2"
+    ):
+        pytest.skip("ROCm custom paged attention does not support fp8_e5m2 KV cache")
+
     current_platform.seed_everything(0)
     torch.set_default_device(device)
 
@@ -96,16 +169,16 @@ def test_contexted_kv_attention(
     )
     k = torch.zeros(sum(query_lens), num_kv_heads, head_size, dtype=dtype)
     v = torch.zeros(sum(query_lens), num_kv_heads, head_size, dtype=dtype)
-    values = torch.arange(0, cache_size, dtype=torch.long)
+    values = torch.arange(0, cache_size, dtype=torch.int32)
     values = values[torch.randperm(cache_size)]
     block_table = values[: BS * max_block_per_request].view(BS, max_block_per_request)
-    b_seq_len = torch.tensor(seq_lens, dtype=torch.long)
-    b_ctx_len = torch.tensor(ctx_lens, dtype=torch.long)
-    b_start_loc = torch.cumsum(torch.tensor([0] + query_lens, dtype=torch.long), dim=0)
+    b_seq_len = torch.tensor(seq_lens, dtype=torch.int32)
+    b_ctx_len = torch.tensor(ctx_lens, dtype=torch.int32)
+    b_start_loc = torch.cumsum(torch.tensor([0] + query_lens, dtype=torch.int32), dim=0)
     max_input_len = MAX_SEQ_LEN
     # copy kv to cache
     b_seq_start_loc = torch.cumsum(
-        torch.tensor([0] + seq_lens[:-1], dtype=torch.long), dim=0
+        torch.tensor([0] + seq_lens[:-1], dtype=torch.int32), dim=0
     )
     for i in range(BS):
         for j in range(query_lens[i]):
@@ -189,56 +262,57 @@ def test_contexted_kv_attention(
 
     scale = float(1.0 / (head_size**0.5))
 
-    attn_op = xops.fmha.cutlass.FwOp()
+    # Reshape for SDPA: (seq_len, num_heads, head_size) ->
+    # (1, num_heads, seq_len, head_size)
+    query_sdpa = query.view(num_tokens, num_kv_heads, num_queries_per_kv, head_size)
+    query_sdpa = query_sdpa.permute(1, 2, 0, 3).reshape(
+        1, num_heads, num_tokens, head_size
+    )
 
-    if num_kv_heads != num_heads:
-        # As of Nov 2023, xformers only supports MHA. For MQA/GQA,
-        # project the key and value tensors to the desired number of
-        # heads.
-        #
-        # see also: vllm/model_executor/layers/attention.py
-        query = query.view(
-            query.shape[0], num_kv_heads, num_queries_per_kv, query.shape[-1]
-        )
-        key = key[:, :, None, :].expand(
-            key.shape[0], num_kv_heads, num_queries_per_kv, key.shape[-1]
-        )
-        value = value[:, :, None, :].expand(
-            value.shape[0], num_kv_heads, num_queries_per_kv, value.shape[-1]
-        )
-    query = query.unsqueeze(0)
-    key = key.unsqueeze(0)
-    value = value.unsqueeze(0)
+    # Expand key and value for GQA/MQA to match query heads
+    key_sdpa = key[:, :, None, :].expand(
+        key.shape[0], num_kv_heads, num_queries_per_kv, key.shape[-1]
+    )
+    key_sdpa = key_sdpa.permute(1, 2, 0, 3).reshape(
+        1, num_heads, sum(seq_lens), head_size
+    )
 
-    attn_bias = BlockDiagonalCausalFromBottomRightMask.from_seqlens(
-        query_lens, seq_lens
+    value_sdpa = value[:, :, None, :].expand(
+        value.shape[0], num_kv_heads, num_queries_per_kv, value.shape[-1]
     )
-    if sliding_window > 0:
-        attn_bias = attn_bias.make_local_attention_from_bottomright(sliding_window)
-    output_ref = xops.memory_efficient_attention_forward(
-        query,
-        key,
-        value,
-        attn_bias=attn_bias,
-        p=0.0,
+    value_sdpa = value_sdpa.permute(1, 2, 0, 3).reshape(
+        1, num_heads, sum(seq_lens), head_size
+    )
+
+    attn_mask = create_causal_attention_mask_for_sdpa(
+        query_lens, seq_lens, sliding_window, device=device, dtype=dtype
+    )
+
+    output_ref = F.scaled_dot_product_attention(
+        query_sdpa,
+        key_sdpa,
+        value_sdpa,
+        attn_mask=attn_mask,
+        dropout_p=0.0,
         scale=scale,
-        op=attn_op,
     )
     torch.cuda.synchronize()
     start_time = time.time()
-    output_ref = xops.memory_efficient_attention_forward(
-        query,
-        key,
-        value,
-        attn_bias=attn_bias,
-        p=0.0,
+    output_ref = F.scaled_dot_product_attention(
+        query_sdpa,
+        key_sdpa,
+        value_sdpa,
+        attn_mask=attn_mask,
+        dropout_p=0.0,
         scale=scale,
-        op=attn_op,
     )
     torch.cuda.synchronize()
     end_time = time.time()
-    print(f"xformers Time: {(end_time - start_time) * 1000:.2f} ms")
-    output_ref = output_ref.reshape(output.shape)
+    print(f"PyTorch SDPA Time: {(end_time - start_time) * 1000:.2f} ms")
+
+    # Reshape output back to (num_tokens, num_heads, head_size)
+    output_ref = output_ref.view(num_heads, num_tokens, head_size)
+    output_ref = output_ref.permute(1, 0, 2).contiguous()
     atol = 1e-3 if "fp8" in kv_cache_dtype else 1e-4
     torch.testing.assert_close(output, output_ref, atol=atol, rtol=0)
 
@@ -265,6 +339,13 @@ def test_contexted_kv_attention_alibi(
             "Triton limitation: fp8e4nv data type is not supported on CUDA arch < 89"
         )
 
+    if (
+        current_platform.is_rocm()
+        and op is chunked_prefill_paged_decode
+        and kv_cache_dtype == "fp8_e5m2"
+    ):
+        pytest.skip("ROCm custom paged attention does not support fp8_e5m2 KV cache")
+
     current_platform.seed_everything(0)
     torch.set_default_device(device)
 
@@ -331,16 +412,16 @@ def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
     )
     k = torch.zeros(sum(query_lens), num_kv_heads, head_size, dtype=dtype)
     v = torch.zeros(sum(query_lens), num_kv_heads, head_size, dtype=dtype)
-    values = torch.arange(0, cache_size, dtype=torch.long)
+    values = torch.arange(0, cache_size, dtype=torch.int32)
     values = values[torch.randperm(cache_size)]
     block_table = values[: BS * max_block_per_request].view(BS, max_block_per_request)
-    b_seq_len = torch.tensor(seq_lens, dtype=torch.long)
-    b_ctx_len = torch.tensor(ctx_lens, dtype=torch.long)
-    b_start_loc = torch.cumsum(torch.tensor([0] + query_lens, dtype=torch.long), dim=0)
+    b_seq_len = torch.tensor(seq_lens, dtype=torch.int32)
+    b_ctx_len = torch.tensor(ctx_lens, dtype=torch.int32)
+    b_start_loc = torch.cumsum(torch.tensor([0] + query_lens, dtype=torch.int32), dim=0)
     max_input_len = MAX_SEQ_LEN
     # copy kv to cache
     b_seq_start_loc = torch.cumsum(
-        torch.tensor([0] + seq_lens[:-1], dtype=torch.long), dim=0
+        torch.tensor([0] + seq_lens[:-1], dtype=torch.int32), dim=0
     )
     for i in range(BS):
         for j in range(query_lens[i]):
@@ -423,78 +504,75 @@ def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
     print(f"triton Time: {(end_time - start_time) * 1000:.2f} ms")
     scale = float(1.0 / (head_size**0.5))
 
-    # NOTE(DefTruth): In order to reuse _make_alibi_bias function,
-    # we have to pad query tensor before MQA/GQA expanding.
-    if query.shape[0] != key.shape[0]:
-        query_pad = torch.empty(sum(seq_lens), num_heads, head_size, dtype=dtype)
-        query_pad.uniform_(-1e-3, 1e-3)
-        seq_start = 0
-        query_start = 0
-        for i, (query_len, seq_len) in enumerate(zip(query_lens, seq_lens)):
-            seq_end = seq_start + seq_len
-            query_end = query_start + query_len
-            query_pad[seq_start:seq_end, ...] = torch.cat(
-                [
-                    torch.zeros(seq_len - query_len, num_heads, head_size, dtype=dtype),
-                    query[query_start:query_end, ...],
-                ],
-                dim=0,
-            )
-            seq_start += seq_len
-            query_start += query_len
-        query = query_pad
-
-    if num_kv_heads != num_heads:
-        # As of Nov 2023, xformers only supports MHA. For MQA/GQA,
-        # project the key and value tensors to the desired number of
-        # heads.
-        #
-        # see also: vllm/model_executor/layers/attention.py
-        key = key[:, :, None, :].expand(
-            key.shape[0], num_kv_heads, num_queries_per_kv, key.shape[-1]
-        )
-        value = value[:, :, None, :].expand(
-            value.shape[0], num_kv_heads, num_queries_per_kv, value.shape[-1]
-        )
-        # [seq, num_kv_heads, num_queries_per_kv, dk]=>
-        # [seq, num_kv_heads*num_queries_per_kv, dk] to comply with rest of the
-        # codebase. We save some time reshaping alibi matrix at runtime.
-        key = key.reshape(key.shape[0], -1, key.shape[-1])
-        value = value.reshape(value.shape[0], -1, value.shape[-1])
-    query = query.unsqueeze(0)
-    key = key.unsqueeze(0)
-    value = value.unsqueeze(0)
-
-    attn_bias = make_alibi_bias(alibi_slopes, num_kv_heads, dtype, seq_lens)
+    # Prepare query, key, value for SDPA
+    # Expand key and value for GQA/MQA to match query heads
+    key_expanded = key[:, :, None, :].expand(
+        key.shape[0], num_kv_heads, num_queries_per_kv, key.shape[-1]
+    )
+    value_expanded = value[:, :, None, :].expand(
+        value.shape[0], num_kv_heads, num_queries_per_kv, value.shape[-1]
+    )
+
     output_ref = torch.empty_like(output)
-    seq_start = 0
-    query_start = 0
+
+    torch.cuda.synchronize()
     start_time = time.time()
-    # Attention with alibi slopes.
-    # FIXME(DefTruth): Because xformers does not support dynamic sequence
-    # lengths with custom attention bias, we process each prompt one by
-    # one. This is inefficient, especially when we have many short prompts.
-    # modified from: vllm/v1/attention/backends/xformers.py#L343
+
+    query_start = 0
+    key_start = 0
     for i, (query_len, seq_len) in enumerate(zip(query_lens, seq_lens)):
-        seq_end = seq_start + seq_len
         query_end = query_start + query_len
-        out = xops.memory_efficient_attention_forward(
-            query[:, seq_start:seq_end],
-            key[:, seq_start:seq_end],
-            value[:, seq_start:seq_end],
-            attn_bias=attn_bias[i],
-            p=0.0,
-            scale=scale,
+        key_end = key_start + seq_len
+
+        # Get query, key, value for this sequence
+        q = query[query_start:query_end]  # [query_len, num_heads, head_size]
+        k = key_expanded[
+            key_start:key_end
+        ]  # [seq_len, num_kv_heads, num_queries_per_kv, head_size]
+        v = value_expanded[
+            key_start:key_end
+        ]  # [seq_len, num_kv_heads, num_queries_per_kv, head_size]
+
+        # Reshape for SDPA: (batch=1, num_heads, seq_len, head_size)
+        q_sdpa = q.view(query_len, num_kv_heads, num_queries_per_kv, head_size)
+        q_sdpa = (
+            q_sdpa.permute(1, 2, 0, 3)
+            .reshape(1, num_heads, query_len, head_size)
+            .contiguous()
+        )
+
+        k_sdpa = (
+            k.permute(1, 2, 0, 3).reshape(1, num_heads, seq_len, head_size).contiguous()
+        )
+        v_sdpa = (
+            v.permute(1, 2, 0, 3).reshape(1, num_heads, seq_len, head_size).contiguous()
         )
-        out = out.view_as(query[:, seq_start:seq_end]).view(
-            seq_len, num_heads, head_size
+
+        # Create ALiBi causal mask for this sequence using utility function
+        alibi_mask = create_alibi_causal_mask(
+            query_len, seq_len, alibi_slopes, device, dtype
+        )
+
+        # Compute attention
+        out = F.scaled_dot_product_attention(
+            q_sdpa,
+            k_sdpa,
+            v_sdpa,
+            attn_mask=alibi_mask,
+            dropout_p=0.0,
+            scale=scale,
         )
-        output_ref[query_start:query_end, ...].copy_(out[seq_len - query_len :, ...])
-        seq_start += seq_len
-        query_start += query_len
+
+        # Reshape output back to [query_len, num_heads, head_size]
+        out = out.view(num_heads, query_len, head_size).permute(1, 0, 2)
+        output_ref[query_start:query_end].copy_(out)
+
+        query_start = query_end
+        key_start = key_end
+
     torch.cuda.synchronize()
     end_time = time.time()
-    print(f"xformers Time: {(end_time - start_time) * 1000:.2f} ms")
+    print(f"PyTorch SDPA Time: {(end_time - start_time) * 1000:.2f} ms")
     atol = 1e-3 if "fp8" in kv_cache_dtype else 1e-6
     torch.testing.assert_close(output, output_ref, atol=atol, rtol=0)
 

From 684f2545851ee0ee49be9a80545ed497324f1a96 Mon Sep 17 00:00:00 2001
From: Matthew Bonanni <mbonanni@redhat.com>
Date: Tue, 11 Nov 2025 11:13:51 -0600
Subject: [PATCH 069/183] Prefer FlashAttention MLA as default over FlashMLA
 (#27363)

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
---
 vllm/platforms/cuda.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/vllm/platforms/cuda.py b/vllm/platforms/cuda.py
index 43daf5e75b66..22c6dde754d0 100644
--- a/vllm/platforms/cuda.py
+++ b/vllm/platforms/cuda.py
@@ -55,15 +55,15 @@ def _get_backend_priorities(
             return [
                 AttentionBackendEnum.CUTLASS_MLA,
                 AttentionBackendEnum.FLASHINFER_MLA,
-                AttentionBackendEnum.FLASHMLA,
                 AttentionBackendEnum.FLASH_ATTN_MLA,
+                AttentionBackendEnum.FLASHMLA,
                 AttentionBackendEnum.TRITON_MLA,
                 AttentionBackendEnum.FLASHMLA_SPARSE,
             ]
         else:
             return [
-                AttentionBackendEnum.FLASHMLA,
                 AttentionBackendEnum.FLASH_ATTN_MLA,
+                AttentionBackendEnum.FLASHMLA,
                 AttentionBackendEnum.FLASHINFER_MLA,
                 AttentionBackendEnum.TRITON_MLA,
                 AttentionBackendEnum.FLASHMLA_SPARSE,

From 6c3c0f8235cacce28982687e362b80d953ea7617 Mon Sep 17 00:00:00 2001
From: Xin Yang <105740670+xyang16@users.noreply.github.com>
Date: Tue, 11 Nov 2025 10:02:23 -0800
Subject: [PATCH 070/183] [Kernel] Optimize rms_norm kernel (#27931)

Signed-off-by: Xin Yang <xyangx@amazon.com>
---
 csrc/dispatch_utils.h           | 29 ++++++++++++++++++++++
 csrc/layernorm_kernels.cu       | 39 +++++++++++++++++++++---------
 csrc/layernorm_quant_kernels.cu | 43 ++++++++++++++++++++++-----------
 3 files changed, 86 insertions(+), 25 deletions(-)

diff --git a/csrc/dispatch_utils.h b/csrc/dispatch_utils.h
index 995374a50b03..9ae0ed975edd 100644
--- a/csrc/dispatch_utils.h
+++ b/csrc/dispatch_utils.h
@@ -88,3 +88,32 @@
 #define VLLM_DISPATCH_INTEGRAL_AND_UNSIGNED_TYPES(TYPE, NAME, ...) \
   AT_DISPATCH_SWITCH(                                              \
       TYPE, NAME, VLLM_DISPATCH_CASE_INTEGRAL_AND_UNSIGNED_TYPES(__VA_ARGS__))
+
+#define VLLM_DISPATCH_VEC_SIZE(VEC_SIZE, ...) \
+  switch (VEC_SIZE) {                         \
+    case 16: {                                \
+      constexpr int vec_size = 16;            \
+      __VA_ARGS__();                          \
+      break;                                  \
+    }                                         \
+    case 8: {                                 \
+      constexpr int vec_size = 8;             \
+      __VA_ARGS__();                          \
+      break;                                  \
+    }                                         \
+    case 4: {                                 \
+      constexpr int vec_size = 4;             \
+      __VA_ARGS__();                          \
+      break;                                  \
+    }                                         \
+    case 2: {                                 \
+      constexpr int vec_size = 2;             \
+      __VA_ARGS__();                          \
+      break;                                  \
+    }                                         \
+    default: {                                \
+      constexpr int vec_size = 1;             \
+      __VA_ARGS__();                          \
+      break;                                  \
+    }                                         \
+  }
diff --git a/csrc/layernorm_kernels.cu b/csrc/layernorm_kernels.cu
index 8cfcf9f41283..48771e4b3aff 100644
--- a/csrc/layernorm_kernels.cu
+++ b/csrc/layernorm_kernels.cu
@@ -10,7 +10,7 @@
 namespace vllm {
 
 // TODO(woosuk): Further optimize this kernel.
-template <typename scalar_t>
+template <typename scalar_t, int VEC_SIZE>
 __global__ void rms_norm_kernel(
     scalar_t* __restrict__ out,          // [..., hidden_size]
     const scalar_t* __restrict__ input,  // [..., hidden_size]
@@ -21,7 +21,6 @@ __global__ void rms_norm_kernel(
   float variance = 0.0f;
   const scalar_t* input_row = input + blockIdx.x * input_stride;
 
-  constexpr int VEC_SIZE = 8;
   auto vec_op = [&variance](const vec_n_t<scalar_t, VEC_SIZE>& vec) {
 #pragma unroll
     for (int i = 0; i < VEC_SIZE; ++i) {
@@ -45,10 +44,20 @@ __global__ void rms_norm_kernel(
   }
   __syncthreads();
 
-  for (int idx = threadIdx.x; idx < hidden_size; idx += blockDim.x) {
-    float x = (float)input[blockIdx.x * input_stride + idx];
-    out[blockIdx.x * hidden_size + idx] =
-        ((scalar_t)(x * s_variance)) * weight[idx];
+  scalar_t* out_row = out + blockIdx.x * hidden_size;
+  auto* v_in = reinterpret_cast<const vec_n_t<scalar_t, VEC_SIZE>*>(input_row);
+  auto* v_w = reinterpret_cast<const vec_n_t<scalar_t, VEC_SIZE>*>(weight);
+  auto* v_out = reinterpret_cast<vec_n_t<scalar_t, VEC_SIZE>*>(out_row);
+  for (int i = threadIdx.x; i < hidden_size / VEC_SIZE; i += blockDim.x) {
+    vec_n_t<scalar_t, VEC_SIZE> dst;
+    vec_n_t<scalar_t, VEC_SIZE> src1 = v_in[i];
+    vec_n_t<scalar_t, VEC_SIZE> src2 = v_w[i];
+#pragma unroll
+    for (int j = 0; j < VEC_SIZE; j++) {
+      float x = static_cast<float>(src1.val[j]);
+      dst.val[j] = ((scalar_t)(x * s_variance)) * src2.val[j];
+    }
+    v_out[i] = dst;
   }
 }
 
@@ -168,16 +177,24 @@ void rms_norm(torch::Tensor& out,     // [..., hidden_size]
   int num_tokens = input_view.numel() / hidden_size;
   int64_t input_stride = input_view.stride(-2);
 
+  // For large num_tokens, use smaller blocks to increase SM concurrency.
+  const int max_block_size = (num_tokens < 256) ? 1024 : 256;
   dim3 grid(num_tokens);
-  dim3 block(std::min(hidden_size, 1024));
   const at::cuda::OptionalCUDAGuard device_guard(device_of(input_view));
   const cudaStream_t stream = at::cuda::getCurrentCUDAStream();
   VLLM_DISPATCH_FLOATING_TYPES(
       input_view.scalar_type(), "rms_norm_kernel", [&] {
-        vllm::rms_norm_kernel<scalar_t><<<grid, block, 0, stream>>>(
-            out.data_ptr<scalar_t>(), input_view.data_ptr<scalar_t>(),
-            input_stride, weight.data_ptr<scalar_t>(), epsilon, num_tokens,
-            hidden_size);
+        const int calculated_vec_size =
+            std::gcd(16 / sizeof(scalar_t), hidden_size);
+        const int block_size =
+            std::min(hidden_size / calculated_vec_size, max_block_size);
+        dim3 block(block_size);
+        VLLM_DISPATCH_VEC_SIZE(calculated_vec_size, [&] {
+          vllm::rms_norm_kernel<scalar_t, vec_size><<<grid, block, 0, stream>>>(
+              out.data_ptr<scalar_t>(), input_view.data_ptr<scalar_t>(),
+              input_stride, weight.data_ptr<scalar_t>(), epsilon, num_tokens,
+              hidden_size);
+        });
       });
 }
 
diff --git a/csrc/layernorm_quant_kernels.cu b/csrc/layernorm_quant_kernels.cu
index 0f7f034ee180..0880b8d50a79 100644
--- a/csrc/layernorm_quant_kernels.cu
+++ b/csrc/layernorm_quant_kernels.cu
@@ -18,7 +18,7 @@
 namespace vllm {
 
 // TODO(woosuk): Further optimize this kernel.
-template <typename scalar_t, typename fp8_type>
+template <typename scalar_t, typename fp8_type, int VEC_SIZE>
 __global__ void rms_norm_static_fp8_quant_kernel(
     fp8_type* __restrict__ out,          // [..., hidden_size]
     const scalar_t* __restrict__ input,  // [..., hidden_size]
@@ -31,7 +31,6 @@ __global__ void rms_norm_static_fp8_quant_kernel(
 
   const scalar_t* input_row = input + blockIdx.x * input_stride;
 
-  constexpr int VEC_SIZE = 8;
   auto vec_op = [&variance](const vec_n_t<scalar_t, VEC_SIZE>& vec) {
 #pragma unroll
     for (int i = 0; i < VEC_SIZE; ++i) {
@@ -58,11 +57,18 @@ __global__ void rms_norm_static_fp8_quant_kernel(
   // invert scale to avoid division
   float const scale_inv = 1.0f / *scale;
 
-  for (int idx = threadIdx.x; idx < hidden_size; idx += blockDim.x) {
-    float x = (float)input[blockIdx.x * input_stride + idx];
-    float const out_norm = ((scalar_t)(x * s_variance)) * weight[idx];
-    out[blockIdx.x * hidden_size + idx] =
-        scaled_fp8_conversion<true, fp8_type>(out_norm, scale_inv);
+  auto* v_in = reinterpret_cast<const vec_n_t<scalar_t, VEC_SIZE>*>(input_row);
+  auto* v_w = reinterpret_cast<const vec_n_t<scalar_t, VEC_SIZE>*>(weight);
+  for (int idx = threadIdx.x; idx < hidden_size / VEC_SIZE; idx += blockDim.x) {
+    vec_n_t<scalar_t, VEC_SIZE> src1 = v_in[idx];
+    vec_n_t<scalar_t, VEC_SIZE> src2 = v_w[idx];
+#pragma unroll
+    for (int j = 0; j < VEC_SIZE; j++) {
+      float x = static_cast<float>(src1.val[j]);
+      float const out_norm = ((scalar_t)(x * s_variance)) * src2.val[j];
+      out[blockIdx.x * hidden_size + idx * VEC_SIZE + j] =
+          scaled_fp8_conversion<true, fp8_type>(out_norm, scale_inv);
+    }
   }
 }
 
@@ -188,20 +194,29 @@ void rms_norm_static_fp8_quant(torch::Tensor& out,     // [..., hidden_size]
   int input_stride = input.stride(-2);
   int num_tokens = input.numel() / hidden_size;
 
+  // For large num_tokens, use smaller blocks to increase SM concurrency.
+  const int max_block_size = (num_tokens < 256) ? 1024 : 256;
   dim3 grid(num_tokens);
-  dim3 block(std::min(hidden_size, 1024));
   const at::cuda::OptionalCUDAGuard device_guard(device_of(input));
   const cudaStream_t stream = at::cuda::getCurrentCUDAStream();
   VLLM_DISPATCH_FLOATING_TYPES(
       input.scalar_type(), "rms_norm_kernel_scalar_type", [&] {
         VLLM_DISPATCH_FP8_TYPES(
             out.scalar_type(), "rms_norm_kernel_fp8_type", [&] {
-              vllm::rms_norm_static_fp8_quant_kernel<scalar_t, fp8_t>
-                  <<<grid, block, 0, stream>>>(
-                      out.data_ptr<fp8_t>(), input.data_ptr<scalar_t>(),
-                      input_stride, weight.data_ptr<scalar_t>(),
-                      scale.data_ptr<float>(), epsilon, num_tokens,
-                      hidden_size);
+              const int calculated_vec_size =
+                  std::gcd(16 / sizeof(scalar_t), hidden_size);
+              const int block_size =
+                  std::min(hidden_size / calculated_vec_size, max_block_size);
+              dim3 block(block_size);
+              VLLM_DISPATCH_VEC_SIZE(calculated_vec_size, [&] {
+                vllm::rms_norm_static_fp8_quant_kernel<scalar_t, fp8_t,
+                                                       vec_size>
+                    <<<grid, block, 0, stream>>>(
+                        out.data_ptr<fp8_t>(), input.data_ptr<scalar_t>(),
+                        input_stride, weight.data_ptr<scalar_t>(),
+                        scale.data_ptr<float>(), epsilon, num_tokens,
+                        hidden_size);
+              });
             });
       });
 }

From d5edcb86781ea56f1eb0c9c5d7482a7cae00ec17 Mon Sep 17 00:00:00 2001
From: Fanli Lin <fanli.lin@intel.com>
Date: Wed, 12 Nov 2025 02:18:02 +0800
Subject: [PATCH 071/183] [BugFix] Fix Siglip2Attention on XPU (#28448)

Signed-off-by: Lin, Fanli <fanli.lin@intel.com>
---
 vllm/model_executor/models/siglip2navit.py | 11 +++++++++--
 1 file changed, 9 insertions(+), 2 deletions(-)

diff --git a/vllm/model_executor/models/siglip2navit.py b/vllm/model_executor/models/siglip2navit.py
index c20bcd975ca3..29dd164ad37f 100644
--- a/vllm/model_executor/models/siglip2navit.py
+++ b/vllm/model_executor/models/siglip2navit.py
@@ -25,6 +25,7 @@
 )
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
+from vllm.platforms import current_platform
 
 from .vision import get_vit_attn_backend
 
@@ -188,7 +189,7 @@ def apply_rotary_pos_emb(
 ) -> tuple[torch.Tensor, torch.Tensor]:
     cos = cos.chunk(2, dim=-1)[0].contiguous()
     sin = sin.chunk(2, dim=-1)[0].contiguous()
-    if is_flash_attn_backend:
+    if is_flash_attn_backend and not current_platform.is_xpu():
         from flash_attn.layers.rotary import apply_rotary_emb
 
         apply_rotary_emb_func = apply_rotary_emb
@@ -306,7 +307,13 @@ def forward(
         max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         if self.is_flash_attn_backend:
             attn_output = self.flash_attn_varlen_func(
-                queries, keys, values, cu_seqlens, cu_seqlens, max_seqlen, max_seqlen
+                queries,
+                keys,
+                values,
+                cu_seqlens_q=cu_seqlens,
+                cu_seqlens_k=cu_seqlens,
+                max_seqlen_q=max_seqlen,
+                max_seqlen_k=max_seqlen,
             ).reshape(seq_length, -1)
         elif self.attn_backend == AttentionBackendEnum.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.

From 76e4dcf225e4de115bdc20b00a78d49bec767c09 Mon Sep 17 00:00:00 2001
From: Lukas Geiger <lukas.geiger94@gmail.com>
Date: Tue, 11 Nov 2025 18:26:04 +0000
Subject: [PATCH 072/183] [Misc] Remove unused attention prefix prefill ops
 functions (#26971)

Signed-off-by: Lukas Geiger <lukas.geiger94@gmail.com>
---
 vllm/attention/ops/prefix_prefill.py          | 210 ------------------
 .../compressed_tensors_moe.py                 |   3 -
 2 files changed, 213 deletions(-)

diff --git a/vllm/attention/ops/prefix_prefill.py b/vllm/attention/ops/prefix_prefill.py
index addf1d9dea73..f101d5c4a927 100644
--- a/vllm/attention/ops/prefix_prefill.py
+++ b/vllm/attention/ops/prefix_prefill.py
@@ -335,216 +335,6 @@ def _fwd_kernel(
     return
 
 
-@triton.jit
-def _fwd_kernel_flash_attn_v2(
-    Q,
-    K,
-    V,
-    K_cache,
-    V_cache,
-    B_Loc,
-    sm_scale,
-    B_Start_Loc,
-    B_Seqlen,
-    B_Ctxlen,
-    block_size,
-    x,
-    Out,
-    stride_b_loc_b,
-    stride_b_loc_s,
-    stride_qbs,
-    stride_qh,
-    stride_qd,
-    stride_kbs,
-    stride_kh,
-    stride_kd,
-    stride_vbs,
-    stride_vh,
-    stride_vd,
-    stride_obs,
-    stride_oh,
-    stride_od,
-    stride_k_cache_bs,
-    stride_k_cache_h,
-    stride_k_cache_d,
-    stride_k_cache_bl,
-    stride_k_cache_x,
-    stride_v_cache_bs,
-    stride_v_cache_h,
-    stride_v_cache_d,
-    stride_v_cache_bl,
-    num_queries_per_kv: int,
-    BLOCK_M: tl.constexpr,
-    BLOCK_DMODEL: tl.constexpr,
-    BLOCK_N: tl.constexpr,
-):
-    cur_batch = tl.program_id(0)
-    cur_head = tl.program_id(1)
-    start_m = tl.program_id(2)
-
-    cur_kv_head = cur_head // num_queries_per_kv
-
-    cur_batch_ctx_len = tl.load(B_Ctxlen + cur_batch)
-    cur_batch_seq_len = tl.load(B_Seqlen + cur_batch)
-    cur_batch_in_all_start_index = tl.load(B_Start_Loc + cur_batch)
-
-    block_start_loc = BLOCK_M * start_m
-
-    # initialize offsets
-    offs_n = tl.arange(0, BLOCK_N)
-    offs_d = tl.arange(0, BLOCK_DMODEL)
-    offs_m = start_m * BLOCK_M + tl.arange(0, BLOCK_M)
-    off_q = (
-        (cur_batch_in_all_start_index + offs_m[:, None]) * stride_qbs
-        + cur_head * stride_qh
-        + offs_d[None, :] * stride_qd
-    )
-
-    q = tl.load(
-        Q + off_q,
-        mask=offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len,
-        other=0.0,
-    )
-
-    # # initialize pointer to m and l
-    m_i = tl.zeros([BLOCK_M], dtype=tl.float32) - float("inf")
-    l_i = tl.zeros([BLOCK_M], dtype=tl.float32)
-    acc = tl.zeros([BLOCK_M, BLOCK_DMODEL], dtype=tl.float32)
-
-    for start_n in range(0, cur_batch_ctx_len, BLOCK_N):
-        start_n = tl.multiple_of(start_n, BLOCK_N)
-        # -- compute qk ----
-        bn = tl.load(
-            B_Loc
-            + cur_batch * stride_b_loc_b
-            + ((start_n + offs_n) // block_size) * stride_b_loc_s,
-            mask=(start_n + offs_n) < cur_batch_ctx_len,
-            other=0,
-        ).to(tl.int64)
-        off_k = (
-            bn[None, :] * stride_k_cache_bs
-            + cur_kv_head * stride_k_cache_h
-            + (offs_d[:, None] // x) * stride_k_cache_d
-            + ((start_n + offs_n[None, :]) % block_size) * stride_k_cache_bl
-            + (offs_d[:, None] % x) * stride_k_cache_x
-        )
-        off_v = (
-            bn[:, None] * stride_v_cache_bs
-            + cur_kv_head * stride_v_cache_h
-            + offs_d[None, :] * stride_v_cache_d
-            + (start_n + offs_n[:, None]) % block_size * stride_v_cache_bl
-        )
-        k = tl.load(
-            K_cache + off_k,
-            mask=(start_n + offs_n[None, :]) < cur_batch_ctx_len,
-            other=0.0,
-        )
-        qk = tl.zeros([BLOCK_M, BLOCK_N], dtype=tl.float32)
-        qk += tl.dot(q, k)
-        qk = tl.where(
-            (start_n + offs_n[None, :]) < cur_batch_ctx_len, qk, float("-inf")
-        )
-        qk *= sm_scale
-
-        # -- compute m_ij, p, l_ij
-        m_ij = tl.max(qk, 1)
-        m_i_new = tl.maximum(m_i, m_ij)
-        p = tl.math.exp(qk - m_i_new[:, None])
-        l_ij = tl.sum(p, 1)
-        # -- update m_i and l_i
-
-        alpha = tl.math.exp(m_i - m_i_new)
-        l_i_new = alpha * l_i + l_ij
-        # -- update output accumulator --
-        # scale p
-        # scale acc
-        acc_scale = alpha
-        # acc_scale = l_i / l_i_new * alpha
-        acc = acc * acc_scale[:, None]
-        # update acc
-        v = tl.load(
-            V_cache + off_v,
-            mask=(start_n + offs_n[:, None]) < cur_batch_ctx_len,
-            other=0.0,
-        )
-
-        p = p.to(v.dtype)
-        acc += tl.dot(p, v)
-        # update m_i and l_i
-        l_i = l_i_new
-        m_i = m_i_new
-
-    off_k = (
-        offs_n[None, :] * stride_kbs
-        + cur_kv_head * stride_kh
-        + offs_d[:, None] * stride_kd
-    )
-    off_v = (
-        offs_n[:, None] * stride_vbs
-        + cur_kv_head * stride_vh
-        + offs_d[None, :] * stride_vd
-    )
-    k_ptrs = K + off_k
-    v_ptrs = V + off_v
-
-    block_mask = tl.where(block_start_loc < cur_batch_seq_len - cur_batch_ctx_len, 1, 0)
-
-    for start_n in range(0, block_mask * (start_m + 1) * BLOCK_M, BLOCK_N):
-        start_n = tl.multiple_of(start_n, BLOCK_N)
-        # -- compute qk ----
-        k = tl.load(
-            k_ptrs + (cur_batch_in_all_start_index + start_n) * stride_kbs,
-            mask=(start_n + offs_n[None, :]) < cur_batch_seq_len - cur_batch_ctx_len,
-            other=0.0,
-        )
-
-        qk = tl.zeros([BLOCK_M, BLOCK_N], dtype=tl.float32)
-        qk += tl.dot(q, k)
-        qk *= sm_scale
-        qk = tl.where(offs_m[:, None] >= (start_n + offs_n[None, :]), qk, float("-inf"))
-
-        # -- compute m_ij, p, l_ij
-        m_ij = tl.max(qk, 1)
-        m_i_new = tl.maximum(m_i, m_ij)
-        p = tl.math.exp(qk - m_i_new[:, None])
-        l_ij = tl.sum(p, 1)
-        # -- update m_i and l_i
-
-        alpha = tl.math.exp(m_i - m_i_new)
-        l_i_new = alpha * l_i + l_ij
-        # -- update output accumulator --
-        # scale p
-        # scale acc
-        acc_scale = alpha
-        # acc_scale = l_i / l_i_new * alpha
-        acc = acc * acc_scale[:, None]
-        # update acc
-        v = tl.load(
-            v_ptrs + (cur_batch_in_all_start_index + start_n) * stride_vbs,
-            mask=(start_n + offs_n[:, None]) < cur_batch_seq_len - cur_batch_ctx_len,
-            other=0.0,
-        )
-
-        p = p.to(v.dtype)
-        acc += tl.dot(p, v)
-        # update m_i and l_i
-        l_i = l_i_new
-        m_i = m_i_new
-
-    # acc /= l_i[:, None]
-    # initialize pointers to output
-    off_o = (
-        (cur_batch_in_all_start_index + offs_m[:, None]) * stride_obs
-        + cur_head * stride_oh
-        + offs_d[None, :] * stride_od
-    )
-    out_ptrs = Out + off_o
-    tl.store(
-        out_ptrs, acc, mask=offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len
-    )
-    return
-
-
 @triton.jit
 def _fwd_kernel_alibi(
     Q,
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
index 59567f2ca13c..6257a410e943 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
@@ -98,9 +98,6 @@ class GPTQMarlinState(Enum):
 
 
 class CompressedTensorsMoEMethod(FusedMoEMethodBase):
-    def __init_(self, moe: FusedMoEConfig):
-        super().__init__(moe)
-
     @staticmethod
     def get_moe_method(
         quant_config: "CompressedTensorsConfig",  # type: ignore # noqa E501

From 4228be7959e98e57d88501bd97aca7ef34ff562e Mon Sep 17 00:00:00 2001
From: Jialin Ouyang <Jialin.Ouyang@gmail.com>
Date: Tue, 11 Nov 2025 10:28:47 -0800
Subject: [PATCH 073/183] [Perf] Use np.ndarray instead of list[list[int]] to
 reduce GC overhead (#28245)

Signed-off-by: Jialin Ouyang <Jialin.Ouyang@gmail.com>
---
 tests/v1/engine/utils.py   |  7 ++++---
 vllm/v1/engine/logprobs.py |  7 ++++++-
 vllm/v1/outputs.py         | 13 +++++++------
 3 files changed, 17 insertions(+), 10 deletions(-)

diff --git a/tests/v1/engine/utils.py b/tests/v1/engine/utils.py
index 23684a2c55ce..3541ef89bfc1 100644
--- a/tests/v1/engine/utils.py
+++ b/tests/v1/engine/utils.py
@@ -5,6 +5,7 @@
 from dataclasses import dataclass
 from typing import TypeAlias
 
+import numpy as np
 import torch
 from transformers import PreTrainedTokenizer, PreTrainedTokenizerFast
 
@@ -369,9 +370,9 @@ def get_outputs(self) -> list[EngineCoreOutput]:
                         self.generated_logprobs_raw[req_idx][token_idx]
                     )
                     logprobs = LogprobsLists(
-                        [logprobs_token_ids_],
-                        [logprobs_],
-                        [sampled_token_ranks_],
+                        np.array([logprobs_token_ids_]),
+                        np.array([logprobs_]),
+                        np.array([sampled_token_ranks_]),
                     )
                 else:
                     logprobs = None
diff --git a/vllm/v1/engine/logprobs.py b/vllm/v1/engine/logprobs.py
index 4c5955d7ee2e..b618d2347265 100644
--- a/vllm/v1/engine/logprobs.py
+++ b/vllm/v1/engine/logprobs.py
@@ -74,7 +74,12 @@ def _update_sample_logprobs(self, logprobs_lists: LogprobsLists) -> None:
 
         token_ids_lst, logprobs_lst, ranks_lst, _ = logprobs_lists
 
-        for rank, logprobs, token_ids in zip(ranks_lst, logprobs_lst, token_ids_lst):
+        for rank_np, logprobs_np, token_ids_np in zip(
+            ranks_lst, logprobs_lst, token_ids_lst
+        ):
+            rank = rank_np.tolist()
+            logprobs = logprobs_np.tolist()
+            token_ids = token_ids_np.tolist()
             # Detokenize (non-incrementally).
             decoded_tokens = (
                 NONES
diff --git a/vllm/v1/outputs.py b/vllm/v1/outputs.py
index b5cba96e1026..5f65e4ee0d1f 100644
--- a/vllm/v1/outputs.py
+++ b/vllm/v1/outputs.py
@@ -5,6 +5,7 @@
 from dataclasses import dataclass, field
 from typing import TYPE_CHECKING, NamedTuple
 
+import numpy as np
 import torch
 
 if TYPE_CHECKING:
@@ -15,11 +16,11 @@
 
 class LogprobsLists(NamedTuple):
     # [num_reqs x num_generated_tokens, max_num_logprobs + 1]
-    logprob_token_ids: list[list[int]]
+    logprob_token_ids: np.ndarray
     # [num_reqs x num_generated_tokens, max_num_logprobs + 1]
-    logprobs: list[list[float]]
+    logprobs: np.ndarray
     # [num_reqs x num_generated_tokens]
-    sampled_token_ranks: list[int]
+    sampled_token_ranks: np.ndarray
     # [num_reqs]
     # Used for slicing the logprobs in cases like speculative
     # decoding where the number of generated tokens may be
@@ -60,9 +61,9 @@ class LogprobsTensors(NamedTuple):
 
     def tolists(self, cu_num_generated_tokens: list[int] | None = None):
         return LogprobsLists(
-            self.logprob_token_ids.tolist(),
-            self.logprobs.tolist(),
-            self.selected_token_ranks.tolist(),
+            self.logprob_token_ids.cpu().numpy(),
+            self.logprobs.cpu().numpy(),
+            self.selected_token_ranks.cpu().numpy(),
             cu_num_generated_tokens,
         )
 

From de120bc94f2e51633824093c626423ec8e7cb3a9 Mon Sep 17 00:00:00 2001
From: Canlin Guo <961750412@qq.com>
Date: Wed, 12 Nov 2025 02:57:12 +0800
Subject: [PATCH 074/183] [V0 deprecation] Clean up num_prefill_tokens logic
 for V0 (#28203)

Signed-off-by: gcanlin <canlinguosdu@gmail.com>
---
 vllm/forward_context.py | 18 +++---------------
 1 file changed, 3 insertions(+), 15 deletions(-)

diff --git a/vllm/forward_context.py b/vllm/forward_context.py
index ef37cf862c9f..44bc2a4cda31 100644
--- a/vllm/forward_context.py
+++ b/vllm/forward_context.py
@@ -5,7 +5,7 @@
 from collections import defaultdict
 from contextlib import contextmanager
 from dataclasses import dataclass
-from typing import TYPE_CHECKING, Any, NamedTuple, Union
+from typing import TYPE_CHECKING, Any, NamedTuple
 
 import torch
 
@@ -185,18 +185,13 @@ class ForwardContext:
     # copy from vllm_config.compilation_config.static_forward_context
     no_compile_layers: dict[str, Any]
     """
-    Type AttentionMetadata for v0, 
     Type Dict[str, AttentionMetadata] for v1, map from layer_name of each 
     attention layer to its attention metadata
     Type List[Dict[str, AttentionMetadata]] for DBO. List of size two, one
     for each microbatch.
     Set dynamically for each forward pass
     """
-    attn_metadata: Union[
-        "AttentionMetadata",
-        dict[str, "AttentionMetadata"],
-        list[dict[str, "AttentionMetadata"]],
-    ]
+    attn_metadata: dict[str, "AttentionMetadata"] | list[dict[str, "AttentionMetadata"]]
     # TODO: remove after making all virtual_engines share the same kv cache
     virtual_engine: int  # set dynamically for each forward pass
     # set dynamically for each forward pass
@@ -324,14 +319,7 @@ def set_forward_context(
     finally:
         global last_logging_time, batchsize_logging_interval
         if need_to_track_batchsize:
-            if hasattr(attn_metadata, "num_prefill_tokens"):
-                # for v0 attention backends
-                batchsize = (
-                    attn_metadata.num_prefill_tokens + attn_metadata.num_decode_tokens
-                )
-            else:
-                # for v1 attention backends
-                batchsize = num_tokens
+            batchsize = num_tokens
             # we use synchronous scheduling right now,
             # adding a sync point here should not affect
             # scheduling of the next batch

From 8c32c6e4b485f1cae1a1dc8a3f9895cf63f3e7af Mon Sep 17 00:00:00 2001
From: Jie Luo <65482183+Livinfly@users.noreply.github.com>
Date: Wed, 12 Nov 2025 02:59:16 +0800
Subject: [PATCH 075/183] [Misc] fix typo in DCP comment (#28389)

Signed-off-by: Livinfly <luojie3m@gmail.com>
---
 vllm/v1/attention/backends/mla/common.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/v1/attention/backends/mla/common.py b/vllm/v1/attention/backends/mla/common.py
index b4cb5c200da3..19bd102cb1e3 100755
--- a/vllm/v1/attention/backends/mla/common.py
+++ b/vllm/v1/attention/backends/mla/common.py
@@ -2000,7 +2000,7 @@ def forward(
                 decode_q, kv_cache, attn_metadata, layer
             )
 
-            # recorect dcp attn_out with lse.
+            # correct dcp attn_out with lse.
             if self.dcp_world_size > 1:
                 attn_out = cp_lse_ag_out_rs(attn_out, lse, get_dcp_group())
 

From 9d1c47470430ba31c02946aa1fd01aadf6e18b91 Mon Sep 17 00:00:00 2001
From: Jee Jee Li <pandaleefree@gmail.com>
Date: Wed, 12 Nov 2025 03:06:21 +0800
Subject: [PATCH 076/183] [LoRA][1/N]Remove LoRA extra vocab (#28382)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>
---
 vllm/model_executor/models/apertus.py         | 30 +++-------------
 vllm/model_executor/models/arcee.py           | 10 ++----
 vllm/model_executor/models/arctic.py          |  6 ++--
 vllm/model_executor/models/aria.py            |  8 ++---
 vllm/model_executor/models/baichuan.py        |  4 +--
 vllm/model_executor/models/bailing_moe.py     |  2 --
 vllm/model_executor/models/bamba.py           | 30 ++++------------
 vllm/model_executor/models/chameleon.py       |  8 ++---
 vllm/model_executor/models/chatglm.py         |  3 +-
 vllm/model_executor/models/commandr.py        | 19 ++++-------
 vllm/model_executor/models/dbrx.py            |  9 ++---
 vllm/model_executor/models/exaone.py          | 27 +++------------
 vllm/model_executor/models/exaone4.py         | 26 +++-----------
 vllm/model_executor/models/falcon_h1.py       | 31 ++++-------------
 vllm/model_executor/models/gemma.py           |  2 --
 vllm/model_executor/models/gemma2.py          |  3 +-
 vllm/model_executor/models/gemma3.py          |  3 +-
 vllm/model_executor/models/gemma3n.py         |  3 +-
 vllm/model_executor/models/glm4.py            |  2 --
 vllm/model_executor/models/gpt_bigcode.py     | 20 +++--------
 vllm/model_executor/models/granitemoe.py      | 27 +++------------
 .../model_executor/models/granitemoehybrid.py | 27 +++------------
 .../model_executor/models/granitemoeshared.py | 28 +++------------
 vllm/model_executor/models/grok1.py           | 26 ++++----------
 vllm/model_executor/models/hunyuan_v1.py      | 21 ++++--------
 vllm/model_executor/models/internlm2.py       |  2 --
 vllm/model_executor/models/jamba.py           | 30 ++++------------
 vllm/model_executor/models/kimi_vl.py         | 10 ++----
 vllm/model_executor/models/lfm2.py            | 31 +++--------------
 vllm/model_executor/models/lfm2_moe.py        | 32 ++++-------------
 vllm/model_executor/models/llama_eagle3.py    |  3 --
 vllm/model_executor/models/longcat_flash.py   |  3 +-
 vllm/model_executor/models/mamba.py           | 29 ++++------------
 vllm/model_executor/models/mamba2.py          | 28 +++------------
 vllm/model_executor/models/medusa.py          | 12 ++-----
 vllm/model_executor/models/mimo.py            |  2 --
 vllm/model_executor/models/minicpm.py         | 30 ++++------------
 vllm/model_executor/models/minicpm_eagle.py   | 29 ++++------------
 vllm/model_executor/models/minimax_text_01.py | 11 ++----
 vllm/model_executor/models/mlp_speculator.py  |  1 -
 vllm/model_executor/models/molmo.py           |  3 +-
 vllm/model_executor/models/nemotron.py        | 30 ++++------------
 vllm/model_executor/models/nemotron_h.py      | 30 ++++------------
 vllm/model_executor/models/nemotron_nas.py    | 31 ++++-------------
 vllm/model_executor/models/olmo.py            |  4 +--
 vllm/model_executor/models/olmo2.py           |  2 --
 vllm/model_executor/models/ouro.py            |  2 --
 vllm/model_executor/models/phi.py             |  3 +-
 vllm/model_executor/models/phi3v.py           |  1 -
 vllm/model_executor/models/phi4mm.py          | 14 ++------
 vllm/model_executor/models/phimoe.py          | 34 ++++---------------
 vllm/model_executor/models/plamo2.py          | 11 ++----
 vllm/model_executor/models/qwen2.py           |  2 --
 vllm/model_executor/models/qwen2_rm.py        |  2 --
 vllm/model_executor/models/qwen3.py           |  2 --
 vllm/model_executor/models/qwen3_next.py      | 30 ++++------------
 vllm/model_executor/models/qwen3_next_mtp.py  | 23 ++++---------
 vllm/model_executor/models/qwen3_vl.py        |  2 --
 vllm/model_executor/models/seed_oss.py        |  2 --
 vllm/model_executor/models/solar.py           | 30 ++++------------
 vllm/model_executor/models/starcoder2.py      | 12 ++-----
 vllm/model_executor/models/step3_text.py      | 16 ++-------
 .../models/transformers/causal.py             |  3 +-
 vllm/model_executor/models/whisper.py         |  6 ++--
 vllm/model_executor/models/zamba2.py          | 28 +++------------
 65 files changed, 197 insertions(+), 754 deletions(-)

diff --git a/vllm/model_executor/models/apertus.py b/vllm/model_executor/models/apertus.py
index 72e5ddcf1abe..233b8c79f299 100644
--- a/vllm/model_executor/models/apertus.py
+++ b/vllm/model_executor/models/apertus.py
@@ -49,7 +49,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -346,24 +345,18 @@ def __init__(
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         if get_pp_group().is_first_rank or (
             config.tie_word_embeddings and get_pp_group().is_last_rank
         ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
                 quant_config=quant_config,
             )
         else:
@@ -518,9 +511,7 @@ def __init__(
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
         self.config = config
-        self.lora_config = lora_config
 
         self.model = self._init_model(
             vllm_config=vllm_config,
@@ -529,20 +520,9 @@ def __init__(
         )
 
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = config.vocab_size
-            if lora_config:
-                self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=(
-                    DEFAULT_VOCAB_PADDING_SIZE
-                    # We need bigger padding if using lora for kernel
-                    # compatibility
-                    if not lora_config
-                    else lora_config.lora_vocab_padding_size
-                ),
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -551,7 +531,7 @@ def __init__(
 
             logit_scale = getattr(config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, config.vocab_size, logit_scale
+                config.vocab_size, scale=logit_scale
             )
         else:
             self.lm_head = PPMissingLayer()
diff --git a/vllm/model_executor/models/arcee.py b/vllm/model_executor/models/arcee.py
index 08bf1a6aad75..f33970aff279 100644
--- a/vllm/model_executor/models/arcee.py
+++ b/vllm/model_executor/models/arcee.py
@@ -23,7 +23,6 @@
 from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -200,7 +199,6 @@ def __init__(
         self.quant_config = quant_config
         self.config = config
         self.vocab_size = config.vocab_size
-        self.org_vocab_size = config.vocab_size
 
         # Word embeddings (parallelized if using pipeline parallel)
         if get_pp_group().is_first_rank or (
@@ -209,7 +207,6 @@ def __init__(
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
                 quant_config=quant_config,
             )
         else:
@@ -383,13 +380,10 @@ def __init__(self, *, vllm_config, prefix: str = "") -> None:
         if get_pp_group().is_last_rank:
             # Determine vocabulary size (including any LoRA extra tokens
             # for padded LM head)
-            self.unpadded_vocab_size = config.vocab_size
 
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE,
                 quant_config=vllm_config.quant_config,
                 bias=getattr(config, "lm_head_bias", False),
                 prefix=f"{prefix}.lm_head",
@@ -399,7 +393,7 @@ def __init__(self, *, vllm_config, prefix: str = "") -> None:
                 self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
             logit_scale = getattr(config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, config.vocab_size, logit_scale
+                config.vocab_size, scale=logit_scale
             )
         else:
             # Placeholder for lm_head on non-last ranks
diff --git a/vllm/model_executor/models/arctic.py b/vllm/model_executor/models/arctic.py
index bb505219ea17..ae3b96c83509 100644
--- a/vllm/model_executor/models/arctic.py
+++ b/vllm/model_executor/models/arctic.py
@@ -490,10 +490,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head.weight = self.model.embed_tokens.weight
         self.num_experts = config.num_local_experts
         self.num_experts_per_tok = config.num_experts_per_tok
-        self.unpadded_vocab_size = config.vocab_size
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+
+        self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
         )
diff --git a/vllm/model_executor/models/aria.py b/vllm/model_executor/models/aria.py
index 222a42579054..fe37487d6ed8 100644
--- a/vllm/model_executor/models/aria.py
+++ b/vllm/model_executor/models/aria.py
@@ -547,18 +547,14 @@ def __init__(
         self.pad_token_id = (
             self.config.pad_token_id if self.config.pad_token_id is not None else -1
         )
-        self.unpadded_vocab_size = config.text_config.vocab_size
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            self.vocab_size,
             config.text_config.hidden_size,
-            org_num_embeddings=self.language_model.org_vocab_size,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, self.vocab_size, logit_scale
-        )
+        self.logits_processor = LogitsProcessor(self.vocab_size, scale=logit_scale)
 
     def _parse_and_validate_image_input(
         self, **kwargs: object
diff --git a/vllm/model_executor/models/baichuan.py b/vllm/model_executor/models/baichuan.py
index 39990b9fd683..dac012eb9f82 100644
--- a/vllm/model_executor/models/baichuan.py
+++ b/vllm/model_executor/models/baichuan.py
@@ -402,9 +402,9 @@ def __init__(
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         self.config = config
-        self.lora_config = lora_config
+
         self.tp_size = get_tensor_model_parallel_world_size()
         self.quant_config = quant_config
         self.model = BaiChuanModel(
diff --git a/vllm/model_executor/models/bailing_moe.py b/vllm/model_executor/models/bailing_moe.py
index 1549c653482f..641bdb69c366 100644
--- a/vllm/model_executor/models/bailing_moe.py
+++ b/vllm/model_executor/models/bailing_moe.py
@@ -581,10 +581,8 @@ def __init__(
         config = vllm_config.model_config.hf_config.get_text_config()
         vllm_config.model_config.hf_config = config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
         self.quant_config = quant_config
         self.max_position_embeddings = config.max_position_embeddings
         self.model = BailingMoeModel(
diff --git a/vllm/model_executor/models/bamba.py b/vllm/model_executor/models/bamba.py
index bc7dbb618f65..4a2b3da1c194 100644
--- a/vllm/model_executor/models/bamba.py
+++ b/vllm/model_executor/models/bamba.py
@@ -30,7 +30,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -284,21 +283,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         model_config = vllm_config.model_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
 
         def get_layer(prefix: str):
@@ -478,7 +470,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
-        lora_config = vllm_config.lora_config
+
         scheduler_config = vllm_config.scheduler_config
         self.quant_config = vllm_config.quant_config
 
@@ -488,24 +480,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.model = BambaModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
 
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
diff --git a/vllm/model_executor/models/chameleon.py b/vllm/model_executor/models/chameleon.py
index 54ff6991fa70..64f73e938bf6 100644
--- a/vllm/model_executor/models/chameleon.py
+++ b/vllm/model_executor/models/chameleon.py
@@ -963,9 +963,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.model = ChameleonModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
-        self.unpadded_vocab_size = config.vocab_size
+
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
@@ -973,9 +973,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head.weight = self.model.embed_tokens.weight
 
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size, logit_scale
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size, scale=logit_scale)
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
         )
diff --git a/vllm/model_executor/models/chatglm.py b/vllm/model_executor/models/chatglm.py
index bcbe82b78c3b..ccf7c9300166 100644
--- a/vllm/model_executor/models/chatglm.py
+++ b/vllm/model_executor/models/chatglm.py
@@ -433,10 +433,9 @@ def __init__(
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         multimodal_config = vllm_config.model_config.multimodal_config
         self.config = config
-        self.lora_config = lora_config
         self.multimodal_config = multimodal_config
 
         self.quant_config = quant_config
diff --git a/vllm/model_executor/models/commandr.py b/vllm/model_executor/models/commandr.py
index 75459601f76b..6ae1dc356082 100644
--- a/vllm/model_executor/models/commandr.py
+++ b/vllm/model_executor/models/commandr.py
@@ -288,17 +288,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
         self.quant_config = quant_config
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         self.embed_tokens = VocabParallelEmbedding(
             config.vocab_size, config.hidden_size
         )
@@ -424,17 +419,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         self.config = config
         # currently all existing command R models have `tie_word_embeddings`
         # enabled
         assert config.tie_word_embeddings
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         self.quant_config = quant_config
         self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size, scale=config.logit_scale
+            config.vocab_size, scale=config.logit_scale
         )
         self.model = CohereModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
diff --git a/vllm/model_executor/models/dbrx.py b/vllm/model_executor/models/dbrx.py
index 22095d05848c..70999501f4c6 100644
--- a/vllm/model_executor/models/dbrx.py
+++ b/vllm/model_executor/models/dbrx.py
@@ -25,7 +25,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -441,21 +440,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         if config.tie_word_embeddings:
             raise ValueError("tie_word_embeddings is not supported for Dbrx models.")
         self.quant_config = quant_config
-        self.unpadded_vocab_size = config.vocab_size
+
         self.transformer = DbrxModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
         )
         self.lm_head = ParallelLMHead(
             config.vocab_size,
             config.d_model,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
             self.transformer.make_empty_intermediate_tensors
         )
diff --git a/vllm/model_executor/models/exaone.py b/vllm/model_executor/models/exaone.py
index 84fb52d13854..b9c7a520caff 100644
--- a/vllm/model_executor/models/exaone.py
+++ b/vllm/model_executor/models/exaone.py
@@ -48,7 +48,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -323,16 +322,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
+
+        self.vocab_size = config.vocab_size
         self.wte = config.vocab_size
         if get_pp_group().is_first_rank or (
             config.tie_word_embeddings and get_pp_group().is_last_rank
@@ -340,7 +334,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.wte = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
                 quant_config=quant_config,
             )
         else:
@@ -489,10 +482,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
+
         self.quant_config = quant_config
 
         self.transformer = ExaoneModel(
@@ -500,18 +492,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=maybe_prefix(prefix, "model"),
         )
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = config.vocab_size
-            if lora_config:
-                self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE
-                # We need bigger padding if using lora for kernel
-                # compatibility
-                if not lora_config
-                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -520,7 +503,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
             logit_scale = getattr(config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, config.vocab_size, logit_scale
+                config.vocab_size, scale=logit_scale
             )
         else:
             self.lm_head = PPMissingLayer()
diff --git a/vllm/model_executor/models/exaone4.py b/vllm/model_executor/models/exaone4.py
index d5e4d9a1486f..6a5c888c095a 100644
--- a/vllm/model_executor/models/exaone4.py
+++ b/vllm/model_executor/models/exaone4.py
@@ -44,7 +44,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -311,23 +310,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
+
+        self.vocab_size = config.vocab_size
         if get_pp_group().is_first_rank or (
             config.tie_word_embeddings and get_pp_group().is_last_rank
         ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
                 quant_config=quant_config,
             )
         else:
@@ -476,10 +469,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
         self.quant_config = quant_config
 
         self.model = Exaone4Model(
@@ -487,18 +478,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=maybe_prefix(prefix, "model"),
         )
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = config.vocab_size
-            if lora_config:
-                self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE
-                # We need bigger padding if using lora for kernel
-                # compatibility
-                if not lora_config
-                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -507,7 +489,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
             logit_scale = getattr(config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, config.vocab_size, logit_scale
+                config.vocab_size, scale=logit_scale
             )
         else:
             self.lm_head = PPMissingLayer()
diff --git a/vllm/model_executor/models/falcon_h1.py b/vllm/model_executor/models/falcon_h1.py
index ac5846cfd869..38838be29093 100644
--- a/vllm/model_executor/models/falcon_h1.py
+++ b/vllm/model_executor/models/falcon_h1.py
@@ -30,7 +30,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -424,21 +423,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         model_config = vllm_config.model_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         if get_pp_group().is_first_rank:
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
             )
             self.embedding_multiplier = config.embedding_multiplier
         else:
@@ -572,7 +565,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
-        lora_config = vllm_config.lora_config
+
         scheduler_config = vllm_config.scheduler_config
 
         self.quant_config = vllm_config.quant_config
@@ -584,21 +577,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
         self.tie_word_embeddings = config.tie_word_embeddings
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         if get_pp_group().is_last_rank:
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=(
-                    DEFAULT_VOCAB_PADDING_SIZE
-                    # We need bigger padding if using lora for kernel
-                    # compatibility
-                    if not lora_config
-                    else lora_config.lora_vocab_padding_size
-                ),
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
             self.lm_head_multiplier = config.lm_head_multiplier
@@ -607,7 +590,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             # Used to track and store by the Mamba cache between steps.
 
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.vocab_size,
                 scale=config.lm_head_multiplier,
             )
diff --git a/vllm/model_executor/models/gemma.py b/vllm/model_executor/models/gemma.py
index 46b111f4d939..caeee7c2e1ec 100644
--- a/vllm/model_executor/models/gemma.py
+++ b/vllm/model_executor/models/gemma.py
@@ -382,12 +382,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         # currently all existing Gemma models have `tie_word_embeddings` enabled
         assert config.tie_word_embeddings
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
         self.model = GemmaModel(
diff --git a/vllm/model_executor/models/gemma2.py b/vllm/model_executor/models/gemma2.py
index 1938efd4895e..efd01535fc3e 100644
--- a/vllm/model_executor/models/gemma2.py
+++ b/vllm/model_executor/models/gemma2.py
@@ -393,8 +393,7 @@ class Gemma2ForCausalLM(nn.Module, SupportsLoRA, SupportsPP):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
-        del lora_config  # Unused.
+
         super().__init__()
         self.config = config
         # currently all existing Gemma models have `tie_word_embeddings` enabled
diff --git a/vllm/model_executor/models/gemma3.py b/vllm/model_executor/models/gemma3.py
index 80ec40f478c6..213f9f562f8a 100644
--- a/vllm/model_executor/models/gemma3.py
+++ b/vllm/model_executor/models/gemma3.py
@@ -524,8 +524,7 @@ class Gemma3ForCausalLM(nn.Module, SupportsLoRA, SupportsPP):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
-        del lora_config  # Unused.
+
         super().__init__()
         self.config = config
         # currently all existing Gemma models have `tie_word_embeddings` enabled
diff --git a/vllm/model_executor/models/gemma3n.py b/vllm/model_executor/models/gemma3n.py
index 547884f393eb..22d51ab76269 100644
--- a/vllm/model_executor/models/gemma3n.py
+++ b/vllm/model_executor/models/gemma3n.py
@@ -1114,8 +1114,7 @@ class Gemma3nForCausalLM(nn.Module):
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
-        lora_config = vllm_config.lora_config
-        del lora_config  # Unused.
+
         super().__init__()
         self.config = config
         self.cache_config = vllm_config.cache_config
diff --git a/vllm/model_executor/models/glm4.py b/vllm/model_executor/models/glm4.py
index d7fd2b109d24..4172f16737c1 100644
--- a/vllm/model_executor/models/glm4.py
+++ b/vllm/model_executor/models/glm4.py
@@ -248,10 +248,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
         self.model = Glm4Model(
diff --git a/vllm/model_executor/models/gpt_bigcode.py b/vllm/model_executor/models/gpt_bigcode.py
index f2c8e2aeb822..99cdaabb98df 100644
--- a/vllm/model_executor/models/gpt_bigcode.py
+++ b/vllm/model_executor/models/gpt_bigcode.py
@@ -207,18 +207,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         assert not config.add_cross_attention
 
         self.embed_dim = config.hidden_size
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
+
+        self.vocab_size = config.vocab_size
         self.wte = VocabParallelEmbedding(
             self.vocab_size, self.embed_dim, org_num_embeddings=config.vocab_size
         )
@@ -290,10 +285,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
         self.transformer = GPTBigCodeModel(
@@ -305,15 +298,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head = ParallelLMHead(
                 self.transformer.vocab_size,
                 self.transformer.embed_dim,
-                org_num_embeddings=self.config.vocab_size,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+
+        self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
             self.transformer.make_empty_intermediate_tensors
         )
diff --git a/vllm/model_executor/models/granitemoe.py b/vllm/model_executor/models/granitemoe.py
index e683f30805f3..c5b36c362ee3 100644
--- a/vllm/model_executor/models/granitemoe.py
+++ b/vllm/model_executor/models/granitemoe.py
@@ -50,7 +50,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -296,22 +295,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config  # Required by MixtralModel
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
         self.embedding_multiplier = config.embedding_multiplier
 
@@ -518,26 +510,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.model = GraniteMoeModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
@@ -545,7 +527,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head.weight = self.model.embed_tokens.weight
 
         self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size,
             config.vocab_size,
             scale=1 / self.config.logits_scaling,
         )
diff --git a/vllm/model_executor/models/granitemoehybrid.py b/vllm/model_executor/models/granitemoehybrid.py
index bac64eec8c55..3a98abed76fd 100644
--- a/vllm/model_executor/models/granitemoehybrid.py
+++ b/vllm/model_executor/models/granitemoehybrid.py
@@ -25,7 +25,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -334,22 +333,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         model_config = vllm_config.model_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
         self.embedding_multiplier = config.embedding_multiplier
 
@@ -658,7 +650,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
-        lora_config = vllm_config.lora_config
+
         scheduler_config = vllm_config.scheduler_config
         self.quant_config = vllm_config.quant_config
         self.config = config
@@ -666,26 +658,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.model = GraniteMoeHybridModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
 
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             quant_config=self.quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         if config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.vocab_size,
             scale=1 / self.config.logits_scaling,
         )
diff --git a/vllm/model_executor/models/granitemoeshared.py b/vllm/model_executor/models/granitemoeshared.py
index e222109f2a94..e08e9f73ec87 100644
--- a/vllm/model_executor/models/granitemoeshared.py
+++ b/vllm/model_executor/models/granitemoeshared.py
@@ -25,7 +25,6 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -159,23 +158,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config  # Required by MixtralModel
         self.padding_idx = config.pad_token_id
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
             quant_config=quant_config,
         )
         self.embedding_multiplier = config.embedding_multiplier
@@ -281,26 +273,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.model = GraniteMoeSharedModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
@@ -308,7 +290,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head.weight = self.model.embed_tokens.weight
 
         self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.vocab_size,
             scale=1 / self.config.logits_scaling,
         )
diff --git a/vllm/model_executor/models/grok1.py b/vllm/model_executor/models/grok1.py
index d77a0bc2993a..0770e03b5356 100644
--- a/vllm/model_executor/models/grok1.py
+++ b/vllm/model_executor/models/grok1.py
@@ -45,7 +45,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -305,18 +304,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config
         self.padding_idx = config.pad_token_id
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         self.embedding_multiplier_scale = getattr(
             config, "embedding_multiplier_scale", DEFAULT_EMBEDDING_MULTIPLIER_SCALE
         )
@@ -324,7 +318,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
             quant_config=quant_config,
         )
 
@@ -499,25 +492,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
+
         self.quant_config = quant_config
 
         self.model = Grok1Model(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
 
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
-
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
@@ -529,7 +515,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config, "output_multiplier_scale", DEFAULT_OUTPUT_MULTIPLIER_SCALE
         )
         self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size, self.output_multiplier_scale
+            config.vocab_size, scale=self.output_multiplier_scale
         )
 
         self.make_empty_intermediate_tensors = (
diff --git a/vllm/model_executor/models/hunyuan_v1.py b/vllm/model_executor/models/hunyuan_v1.py
index 8fa9776bd018..a05a00932c13 100644
--- a/vllm/model_executor/models/hunyuan_v1.py
+++ b/vllm/model_executor/models/hunyuan_v1.py
@@ -57,7 +57,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -606,7 +605,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         eplb_config = vllm_config.parallel_config.eplb_config
         enable_eplb = vllm_config.parallel_config.enable_eplb
         self.num_redundant_experts = eplb_config.num_redundant_experts
@@ -614,20 +613,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.quant_config = quant_config
         self.padding_idx = config.pad_token_id
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         if get_pp_group().is_first_rank or (
             config.tie_word_embeddings and get_pp_group().is_last_rank
         ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
                 quant_config=quant_config,
             )
         else:
@@ -937,12 +931,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.model = HunYuanModel(vllm_config=vllm_config, prefix="model")
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = config.vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -951,7 +942,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
             logit_scale = getattr(config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, config.vocab_size, logit_scale
+                config.vocab_size, scale=logit_scale
             )
         else:
             self.lm_head = PPMissingLayer()
diff --git a/vllm/model_executor/models/internlm2.py b/vllm/model_executor/models/internlm2.py
index c5bbd5497a14..d856f5c79e33 100644
--- a/vllm/model_executor/models/internlm2.py
+++ b/vllm/model_executor/models/internlm2.py
@@ -330,11 +330,9 @@ def __init__(
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config
-        self.lora_config = lora_config
 
         self.model = model_type(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
diff --git a/vllm/model_executor/models/jamba.py b/vllm/model_executor/models/jamba.py
index 0cb993901fd3..70f52e3106f8 100644
--- a/vllm/model_executor/models/jamba.py
+++ b/vllm/model_executor/models/jamba.py
@@ -30,7 +30,6 @@
 from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -307,21 +306,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         model_config = vllm_config.model_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
 
         extra_kwargs = {"is_lora_enabled": bool(vllm_config.lora_config)}
@@ -492,7 +484,7 @@ class JambaForCausalLM(
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
-        lora_config = vllm_config.lora_config
+
         scheduler_config = vllm_config.scheduler_config
 
         super().__init__()
@@ -503,24 +495,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.model = JambaModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
 
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
diff --git a/vllm/model_executor/models/kimi_vl.py b/vllm/model_executor/models/kimi_vl.py
index b79bdf8595ca..fa04f60b9c14 100644
--- a/vllm/model_executor/models/kimi_vl.py
+++ b/vllm/model_executor/models/kimi_vl.py
@@ -60,7 +60,6 @@
 from vllm.model_executor.layers.linear import ReplicatedLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
 )
 from vllm.model_executor.model_loader.weight_utils import (
@@ -347,13 +346,10 @@ def __init__(
             vllm_config=sub_vllm_config,
             prefix=maybe_prefix(prefix, "language_model"),
         )
-        self.unpadded_vocab_size = config.text_config.vocab_size
         if get_pp_group().is_last_rank:
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.text_config.hidden_size,
-                org_num_embeddings=self.config.text_config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
         else:
@@ -362,9 +358,7 @@ def __init__(
             self.language_model.make_empty_intermediate_tensors
         )
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size, logit_scale
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size, scale=logit_scale)
         self.media_placeholder: int = self.config.media_placeholder_token_id
 
     def _parse_and_validate_image_input(
diff --git a/vllm/model_executor/models/lfm2.py b/vllm/model_executor/models/lfm2.py
index 5684b9a89125..21d71887178e 100644
--- a/vllm/model_executor/models/lfm2.py
+++ b/vllm/model_executor/models/lfm2.py
@@ -28,7 +28,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -316,16 +315,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         model_config = vllm_config.model_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size, config.hidden_size, org_num_embeddings=config.vocab_size
@@ -483,7 +476,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         cache_config = vllm_config.cache_config
-        lora_config = vllm_config.lora_config
+
         assert not cache_config.enable_prefix_caching, (
             "Lfm2 currently does not support prefix caching"
         )
@@ -495,21 +488,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         )
 
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = self.config.vocab_size
-            if lora_config:
-                self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
-
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=(
-                    DEFAULT_VOCAB_PADDING_SIZE
-                    # We need bigger padding if using lora for kernel
-                    # compatibility
-                    if not lora_config
-                    else lora_config.lora_vocab_padding_size
-                ),
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -517,9 +498,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         else:
             self.lm_head = PPMissingLayer()
 
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
diff --git a/vllm/model_executor/models/lfm2_moe.py b/vllm/model_executor/models/lfm2_moe.py
index 02a490e9c7fd..b19116467105 100644
--- a/vllm/model_executor/models/lfm2_moe.py
+++ b/vllm/model_executor/models/lfm2_moe.py
@@ -33,7 +33,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -423,20 +422,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         model_config = vllm_config.model_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         parallel_config = vllm_config.parallel_config
         enable_eplb = parallel_config.enable_eplb
         eplb_config = parallel_config.eplb_config
         self.num_redundant_experts = eplb_config.num_redundant_experts
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size, config.hidden_size, org_num_embeddings=config.vocab_size
@@ -662,7 +656,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         cache_config = vllm_config.cache_config
-        lora_config = vllm_config.lora_config
+
         assert not cache_config.enable_prefix_caching, (
             "Lfm2Moe currently does not support prefix caching"
         )
@@ -674,21 +668,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         )
 
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = self.config.vocab_size
-            if lora_config:
-                self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
-
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=(
-                    DEFAULT_VOCAB_PADDING_SIZE
-                    # We need bigger padding if using lora for kernel
-                    # compatibility
-                    if not lora_config
-                    else lora_config.lora_vocab_padding_size
-                ),
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -696,9 +678,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         else:
             self.lm_head = PPMissingLayer()
 
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
diff --git a/vllm/model_executor/models/llama_eagle3.py b/vllm/model_executor/models/llama_eagle3.py
index da4bbda186b1..b8b9cc76d08d 100644
--- a/vllm/model_executor/models/llama_eagle3.py
+++ b/vllm/model_executor/models/llama_eagle3.py
@@ -15,7 +15,6 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization.base_config import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -252,8 +251,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lm_head = ParallelLMHead(
             self.config.draft_vocab_size,
             self.config.hidden_size,
-            org_num_embeddings=self.config.draft_vocab_size,
-            padding_size=(DEFAULT_VOCAB_PADDING_SIZE),
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         self.logits_processor = LogitsProcessor(
diff --git a/vllm/model_executor/models/longcat_flash.py b/vllm/model_executor/models/longcat_flash.py
index 5671347c00a2..b848ae6e822f 100644
--- a/vllm/model_executor/models/longcat_flash.py
+++ b/vllm/model_executor/models/longcat_flash.py
@@ -554,7 +554,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = FlashConfig(**vllm_config.model_config.hf_config.__dict__)
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         config.intermediate_size = (
@@ -562,7 +561,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             if hasattr(config, "ffn_hidden_size")
             else config.intermediate_size
         )
-        self.lora_config = lora_config
+
         self.quant_config = quant_config
 
         self.model = FlashModel(
diff --git a/vllm/model_executor/models/mamba.py b/vllm/model_executor/models/mamba.py
index f684203f6d35..02abe693e071 100644
--- a/vllm/model_executor/models/mamba.py
+++ b/vllm/model_executor/models/mamba.py
@@ -21,7 +21,6 @@
 )
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -110,18 +109,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         is_lora_enabled = bool(lora_config)
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embeddings = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
@@ -199,7 +192,7 @@ class MambaForCausalLM(
 ):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
-        lora_config = vllm_config.lora_config
+
         self.scheduler_config = vllm_config.scheduler_config
 
         super().__init__()
@@ -209,27 +202,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.backbone = MambaModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "backbone")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         if config.tie_word_embeddings:
             self.lm_head = self.backbone.embeddings
         else:
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE
-                # We need bigger padding if using lora for kernel
-                # compatibility
-                if not lora_config
-                else lora_config.lora_vocab_padding_size,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
 
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
             self.backbone.make_empty_intermediate_tensors
diff --git a/vllm/model_executor/models/mamba2.py b/vllm/model_executor/models/mamba2.py
index 8ba8af66635b..d19480b064e0 100644
--- a/vllm/model_executor/models/mamba2.py
+++ b/vllm/model_executor/models/mamba2.py
@@ -20,7 +20,6 @@
 )
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -107,18 +106,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         assert not is_lora_enabled
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embeddings = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
@@ -238,7 +231,7 @@ def get_mamba_state_shape_from_config(
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
-        lora_config = vllm_config.lora_config
+
         scheduler_config = vllm_config.scheduler_config
 
         super().__init__()
@@ -249,27 +242,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.backbone = Mamba2Model(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "backbone")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
 
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         if config.tie_word_embeddings:
             self.lm_head = self.lm_head.tie_weights(self.backbone.embeddings)
 
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
             self.backbone.make_empty_intermediate_tensors
diff --git a/vllm/model_executor/models/medusa.py b/vllm/model_executor/models/medusa.py
index 7e1d2bf14bb5..fd7fc2c73f16 100644
--- a/vllm/model_executor/models/medusa.py
+++ b/vllm/model_executor/models/medusa.py
@@ -9,7 +9,6 @@
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
 )
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
@@ -70,14 +69,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         )
         self.orig_vocab_size = config.vocab_size
         self.truncated_vocab_size = config.truncated_vocab_size
-        self.unpadded_vocab_size = self.truncated_vocab_size
 
         if getattr(config, "original_lm_head", False):
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                self.truncated_vocab_size,
                 config.hidden_size,
-                org_num_embeddings=self.truncated_vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
             self.lm_heads = [self.lm_head for _ in range(self.config.num_heads)]
@@ -85,10 +81,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             self.lm_heads = nn.ModuleList(
                 [
                     ParallelLMHead(
-                        self.unpadded_vocab_size,
+                        config.vocab_size,
                         config.hidden_size,
-                        org_num_embeddings=self.truncated_vocab_size,
-                        padding_size=DEFAULT_VOCAB_PADDING_SIZE,
                         prefix=maybe_prefix(prefix, f"lm_heads.{i}"),
                     )
                     for i in range(self.config.num_heads)
@@ -97,7 +91,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         logit_scale = getattr(config, "logit_scale", 1.0)
         self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, self.truncated_vocab_size, logit_scale
+            config.vocab_size, self.truncated_vocab_size, logit_scale
         )
 
         # Token map is a idx to token mapping to reduce the vocab size for
diff --git a/vllm/model_executor/models/mimo.py b/vllm/model_executor/models/mimo.py
index 726752a77e0d..666ac90c4429 100644
--- a/vllm/model_executor/models/mimo.py
+++ b/vllm/model_executor/models/mimo.py
@@ -151,10 +151,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         nn.Module.__init__(self)
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
 
diff --git a/vllm/model_executor/models/minicpm.py b/vllm/model_executor/models/minicpm.py
index 85d3542317a1..d9f0b477180e 100644
--- a/vllm/model_executor/models/minicpm.py
+++ b/vllm/model_executor/models/minicpm.py
@@ -55,7 +55,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -405,22 +404,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.cache_config = cache_config
         self.quant_config = quant_config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
         self.num_experts = getattr(self.config, "num_experts", 0)
         self._init_layers(prefix, config, cache_config, quant_config)
@@ -588,13 +581,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         parallel_config = vllm_config.parallel_config
 
         self.prefix = prefix
         self.vllm_config = vllm_config
         self.config = config
-        self.lora_config = lora_config
+
         self.cache_config = cache_config
         self.quant_config = quant_config
 
@@ -602,18 +595,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
 
-        unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            unpadded_vocab_size += lora_config.lora_extra_vocab_size
         self.lm_head = ParallelLMHead(
-            unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
@@ -621,7 +605,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
         self.scale_width = self.config.hidden_size / self.config.dim_model_base
 
-        self.logits_processor = LogitsProcessor(unpadded_vocab_size, config.vocab_size)
+        self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
         )
diff --git a/vllm/model_executor/models/minicpm_eagle.py b/vllm/model_executor/models/minicpm_eagle.py
index 463af9bbe139..6efc61e25ea1 100644
--- a/vllm/model_executor/models/minicpm_eagle.py
+++ b/vllm/model_executor/models/minicpm_eagle.py
@@ -37,7 +37,6 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -151,18 +150,13 @@ def __init__(
         config = vllm_config.speculative_config.draft_model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.cache_config = cache_config
         self.quant_config = quant_config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         self.fc = torch.nn.Linear(
             self.config.hidden_size * 2, self.config.hidden_size, bias=False
         )
@@ -171,7 +165,6 @@ def __init__(
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
         self.num_experts = getattr(self.config, "num_experts", 0)
         self._init_layers(prefix, config, cache_config, quant_config, start_layer)
@@ -321,12 +314,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.speculative_config.draft_model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.prefix = prefix
         self.vllm_config = vllm_config
         self.config = config
-        self.lora_config = lora_config
+
         self.cache_config = cache_config
         self.quant_config = quant_config
 
@@ -340,18 +332,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             start_layer=target_layer_num,
         )
 
-        unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            unpadded_vocab_size += lora_config.lora_extra_vocab_size
         self.lm_head = ParallelLMHead(
-            unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
@@ -359,7 +342,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
         self.scale_width = self.config.hidden_size / self.config.dim_model_base
 
-        self.logits_processor = LogitsProcessor(unpadded_vocab_size, config.vocab_size)
+        self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
         )
diff --git a/vllm/model_executor/models/minimax_text_01.py b/vllm/model_executor/models/minimax_text_01.py
index e262012dcd52..1409a309f3ae 100644
--- a/vllm/model_executor/models/minimax_text_01.py
+++ b/vllm/model_executor/models/minimax_text_01.py
@@ -41,7 +41,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -669,16 +668,14 @@ class MiniMaxText01ForCausalLM(nn.Module, HasInnerState, IsHybrid):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         super().__init__()
         config = vllm_config.model_config.hf_config
-        lora_config = vllm_config.lora_config
+
         self.config = config
-        self.lora_config = lora_config
 
         if not hasattr(config, "sliding_window"):
             config.sliding_window = None
 
         self.CONCAT_FFN = True
 
-        self.unpadded_vocab_size = self.config.vocab_size
         if hasattr(vllm_config.model_config, "max_model_len"):
             self.config.max_model_len = vllm_config.model_config.max_model_len
         self.model = MiniMaxText01Model(
@@ -686,15 +683,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         )
         if get_pp_group().is_last_rank:
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 self.config.hidden_size,
-                org_num_embeddings=self.config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
 
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, self.config.vocab_size
+                config.vocab_size, self.config.vocab_size
             )
 
         else:
diff --git a/vllm/model_executor/models/mlp_speculator.py b/vllm/model_executor/models/mlp_speculator.py
index 4901ac74fb28..48604d8e5103 100644
--- a/vllm/model_executor/models/mlp_speculator.py
+++ b/vllm/model_executor/models/mlp_speculator.py
@@ -123,7 +123,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                     VocabParallelEmbedding(
                         config.vocab_size,
                         self.inner_dim,
-                        org_num_embeddings=config.vocab_size,
                     )
                     for _ in range(self.max_speculative_tokens)
                 ]
diff --git a/vllm/model_executor/models/molmo.py b/vllm/model_executor/models/molmo.py
index dce94d181c4c..7a9e3d81b73a 100644
--- a/vllm/model_executor/models/molmo.py
+++ b/vllm/model_executor/models/molmo.py
@@ -1404,10 +1404,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         multimodal_config = vllm_config.model_config.multimodal_config
-        lora_config = vllm_config.lora_config
+
         self.config = config
         self.multimodal_config = multimodal_config
-        self.lora_config = lora_config
 
         vision_config = VisionBackboneConfig()
         self.vision_backbone = MolmoVisionBackbone(config, vision_config, quant_config)
diff --git a/vllm/model_executor/models/nemotron.py b/vllm/model_executor/models/nemotron.py
index 845798b18d1b..17e8e7f28258 100644
--- a/vllm/model_executor/models/nemotron.py
+++ b/vllm/model_executor/models/nemotron.py
@@ -45,7 +45,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -319,24 +318,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         if get_pp_group().is_first_rank or (
             config.tie_word_embeddings and get_pp_group().is_last_rank
         ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
             )
         else:
             self.embed_tokens = PPMissingLayer()
@@ -467,29 +460,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         assert isinstance(config, NemotronConfig)
 
         self.config = config
-        self.lora_config = lora_config
+
         self.quant_config = quant_config
 
         self.model = NemotronModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = config.vocab_size
-            if lora_config:
-                self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE
-                # We need bigger padding if using lora for kernel
-                # compatibility
-                if not lora_config
-                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -498,7 +482,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
             logit_scale = getattr(config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, config.vocab_size, logit_scale
+                config.vocab_size, scale=logit_scale
             )
         else:
             self.lm_head = PPMissingLayer()
diff --git a/vllm/model_executor/models/nemotron_h.py b/vllm/model_executor/models/nemotron_h.py
index fb58d01be7ba..8ef3eee173eb 100644
--- a/vllm/model_executor/models/nemotron_h.py
+++ b/vllm/model_executor/models/nemotron_h.py
@@ -50,7 +50,6 @@
 )
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -513,21 +512,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
         parallel_config = vllm_config.parallel_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
 
         self.has_moe = "E" in config.hybrid_override_pattern
@@ -768,7 +760,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
-        lora_config = vllm_config.lora_config
+
         scheduler_config = vllm_config.scheduler_config
 
         self.quant_config = vllm_config.quant_config
@@ -779,24 +771,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.model = NemotronHModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
 
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
diff --git a/vllm/model_executor/models/nemotron_nas.py b/vllm/model_executor/models/nemotron_nas.py
index 17e009612df4..acd0d0c98234 100644
--- a/vllm/model_executor/models/nemotron_nas.py
+++ b/vllm/model_executor/models/nemotron_nas.py
@@ -41,7 +41,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -250,25 +249,19 @@ def __init__(
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config
         self.padding_idx = config.pad_token_id
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         if get_pp_group().is_first_rank or (
             config.tie_word_embeddings and get_pp_group().is_last_rank
         ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
                 quant_config=quant_config,
             )
         else:
@@ -437,29 +430,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         self.config = config
-        self.lora_config = lora_config
 
         self.model = self._init_model(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
 
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = config.vocab_size
-            if lora_config:
-                self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=(
-                    DEFAULT_VOCAB_PADDING_SIZE
-                    # We need bigger padding if using lora for kernel
-                    # compatibility
-                    if not lora_config
-                    else lora_config.lora_vocab_padding_size
-                ),
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -468,7 +449,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
             logit_scale = getattr(config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, config.vocab_size, logit_scale
+                config.vocab_size, scale=logit_scale
             )
         else:
             self.lm_head = PPMissingLayer()
diff --git a/vllm/model_executor/models/olmo.py b/vllm/model_executor/models/olmo.py
index 390a91d3425c..cb47f76a27ff 100644
--- a/vllm/model_executor/models/olmo.py
+++ b/vllm/model_executor/models/olmo.py
@@ -368,11 +368,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         if config.tie_word_embeddings:
             self.lm_head = self.model.embed_tokens
         else:
-            self.unpadded_vocab_size = config.vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
diff --git a/vllm/model_executor/models/olmo2.py b/vllm/model_executor/models/olmo2.py
index 7e39f6dff25e..2aa01adebc9f 100644
--- a/vllm/model_executor/models/olmo2.py
+++ b/vllm/model_executor/models/olmo2.py
@@ -408,11 +408,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         if config.tie_word_embeddings:
             self.lm_head = self.model.embed_tokens
         else:
-            self.unpadded_vocab_size = config.vocab_size
             self.lm_head = ParallelLMHead(
                 config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
                 quant_config=vllm_config.quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
diff --git a/vllm/model_executor/models/ouro.py b/vllm/model_executor/models/ouro.py
index b8dad909c547..cc7947df50ae 100644
--- a/vllm/model_executor/models/ouro.py
+++ b/vllm/model_executor/models/ouro.py
@@ -462,10 +462,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
         self.model = OuroModel(
diff --git a/vllm/model_executor/models/phi.py b/vllm/model_executor/models/phi.py
index 34db124b6447..e76fb1904727 100644
--- a/vllm/model_executor/models/phi.py
+++ b/vllm/model_executor/models/phi.py
@@ -323,11 +323,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         self.config = config
         # lm_head use bias, cannot share word embeddings
         assert not config.tie_word_embeddings
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
 
diff --git a/vllm/model_executor/models/phi3v.py b/vllm/model_executor/models/phi3v.py
index b86fe67fb476..a7b28bd18cc7 100644
--- a/vllm/model_executor/models/phi3v.py
+++ b/vllm/model_executor/models/phi3v.py
@@ -591,7 +591,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.embed_tokens = VocabParallelEmbedding(
             config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
             quant_config=self.quant_config,
             prefix=maybe_prefix(prefix, "model.embed_tokens"),
         )
diff --git a/vllm/model_executor/models/phi4mm.py b/vllm/model_executor/models/phi4mm.py
index acad72b058fc..c2a3be16b610 100644
--- a/vllm/model_executor/models/phi4mm.py
+++ b/vllm/model_executor/models/phi4mm.py
@@ -21,7 +21,6 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
 )
 from vllm.model_executor.models.llama import LlamaModel
@@ -1023,12 +1022,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         multimodal_config = vllm_config.model_config.multimodal_config
         assert multimodal_config, "multimodal_config is required"
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.multimodal_config = multimodal_config
         self.quant_config = quant_config
-        self.lora_config = lora_config
 
         # Tensor/Pipeline parallel not supported for now.
         assert get_pp_group().world_size == 1, "pipeline parallel is not supported"
@@ -1055,23 +1052,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
 
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         if config.tie_word_embeddings:
             self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size, logit_scale
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size, scale=logit_scale)
 
     def _parse_and_validate_audio_input(
         self, **kwargs: object
diff --git a/vllm/model_executor/models/phimoe.py b/vllm/model_executor/models/phimoe.py
index c7436cedeb22..97e553787790 100644
--- a/vllm/model_executor/models/phimoe.py
+++ b/vllm/model_executor/models/phimoe.py
@@ -45,7 +45,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -458,22 +457,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+        self.vocab_size = config.vocab_size
+
         self.config = config
         self.quant_config = quant_config
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
@@ -634,35 +626,23 @@ class PhiMoEForCausalLM(nn.Module, SupportsLoRA, SupportsPP):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
-        lora_config = vllm_config.lora_config
+
         self.config = config
-        self.lora_config = lora_config
+
         self.quant_config = vllm_config.quant_config
 
         self.model = PhiMoEModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=(
-                DEFAULT_VOCAB_PADDING_SIZE
-                # We need bigger padding if using lora for kernel
-                # compatibility
-                if not lora_config
-                else lora_config.lora_vocab_padding_size
-            ),
             quant_config=None,
             bias=True,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
diff --git a/vllm/model_executor/models/plamo2.py b/vllm/model_executor/models/plamo2.py
index 6427ccfccc13..ece1c5ec23cf 100644
--- a/vllm/model_executor/models/plamo2.py
+++ b/vllm/model_executor/models/plamo2.py
@@ -46,7 +46,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -751,12 +750,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.padding_idx = config.pad_token_id
         self.vocab_size = config.vocab_size
-        self.org_vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
             prefix=f"{prefix}.embed_tokens",
         )
         self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
@@ -827,20 +824,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
         self.vocab_size = self.config.vocab_size
-        self.unpadded_vocab_size = self.config.vocab_size
-        num_embeddings = ((self.vocab_size + 15) // 16) * 16
         self.lm_head = ParallelLMHead(
-            num_embeddings,
+            self.vocab_size,
             self.config.hidden_size,
-            org_num_embeddings=self.config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE,
             prefix=f"{prefix}.lm_head",
         )
         if self.config.tie_word_embeddings:
             self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
 
         self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, self.config.vocab_size
+            config.vocab_size, self.config.vocab_size
         )
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
diff --git a/vllm/model_executor/models/qwen2.py b/vllm/model_executor/models/qwen2.py
index b26546647ce7..cdf32c6c5137 100644
--- a/vllm/model_executor/models/qwen2.py
+++ b/vllm/model_executor/models/qwen2.py
@@ -477,10 +477,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
         self.model = Qwen2Model(
diff --git a/vllm/model_executor/models/qwen2_rm.py b/vllm/model_executor/models/qwen2_rm.py
index e2ba0e262cf7..c5582218b852 100644
--- a/vllm/model_executor/models/qwen2_rm.py
+++ b/vllm/model_executor/models/qwen2_rm.py
@@ -43,10 +43,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
         self.model = Qwen2Model(
diff --git a/vllm/model_executor/models/qwen3.py b/vllm/model_executor/models/qwen3.py
index 563d3cc23d72..f689ff79d761 100644
--- a/vllm/model_executor/models/qwen3.py
+++ b/vllm/model_executor/models/qwen3.py
@@ -272,10 +272,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
         self.model = Qwen3Model(
diff --git a/vllm/model_executor/models/qwen3_next.py b/vllm/model_executor/models/qwen3_next.py
index ddb8693c16e2..9cd342caacb0 100644
--- a/vllm/model_executor/models/qwen3_next.py
+++ b/vllm/model_executor/models/qwen3_next.py
@@ -59,7 +59,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -967,22 +966,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         config: Qwen3NextConfig = vllm_config.model_config.hf_config
         parallel_config = vllm_config.parallel_config
-        lora_config = vllm_config.lora_config
+
         eplb_config = parallel_config.eplb_config
         self.num_redundant_experts = eplb_config.num_redundant_experts
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
+
+        self.vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
 
         def get_layer(prefix: str):
@@ -1196,7 +1190,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
         cache_config = vllm_config.cache_config
-        lora_config = vllm_config.lora_config
+
         scheduler_config = vllm_config.scheduler_config
         assert not cache_config.enable_prefix_caching, (
             "Qwen3Next currently does not support prefix caching"
@@ -1209,23 +1203,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.model = Qwen3NextModel(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
+
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
         )
diff --git a/vllm/model_executor/models/qwen3_next_mtp.py b/vllm/model_executor/models/qwen3_next_mtp.py
index 271b76adcff7..9a552db029ee 100644
--- a/vllm/model_executor/models/qwen3_next_mtp.py
+++ b/vllm/model_executor/models/qwen3_next_mtp.py
@@ -15,7 +15,6 @@
 from vllm.model_executor.layers.linear import ColumnParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -48,17 +47,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         model_config = vllm_config.model_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         config: Qwen3NextConfig = model_config.hf_config
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         self.mtp_start_layer_idx = config.num_hidden_layers
         self.num_mtp_layers = getattr(config, "num_nextn_predict_layers", 1)
@@ -66,7 +60,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
 
         self.fc = ColumnParallelLinear(
@@ -252,17 +245,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.model = Qwen3NextMultiTokenPredictor(
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "mtp")
         )
-        self.unpadded_vocab_size = config.vocab_size
+
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
         )
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index 97d4667d82e9..d880e6015e5d 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -1136,10 +1136,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super(Qwen3ForCausalLM, self).__init__()
         config = vllm_config.model_config.hf_config.text_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
         self.model = Qwen3LLMModel(vllm_config=vllm_config, prefix=prefix)
diff --git a/vllm/model_executor/models/seed_oss.py b/vllm/model_executor/models/seed_oss.py
index 641160295afb..04da19a440a1 100644
--- a/vllm/model_executor/models/seed_oss.py
+++ b/vllm/model_executor/models/seed_oss.py
@@ -440,10 +440,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
-        self.lora_config = lora_config
 
         self.quant_config = quant_config
         self.model = SeedOssModel(
diff --git a/vllm/model_executor/models/solar.py b/vllm/model_executor/models/solar.py
index f0dfce7bc7b6..5b8bf150edf6 100644
--- a/vllm/model_executor/models/solar.py
+++ b/vllm/model_executor/models/solar.py
@@ -46,7 +46,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -277,24 +276,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
+
         if get_pp_group().is_first_rank or (
             config.tie_word_embeddings and get_pp_group().is_last_rank
         ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
             )
         else:
             self.embed_tokens = PPMissingLayer()
@@ -455,9 +448,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
-        lora_config = vllm_config.lora_config
+
         self.config = config
-        self.lora_config = lora_config
+
         self.quant_config = quant_config
 
         self.model = SolarModel(
@@ -465,18 +458,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=maybe_prefix(prefix, "model"),
         )
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = config.vocab_size
-            if lora_config:
-                self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE
-                # We need bigger padding if using lora for kernel
-                # compatibility
-                if not lora_config
-                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -485,7 +469,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
             logit_scale = getattr(config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, config.vocab_size, logit_scale
+                config.vocab_size, scale=logit_scale
             )
         else:
             self.lm_head = PPMissingLayer()
diff --git a/vllm/model_executor/models/starcoder2.py b/vllm/model_executor/models/starcoder2.py
index d147237808c2..4cdc90b1f5cb 100644
--- a/vllm/model_executor/models/starcoder2.py
+++ b/vllm/model_executor/models/starcoder2.py
@@ -42,7 +42,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -319,22 +318,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
         self.vocab_size = config.vocab_size
-        self.unpadded_vocab_size = config.vocab_size
+
         if config.tie_word_embeddings:
             self.lm_head = self.model.embed_tokens
         else:
-            self.unpadded_vocab_size = config.vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE,
                 quant_config=quant_config,
                 prefix=f"{prefix}.lm_head",
             )
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
             self.model.make_empty_intermediate_tensors
         )
diff --git a/vllm/model_executor/models/step3_text.py b/vllm/model_executor/models/step3_text.py
index a2a1bfd30d8d..381b3f4932e5 100644
--- a/vllm/model_executor/models/step3_text.py
+++ b/vllm/model_executor/models/step3_text.py
@@ -31,7 +31,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -400,28 +399,19 @@ def __init__(
     ):
         super().__init__()
         config = vllm_config.model_config.hf_config
-        lora_config = vllm_config.lora_config
+
         self.config = config
         self.vllm_config = vllm_config
 
         self.model = Step3TextModel(vllm_config=vllm_config, prefix=prefix)
 
         if get_pp_group().is_last_rank:
-            self.unpadded_vocab_size = config.vocab_size
-            if lora_config:
-                self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
             self.lm_head = ParallelLMHead(
-                self.unpadded_vocab_size,
+                config.vocab_size,
                 config.hidden_size,
-                org_num_embeddings=config.vocab_size,
-                padding_size=DEFAULT_VOCAB_PADDING_SIZE
-                if not lora_config
-                else lora_config.lora_vocab_padding_size,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
-            self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, config.vocab_size
-            )
+            self.logits_processor = LogitsProcessor(config.vocab_size)
         else:
             self.lm_head = PPMissingLayer()
 
diff --git a/vllm/model_executor/models/transformers/causal.py b/vllm/model_executor/models/transformers/causal.py
index 7f7b15a5675a..42fd11117c73 100644
--- a/vllm/model_executor/models/transformers/causal.py
+++ b/vllm/model_executor/models/transformers/causal.py
@@ -42,7 +42,6 @@ def __init__(self, *, vllm_config: "VllmConfig", prefix: str = ""):
             self.skip_prefixes.append("lm_head.")
 
         if self.pp_group.is_last_rank:
-            self.unpadded_vocab_size = self.text_config.vocab_size
             self.lm_head = ParallelLMHead(
                 self.text_config.vocab_size,
                 self.text_config.hidden_size,
@@ -56,7 +55,7 @@ def __init__(self, *, vllm_config: "VllmConfig", prefix: str = ""):
 
             logit_scale = getattr(self.text_config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, self.text_config.vocab_size, logit_scale
+                self.text_config.vocab_size, scale=logit_scale
             )
         else:
             self.lm_head = PPMissingLayer()
diff --git a/vllm/model_executor/models/whisper.py b/vllm/model_executor/models/whisper.py
index ccfe1871ef07..502783b1fd93 100644
--- a/vllm/model_executor/models/whisper.py
+++ b/vllm/model_executor/models/whisper.py
@@ -890,7 +890,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.dtype = vllm_config.model_config.dtype
 
         self.model = WhisperModel(vllm_config=vllm_config, prefix=prefix)
-        self.unpadded_vocab_size = config.vocab_size
+
         self.proj_out = ParallelLMHead(
             config.vocab_size,
             config.d_model,
@@ -899,9 +899,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.proj_out = self.proj_out.tie_weights(self.model.decoder.embed_tokens)
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size, logit_scale
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size, scale=logit_scale)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/zamba2.py b/vllm/model_executor/models/zamba2.py
index bc1351600a2f..bf3107525bc5 100644
--- a/vllm/model_executor/models/zamba2.py
+++ b/vllm/model_executor/models/zamba2.py
@@ -38,7 +38,6 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE,
     ParallelLMHead,
     VocabParallelEmbedding,
 )
@@ -692,19 +691,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         assert not is_lora_enabled
 
         self.config = config
-        lora_vocab = (
-            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
-            if lora_config
-            else 0
-        )
-        self.vocab_size = config.vocab_size + lora_vocab
-        self.org_vocab_size = config.vocab_size
+
+        self.vocab_size = config.vocab_size
 
         # Initialize token embeddings
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
         )
 
         # Map hybrid layer indices to block indices
@@ -911,7 +904,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                 (not supported by Mamba)
         """
         config = vllm_config.model_config.hf_config
-        lora_config = vllm_config.lora_config
+
         scheduler_config = vllm_config.scheduler_config
 
         super().__init__()
@@ -919,9 +912,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.vllm_config = vllm_config
         self.scheduler_config = scheduler_config
         self.model_config = vllm_config.model_config
-        self.unpadded_vocab_size = config.vocab_size
-        if lora_config:
-            self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
 
         # Initialize core model
         self.model = Zamba2Model(
@@ -930,23 +920,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         # Initialize language modeling head
         self.lm_head = ParallelLMHead(
-            self.unpadded_vocab_size,
+            config.vocab_size,
             config.hidden_size,
-            org_num_embeddings=config.vocab_size,
-            padding_size=DEFAULT_VOCAB_PADDING_SIZE
-            # We need bigger padding if using lora for kernel
-            # compatibility
-            if not lora_config
-            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         # Tie weights with input embeddings if using same dimensions
         self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
 
         # Initialize logits processing and sampling
-        self.logits_processor = LogitsProcessor(
-            self.unpadded_vocab_size, config.vocab_size
-        )
+        self.logits_processor = LogitsProcessor(config.vocab_size)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         """Convert input token IDs to embeddings.

From df4d3a44a83681feea723cc4c4ebe9085d29d58d Mon Sep 17 00:00:00 2001
From: Kyuyeun Kim <62023335+kyuyeunk@users.noreply.github.com>
Date: Tue, 11 Nov 2025 11:16:47 -0800
Subject: [PATCH 077/183] [TPU] Rename path to tpu platform (#28452)

Signed-off-by: Kyuyeun Kim <kyuyeunk@google.com>
---
 vllm/platforms/__init__.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/platforms/__init__.py b/vllm/platforms/__init__.py
index badf72de4a90..a45ca988200d 100644
--- a/vllm/platforms/__init__.py
+++ b/vllm/platforms/__init__.py
@@ -38,7 +38,7 @@ def tpu_platform_plugin() -> str | None:
     # Check for Pathways TPU proxy
     if envs.VLLM_TPU_USING_PATHWAYS:
         logger.debug("Confirmed TPU platform is available via Pathways proxy.")
-        return "tpu_inference.platforms.tpu_jax.TpuPlatform"
+        return "tpu_inference.platforms.tpu_platform.TpuPlatform"
 
     # Check for libtpu installation
     try:

From d4902ba56d9b265698fb53f2d956117454945371 Mon Sep 17 00:00:00 2001
From: wangxiyuan <wangxiyuan1007@gmail.com>
Date: Wed, 12 Nov 2025 06:28:07 +0800
Subject: [PATCH 078/183] [Misc] Cleanup Executor interface (#28441)

Signed-off-by: wangxiyuan <wangxiyuan1007@gmail.com>
---
 vllm/v1/executor/abstract.py | 6 ------
 1 file changed, 6 deletions(-)

diff --git a/vllm/v1/executor/abstract.py b/vllm/v1/executor/abstract.py
index 1e913876b763..db8303fcec50 100644
--- a/vllm/v1/executor/abstract.py
+++ b/vllm/v1/executor/abstract.py
@@ -294,12 +294,6 @@ def reset_mm_cache(self) -> None:
         """Reset the multi-modal cache in each worker."""
         self.collective_rpc("reset_mm_cache")
 
-    def start_profile(self) -> None:
-        self.collective_rpc("start_profile")
-
-    def stop_profile(self) -> None:
-        self.collective_rpc("stop_profile")
-
     def sleep(self, level: int = 1):
         if self.is_sleeping:
             logger.warning("Executor is already sleeping.")

From 28534b92b9f002e56d4e31d02ca59a070cdad468 Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Tue, 11 Nov 2025 17:53:59 -0500
Subject: [PATCH 079/183] Add Zurich vLLM Meetup (#28488)

Signed-off-by: mgoin <mgoin64@gmail.com>
---
 README.md                 | 1 +
 docs/community/meetups.md | 1 +
 2 files changed, 2 insertions(+)

diff --git a/README.md b/README.md
index b5e230e4b9b0..033e1035d891 100644
--- a/README.md
+++ b/README.md
@@ -21,6 +21,7 @@ Join us at the [PyTorch Conference, October 22-23](https://events.linuxfoundatio
 
 *Latest News* 🔥
 
+- [2025/11] We hosted [the first vLLM Europe Meetup in Zurich](https://luma.com/0gls27kb) focused on quantization, distributed inference, and reinforcement learning at scale with speakers from Mistral, IBM, and Red Hat. Please find the meetup slides [here](https://docs.google.com/presentation/d/1UC9PTLCHYXQpOmJDSFg6Sljra3iVXzc09DeEI7dnxMc/edit?usp=sharing) and recording [here](https://www.youtube.com/watch?v=6m6ZE6yVEDI)
 - [2025/11] We hosted [vLLM Beijing Meetup](https://mp.weixin.qq.com/s/xSrYXjNgr1HbCP4ExYNG1w) focusing on distributed inference and diverse accelerator support with vLLM! Please find the meetup slides [here](https://drive.google.com/drive/folders/1nQJ8ZkLSjKxvu36sSHaceVXtttbLvvu-?usp=drive_link).
 - [2025/10] We hosted [vLLM Shanghai Meetup](https://mp.weixin.qq.com/s/__xb4OyOsImz-9eAVrdlcg) focused on hands-on vLLM inference optimization! Please find the meetup slides [here](https://drive.google.com/drive/folders/1KqwjsFJLfEsC8wlDugnrR61zsWHt94Q6).
 - [2025/09] We hosted [vLLM Toronto Meetup](https://luma.com/e80e0ymm) focused on tackling inference at scale and speculative decoding with speakers from NVIDIA and Red Hat! Please find the meetup slides [here](https://docs.google.com/presentation/d/1IYJYmJcu9fLpID5N5RbW_vO0XLo0CGOR14IXOjB61V8/edit?usp=sharing).
diff --git a/docs/community/meetups.md b/docs/community/meetups.md
index 7ddd45799789..3fca4659e284 100644
--- a/docs/community/meetups.md
+++ b/docs/community/meetups.md
@@ -2,6 +2,7 @@
 
 We host regular meetups in San Francisco Bay Area every 2 months. We will share the project updates from the vLLM team and have guest speakers from the industry to share their experience and insights. Please find the materials of our previous meetups below:
 
+- [vLLM Zurich Meetup](https://luma.com/0gls27kb), November 6th 2025. [[Slides]](https://docs.google.com/presentation/d/1UC9PTLCHYXQpOmJDSFg6Sljra3iVXzc09DeEI7dnxMc/edit?usp=sharing) [[Recording]](https://www.youtube.com/watch?v=6m6ZE6yVEDI)
 - [vLLM Beijing Meetup](https://mp.weixin.qq.com/s/xSrYXjNgr1HbCP4ExYNG1w), November 1st 2025. [[Slides]](https://drive.google.com/drive/folders/1nQJ8ZkLSjKxvu36sSHaceVXtttbLvvu-?usp=drive_link)
 - [vLLM Shanghai Meetup](https://mp.weixin.qq.com/s/__xb4OyOsImz-9eAVrdlcg), October 25th 2025. [[Slides]](https://drive.google.com/drive/folders/1KqwjsFJLfEsC8wlDugnrR61zsWHt94Q6)
 - [vLLM Toronto Meetup](https://luma.com/e80e0ymm), September 25th 2025. [[Slides]](https://docs.google.com/presentation/d/1IYJYmJcu9fLpID5N5RbW_vO0XLo0CGOR14IXOjB61V8/edit?usp=sharing)

From e5f599d4d1cfd34a5216cf0733d152ea42073f28 Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Tue, 11 Nov 2025 18:16:12 -0500
Subject: [PATCH 080/183] [Bugfix] Disable shared expert overlap if Marlin MoE
 is used (#28410)

Signed-off-by: mgoin <mgoin64@gmail.com>
---
 vllm/model_executor/layers/fused_moe/layer.py          |  4 ++++
 .../layers/fused_moe/shared_fused_moe.py               | 10 +++++-----
 vllm/model_executor/layers/quantization/awq_marlin.py  |  1 +
 .../compressed_tensors/compressed_tensors_moe.py       |  1 +
 vllm/model_executor/layers/quantization/gptq_marlin.py |  1 +
 vllm/model_executor/layers/quantization/mxfp4.py       |  1 +
 6 files changed, 13 insertions(+), 5 deletions(-)

diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index e198322ba7a8..615da58eeda2 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -678,6 +678,10 @@ def use_flashinfer_cutlass_kernels(self):
             and self.moe_config.use_flashinfer_cutlass_kernels
         )
 
+    @property
+    def use_marlin_kernels(self):
+        return getattr(self.quant_method, "use_marlin", False)
+
     @property
     def use_dp_chunking(self) -> bool:
         return (
diff --git a/vllm/model_executor/layers/fused_moe/shared_fused_moe.py b/vllm/model_executor/layers/fused_moe/shared_fused_moe.py
index 06112ca51b6d..6ec8b33ed930 100644
--- a/vllm/model_executor/layers/fused_moe/shared_fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/shared_fused_moe.py
@@ -28,17 +28,17 @@ def __init__(
         super().__init__(**kwargs)
         self._shared_experts = shared_experts
 
-        # Disable shared expert overlap if we are using eplb, because of
-        # correctness issues, or if using flashinfer with DP, since there
-        # is nothing to be gained in this case. Disabling the overlap
-        # optimization also prevents the shared experts from being hidden
-        # from torch.compile.
+        # Disable shared expert overlap if:
+        #   - we are using eplb, because of correctness issues
+        #   - we are using flashinfer with DP, since there nothint to gain
+        #   - we are using marlin kjernels
         self.use_overlapped = (
             use_overlapped
             and not (
                 # TODO(wentao): find the root cause and remove this condition
                 self.enable_eplb
                 or (self.moe_config.use_flashinfer_cutlass_kernels and self.dp_size > 1)
+                or self.use_marlin_kernels
             )
             and self._shared_experts is not None
         )
diff --git a/vllm/model_executor/layers/quantization/awq_marlin.py b/vllm/model_executor/layers/quantization/awq_marlin.py
index 3e1f87b59a34..3f6ea68072b4 100644
--- a/vllm/model_executor/layers/quantization/awq_marlin.py
+++ b/vllm/model_executor/layers/quantization/awq_marlin.py
@@ -424,6 +424,7 @@ def __init__(
         if self.quant_config.weight_bits != 4:
             raise ValueError("AWQMoEMethod only supports 4bit now.")
         self.quant_type = scalar_types.uint4
+        self.use_marlin = True
 
     def create_weights(
         self,
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
index 6257a410e943..f1050c15f79e 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
@@ -1342,6 +1342,7 @@ def __init__(
                 f"{WNA16_SUPPORTED_BITS}",
             )
         self.quant_type = WNA16_SUPPORTED_TYPES_MAP[self.num_bits]
+        self.use_marlin = True
 
     def create_weights(
         self,
diff --git a/vllm/model_executor/layers/quantization/gptq_marlin.py b/vllm/model_executor/layers/quantization/gptq_marlin.py
index 42a569e7770c..68a122fd46c6 100644
--- a/vllm/model_executor/layers/quantization/gptq_marlin.py
+++ b/vllm/model_executor/layers/quantization/gptq_marlin.py
@@ -482,6 +482,7 @@ def __init__(
             self.quant_type = scalar_types.uint8b128
         else:
             raise ValueError("GPTQMarlinMoEMethod only supports int4 and int8 now.")
+        self.use_marlin = True
 
     def create_weights(
         self,
diff --git a/vllm/model_executor/layers/quantization/mxfp4.py b/vllm/model_executor/layers/quantization/mxfp4.py
index 8d7297a0a1b3..7940b359a150 100644
--- a/vllm/model_executor/layers/quantization/mxfp4.py
+++ b/vllm/model_executor/layers/quantization/mxfp4.py
@@ -216,6 +216,7 @@ class Mxfp4MoEMethod(FusedMoEMethodBase):
     def __init__(self, moe: FusedMoEConfig):
         super().__init__(moe)
         self.mxfp4_backend = get_mxfp4_backend(moe.is_lora_enabled)
+        self.use_marlin = self.mxfp4_backend == Mxfp4Backend.MARLIN
         self.max_capture_size = (
             get_current_vllm_config().compilation_config.max_cudagraph_capture_size
         )

From 412e153df557bbae541363ac4abde879a6d84488 Mon Sep 17 00:00:00 2001
From: Max Hu <hyoung2991@gmail.com>
Date: Tue, 11 Nov 2025 18:32:20 -0500
Subject: [PATCH 081/183] [Feature] Allow configuring FlashInfer workspace size
 (#28269)

Signed-off-by: Max Hu <hyoung2991@gmail.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
---
 vllm/envs.py                             |  6 ++++++
 vllm/v1/attention/backends/flashinfer.py |  6 +++---
 vllm/v1/attention/backends/mla/common.py | 16 +++++++---------
 3 files changed, 16 insertions(+), 12 deletions(-)

diff --git a/vllm/envs.py b/vllm/envs.py
index 52a9671bc46e..5274c8ba1b24 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -159,6 +159,7 @@
     VLLM_USE_FLASHINFER_MOE_FP8: bool = False
     VLLM_USE_FLASHINFER_MOE_FP4: bool = False
     VLLM_FLASHINFER_MOE_BACKEND: Literal["throughput", "latency"] = "latency"
+    VLLM_FLASHINFER_WORKSPACE_BUFFER_SIZE: int = 394 * 1024 * 1024
     VLLM_XGRAMMAR_CACHE_MB: int = 0
     VLLM_MSGPACK_ZERO_COPY_THRESHOLD: int = 256
     VLLM_ALLOW_INSECURE_SERIALIZATION: bool = False
@@ -1237,6 +1238,10 @@ def get_vllm_port() -> int | None:
     "VLLM_FLASHINFER_MOE_BACKEND": env_with_choices(
         "VLLM_FLASHINFER_MOE_BACKEND", "latency", ["throughput", "latency"]
     ),
+    # Control the workspace buffer size for the FlashInfer backend.
+    "VLLM_FLASHINFER_WORKSPACE_BUFFER_SIZE": lambda: int(
+        os.getenv("VLLM_FLASHINFER_WORKSPACE_BUFFER_SIZE", str(394 * 1024 * 1024))
+    ),
     # Control the maximum number of tokens per expert supported by the
     # NVFP4 MoE CUTLASS Kernel. This value is used to create a buffer for
     # the blockscale tensor of activations NVFP4 Quantization.
@@ -1583,6 +1588,7 @@ def compute_hash() -> str:
         "VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8",
         "VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS",
         "VLLM_USE_FLASHINFER_MOE_MXFP4_BF16",
+        "VLLM_FLASHINFER_WORKSPACE_BUFFER_SIZE",
         "VLLM_USE_CUDNN_PREFILL",
         "VLLM_USE_TRTLLM_RAGGED_DEEPSEEK_PREFILL",
         "VLLM_USE_TRTLLM_ATTENTION",
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 07a0ab41a9e0..18bbc3cc3c12 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -16,6 +16,7 @@
 from flashinfer.prefill import trtllm_batch_context_with_kv_cache
 from flashinfer.utils import FP4Tensor
 
+from vllm import envs
 from vllm.attention.backends.abstract import (
     AttentionBackend,
     AttentionImpl,
@@ -55,7 +56,6 @@
 )
 from vllm.v1.kv_cache_interface import AttentionSpec
 
-FLASHINFER_WORKSPACE_BUFFER_SIZE = 256 * 1024 * 1024
 FLASHINFER_WORKSPACE_BUFFER_SIZE_BATCH_INVARIANT = 2048 * 1024 * 1024
 
 FP8_DTYPE = current_platform.fp8_dtype()
@@ -70,7 +70,7 @@ def _get_trtllm_gen_workspace_buffer():
     global trtllm_gen_workspace_buffer
     if trtllm_gen_workspace_buffer is None:
         trtllm_gen_workspace_buffer = torch.zeros(
-            FLASHINFER_WORKSPACE_BUFFER_SIZE, dtype=torch.uint8, device="cuda"
+            envs.VLLM_FLASHINFER_WORKSPACE_BUFFER_SIZE, dtype=torch.uint8, device="cuda"
         )
     return trtllm_gen_workspace_buffer
 
@@ -414,7 +414,7 @@ def __init__(
 
     def _get_workspace_buffer(self):
         if self._workspace_buffer is None:
-            buffer_size = FLASHINFER_WORKSPACE_BUFFER_SIZE
+            buffer_size = envs.VLLM_FLASHINFER_WORKSPACE_BUFFER_SIZE
             if vllm_is_batch_invariant():
                 buffer_size = FLASHINFER_WORKSPACE_BUFFER_SIZE_BATCH_INVARIANT
             self._workspace_buffer = torch.zeros(
diff --git a/vllm/v1/attention/backends/mla/common.py b/vllm/v1/attention/backends/mla/common.py
index 19bd102cb1e3..467c01cd9d06 100755
--- a/vllm/v1/attention/backends/mla/common.py
+++ b/vllm/v1/attention/backends/mla/common.py
@@ -196,8 +196,8 @@
 import torch
 from tqdm import tqdm
 
-import vllm.envs as envs
 from vllm import _custom_ops as ops
+from vllm import envs
 from vllm._aiter_ops import rocm_aiter_ops
 from vllm.attention.backends.abstract import (
     AttentionBackend,
@@ -453,12 +453,6 @@ def use_trtllm_ragged_deepseek_prefill() -> bool:
     )
 
 
-# Currently 394MB, this can be tuned based on GEMM sizes used.
-# Chosen to be the same as sglang:
-#  https://github.com/sgl-project/sglang/blob/766392c6bda2558b61ce6d1c1bfd8081a549e1f1/python/sglang/global_config.py#L37
-FLASHINFER_WORKSPACE_BUFFER_SIZE = 394 * 1024 * 1024
-
-
 class MLACommonMetadataBuilder(AttentionMetadataBuilder[M]):
     """
     NOTE: Please read the comment at the top of the file before trying to
@@ -590,7 +584,9 @@ def __init__(
 
         if self._use_fi_prefill:
             self._workspace_buffer = torch.empty(
-                FLASHINFER_WORKSPACE_BUFFER_SIZE, dtype=torch.uint8, device=device
+                envs.VLLM_FLASHINFER_WORKSPACE_BUFFER_SIZE,
+                dtype=torch.uint8,
+                device=device,
             )
 
             self._fi_prefill_main: BatchPrefillWithRaggedKVCacheWrapper | None = None
@@ -602,7 +598,9 @@ def __init__(
 
         if self._use_trtllm_ragged_prefill:
             self._workspace_buffer = torch.empty(
-                FLASHINFER_WORKSPACE_BUFFER_SIZE, dtype=torch.uint8, device=device
+                envs.VLLM_FLASHINFER_WORKSPACE_BUFFER_SIZE,
+                dtype=torch.uint8,
+                device=device,
             )
 
         if self._use_cudnn_prefill:

From d23539549a6db54ab152ce4e566c31f6891ddab5 Mon Sep 17 00:00:00 2001
From: Adrian Abeyta <aabeyta@redhat.com>
Date: Tue, 11 Nov 2025 18:34:58 -0600
Subject: [PATCH 082/183] Use FLASHINFER MLA backend when testing
 fp8_kv_scale_compile (#28491)

Signed-off-by: adabeyta <aabeyta@redhat.com>
---
 tests/compile/test_full_graph.py | 20 ++++++++++++++++----
 1 file changed, 16 insertions(+), 4 deletions(-)

diff --git a/tests/compile/test_full_graph.py b/tests/compile/test_full_graph.py
index 71f90f6d8d3e..b4e5e56ac9fe 100644
--- a/tests/compile/test_full_graph.py
+++ b/tests/compile/test_full_graph.py
@@ -10,6 +10,7 @@
 
 from tests.quantization.utils import is_quant_method_supported
 from vllm import LLM, SamplingParams
+from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.config import CompilationConfig, CompilationMode, CUDAGraphMode, PassConfig
 from vllm.platforms import current_platform
 from vllm.utils.torch_utils import is_torch_equal_or_newer
@@ -184,13 +185,24 @@ def test_custom_compile_config(
     [CompilationMode.NONE, CompilationMode.VLLM_COMPILE],
 )
 @pytest.mark.parametrize(
-    "model",
+    "model, backend",
     [
-        "Qwen/Qwen2-0.5B",  # Standard attention model
-        "deepseek-ai/DeepSeek-V2-Lite",  # MLA (Multi-head Latent Attention) model
+        ("Qwen/Qwen2-0.5B", None),  # Standard attention model
+        (
+            "deepseek-ai/DeepSeek-V2-Lite",
+            AttentionBackendEnum.FLASHINFER_MLA,
+        ),  # MLA (Multi-head Latent Attention) model
     ],
 )
-def test_fp8_kv_scale_compile(compilation_mode: int, model: str):
+def test_fp8_kv_scale_compile(
+    monkeypatch: pytest.MonkeyPatch,
+    compilation_mode: int,
+    model: str,
+    backend: AttentionBackendEnum | None,
+):
+    if backend:
+        monkeypatch.setenv("VLLM_ATTENTION_BACKEND", backend.name)
+
     model_kwargs = {
         "quantization": "fp8",
         "kv_cache_dtype": "fp8_e4m3",

From 1788aa1efb1f3cd8bf521885244aed3b89bed8a1 Mon Sep 17 00:00:00 2001
From: Ilya Markov <markovilya197@gmail.com>
Date: Wed, 12 Nov 2025 01:41:54 +0100
Subject: [PATCH 083/183] [BugFix] Graceful handling of torch symm mem errors.
 (#27671)

Signed-off-by: ilmarkov <markovilya197@gmail.com>
Co-authored-by: Michael Goin <mgoin64@gmail.com>
---
 .../device_communicators/symm_mem.py          | 22 +++++++++++++------
 vllm/envs.py                                  |  4 ++--
 2 files changed, 17 insertions(+), 9 deletions(-)

diff --git a/vllm/distributed/device_communicators/symm_mem.py b/vllm/distributed/device_communicators/symm_mem.py
index 74d6fb40c83b..eb1f173b1192 100644
--- a/vllm/distributed/device_communicators/symm_mem.py
+++ b/vllm/distributed/device_communicators/symm_mem.py
@@ -88,13 +88,21 @@ def __init__(
             self.max_size = SYMM_MEM_ALL_REDUCE_MAX_SIZES[self.device_capability][
                 self.world_size
             ]
-
-        self.buffer = torch_symm_mem.empty(
-            self.max_size // self.dtype.itemsize,
-            device=self.device,
-            dtype=self.dtype,
-        )
-        handle = torch_symm_mem.rendezvous(self.buffer, self.group.group_name)
+        try:
+            self.buffer = torch_symm_mem.empty(
+                self.max_size // self.dtype.itemsize,
+                device=self.device,
+                dtype=self.dtype,
+            )
+            handle = torch_symm_mem.rendezvous(self.buffer, self.group.group_name)
+        except RuntimeError as e:
+            logger.warning_once(
+                "SymmMemCommunicator: symmetric memory initialization failed: %s "
+                "Communicator is not available. To suppress this warning set "
+                "VLLM_ALLREDUCE_USE_SYMM_MEM=0",
+                str(e),
+            )
+            return
         if handle.multicast_ptr == 0:
             logger.warning(
                 "SymmMemCommunicator: symmetric memory "
diff --git a/vllm/envs.py b/vllm/envs.py
index 5274c8ba1b24..46725efac70e 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -201,7 +201,7 @@
     VLLM_USE_FLASHINFER_MOE_MXFP4_BF16: bool = False
     VLLM_ROCM_FP8_MFMA_PAGE_ATTN: bool = False
     VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS: bool = False
-    VLLM_ALLREDUCE_USE_SYMM_MEM: bool = False
+    VLLM_ALLREDUCE_USE_SYMM_MEM: bool = True
     VLLM_TUNED_CONFIG_FOLDER: str | None = None
     VLLM_GPT_OSS_SYSTEM_TOOL_MCP_LABELS: set[str] = set()
     VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS: bool = False
@@ -1389,7 +1389,7 @@ def get_vllm_port() -> int | None:
     ),
     # Whether to use pytorch symmetric memory for allreduce
     "VLLM_ALLREDUCE_USE_SYMM_MEM": lambda: bool(
-        int(os.getenv("VLLM_ALLREDUCE_USE_SYMM_MEM", "0"))
+        int(os.getenv("VLLM_ALLREDUCE_USE_SYMM_MEM", "1"))
     ),
     # Allows vllm to find tuned config under customized folder
     "VLLM_TUNED_CONFIG_FOLDER": lambda: os.getenv("VLLM_TUNED_CONFIG_FOLDER", None),

From 48c879369f83ab1ab281a4bfe97f9a54790715d1 Mon Sep 17 00:00:00 2001
From: Yanan Cao <gmagogsfm@users.noreply.github.com>
Date: Tue, 11 Nov 2025 16:46:18 -0800
Subject: [PATCH 084/183] [Frontend] Change CompilationMode to a proper Enum
 (#28165)

Signed-off-by: Yanan Cao <gmagogsfm@gmail.com>
---
 tests/compile/test_basic_correctness.py |  6 ++-
 tests/utils_/test_argparse_utils.py     | 60 +++++++++++++++++++++++++
 vllm/compilation/wrapper.py             |  4 +-
 vllm/config/compilation.py              | 51 ++++++++++++++-------
 vllm/config/vllm.py                     |  5 +--
 vllm/entrypoints/llm.py                 |  5 ++-
 6 files changed, 108 insertions(+), 23 deletions(-)

diff --git a/tests/compile/test_basic_correctness.py b/tests/compile/test_basic_correctness.py
index 132a838b8d44..3f6898607f6b 100644
--- a/tests/compile/test_basic_correctness.py
+++ b/tests/compile/test_basic_correctness.py
@@ -127,7 +127,9 @@ def test_compile_correctness(
             CompilationMode.VLLM_COMPILE,
         ]:
             for mode in [CompilationMode.NONE, comp_mode]:
-                all_args.append(final_args + [f"-O.mode={mode}", "-O.backend=inductor"])
+                all_args.append(
+                    final_args + [f"-O.mode={mode.name}", "-O.backend=inductor"]
+                )
 
             # inductor will change the output, so we only compare if the output
             # is close, not exactly the same.
@@ -146,7 +148,7 @@ def test_compile_correctness(
             CompilationMode.DYNAMO_TRACE_ONCE,
             CompilationMode.VLLM_COMPILE,
         ]:
-            all_args.append(final_args + [f"-O.mode={mode}", "-O.backend=eager"])
+            all_args.append(final_args + [f"-O.mode={mode.name}", "-O.backend=eager"])
             all_envs.append({})
             all_envs.append({})
 
diff --git a/tests/utils_/test_argparse_utils.py b/tests/utils_/test_argparse_utils.py
index 51684edcc8a3..3310753d2b6d 100644
--- a/tests/utils_/test_argparse_utils.py
+++ b/tests/utils_/test_argparse_utils.py
@@ -8,6 +8,7 @@
 import pytest
 import yaml
 from transformers import AutoTokenizer
+from pydantic import ValidationError
 
 from vllm.transformers_utils.detokenizer_utils import convert_ids_list_to_tokens
 
@@ -376,6 +377,65 @@ def test_load_config_file(tmp_path):
     os.remove(str(config_file_path))
 
 
+def test_compilation_mode_string_values(parser):
+    """Test that -O.mode accepts both integer and string mode values."""
+    args = parser.parse_args(["-O.mode", "0"])
+    assert args.compilation_config == {"mode": 0}
+
+    args = parser.parse_args(["-O3"])
+    assert args.compilation_config == {"mode": 3}
+
+    args = parser.parse_args(["-O.mode=NONE"])
+    assert args.compilation_config == {"mode": "NONE"}
+
+    args = parser.parse_args(["-O.mode", "STOCK_TORCH_COMPILE"])
+    assert args.compilation_config == {"mode": "STOCK_TORCH_COMPILE"}
+
+    args = parser.parse_args(["-O.mode=DYNAMO_TRACE_ONCE"])
+    assert args.compilation_config == {"mode": "DYNAMO_TRACE_ONCE"}
+
+    args = parser.parse_args(["-O.mode", "VLLM_COMPILE"])
+    assert args.compilation_config == {"mode": "VLLM_COMPILE"}
+
+    args = parser.parse_args(["-O.mode=none"])
+    assert args.compilation_config == {"mode": "none"}
+
+    args = parser.parse_args(["-O.mode=vllm_compile"])
+    assert args.compilation_config == {"mode": "vllm_compile"}
+
+
+def test_compilation_config_mode_validator():
+    """Test that CompilationConfig.mode field validator converts strings to integers."""
+    from vllm.config.compilation import CompilationConfig, CompilationMode
+
+    config = CompilationConfig(mode=0)
+    assert config.mode == CompilationMode.NONE
+
+    config = CompilationConfig(mode=3)
+    assert config.mode == CompilationMode.VLLM_COMPILE
+
+    config = CompilationConfig(mode="NONE")
+    assert config.mode == CompilationMode.NONE
+
+    config = CompilationConfig(mode="STOCK_TORCH_COMPILE")
+    assert config.mode == CompilationMode.STOCK_TORCH_COMPILE
+
+    config = CompilationConfig(mode="DYNAMO_TRACE_ONCE")
+    assert config.mode == CompilationMode.DYNAMO_TRACE_ONCE
+
+    config = CompilationConfig(mode="VLLM_COMPILE")
+    assert config.mode == CompilationMode.VLLM_COMPILE
+
+    config = CompilationConfig(mode="none")
+    assert config.mode == CompilationMode.NONE
+
+    config = CompilationConfig(mode="vllm_compile")
+    assert config.mode == CompilationMode.VLLM_COMPILE
+
+    with pytest.raises(ValidationError, match="Invalid compilation mode"):
+        CompilationConfig(mode="INVALID_MODE")
+
+
 def test_flat_product():
     # Check regular itertools.product behavior
     result1 = list(flat_product([1, 2, 3], ["a", "b"]))
diff --git a/vllm/compilation/wrapper.py b/vllm/compilation/wrapper.py
index 4b10c85209f6..4d26619bd128 100644
--- a/vllm/compilation/wrapper.py
+++ b/vllm/compilation/wrapper.py
@@ -31,7 +31,9 @@ class TorchCompileWrapperWithCustomDispatcher:
     """
 
     def __init__(
-        self, compiled_callable: Callable | None = None, compilation_mode: int = 0
+        self,
+        compiled_callable: Callable | None = None,
+        compilation_mode: CompilationMode = CompilationMode.NONE,
     ):
         vllm_config = get_current_vllm_config()
         self.vllm_config = vllm_config
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 9c9557df4e73..e1d60ee84d89 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -28,7 +28,7 @@
 logger = init_logger(__name__)
 
 
-class CompilationMode:
+class CompilationMode(enum.IntEnum):
     """The compilation approach used for torch.compile-based compilation of the
     model."""
 
@@ -115,7 +115,7 @@ class PassConfig:
     """The threshold of the communicated tensor sizes under which
     vllm should use flashinfer fused allreduce. Specified as a
     float in MB.
-    Unspecified will fallback to default values 
+    Unspecified will fallback to default values
     which are compute capability and world size dependent.
         FI_ALLREDUCE_FUSION_MAX_SIZE_MB = {
             90: {
@@ -244,7 +244,7 @@ class CompilationConfig:
     Please use mode. Currently all levels are mapped to mode.
     """
     # Top-level Compilation control
-    mode: int | None = None
+    mode: CompilationMode | None = None
     """The compilation approach used for torch.compile-based compilation of the
     model.
 
@@ -377,23 +377,23 @@ class CompilationConfig:
     FULL mode: Capture full cudagraph for all batches. Can be good for small
     models or workloads with small prompts; not supported by many backends.
     Generally for performance FULL_AND_PIECEWISE is better.
-    
+
     FULL_DECODE_ONLY mode: Capture full cudagraph for decode batches only.
     Mixed prefill-decode batches are run without cudagraphs. Can be good for
     decode instances in a P/D setup where prefill is not as important so we
     can save some memory.
-    
+
     FULL_AND_PIECEWISE mode: Capture full cudagraph for decode batches and
     piecewise cudagraph for prefill and mixed prefill-decode batches.
     This is the most performant mode for most models and is the default.
 
     Currently, the cudagraph mode is only used for the v1 engine.
-    Note that the cudagraph logic is generally orthogonal to the 
-    compilation logic. While piecewise cudagraphs require piecewise 
+    Note that the cudagraph logic is generally orthogonal to the
+    compilation logic. While piecewise cudagraphs require piecewise
     compilation (mode=VLLM_COMPILE and non-empty splitting_ops), full
     cudagraphs are supported with and without compilation.
-    
-    Warning: This flag is new and subject to change in addition 
+
+    Warning: This flag is new and subject to change in addition
     more modes may be added.
     """
     use_cudagraph: bool = True
@@ -422,7 +422,7 @@ class CompilationConfig:
     cudagraph. If the caller can guarantee that the same input buffers
     are always used, it can set this to False. Otherwise, it should
     set this to True, and the compiler will copy the input to an
-    internally managed buffer. Default is False. 
+    internally managed buffer. Default is False.
     Note that this flag is only effective when cudagraph_mode is PIECEWISE.
     """
     full_cuda_graph: bool | None = False
@@ -451,7 +451,7 @@ class CompilationConfig:
     outside the partition functions. For a graph with N cudagraph-unsafe ops
     (e.g., Attention), there would be N+1 partitions. To mark an op as
     cudagraph unsafe, we can add `tags=(torch._C.Tag.cudagraph_unsafe)` when
-    register the custom op. 
+    register the custom op.
 
     This config supports both full cudagraph and piecewise cudagraph without
     compiling twice. For piecewise cudagraph, it applies vLLM CUDAGraph wrapper
@@ -468,8 +468,8 @@ class CompilationConfig:
 
     max_cudagraph_capture_size: int | None = field(default=None)
     """The maximum cudagraph capture size.
-    
-    If cudagraph_capture_sizes is specified, this will be set to the largest 
+
+    If cudagraph_capture_sizes is specified, this will be set to the largest
     size in that list (or checked for consistency if specified). If
     cudagraph_capture_sizes is not specified, the list of sizes is generated
     automatically following the pattern:
@@ -478,7 +478,7 @@ class CompilationConfig:
         range(256, max_cudagraph_capture_size + 1, 16))
 
     If not specified, max_cudagraph_capture_size is set to min(max_num_seqs*2,
-    512) by default. This voids OOM in tight memory scenarios with small 
+    512) by default. This voids OOM in tight memory scenarios with small
     max_num_seqs, and prevents capture of many large graphs (>512) that would
     greatly increase startup time with limited performance benefit.
     """
@@ -579,6 +579,27 @@ def __repr__(self) -> str:
 
     __str__ = __repr__
 
+    @field_validator("mode", mode="before")
+    @classmethod
+    def validate_mode_before(cls, value: Any) -> Any:
+        """
+        Enable parsing the `mode` field from string mode names.
+        Accepts both integers (0-3) and string names, like NONE, STOCK_TORCH_COMPILE,
+        DYNAMO_TRACE_ONCE, VLLM_COMPILE.
+        """
+        if isinstance(value, str):
+            # Convert string mode name to integer value
+            mode_name = value.upper()
+
+            if mode_name not in CompilationMode.__members__:
+                raise ValueError(
+                    f"Invalid compilation mode: {value}. "
+                    f"Valid modes are: {', '.join(CompilationMode.__members__.keys())}"
+                )
+
+            return CompilationMode[mode_name]
+        return value
+
     @field_validator("cudagraph_mode", mode="before")
     @classmethod
     def validate_cudagraph_mode_before(cls, value: Any) -> Any:
@@ -904,7 +925,7 @@ def is_attention_compiled_piecewise(self) -> bool:
             return self.mode == CompilationMode.VLLM_COMPILE
 
         # Inductor partition case
-        return self.backend == "inductor" and self.mode > CompilationMode.NONE
+        return self.backend == "inductor" and self.mode != CompilationMode.NONE
 
     def custom_op_log_check(self):
         """
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 0fca967d9083..df9a1fd08af6 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -422,16 +422,13 @@ def __post_init__(self):
                 self.compilation_config.mode = CompilationMode.VLLM_COMPILE
             else:
                 self.compilation_config.mode = CompilationMode.NONE
-        else:
-            assert self.compilation_config.mode >= CompilationMode.NONE
-            assert self.compilation_config.mode <= CompilationMode.VLLM_COMPILE
 
         # If user does not set custom ops via none or all set it here based on
         # compilation mode and backend.
         if all(s not in self.compilation_config.custom_ops for s in ("all", "none")):
             if (
                 self.compilation_config.backend == "inductor"
-                and self.compilation_config.mode > CompilationMode.NONE
+                and self.compilation_config.mode != CompilationMode.NONE
             ):
                 self.compilation_config.custom_ops.append("none")
             else:
diff --git a/vllm/entrypoints/llm.py b/vllm/entrypoints/llm.py
index 22fe2ae9280a..62717a7eacdf 100644
--- a/vllm/entrypoints/llm.py
+++ b/vllm/entrypoints/llm.py
@@ -23,6 +23,7 @@
     StructuredOutputsConfig,
     is_init_field,
 )
+from vllm.config.compilation import CompilationMode
 from vllm.config.model import (
     ConvertOption,
     HfOverrides,
@@ -259,7 +260,9 @@ def __init__(
 
         if compilation_config is not None:
             if isinstance(compilation_config, int):
-                compilation_config_instance = CompilationConfig(mode=compilation_config)
+                compilation_config_instance = CompilationConfig(
+                    mode=CompilationMode(compilation_config)
+                )
             elif isinstance(compilation_config, dict):
                 compilation_config_instance = CompilationConfig(
                     **{

From 3f770f4427cb926c24af540cc72d1b5901f7f702 Mon Sep 17 00:00:00 2001
From: Isotr0py <mozf@mail2.sysu.edu.cn>
Date: Wed, 12 Nov 2025 08:49:29 +0800
Subject: [PATCH 085/183] [Performance] Cache loaded custom logitsprocs to
 avoid overheads (#28462)

Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>
---
 vllm/v1/sample/logits_processor/__init__.py | 10 ++++++++--
 1 file changed, 8 insertions(+), 2 deletions(-)

diff --git a/vllm/v1/sample/logits_processor/__init__.py b/vllm/v1/sample/logits_processor/__init__.py
index eb537eae6c90..5992c4066c9c 100644
--- a/vllm/v1/sample/logits_processor/__init__.py
+++ b/vllm/v1/sample/logits_processor/__init__.py
@@ -5,7 +5,7 @@
 import itertools
 from abc import abstractmethod
 from collections.abc import Sequence
-from functools import partial
+from functools import lru_cache, partial
 from typing import TYPE_CHECKING
 
 import torch
@@ -216,11 +216,17 @@ def build_logitsprocs(
     )
 
 
+cached_load_custom_logitsprocs = lru_cache(_load_custom_logitsprocs)
+
+
 def validate_logits_processors_parameters(
     logits_processors: Sequence[str | type[LogitsProcessor]] | None,
     sampling_params: SamplingParams,
 ):
-    for logits_procs in _load_custom_logitsprocs(logits_processors):
+    logits_processors = (
+        tuple(logits_processors) if logits_processors is not None else None
+    )
+    for logits_procs in cached_load_custom_logitsprocs(logits_processors):
         logits_procs.validate_params(sampling_params)
 
 

From e1710393c44cff20e481b632b86d157a9d694625 Mon Sep 17 00:00:00 2001
From: wangxiyuan <wangxiyuan1007@gmail.com>
Date: Wed, 12 Nov 2025 09:22:16 +0800
Subject: [PATCH 086/183] [[V0 deprecation]]Remove VLLM_USE_V1 env (#28204)

Signed-off-by: wangxiyuan <wangxiyuan1007@gmail.com>
---
 .../scripts/hardware_ci/run-cpu-test.sh       |  2 +-
 examples/offline_inference/mlpspeculator.py   |  3 +-
 .../offline_inference/qwen2_5_omni/README.md  |  2 -
 .../qwen2_5_omni/only_thinker.py              |  7 +--
 .../others/lmcache/cpu_offload_lmcache.py     | 43 ++++++-------------
 tests/entrypoints/openai/test_orca_metrics.py |  3 --
 vllm/envs.py                                  | 13 ------
 vllm/usage/usage_lib.py                       |  1 -
 8 files changed, 15 insertions(+), 59 deletions(-)

diff --git a/.buildkite/scripts/hardware_ci/run-cpu-test.sh b/.buildkite/scripts/hardware_ci/run-cpu-test.sh
index 7927aef19e4e..7e0f720feaa7 100644
--- a/.buildkite/scripts/hardware_ci/run-cpu-test.sh
+++ b/.buildkite/scripts/hardware_ci/run-cpu-test.sh
@@ -76,7 +76,7 @@ function cpu_tests() {
   # Run AWQ test
   # docker exec cpu-test-"$NUMA_NODE" bash -c "
   #   set -e
-  #   VLLM_USE_V1=0 pytest -x -s -v \
+  #   pytest -x -s -v \
   #   tests/quantization/test_ipex_quant.py"
 
   # Run multi-lora tests
diff --git a/examples/offline_inference/mlpspeculator.py b/examples/offline_inference/mlpspeculator.py
index d5b1b4ad29a9..6a533eb5c937 100644
--- a/examples/offline_inference/mlpspeculator.py
+++ b/examples/offline_inference/mlpspeculator.py
@@ -4,8 +4,7 @@
 This file demonstrates the usage of text generation with an LLM model,
 comparing the performance with and without speculative decoding.
 
-Note that still not support `v1`:
-VLLM_USE_V1=0 python examples/offline_inference/mlpspeculator.py
+Note that this example is out of date and not supported in vLLM v1.
 """
 
 import gc
diff --git a/examples/offline_inference/qwen2_5_omni/README.md b/examples/offline_inference/qwen2_5_omni/README.md
index 16d44cbadbc9..d8fb50d7fe55 100644
--- a/examples/offline_inference/qwen2_5_omni/README.md
+++ b/examples/offline_inference/qwen2_5_omni/README.md
@@ -11,12 +11,10 @@ python examples/offline_inference/qwen2_5_omni/only_thinker.py \
 
 # Read vision and audio inputs from a single video file
 # NOTE: V1 engine does not support interleaved modalities yet.
-VLLM_USE_V1=0 \
 python examples/offline_inference/qwen2_5_omni/only_thinker.py \
     -q use_audio_in_video
 
 # Multiple audios
-VLLM_USE_V1=0 \
 python examples/offline_inference/qwen2_5_omni/only_thinker.py \
     -q multi_audios
 ```
diff --git a/examples/offline_inference/qwen2_5_omni/only_thinker.py b/examples/offline_inference/qwen2_5_omni/only_thinker.py
index 6fbe1303f431..ed005e6a69b8 100644
--- a/examples/offline_inference/qwen2_5_omni/only_thinker.py
+++ b/examples/offline_inference/qwen2_5_omni/only_thinker.py
@@ -7,7 +7,6 @@
 
 from typing import NamedTuple
 
-import vllm.envs as envs
 from vllm import LLM, SamplingParams
 from vllm.assets.audio import AudioAsset
 from vllm.assets.image import ImageAsset
@@ -72,11 +71,7 @@ def get_use_audio_in_video_query() -> QueryResult:
     )
     asset = VideoAsset(name="baby_reading", num_frames=16)
     audio = asset.get_audio(sampling_rate=16000)
-    assert not envs.VLLM_USE_V1, (
-        "V1 does not support use_audio_in_video. "
-        "Please launch this example with "
-        "`VLLM_USE_V1=0`."
-    )
+
     return QueryResult(
         inputs={
             "prompt": prompt,
diff --git a/examples/others/lmcache/cpu_offload_lmcache.py b/examples/others/lmcache/cpu_offload_lmcache.py
index e10ee4e2a9a9..53036b3eb0ff 100644
--- a/examples/others/lmcache/cpu_offload_lmcache.py
+++ b/examples/others/lmcache/cpu_offload_lmcache.py
@@ -37,7 +37,7 @@
 from vllm.engine.arg_utils import EngineArgs
 
 
-def setup_environment_variables(vllm_version: str):
+def setup_environment_variables():
     # LMCache-related environment variables
     # Use experimental features in LMCache
     os.environ["LMCACHE_USE_EXPERIMENTAL"] = "True"
@@ -47,12 +47,10 @@ def setup_environment_variables(vllm_version: str):
     os.environ["LMCACHE_LOCAL_CPU"] = "True"
     # Set local CPU memory limit to 5.0 GB
     os.environ["LMCACHE_MAX_LOCAL_CPU_SIZE"] = "5.0"
-    if vllm_version == "v0":
-        os.environ["VLLM_USE_V1"] = "0"
 
 
 @contextlib.contextmanager
-def build_llm_with_lmcache(lmcache_connector: str, model: str, vllm_version: str):
+def build_llm_with_lmcache(lmcache_connector: str, model: str):
     ktc = KVTransferConfig(
         kv_connector=lmcache_connector,
         kv_role="kv_both",
@@ -60,21 +58,12 @@ def build_llm_with_lmcache(lmcache_connector: str, model: str, vllm_version: str
     # Set GPU memory utilization to 0.8 for an A40 GPU with 40GB
     # memory. Reduce the value if your GPU has less memory.
     # Note: LMCache supports chunked prefill (see vLLM#14505, LMCache#392).
-    if vllm_version == "v0":
-        llm_args = EngineArgs(
-            model=model,
-            kv_transfer_config=ktc,
-            max_model_len=8000,
-            gpu_memory_utilization=0.8,
-            enable_chunked_prefill=True,  # Only in v0
-        )
-    else:
-        llm_args = EngineArgs(
-            model=model,
-            kv_transfer_config=ktc,
-            max_model_len=8000,
-            gpu_memory_utilization=0.8,
-        )
+    llm_args = EngineArgs(
+        model=model,
+        kv_transfer_config=ktc,
+        max_model_len=8000,
+        gpu_memory_utilization=0.8,
+    )
 
     llm = LLM(**asdict(llm_args))
     try:
@@ -116,18 +105,10 @@ def parse_args():
 
 
 def main():
-    args = parse_args()
-
-    if args.version == "v0":
-        lmcache_connector = "LMCacheConnector"
-        model = "mistralai/Mistral-7B-Instruct-v0.2"
-    else:
-        lmcache_connector = "LMCacheConnectorV1"
-        model = "meta-llama/Meta-Llama-3.1-8B-Instruct"
-
-    setup_environment_variables(args.version)
-
-    with build_llm_with_lmcache(lmcache_connector, model, args.version) as llm:
+    lmcache_connector = "LMCacheConnectorV1"
+    model = "meta-llama/Meta-Llama-3.1-8B-Instruct"
+    setup_environment_variables()
+    with build_llm_with_lmcache(lmcache_connector, model) as llm:
         # This example script runs two requests with a shared prefix.
         # Define the shared prompt and specific prompts
         shared_prompt = "Hello, how are you?" * 1000
diff --git a/tests/entrypoints/openai/test_orca_metrics.py b/tests/entrypoints/openai/test_orca_metrics.py
index d32cfde07c21..1ed44a33bf81 100644
--- a/tests/entrypoints/openai/test_orca_metrics.py
+++ b/tests/entrypoints/openai/test_orca_metrics.py
@@ -22,9 +22,6 @@ def monkeypatch_module():
 
 @pytest.fixture(scope="module", params=[True])
 def server(request, monkeypatch_module):
-    use_v1 = request.param
-    monkeypatch_module.setenv("VLLM_USE_V1", "1" if use_v1 else "0")
-
     args = [
         "--dtype",
         "bfloat16",
diff --git a/vllm/envs.py b/vllm/envs.py
index 46725efac70e..2aa6afcabf28 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -100,7 +100,6 @@
     VLLM_SKIP_P2P_CHECK: bool = False
     VLLM_DISABLED_KERNELS: list[str] = []
     VLLM_DISABLE_PYNCCL: bool = False
-    VLLM_USE_V1: bool = True
     VLLM_ROCM_USE_AITER: bool = False
     VLLM_ROCM_USE_AITER_PAGED_ATTN: bool = False
     VLLM_ROCM_USE_AITER_LINEAR: bool = True
@@ -884,8 +883,6 @@ def get_vllm_port() -> int | None:
     "VLLM_DISABLE_PYNCCL": lambda: (
         os.getenv("VLLM_DISABLE_PYNCCL", "False").lower() in ("true", "1")
     ),
-    # If set, use the V1 code path.
-    "VLLM_USE_V1": lambda: bool(int(os.getenv("VLLM_USE_V1", "1"))),
     # Disable aiter ops unless specifically enabled.
     # Acts as a parent switch to enable the rest of the other operations.
     "VLLM_ROCM_USE_AITER": lambda: (
@@ -1538,16 +1535,6 @@ def is_set(name: str):
     raise AttributeError(f"module {__name__!r} has no attribute {name!r}")
 
 
-def set_vllm_use_v1(use_v1: bool):
-    if is_set("VLLM_USE_V1"):
-        raise ValueError(
-            "Should not call set_vllm_use_v1() if VLLM_USE_V1 is set "
-            "explicitly by the user. Please raise this as a Github "
-            "Issue and explicitly set VLLM_USE_V1=0 or 1."
-        )
-    os.environ["VLLM_USE_V1"] = "1" if use_v1 else "0"
-
-
 def compute_hash() -> str:
     """
     WARNING: Whenever a new key is added to this environment
diff --git a/vllm/usage/usage_lib.py b/vllm/usage/usage_lib.py
index c8bff8b7c80b..4eddaf56d81a 100644
--- a/vllm/usage/usage_lib.py
+++ b/vllm/usage/usage_lib.py
@@ -42,7 +42,6 @@
     "VLLM_USE_FLASHINFER_SAMPLER",
     "VLLM_PP_LAYER_PARTITION",
     "VLLM_USE_TRITON_AWQ",
-    "VLLM_USE_V1",
     "VLLM_ENABLE_V1_MULTIPROCESSING",
 ]
 

From 7f829be7d3d734020606fcca520f3c500581beb8 Mon Sep 17 00:00:00 2001
From: "Li, Jiang" <jiang1.li@intel.com>
Date: Wed, 12 Nov 2025 09:43:06 +0800
Subject: [PATCH 087/183] [CPU] Refactor CPU attention backend (#27954)

Signed-off-by: jiang1.li <jiang1.li@intel.com>
---
 .buildkite/release-pipeline.yaml              |    2 +-
 .../scripts/hardware_ci/run-cpu-test.sh       |    3 +-
 cmake/cpu_extension.cmake                     |   28 +-
 csrc/cpu/attention.cpp                        |  798 -------
 csrc/cpu/cache.cpp                            |  214 --
 csrc/cpu/cpu_attn.cpp                         |  249 +++
 csrc/cpu/cpu_attn_amx.hpp                     |  511 +++++
 csrc/cpu/cpu_attn_impl.hpp                    | 1977 +++++++++++++++++
 csrc/cpu/cpu_attn_macros.h                    |   63 +
 csrc/cpu/cpu_attn_vec.hpp                     |  248 +++
 csrc/cpu/cpu_attn_vec16.hpp                   |  171 ++
 csrc/cpu/cpu_types_x86.hpp                    |   50 +-
 csrc/cpu/dnnl_helper.cpp                      |   18 +-
 csrc/cpu/dnnl_helper.h                        |   24 -
 csrc/cpu/scratchpad_manager.cpp               |   23 +
 csrc/cpu/scratchpad_manager.h                 |   31 +
 csrc/cpu/shm.cpp                              |    2 +-
 csrc/cpu/torch_bindings.cpp                   |  105 +-
 docker/Dockerfile.cpu                         |    4 +
 docs/getting_started/installation/cpu.md      |    2 +
 .../attention/test_attention_selector.py      |    6 +-
 tests/kernels/attention/test_cpu_attn.py      |  575 +++++
 tests/kernels/test_onednn.py                  |    1 -
 .../models/language/generation/test_common.py |   17 +-
 .../models/language/pooling/test_embedding.py |    3 +-
 tests/models/registry.py                      |    4 +-
 vllm/_custom_ops.py                           |   82 +
 vllm/attention/backends/registry.py           |    3 +-
 vllm/engine/arg_utils.py                      |    3 -
 vllm/platforms/cpu.py                         |   37 +-
 vllm/utils/__init__.py                        |    1 -
 vllm/v1/attention/backends/cpu_attn.py        |  981 +++-----
 vllm/v1/attention/backends/utils.py           |    2 +-
 vllm/v1/worker/cpu_model_runner.py            |   14 +-
 34 files changed, 4352 insertions(+), 1900 deletions(-)
 delete mode 100644 csrc/cpu/attention.cpp
 delete mode 100644 csrc/cpu/cache.cpp
 create mode 100644 csrc/cpu/cpu_attn.cpp
 create mode 100644 csrc/cpu/cpu_attn_amx.hpp
 create mode 100644 csrc/cpu/cpu_attn_impl.hpp
 create mode 100644 csrc/cpu/cpu_attn_macros.h
 create mode 100644 csrc/cpu/cpu_attn_vec.hpp
 create mode 100644 csrc/cpu/cpu_attn_vec16.hpp
 create mode 100644 csrc/cpu/scratchpad_manager.cpp
 create mode 100644 csrc/cpu/scratchpad_manager.h
 create mode 100644 tests/kernels/attention/test_cpu_attn.py

diff --git a/.buildkite/release-pipeline.yaml b/.buildkite/release-pipeline.yaml
index 12f730738b8a..38c400ba1faf 100644
--- a/.buildkite/release-pipeline.yaml
+++ b/.buildkite/release-pipeline.yaml
@@ -132,7 +132,7 @@ steps:
       queue: cpu_queue_postmerge
     commands:
       - "aws ecr-public get-login-password --region us-east-1 | docker login --username AWS --password-stdin public.ecr.aws/q9t5s3a7"
-      - "DOCKER_BUILDKIT=1 docker build --build-arg max_jobs=16 --build-arg GIT_REPO_CHECK=1 --build-arg VLLM_CPU_AVX512BF16=true --build-arg VLLM_CPU_AVX512VNNI=true --tag public.ecr.aws/q9t5s3a7/vllm-cpu-release-repo:$(buildkite-agent meta-data get release-version) --tag public.ecr.aws/q9t5s3a7/vllm-cpu-release-repo:latest --progress plain --target vllm-openai -f docker/Dockerfile.cpu ."
+      - "DOCKER_BUILDKIT=1 docker build --build-arg max_jobs=16 --build-arg GIT_REPO_CHECK=1 --build-arg VLLM_CPU_AVX512BF16=true --build-arg VLLM_CPU_AVX512VNNI=true --build-arg VLLM_CPU_AMXBF16=true --tag public.ecr.aws/q9t5s3a7/vllm-cpu-release-repo:$(buildkite-agent meta-data get release-version) --tag public.ecr.aws/q9t5s3a7/vllm-cpu-release-repo:latest --progress plain --target vllm-openai -f docker/Dockerfile.cpu ."
       - "docker push public.ecr.aws/q9t5s3a7/vllm-cpu-release-repo:latest"
       - "docker push public.ecr.aws/q9t5s3a7/vllm-cpu-release-repo:$(buildkite-agent meta-data get release-version)"
     env:
diff --git a/.buildkite/scripts/hardware_ci/run-cpu-test.sh b/.buildkite/scripts/hardware_ci/run-cpu-test.sh
index 7e0f720feaa7..7479c43977d7 100644
--- a/.buildkite/scripts/hardware_ci/run-cpu-test.sh
+++ b/.buildkite/scripts/hardware_ci/run-cpu-test.sh
@@ -49,6 +49,7 @@ function cpu_tests() {
   # Run kernel tests
   docker exec cpu-test-"$NUMA_NODE" bash -c "
     set -e
+    pytest -x -v -s tests/kernels/attention/test_cpu_attn.py
     pytest -x -v -s tests/kernels/test_onednn.py"
 
   # Run basic model test
@@ -116,4 +117,4 @@ function cpu_tests() {
 
 # All of CPU tests are expected to be finished less than 40 mins.
 export -f cpu_tests
-timeout 2h bash -c "cpu_tests $CORE_RANGE $NUMA_NODE"
+timeout 2.5h bash -c "cpu_tests $CORE_RANGE $NUMA_NODE"
diff --git a/cmake/cpu_extension.cmake b/cmake/cpu_extension.cmake
index dbda19fbcbf2..51447cde0b29 100644
--- a/cmake/cpu_extension.cmake
+++ b/cmake/cpu_extension.cmake
@@ -15,6 +15,7 @@ endif()
 #
 set(ENABLE_AVX512BF16 $ENV{VLLM_CPU_AVX512BF16})
 set(ENABLE_AVX512VNNI $ENV{VLLM_CPU_AVX512VNNI})
+set(ENABLE_AMXBF16 $ENV{VLLM_CPU_AMXBF16})
 
 include_directories("${CMAKE_SOURCE_DIR}/csrc")
 
@@ -140,6 +141,22 @@ if (AVX512_FOUND AND NOT AVX512_DISABLED)
         set(ENABLE_AVX512VNNI OFF)
         message(WARNING "Disable AVX512-VNNI ISA support, no avx512_vnni found in local CPU flags." " If cross-compilation is required, please set env VLLM_CPU_AVX512VNNI=1.")
     endif()
+
+    find_isa(${CPUINFO} "amx_bf16" AMXBF16_FOUND)
+    if (AMXBF16_FOUND OR ENABLE_AMXBF16)
+        if (CMAKE_CXX_COMPILER_ID STREQUAL "GNU" AND
+            CMAKE_CXX_COMPILER_VERSION VERSION_GREATER_EQUAL 12.3)
+            list(APPEND CXX_COMPILE_FLAGS "-mamx-bf16" "-mamx-tile")
+            set(ENABLE_AMXBF16 ON)
+            add_compile_definitions(-DCPU_CAPABILITY_AMXBF16)
+        else()
+            set(ENABLE_AMXBF16 OFF)
+            message(WARNING "Disable AMX_BF16 ISA support, requires gcc/g++ >= 12.3")
+        endif()
+    else()
+        set(ENABLE_AMXBF16 OFF)
+        message(WARNING "Disable AMX_BF16 ISA support, no amx_bf16 found in local CPU flags." " If cross-compilation is required, please set env VLLM_CPU_AMXBF16=1.")
+    endif()
     
 elseif (AVX2_FOUND)
     list(APPEND CXX_COMPILE_FLAGS "-mavx2")
@@ -275,7 +292,10 @@ if ((AVX512_FOUND AND NOT AVX512_DISABLED) OR (ASIMD_FOUND AND NOT APPLE_SILICON
     set(ONEDNN_VERBOSE "OFF")
     set(CMAKE_POLICY_DEFAULT_CMP0077 NEW)
 
+    set(VLLM_BUILD_TYPE ${CMAKE_BUILD_TYPE})
+    set(CMAKE_BUILD_TYPE "Release") # remove oneDNN debug symbols to reduce size
     FetchContent_MakeAvailable(oneDNN)
+    set(CMAKE_BUILD_TYPE ${VLLM_BUILD_TYPE})
     add_library(dnnl_ext OBJECT "csrc/cpu/dnnl_helper.cpp")
     target_include_directories(
         dnnl_ext
@@ -305,14 +325,14 @@ endif()
 #
 set(VLLM_EXT_SRC
     "csrc/cpu/activation.cpp"
-    "csrc/cpu/attention.cpp"
-    "csrc/cpu/cache.cpp"
     "csrc/cpu/utils.cpp"
     "csrc/cpu/layernorm.cpp"
     "csrc/cpu/mla_decode.cpp"
     "csrc/cpu/pos_encoding.cpp"
-    "csrc/cpu/torch_bindings.cpp"
-    "csrc/moe/dynamic_4bit_int_moe_cpu.cpp")
+    "csrc/moe/dynamic_4bit_int_moe_cpu.cpp"
+    "csrc/cpu/cpu_attn.cpp"
+    "csrc/cpu/scratchpad_manager.cpp"
+    "csrc/cpu/torch_bindings.cpp")
 
 if (AVX512_FOUND AND NOT AVX512_DISABLED)
     set(VLLM_EXT_SRC
diff --git a/csrc/cpu/attention.cpp b/csrc/cpu/attention.cpp
deleted file mode 100644
index 82862fea7f2b..000000000000
--- a/csrc/cpu/attention.cpp
+++ /dev/null
@@ -1,798 +0,0 @@
-#include "cpu_types.hpp"
-
-namespace {
-
-template <typename scalar_t>
-struct KernelVecType {
-  using q_load_vec_type = void;
-  using q_vec_type = void;
-  using k_load_vec_type = void;
-  using k_vec_type = void;
-  using qk_acc_vec_type = void;
-  using v_load_vec_type = void;
-};
-
-template <>
-struct KernelVecType<float> {
-  using q_load_vec_type = vec_op::FP32Vec4;
-  using q_vec_type = vec_op::FP32Vec16;
-  using k_load_vec_type = vec_op::FP32Vec16;
-  using k_vec_type = vec_op::FP32Vec16;
-  using qk_acc_vec_type = vec_op::FP32Vec16;
-  using v_load_vec_type = vec_op::FP32Vec16;
-};
-
-template <>
-struct KernelVecType<c10::Half> {
-#if defined(__powerpc64__) || defined(__s390x__)
-  // Power and s390x architecture-specific vector types
-  using q_load_vec_type = vec_op::FP32Vec8;
-  using k_load_vec_type = vec_op::FP32Vec16;
-  using v_load_vec_type = vec_op::FP32Vec16;
-#else
-  // Fallback for other architectures, including x86
-  using q_load_vec_type = vec_op::FP16Vec8;
-  using k_load_vec_type = vec_op::FP16Vec16;
-  using v_load_vec_type = vec_op::FP16Vec16;
-#endif
-  using q_vec_type = vec_op::FP32Vec16;
-  using k_vec_type = vec_op::FP32Vec16;
-  using qk_acc_vec_type = vec_op::FP32Vec16;
-};
-
-#ifdef __AVX512BF16__
-template <>
-struct KernelVecType<c10::BFloat16> {
-  using q_load_vec_type = vec_op::BF16Vec8;
-  using q_vec_type = vec_op::BF16Vec32;
-  using k_load_vec_type = vec_op::BF16Vec32;
-  using k_vec_type = vec_op::BF16Vec32;
-  using qk_acc_vec_type = vec_op::FP32Vec16;
-  using v_load_vec_type = vec_op::BF16Vec16;
-};
-#else
-  #ifdef __aarch64__
-    #ifndef ARM_BF16_SUPPORT
-    // pass
-    #else
-template <>
-struct KernelVecType<c10::BFloat16> {
-  using q_load_vec_type = vec_op::BF16Vec8;
-  using q_vec_type = vec_op::FP32Vec16;
-  using k_load_vec_type = vec_op::BF16Vec16;
-  using k_vec_type = vec_op::FP32Vec16;
-  using qk_acc_vec_type = vec_op::FP32Vec16;
-  using v_load_vec_type = vec_op::BF16Vec16;
-};
-    #endif
-  #else
-template <>
-struct KernelVecType<c10::BFloat16> {
-  using q_load_vec_type = vec_op::BF16Vec8;
-  using q_vec_type = vec_op::FP32Vec16;
-  using k_load_vec_type = vec_op::BF16Vec16;
-  using k_vec_type = vec_op::FP32Vec16;
-  using qk_acc_vec_type = vec_op::FP32Vec16;
-  using v_load_vec_type = vec_op::BF16Vec16;
-};
-  #endif
-#endif
-
-template <typename T>
-FORCE_INLINE std::pair<T, T> reduceSoftmax(T* data, const int size,
-                                           const int capacity) {
-  T max = data[0];
-  for (int i = 1; i < size; ++i) {
-    max = max >= data[i] ? max : data[i];
-  }
-
-  T sum = 0;
-  for (int i = 0; i < size; ++i) {
-    data[i] = std::exp(data[i] - max);
-    sum += data[i];
-  }
-
-  int i = 0;
-  for (; i < size; ++i) {
-    data[i] /= sum;
-  }
-
-  for (; i < capacity; ++i) {
-    data[i] = 0;
-  }
-
-  return {max, sum};
-}
-
-template <typename T>
-FORCE_INLINE std::pair<T, T> reduceSoftmaxAlibi(T* data, const int size,
-                                                const int capacity,
-                                                const float alibi_slope,
-                                                const int start_index,
-                                                const int seq_len) {
-  data[0] += alibi_slope * (start_index - seq_len + 1);
-  T max = data[0];
-  for (int i = 1; i < size; ++i) {
-    T qk = data[i] + alibi_slope * (start_index + i - seq_len + 1);
-    data[i] = qk;
-    max = max >= qk ? max : qk;
-  }
-
-  T sum = 0;
-  for (int i = 0; i < size; ++i) {
-    data[i] = std::exp(data[i] - max);
-    sum += data[i];
-  }
-
-  int i = 0;
-  for (; i < size; ++i) {
-    data[i] /= sum;
-  }
-
-  for (; i < capacity; ++i) {
-    data[i] = 0;
-  }
-
-  return {max, sum};
-}
-
-template <typename T>
-FORCE_INLINE void reducePartitionSoftmax(const T* max_data, T* sum_data,
-                                         const int size) {
-  T max = max_data[0];
-  for (int i = 1; i < size; ++i) {
-    max = max >= max_data[i] ? max : max_data[i];
-  }
-
-  T rescaled_sum = 0;
-  for (int i = 0; i < size; ++i) {
-    T rescale_factor = std::exp(max_data[i] - max);
-    rescaled_sum += rescale_factor * sum_data[i];
-    sum_data[i] *= rescale_factor;
-  }
-  for (int i = 0; i < size; ++i) {
-    sum_data[i] /= rescaled_sum + 1e-8;
-  }
-}
-
-template <typename scalar_t, int HEAD_SIZE, int BLOCK_SIZE, int x>
-struct reduceQKBlockKernel {
-  using q_load_vec_type = typename KernelVecType<scalar_t>::q_load_vec_type;
-  using q_vec_type = typename KernelVecType<scalar_t>::q_vec_type;
-  using k_load_vec_type = typename KernelVecType<scalar_t>::k_load_vec_type;
-  using k_vec_type = typename KernelVecType<scalar_t>::k_vec_type;
-  using qk_acc_vec_type = typename KernelVecType<scalar_t>::qk_acc_vec_type;
-
-  constexpr static int TOKEN_PER_GROUP = k_load_vec_type::get_elem_num() / x;
-  constexpr static int MAX_GROUP_NUM = 16 / TOKEN_PER_GROUP;
-  constexpr static int UNROLL_GROUP_NUM = MAX_GROUP_NUM / 4;
-
-  static_assert(MAX_GROUP_NUM == 8 || MAX_GROUP_NUM == 4);
-  static_assert(k_load_vec_type::get_elem_num() % x == 0);
-  static_assert(q_load_vec_type::get_elem_num() * sizeof(scalar_t) == 16);
-
-  FORCE_INLINE static void call(const scalar_t* __restrict__ q,
-                                const scalar_t* __restrict__ k_block,
-                                float* __restrict__ logits, float scale,
-                                const int token_num) {
-    const int group_num = (token_num + TOKEN_PER_GROUP - 1) / TOKEN_PER_GROUP;
-
-    qk_acc_vec_type group_accums[MAX_GROUP_NUM];
-    if (token_num == BLOCK_SIZE) {
-      for (int q_offset = 0; q_offset < HEAD_SIZE;
-           q_offset += x, k_block += x * BLOCK_SIZE) {
-        q_load_vec_type q_load_group_vec(q + q_offset);
-        q_vec_type q_group_vec(q_load_group_vec);
-
-        vec_op::unroll_loop<int, MAX_GROUP_NUM>(
-            [k_block, &q_group_vec, &group_accums](int token_group_idx) {
-              k_load_vec_type k_load_group_vec(k_block + token_group_idx * x *
-                                                             TOKEN_PER_GROUP);
-              k_vec_type k_group_vec(k_load_group_vec);
-              vec_op::fma(group_accums[token_group_idx], q_group_vec,
-                          k_group_vec);
-              vec_op::prefetch(k_block + x * BLOCK_SIZE +
-                               token_group_idx * x * TOKEN_PER_GROUP);
-            });
-      }
-    } else {
-      for (int q_offset = 0; q_offset < HEAD_SIZE;
-           q_offset += x, k_block += x * BLOCK_SIZE) {
-        q_load_vec_type q_load_group_vec(q + q_offset);
-        q_vec_type q_group_vec(q_load_group_vec);
-        for (int token_group_start = 0; token_group_start < group_num;
-             token_group_start += UNROLL_GROUP_NUM) {
-          vec_op::unroll_loop<int, UNROLL_GROUP_NUM>(
-              [token_group_start, k_block, &q_group_vec,
-               &group_accums](int token_group_idx) {
-                token_group_idx += token_group_start;
-                k_load_vec_type k_load_group_vec(k_block + token_group_idx * x *
-                                                               TOKEN_PER_GROUP);
-                k_vec_type k_group_vec(k_load_group_vec);
-                vec_op::fma(group_accums[token_group_idx], q_group_vec,
-                            k_group_vec);
-                vec_op::prefetch(k_block + x * BLOCK_SIZE +
-                                 token_group_idx * x * TOKEN_PER_GROUP);
-              });
-        }
-      }
-    }
-
-    for (int token_group_idx = 0; token_group_idx < group_num;
-         ++token_group_idx) {
-      vec_op::unroll_loop<int, TOKEN_PER_GROUP>(
-          [&group_accums, logits, scale, token_group_idx](int token_idx) {
-            float dot_v =
-                group_accums[token_group_idx]
-                    .template reduce_sub_sum<qk_acc_vec_type::get_elem_num() /
-                                             TOKEN_PER_GROUP>(token_idx);
-            logits[token_group_idx * TOKEN_PER_GROUP + token_idx] =
-                dot_v * scale;
-          });
-    }
-  }
-};
-
-template <typename scalar_t, int HEAD_SIZE, int BLOCK_SIZE,
-          int HEAD_PARTITION_SIZE, typename acc_t>
-FORCE_INLINE void reduceValueBlock(const float* prob, const scalar_t* v_block,
-                                   acc_t&& acc) {
-  using v_load_vec_type = typename KernelVecType<scalar_t>::v_load_vec_type;
-  constexpr int ELEM_NUM = v_load_vec_type::get_elem_num();
-  static_assert(BLOCK_SIZE == ELEM_NUM);
-  vec_op::FP32Vec16 prob_vec(prob);
-
-  vec_op::unroll_loop<int, HEAD_PARTITION_SIZE>([&](int head_elem_idx) {
-    v_load_vec_type v_vec(v_block + BLOCK_SIZE * head_elem_idx);
-    vec_op::FP32Vec16 fp32_v_vec(v_vec);
-    acc[head_elem_idx] = acc[head_elem_idx] + prob_vec * fp32_v_vec;
-  });
-}
-};  // namespace
-
-// Paged attention v1
-namespace {
-template <typename scalar_t, int HEAD_SIZE, int BLOCK_SIZE>
-struct paged_attention_v1_impl {
-  static void call(
-      scalar_t* __restrict__ out,            // [num_seqs, num_heads, head_size]
-      const scalar_t* __restrict__ q,        // [num_seqs, num_heads, head_size]
-      const scalar_t* __restrict__ k_cache,  // [num_blocks, num_kv_heads,
-                                             // head_size/x, block_size, x]
-      const scalar_t* __restrict__ v_cache,  // [num_blocks, num_kv_heads,
-                                             // head_size, block_size]
-      const int num_kv_heads, const float scale,
-      const int* __restrict__ block_tables,  // [num_seqs,
-                                             // max_num_blocks_per_seq]
-      const int* __restrict__ seq_lens,      // [num_seqs]
-      const int max_num_blocks_per_seq,
-      const float* __restrict__ alibi_slopes,  // [num_heads]
-      const int q_stride, const int kv_block_stride, const int kv_head_stride,
-      const int num_seqs, const int num_heads) {
-    constexpr int x = 16 / sizeof(scalar_t);
-    const int num_queries_per_kv = num_heads / num_kv_heads;
-
-    static_assert(BLOCK_SIZE == 16);
-
-    int max_seq_len = max_num_blocks_per_seq * BLOCK_SIZE;
-    int max_seq_len_padded = (max_seq_len + 15) & 0xFFFFFFF0;
-    TORCH_CHECK((max_seq_len_padded * sizeof(float)) % 64 == 0);
-
-    const int parallel_work_item_num = omp_get_max_threads();
-
-    size_t logits_bytes =
-        parallel_work_item_num * max_seq_len_padded * sizeof(float);
-    float* logits = (float*)std::aligned_alloc(
-        64, logits_bytes);  // Cacheline alignment for each context token.
-                            // [parallel_work_item_num, max_seq_len_padded]
-
-#pragma omp parallel for collapse(2) schedule(dynamic, 1)
-    for (int seq_idx = 0; seq_idx < num_seqs; ++seq_idx) {
-      for (int head_idx = 0; head_idx < num_heads; ++head_idx) {
-        int seq_len = seq_lens[seq_idx];
-        const int* seq_block_table =
-            block_tables + max_num_blocks_per_seq * seq_idx;
-        const int block_num = (seq_len + BLOCK_SIZE - 1) / BLOCK_SIZE;
-        const int64_t kv_head_idx = head_idx / num_queries_per_kv;
-        const scalar_t* __restrict__ q_vec_ptr =
-            q + seq_idx * q_stride + head_idx * HEAD_SIZE;
-        const int last_block_token_num = seq_len - (block_num - 1) * BLOCK_SIZE;
-        float* __restrict__ thread_block_logits =
-            logits + omp_get_thread_num() * max_seq_len_padded;
-
-        // Compute logits
-        for (int block_idx = 0; block_idx < block_num; ++block_idx) {
-          const int64_t physical_block_idx = seq_block_table[block_idx];
-          const scalar_t* __restrict__ k_block_cache_ptr =
-              k_cache + physical_block_idx * kv_block_stride +
-              kv_head_idx * kv_head_stride;
-          float* __restrict__ head_block_logits =
-              thread_block_logits + block_idx * BLOCK_SIZE;
-
-          reduceQKBlockKernel<scalar_t, HEAD_SIZE, BLOCK_SIZE, x>::call(
-              q_vec_ptr, k_block_cache_ptr, head_block_logits, scale,
-              block_idx == block_num - 1 ? last_block_token_num : BLOCK_SIZE);
-        }
-
-        // Compute softmax
-        if (alibi_slopes) {
-          reduceSoftmaxAlibi(thread_block_logits, seq_len,
-                             block_num * BLOCK_SIZE, alibi_slopes[head_idx], 0,
-                             seq_len);
-        } else {
-          reduceSoftmax(thread_block_logits, seq_len, block_num * BLOCK_SIZE);
-        }
-
-        // Compute value
-        constexpr int head_elem_num_per_partition = 16;
-        constexpr int head_partition_num =
-            HEAD_SIZE / head_elem_num_per_partition;
-        for (int head_part_idx = 0; head_part_idx < head_partition_num;
-             ++head_part_idx) {
-          vec_op::FP32Vec16 accums[head_elem_num_per_partition];
-          scalar_t* __restrict__ out_ptr =
-              out + seq_idx * num_heads * HEAD_SIZE + head_idx * HEAD_SIZE +
-              head_part_idx * head_elem_num_per_partition;
-          for (int block_idx = 0; block_idx < block_num; ++block_idx) {
-            const int64_t physical_block_idx = seq_block_table[block_idx];
-            const float* __restrict__ prob_vec_ptr =
-                thread_block_logits + block_idx * BLOCK_SIZE;
-            const scalar_t* __restrict__ v_block_cache_ptr =
-                v_cache + physical_block_idx * kv_block_stride +
-                kv_head_idx * kv_head_stride +
-                BLOCK_SIZE * head_part_idx * head_elem_num_per_partition;
-            reduceValueBlock<scalar_t, HEAD_SIZE, BLOCK_SIZE,
-                             head_elem_num_per_partition>(
-                prob_vec_ptr, v_block_cache_ptr, accums);
-
-            if (block_idx != block_num - 1) {
-              const int64_t next_physical_block_idx =
-                  seq_block_table[block_idx + 1];
-              const scalar_t* __restrict__ next_v_block_cache_ptr =
-                  v_cache + next_physical_block_idx * kv_block_stride +
-                  kv_head_idx * kv_head_stride +
-                  BLOCK_SIZE * head_part_idx * head_elem_num_per_partition;
-              vec_op::unroll_loop<int, head_elem_num_per_partition>(
-                  [&](int head_elem_idx) {
-                    if (head_elem_idx % 2 == 0) {
-                      vec_op::prefetch(next_v_block_cache_ptr +
-                                       BLOCK_SIZE * head_elem_idx);
-                    }
-                  });
-            }
-          }
-
-          vec_op::unroll_loop<int, head_elem_num_per_partition>(
-              [&](int head_elem_idx) {
-                float value = accums[head_elem_idx].reduce_sum();
-                vec_op::storeFP32(value, out_ptr + head_elem_idx);
-              });
-        }
-      }
-    }
-    std::free(logits);
-  }
-};
-
-#define LAUNCH_V1_ATTENTION_KERNEL(T, HEAD_SIZE, BLOCK_SIZE)                   \
-  paged_attention_v1_impl<T, HEAD_SIZE, BLOCK_SIZE>::call(                     \
-      out_ptr, query_ptr, key_cache_ptr, value_cache_ptr, num_kv_heads, scale, \
-      block_tables_ptr, seq_lens_ptr, max_num_blocks_per_seq,                  \
-      alibi_slopes_ptr, q_stride, kv_block_stride, kv_head_stride, num_seqs,   \
-      num_heads);
-
-template <typename T, int BLOCK_SIZE>
-void paged_attention_v1_impl_launcher(
-    torch::Tensor& out, torch::Tensor& query, torch::Tensor& key_cache,
-    torch::Tensor& value_cache, int num_kv_heads, float scale,
-    torch::Tensor& block_tables, torch::Tensor& seq_lens, int max_seq_len,
-    const std::optional<torch::Tensor>& alibi_slopes) {
-  int num_seqs = query.size(0);
-  int num_heads = query.size(1);
-  int head_size = query.size(2);
-  int max_num_blocks_per_seq = block_tables.size(1);
-  int q_stride = query.stride(0);
-  int kv_block_stride = key_cache.stride(0);
-  int kv_head_stride = key_cache.stride(1);
-
-  // NOTE: alibi_slopes is optional.
-  const float* alibi_slopes_ptr =
-      alibi_slopes
-          ? reinterpret_cast<const float*>(alibi_slopes.value().data_ptr())
-          : nullptr;
-
-  T* out_ptr = reinterpret_cast<T*>(out.data_ptr());
-  T* query_ptr = reinterpret_cast<T*>(query.data_ptr());
-  T* key_cache_ptr = reinterpret_cast<T*>(key_cache.data_ptr());
-  T* value_cache_ptr = reinterpret_cast<T*>(value_cache.data_ptr());
-  int* block_tables_ptr = block_tables.data_ptr<int>();
-  int* seq_lens_ptr = seq_lens.data_ptr<int>();
-
-  switch (head_size) {
-    case 32:
-      LAUNCH_V1_ATTENTION_KERNEL(T, 32, BLOCK_SIZE);
-      break;
-    case 64:
-      LAUNCH_V1_ATTENTION_KERNEL(T, 64, BLOCK_SIZE);
-      break;
-    case 80:
-      LAUNCH_V1_ATTENTION_KERNEL(T, 80, BLOCK_SIZE);
-      break;
-    case 96:
-      LAUNCH_V1_ATTENTION_KERNEL(T, 96, BLOCK_SIZE);
-      break;
-    case 112:
-      LAUNCH_V1_ATTENTION_KERNEL(T, 112, BLOCK_SIZE);
-      break;
-    case 128:
-      LAUNCH_V1_ATTENTION_KERNEL(T, 128, BLOCK_SIZE);
-      break;
-    case 192:
-      LAUNCH_V1_ATTENTION_KERNEL(T, 192, BLOCK_SIZE);
-      break;
-    case 256:
-      LAUNCH_V1_ATTENTION_KERNEL(T, 256, BLOCK_SIZE);
-      break;
-    default:
-      TORCH_CHECK(false, "Unsupported head size: ", head_size);
-      break;
-  }
-}
-
-#define CALL_V1_KERNEL_LAUNCHER(T, BLOCK_SIZE)                               \
-  paged_attention_v1_impl_launcher<T, BLOCK_SIZE>(                           \
-      out, query, key_cache, value_cache, num_kv_heads, scale, block_tables, \
-      seq_lens, max_seq_len, alibi_slopes);
-
-#define CALL_V1_KERNEL_LAUNCHER_BLOCK_SIZE(T)                     \
-  switch (block_size) {                                           \
-    case 16:                                                      \
-      CALL_V1_KERNEL_LAUNCHER(T, 16);                             \
-      break;                                                      \
-    default:                                                      \
-      TORCH_CHECK(false, "Unsupported block size: ", block_size); \
-      break;                                                      \
-  }
-}  // namespace
-
-void paged_attention_v1(
-    torch::Tensor& out, torch::Tensor& query, torch::Tensor& key_cache,
-    torch::Tensor& value_cache, int64_t num_kv_heads, double scale,
-    torch::Tensor& block_tables, torch::Tensor& seq_lens, int64_t block_size,
-    int64_t max_seq_len, const std::optional<torch::Tensor>& alibi_slopes,
-    const std::string& kv_cache_dtype, torch::Tensor& k_scale,
-    torch::Tensor& v_scale, const int64_t tp_rank,
-    const int64_t blocksparse_local_blocks,
-    const int64_t blocksparse_vert_stride, const int64_t blocksparse_block_size,
-    const int64_t blocksparse_head_sliding_step) {
-  TORCH_CHECK(blocksparse_vert_stride <= 1,
-              "CPU backend does not support blocksparse attention yet.");
-  VLLM_DISPATCH_FLOATING_TYPES(query.scalar_type(), "paged_attention_v1_impl",
-                               [&] {
-                                 CPU_KERNEL_GUARD_IN(paged_attention_v1_impl)
-                                 CALL_V1_KERNEL_LAUNCHER_BLOCK_SIZE(scalar_t);
-                                 CPU_KERNEL_GUARD_OUT(paged_attention_v1_impl)
-                               });
-}
-
-// Paged attention v2
-namespace {
-template <typename scalar_t, int HEAD_SIZE, int BLOCK_SIZE, int PARTITION_SIZE>
-struct paged_attention_v2_impl {
-  static void call(
-      scalar_t* __restrict__ out,            // [num_seqs, num_heads, head_size]
-      float* __restrict__ exp_sums,          // [num_seqs, num_heads,
-                                             // max_num_partitions]
-      float* __restrict__ max_logits,        // [num_seqs, num_heads,
-                                             // max_num_partitions]
-      scalar_t* __restrict__ tmp_out,        // [num_seqs, num_heads,
-                                             // max_num_partitions, head_size]
-      const scalar_t* __restrict__ q,        // [num_seqs, num_heads, head_size]
-      const scalar_t* __restrict__ k_cache,  // [num_blocks, num_kv_heads,
-                                             // head_size/x, block_size, x]
-      const scalar_t* __restrict__ v_cache,  // [num_blocks, num_kv_heads,
-                                             // head_size, block_size]
-      const int num_kv_heads, const float scale,
-      const int* __restrict__ block_tables,  // [num_seqs,
-                                             // max_num_blocks_per_seq]
-      const int* __restrict__ seq_lens,      // [num_seqs]
-      const int max_num_blocks_per_seq,
-      const float* __restrict__ alibi_slopes,  // [num_heads]
-      const int q_stride, const int kv_block_stride, const int kv_head_stride,
-      const int num_seqs, const int num_heads, const int max_num_partitions) {
-    constexpr int x = 16 / sizeof(scalar_t);
-    const int num_queries_per_kv = num_heads / num_kv_heads;
-
-    static_assert(BLOCK_SIZE == 16);
-    static_assert(PARTITION_SIZE * sizeof(float) % 64 == 0);
-    static_assert(PARTITION_SIZE % BLOCK_SIZE == 0);
-
-#pragma omp parallel for collapse(3) schedule(static, 1)
-    for (int seq_idx = 0; seq_idx < num_seqs; ++seq_idx) {
-      for (int partition_idx = 0; partition_idx < max_num_partitions;
-           ++partition_idx) {
-        for (int head_idx = 0; head_idx < num_heads; ++head_idx) {
-          const int seq_len = seq_lens[seq_idx];
-          const int start_token_idx = partition_idx * PARTITION_SIZE;
-
-          if (start_token_idx >= seq_len) continue;
-
-          const int partition_num =
-              (seq_len + PARTITION_SIZE - 1) / PARTITION_SIZE;
-          const bool no_reduce = (partition_num == 1);
-          const int token_num =
-              (std::min(seq_len, start_token_idx + PARTITION_SIZE) -
-               start_token_idx);
-          const int block_num = (token_num + BLOCK_SIZE - 1) / BLOCK_SIZE;
-          const int last_block_token_num =
-              token_num - (block_num - 1) * BLOCK_SIZE;
-          const int* seq_block_table = block_tables +
-                                       max_num_blocks_per_seq * seq_idx +
-                                       start_token_idx / BLOCK_SIZE;
-          const int64_t kv_head_idx = head_idx / num_queries_per_kv;
-          const scalar_t* __restrict__ q_vec_ptr =
-              q + seq_idx * q_stride + head_idx * HEAD_SIZE;
-
-          float logits[PARTITION_SIZE] __attribute__((aligned(64))) = {0};
-
-          // Compute logits
-          for (int block_idx = 0; block_idx < block_num; ++block_idx) {
-            const int64_t physical_block_idx = seq_block_table[block_idx];
-            const scalar_t* __restrict__ k_block_cache_ptr =
-                k_cache + physical_block_idx * kv_block_stride +
-                kv_head_idx * kv_head_stride;
-            float* __restrict__ head_block_logits =
-                logits + block_idx * BLOCK_SIZE;
-
-            reduceQKBlockKernel<scalar_t, HEAD_SIZE, BLOCK_SIZE, x>::call(
-                q_vec_ptr, k_block_cache_ptr, head_block_logits, scale,
-                block_idx == block_num - 1 ? last_block_token_num : BLOCK_SIZE);
-          }
-
-          std::pair<float, float> max_and_sum;
-          if (alibi_slopes) {
-            max_and_sum = reduceSoftmaxAlibi(
-                logits, token_num, block_num * BLOCK_SIZE,
-                alibi_slopes[head_idx], start_token_idx, seq_len);
-          } else {
-            max_and_sum =
-                reduceSoftmax(logits, token_num, block_num * BLOCK_SIZE);
-          }
-
-          auto&& [max_logit, exp_sum] = max_and_sum;
-
-          scalar_t* __restrict__ output_buffer = nullptr;
-          if (!no_reduce) {
-            auto idx = seq_idx * num_heads * max_num_partitions +
-                       head_idx * max_num_partitions + partition_idx;
-            max_logits[idx] = max_logit;
-            exp_sums[idx] = exp_sum;
-            output_buffer =
-                tmp_out + seq_idx * num_heads * max_num_partitions * HEAD_SIZE +
-                head_idx * max_num_partitions * HEAD_SIZE +
-                partition_idx * HEAD_SIZE;
-          } else {
-            output_buffer =
-                out + seq_idx * num_heads * HEAD_SIZE + head_idx * HEAD_SIZE;
-          }
-
-          // Compute value
-          constexpr int head_elem_num_per_partition = 16;
-          constexpr int head_partition_num =
-              HEAD_SIZE / head_elem_num_per_partition;
-          for (int head_part_idx = 0; head_part_idx < head_partition_num;
-               ++head_part_idx) {
-            vec_op::FP32Vec16 accums[head_elem_num_per_partition];
-            scalar_t* __restrict__ out_ptr =
-                output_buffer + head_part_idx * head_elem_num_per_partition;
-            for (int block_idx = 0; block_idx < block_num; ++block_idx) {
-              const int64_t physical_block_idx = seq_block_table[block_idx];
-              const float* __restrict__ prob_vec_ptr =
-                  logits + block_idx * BLOCK_SIZE;
-              const scalar_t* __restrict__ v_block_cache_ptr =
-                  v_cache + physical_block_idx * kv_block_stride +
-                  kv_head_idx * kv_head_stride +
-                  BLOCK_SIZE * head_part_idx * head_elem_num_per_partition;
-              reduceValueBlock<scalar_t, HEAD_SIZE, BLOCK_SIZE,
-                               head_elem_num_per_partition>(
-                  prob_vec_ptr, v_block_cache_ptr, accums);
-
-              if (block_idx != block_num - 1) {
-                const int64_t next_physical_block_idx =
-                    seq_block_table[block_idx + 1];
-                const scalar_t* __restrict__ next_v_block_cache_ptr =
-                    v_cache + next_physical_block_idx * kv_block_stride +
-                    kv_head_idx * kv_head_stride +
-                    BLOCK_SIZE * head_part_idx * head_elem_num_per_partition;
-                vec_op::unroll_loop<int, head_elem_num_per_partition>(
-                    [&](int head_elem_idx) {
-                      if (head_elem_idx % 2 == 0) {
-                        vec_op::prefetch(next_v_block_cache_ptr +
-                                         BLOCK_SIZE * head_elem_idx);
-                      }
-                    });
-              }
-            }
-
-            vec_op::unroll_loop<int, head_elem_num_per_partition>(
-                [&](int head_elem_idx) {
-                  float value = accums[head_elem_idx].reduce_sum();
-                  vec_op::storeFP32(value, out_ptr + head_elem_idx);
-                });
-          }
-        }
-      }
-    }
-
-    // Rescale partition softmax and store the factors to exp_sums
-#pragma omp parallel for collapse(2) schedule(static, 1)
-    for (int seq_idx = 0; seq_idx < num_seqs; ++seq_idx) {
-      for (int head_idx = 0; head_idx < num_heads; ++head_idx) {
-        const int seq_len = seq_lens[seq_idx];
-        const int partition_num =
-            (seq_len + PARTITION_SIZE - 1) / PARTITION_SIZE;
-
-        if (partition_num == 1) continue;
-
-        reducePartitionSoftmax(
-            max_logits + seq_idx * num_heads * max_num_partitions +
-                head_idx * max_num_partitions,
-            exp_sums + seq_idx * num_heads * max_num_partitions +
-                head_idx * max_num_partitions,
-            partition_num);
-      }
-    }
-
-    // Reduce values
-    using v_load_vec_type = typename KernelVecType<scalar_t>::v_load_vec_type;
-    static_assert(v_load_vec_type::get_elem_num() == BLOCK_SIZE);
-    constexpr int head_elem_num_per_group =
-        16;  // Note: didn't align with the cacheline size, due to some
-             // HEAD_SIZE didn't align with 64 bytes
-    static_assert(HEAD_SIZE % head_elem_num_per_group == 0);
-    constexpr int head_group_num = HEAD_SIZE / head_elem_num_per_group;
-    const float* __restrict__ rescale_factors = exp_sums;
-#pragma omp parallel for collapse(3) schedule(static, 1)
-    for (int seq_idx = 0; seq_idx < num_seqs; ++seq_idx) {
-      for (int head_idx = 0; head_idx < num_heads; ++head_idx) {
-        for (int group_idx = 0; group_idx < head_group_num; ++group_idx) {
-          const int seq_len = seq_lens[seq_idx];
-          const int partition_num =
-              (seq_len + PARTITION_SIZE - 1) / PARTITION_SIZE;
-
-          if (partition_num == 1) continue;
-
-          const float* __restrict__ seq_head_rescale_factors =
-              rescale_factors + seq_idx * num_heads * max_num_partitions +
-              head_idx * max_num_partitions;
-          const scalar_t* __restrict__ seq_head_tmp_out =
-              tmp_out + seq_idx * num_heads * max_num_partitions * HEAD_SIZE +
-              head_idx * max_num_partitions * HEAD_SIZE +
-              group_idx * head_elem_num_per_group;
-          scalar_t* __restrict__ seq_head_output =
-              out + seq_idx * num_heads * HEAD_SIZE + head_idx * HEAD_SIZE +
-              group_idx * head_elem_num_per_group;
-
-          vec_op::FP32Vec16 acc;
-          for (int i = 0; i < partition_num; ++i) {
-            vec_op::FP32Vec16 rescale_factor(seq_head_rescale_factors[i]);
-            v_load_vec_type value(seq_head_tmp_out + i * HEAD_SIZE);
-            vec_op::FP32Vec16 fp32_value(value);
-            acc = acc + fp32_value * rescale_factor;
-          }
-          v_load_vec_type cast_acc(acc);
-          cast_acc.save(seq_head_output);
-        }
-      }
-    }
-  }
-};
-
-#define LAUNCH_V2_ATTENTION_KERNEL(T, HEAD_SIZE, BLOCK_SIZE)                 \
-  paged_attention_v2_impl<T, HEAD_SIZE, BLOCK_SIZE, PARTITION_SIZE>::call(   \
-      out_ptr, exp_sums_ptr, max_logits_ptr, tmp_out_ptr, query_ptr,         \
-      key_cache_ptr, value_cache_ptr, num_kv_heads, scale, block_tables_ptr, \
-      seq_lens_ptr, max_num_blocks_per_seq, alibi_slopes_ptr, q_stride,      \
-      kv_block_stride, kv_head_stride, num_seqs, num_heads,                  \
-      max_num_partitions);
-
-template <typename T, int BLOCK_SIZE, int PARTITION_SIZE = 512>
-void paged_attention_v2_impl_launcher(
-    torch::Tensor& out, torch::Tensor& exp_sums, torch::Tensor& max_logits,
-    torch::Tensor& tmp_out, torch::Tensor& query, torch::Tensor& key_cache,
-    torch::Tensor& value_cache, int num_kv_heads, float scale,
-    torch::Tensor& block_tables, torch::Tensor& seq_lens, int block_size,
-    int max_seq_len, const std::optional<torch::Tensor>& alibi_slopes) {
-  int num_seqs = query.size(0);
-  int num_heads = query.size(1);
-  int head_size = query.size(2);
-  int max_num_blocks_per_seq = block_tables.size(1);
-  int q_stride = query.stride(0);
-  int kv_block_stride = key_cache.stride(0);
-  int kv_head_stride = key_cache.stride(1);
-  int max_num_partitions = exp_sums.size(-1);
-
-  // NOTE: alibi_slopes is optional.
-  const float* alibi_slopes_ptr =
-      alibi_slopes
-          ? reinterpret_cast<const float*>(alibi_slopes.value().data_ptr())
-          : nullptr;
-
-  T* out_ptr = reinterpret_cast<T*>(out.data_ptr());
-  float* exp_sums_ptr = reinterpret_cast<float*>(exp_sums.data_ptr());
-  float* max_logits_ptr = reinterpret_cast<float*>(max_logits.data_ptr());
-  T* tmp_out_ptr = reinterpret_cast<T*>(tmp_out.data_ptr());
-  T* query_ptr = reinterpret_cast<T*>(query.data_ptr());
-  T* key_cache_ptr = reinterpret_cast<T*>(key_cache.data_ptr());
-  T* value_cache_ptr = reinterpret_cast<T*>(value_cache.data_ptr());
-  int* block_tables_ptr = block_tables.data_ptr<int>();
-  int* seq_lens_ptr = seq_lens.data_ptr<int>();
-
-  switch (head_size) {
-    case 32:
-      LAUNCH_V2_ATTENTION_KERNEL(T, 32, BLOCK_SIZE);
-      break;
-    case 64:
-      LAUNCH_V2_ATTENTION_KERNEL(T, 64, BLOCK_SIZE);
-      break;
-    case 80:
-      LAUNCH_V2_ATTENTION_KERNEL(T, 80, BLOCK_SIZE);
-      break;
-    case 96:
-      LAUNCH_V2_ATTENTION_KERNEL(T, 96, BLOCK_SIZE);
-      break;
-    case 112:
-      LAUNCH_V2_ATTENTION_KERNEL(T, 112, BLOCK_SIZE);
-      break;
-    case 128:
-      LAUNCH_V2_ATTENTION_KERNEL(T, 128, BLOCK_SIZE);
-      break;
-    case 192:
-      LAUNCH_V2_ATTENTION_KERNEL(T, 192, BLOCK_SIZE);
-      break;
-    case 256:
-      LAUNCH_V2_ATTENTION_KERNEL(T, 256, BLOCK_SIZE);
-      break;
-    default:
-      TORCH_CHECK(false, "Unsupported head size: ", head_size);
-      break;
-  }
-}
-
-#define CALL_V2_KERNEL_LAUNCHER(T, BLOCK_SIZE)                              \
-  paged_attention_v2_impl_launcher<T, BLOCK_SIZE>(                          \
-      out, exp_sums, max_logits, tmp_out, query, key_cache, value_cache,    \
-      num_kv_heads, scale, block_tables, seq_lens, block_size, max_seq_len, \
-      alibi_slopes);
-
-#define CALL_V2_KERNEL_LAUNCHER_BLOCK_SIZE(T)                     \
-  switch (block_size) {                                           \
-    case 16:                                                      \
-      CALL_V2_KERNEL_LAUNCHER(T, 16);                             \
-      break;                                                      \
-    default:                                                      \
-      TORCH_CHECK(false, "Unsupported block size: ", block_size); \
-      break;                                                      \
-  }
-}  // namespace
-
-void paged_attention_v2(
-    torch::Tensor& out, torch::Tensor& exp_sums, torch::Tensor& max_logits,
-    torch::Tensor& tmp_out, torch::Tensor& query, torch::Tensor& key_cache,
-    torch::Tensor& value_cache, int64_t num_kv_heads, double scale,
-    torch::Tensor& block_tables, torch::Tensor& seq_lens, int64_t block_size,
-    int64_t max_seq_len, const std::optional<torch::Tensor>& alibi_slopes,
-    const std::string& kv_cache_dtype, torch::Tensor& k_scale,
-    torch::Tensor& v_scale, const int64_t tp_rank,
-    const int64_t blocksparse_local_blocks,
-    const int64_t blocksparse_vert_stride, const int64_t blocksparse_block_size,
-    const int64_t blocksparse_head_sliding_step) {
-  TORCH_CHECK(blocksparse_vert_stride <= 1,
-              "CPU backend does not support blocksparse attention yet.");
-  VLLM_DISPATCH_FLOATING_TYPES(query.scalar_type(), "paged_attention_v2_impl",
-                               [&] {
-                                 CPU_KERNEL_GUARD_IN(paged_attention_v2_impl)
-                                 CALL_V2_KERNEL_LAUNCHER_BLOCK_SIZE(scalar_t);
-                                 CPU_KERNEL_GUARD_OUT(paged_attention_v2_impl)
-                               });
-}
\ No newline at end of file
diff --git a/csrc/cpu/cache.cpp b/csrc/cpu/cache.cpp
deleted file mode 100644
index 69f6d06e3c96..000000000000
--- a/csrc/cpu/cache.cpp
+++ /dev/null
@@ -1,214 +0,0 @@
-#include <map>
-#include <vector>
-
-#include "cpu_types.hpp"
-
-#if defined(__x86_64__)
-  #define DISPATCH_MACRO VLLM_DISPATCH_FLOATING_TYPES_WITH_E5M2
-#else
-  #define DISPATCH_MACRO VLLM_DISPATCH_FLOATING_TYPES
-#endif
-
-namespace {
-template <typename scalar_t>
-void copy_blocks_cpu_impl(std::vector<torch::Tensor> const& key_caches,
-                          std::vector<torch::Tensor> const& value_caches,
-                          const torch::Tensor& mapping_pairs,
-                          const int element_num_per_block,
-                          const int layer_num) {
-  const size_t pair_num = mapping_pairs.size(0);
-  const size_t block_bytes = sizeof(scalar_t) * element_num_per_block;
-#pragma omp parallel for collapse(2)
-  for (int layer = 0; layer < layer_num; ++layer) {
-    for (size_t pair = 0; pair < pair_num; ++pair) {
-      int64_t source_offset =
-          element_num_per_block * mapping_pairs[pair][0].item<int64_t>();
-      int64_t target_offset =
-          element_num_per_block * mapping_pairs[pair][1].item<int64_t>();
-      scalar_t* key_cache_ptr = key_caches[layer].data_ptr<scalar_t>();
-      scalar_t* source_ptr = key_cache_ptr + source_offset;
-      scalar_t* target_ptr = key_cache_ptr + target_offset;
-      std::memcpy(target_ptr, source_ptr, block_bytes);
-
-      scalar_t* value_cache_ptr = value_caches[layer].data_ptr<scalar_t>();
-      source_ptr = value_cache_ptr + source_offset;
-      target_ptr = value_cache_ptr + target_offset;
-      std::memcpy(target_ptr, source_ptr, block_bytes);
-    }
-  }
-}
-
-template <typename scalar_t>
-void reshape_and_cache_cpu_impl(
-    const scalar_t* __restrict__ key, const scalar_t* __restrict__ value,
-    scalar_t* __restrict__ key_cache, scalar_t* __restrict__ value_cache,
-    const int64_t* __restrict__ slot_mapping, const int num_tokens,
-    const int key_stride, const int value_stride, const int num_heads,
-    const int head_size, const int block_size, const int x) {
-  const int block_elem_num = num_heads * head_size * block_size;
-
-#pragma omp parallel for collapse(2)
-  for (int token_idx = 0; token_idx < num_tokens; ++token_idx) {
-    for (int head_idx = 0; head_idx < num_heads; ++head_idx) {
-      const int64_t slot_idx = slot_mapping[token_idx];
-      if (slot_idx >= 0) {
-        int src_key_head_idx = token_idx * key_stride + head_idx * head_size;
-        int src_value_head_idx =
-            token_idx * value_stride + head_idx * head_size;
-        const scalar_t* src_key_head_ptr = key + src_key_head_idx;
-        const scalar_t* src_value_head_ptr = value + src_value_head_idx;
-        const int64_t block_index = slot_idx / block_size;
-        const int64_t block_offset = slot_idx % block_size;
-        scalar_t* target_key_head_ptr = key_cache +
-                                        block_elem_num * block_index +
-                                        head_idx * block_size * head_size;
-        scalar_t* target_value_head_ptr = value_cache +
-                                          block_elem_num * block_index +
-                                          head_idx * block_size * head_size;
-
-        for (int src_key_idx = 0; src_key_idx < head_size; src_key_idx += x) {
-          const int64_t target_offset =
-              src_key_idx * block_size + block_offset * x;
-          for (int i = 0; i < x; ++i) {
-            target_key_head_ptr[target_offset + i] =
-                src_key_head_ptr[src_key_idx + i];
-          }
-        }
-
-        for (int src_value_idx = 0; src_value_idx < head_size;
-             ++src_value_idx) {
-          const int64_t target_offset =
-              src_value_idx * block_size + block_offset;
-          target_value_head_ptr[target_offset] =
-              src_value_head_ptr[src_value_idx];
-        }
-      }
-    }
-  }
-}
-};  // namespace
-
-template <typename scalar_t>
-void concat_and_cache_mla_cpu_impl(
-    const scalar_t* __restrict__ kv_c,  // [num_tokens, kv_lora_rank]
-    const scalar_t* __restrict__ k_pe,  // [num_tokens, pe_dim]
-    scalar_t* __restrict__ kv_cache,  // [num_blocks, block_size, (kv_lora_rank
-                                      // + pe_dim)]
-    const int64_t* __restrict__ slot_mapping,  // [num_tokens]
-    const int num_tokens,                      //
-    const int block_stride,                    //
-    const int entry_stride,                    //
-    const int kv_c_stride,                     //
-    const int k_pe_stride,                     //
-    const int kv_lora_rank,                    //
-    const int pe_dim,                          //
-    const int block_size                       //
-) {
-#pragma omp parallel for
-  for (int token_idx = 0; token_idx < num_tokens; ++token_idx) {
-    const int64_t slot_idx = slot_mapping[token_idx];
-    // NOTE: slot_idx can be -1 if the token is padded
-    if (slot_idx < 0) {
-      continue;
-    }
-    const int64_t block_idx = slot_idx / block_size;
-    const int64_t block_offset = slot_idx % block_size;
-
-    auto copy = [&](const scalar_t* __restrict__ src,
-                    scalar_t* __restrict__ dst, int src_stride, int dst_stride,
-                    int size, int offset) {
-      for (int i = 0; i < size; i++) {
-        const int64_t src_idx = token_idx * src_stride + i;
-        const int64_t dst_idx =
-            block_idx * block_stride + block_offset * entry_stride + i + offset;
-        dst[dst_idx] = src[src_idx];
-      }
-    };
-
-    copy(kv_c, kv_cache, kv_c_stride, block_stride, kv_lora_rank, 0);
-    copy(k_pe, kv_cache, k_pe_stride, block_stride, pe_dim, kv_lora_rank);
-  }
-}
-
-// Note: the key_caches and value_caches vectors are constant but
-// not the Tensors they contain. The vectors need to be const refs
-// in order to satisfy pytorch's C++ operator registration code.
-void copy_blocks(std::vector<torch::Tensor> const& key_caches,
-                 std::vector<torch::Tensor> const& value_caches,
-                 const torch::Tensor& block_mapping) {
-  unsigned num_layers = key_caches.size();
-  TORCH_CHECK(num_layers == value_caches.size());
-  if (num_layers == 0) {
-    return;
-  }
-
-  const int element_num_per_block = key_caches[0][0].numel();
-  DISPATCH_MACRO(key_caches[0].scalar_type(), "copy_blocks_cpu_impl", [&] {
-    CPU_KERNEL_GUARD_IN(copy_blocks_cpu_impl)
-    copy_blocks_cpu_impl<scalar_t>(key_caches, value_caches, block_mapping,
-                                   element_num_per_block, num_layers);
-    CPU_KERNEL_GUARD_OUT(copy_blocks_cpu_impl)
-  });
-}
-
-void reshape_and_cache(torch::Tensor& key, torch::Tensor& value,
-                       torch::Tensor& key_cache, torch::Tensor& value_cache,
-                       torch::Tensor& slot_mapping,
-                       const std::string& kv_cache_dtype,
-                       torch::Tensor& k_scale, torch::Tensor& v_scale) {
-  int num_tokens = key.size(0);
-  int num_heads = key.size(1);
-  int head_size = key.size(2);
-  int block_size = key_cache.size(3);
-  int x = key_cache.size(4);
-
-  int key_stride = key.stride(0);
-  int value_stride = value.stride(0);
-
-  DISPATCH_MACRO(key.scalar_type(), "reshape_and_cache_cpu_impl", [&] {
-    CPU_KERNEL_GUARD_IN(reshape_and_cache_cpu_impl)
-    reshape_and_cache_cpu_impl<scalar_t>(
-        key.data_ptr<scalar_t>(), value.data_ptr<scalar_t>(),
-        key_cache.data_ptr<scalar_t>(), value_cache.data_ptr<scalar_t>(),
-        slot_mapping.data_ptr<int64_t>(), num_tokens, key_stride, value_stride,
-        num_heads, head_size, block_size, x);
-    CPU_KERNEL_GUARD_OUT(reshape_and_cache_cpu_impl)
-  });
-}
-
-void concat_and_cache_mla(
-    torch::Tensor& kv_c,          // [num_tokens, kv_lora_rank]
-    torch::Tensor& k_pe,          // [num_tokens, pe_dim]
-    torch::Tensor& kv_cache,      // [num_blocks, block_size, (kv_lora_rank +
-                                  // pe_dim)]
-    torch::Tensor& slot_mapping,  // [num_tokens] or [num_actual_tokens]
-    const std::string& kv_cache_dtype, torch::Tensor& scale) {
-  int num_tokens = slot_mapping.size(0);
-  int kv_lora_rank = kv_c.size(1);
-  int pe_dim = k_pe.size(1);
-  int block_size = kv_cache.size(1);
-
-  TORCH_CHECK(kv_cache.size(2) == kv_lora_rank + pe_dim);
-  TORCH_CHECK(kv_cache_dtype != "fp8");
-
-  int kv_c_stride = kv_c.stride(0);
-  int k_pe_stride = k_pe.stride(0);
-  int block_stride = kv_cache.stride(0);
-  int entry_stride = kv_cache.stride(1);
-
-  VLLM_DISPATCH_FLOATING_TYPES(
-      kv_c.scalar_type(), "concat_and_cache_mla_cpu_impl", [&] {
-        CPU_KERNEL_GUARD_IN(concat_and_cache_mla_cpu_impl)
-        concat_and_cache_mla_cpu_impl<scalar_t>(
-            kv_c.data_ptr<scalar_t>(), k_pe.data_ptr<scalar_t>(),
-            kv_cache.data_ptr<scalar_t>(), slot_mapping.data_ptr<int64_t>(),
-            num_tokens, block_stride, entry_stride, kv_c_stride, k_pe_stride,
-            kv_lora_rank, pe_dim, block_size);
-        CPU_KERNEL_GUARD_OUT(concat_and_cache_mla_cpu_impl)
-      });
-}
-
-void swap_blocks(torch::Tensor& src, torch::Tensor& dst,
-                 const torch::Tensor& block_mapping) {
-  TORCH_CHECK(false, "swap_blocks is unsupported on CPU.")
-}
diff --git a/csrc/cpu/cpu_attn.cpp b/csrc/cpu/cpu_attn.cpp
new file mode 100644
index 000000000000..50f17c758c14
--- /dev/null
+++ b/csrc/cpu/cpu_attn.cpp
@@ -0,0 +1,249 @@
+#include "cpu_attn_vec.hpp"
+#include "cpu_attn_vec16.hpp"
+
+#ifdef CPU_CAPABILITY_AMXBF16
+  #include "cpu_attn_amx.hpp"
+  #define AMX_DISPATCH(...)                                                   \
+    case cpu_attention::ISA::AMX: {                                           \
+      using attn_impl = cpu_attention::AttentionImpl<cpu_attention::ISA::AMX, \
+                                                     scalar_t, head_dim>;     \
+      return __VA_ARGS__();                                                   \
+    }
+#else
+  #define AMX_DISPATCH(...) case cpu_attention::ISA::AMX:
+#endif
+
+#define CPU_ATTN_DISPATCH_CASE(HEAD_DIM, ...) \
+  case HEAD_DIM: {                            \
+    constexpr size_t head_dim = HEAD_DIM;     \
+    return __VA_ARGS__();                     \
+  }
+
+#define CPU_ATTN_DISPATCH_CASE_HEADDIM(HEAD_DIM, ...)           \
+  [&] {                                                         \
+    switch (HEAD_DIM) {                                         \
+      CPU_ATTN_DISPATCH_CASE(32, __VA_ARGS__)                   \
+      CPU_ATTN_DISPATCH_CASE(64, __VA_ARGS__)                   \
+      CPU_ATTN_DISPATCH_CASE(96, __VA_ARGS__)                   \
+      CPU_ATTN_DISPATCH_CASE(128, __VA_ARGS__)                  \
+      CPU_ATTN_DISPATCH_CASE(160, __VA_ARGS__)                  \
+      CPU_ATTN_DISPATCH_CASE(192, __VA_ARGS__)                  \
+      CPU_ATTN_DISPATCH_CASE(224, __VA_ARGS__)                  \
+      CPU_ATTN_DISPATCH_CASE(256, __VA_ARGS__)                  \
+      default: {                                                \
+        TORCH_CHECK(false, "Invalid CPU attention head_dim: " + \
+                               std::to_string(HEAD_DIM));       \
+      }                                                         \
+    }                                                           \
+  }()
+
+#define CPU_ATTN_DISPATCH_IMPL(ISA_TYPE, ...)                                 \
+  [&] {                                                                       \
+    switch (ISA_TYPE) {                                                       \
+      AMX_DISPATCH(__VA_ARGS__)                                               \
+      case cpu_attention::ISA::VEC: {                                         \
+        using attn_impl =                                                     \
+            cpu_attention::AttentionImpl<cpu_attention::ISA::VEC, scalar_t,   \
+                                         head_dim>;                           \
+        return __VA_ARGS__();                                                 \
+      }                                                                       \
+      case cpu_attention::ISA::VEC16: {                                       \
+        using attn_impl =                                                     \
+            cpu_attention::AttentionImpl<cpu_attention::ISA::VEC16, scalar_t, \
+                                         head_dim>;                           \
+        return __VA_ARGS__();                                                 \
+      }                                                                       \
+      default: {                                                              \
+        TORCH_CHECK(false, "Invalid CPU attention ISA type.");                \
+      }                                                                       \
+    }                                                                         \
+  }()
+
+torch::Tensor get_scheduler_metadata(
+    const int64_t num_req, const int64_t num_heads_q,
+    const int64_t num_heads_kv, const int64_t head_dim,
+    const torch::Tensor& seq_lens, at::ScalarType dtype,
+    const torch::Tensor& query_start_loc, const bool casual,
+    const int64_t window_size, const std::string& isa_hint,
+    const bool enable_kv_split) {
+  cpu_attention::ISA isa;
+  if (isa_hint == "amx") {
+    isa = cpu_attention::ISA::AMX;
+  } else if (isa_hint == "vec") {
+    isa = cpu_attention::ISA::VEC;
+  } else if (isa_hint == "vec16") {
+    isa = cpu_attention::ISA::VEC16;
+  } else {
+    TORCH_CHECK(false, "Unsupported CPU attention ISA hint: " + isa_hint);
+  }
+
+  cpu_attention::AttentionScheduler::ScheduleInput input;
+  input.num_reqs = num_req;
+  input.num_heads_q = num_heads_q;
+  input.num_heads_kv = num_heads_kv;
+  input.head_dim = head_dim;
+  input.query_start_loc = query_start_loc.data_ptr<int32_t>();
+  input.seq_lens = seq_lens.data_ptr<int32_t>();
+  if (window_size != -1) {
+    input.left_sliding_window_size = window_size - 1;
+    if (casual) {
+      input.right_sliding_window_size = 0;
+    } else {
+      input.right_sliding_window_size = window_size - 1;
+    }
+  } else {
+    input.left_sliding_window_size = -1;
+    if (casual) {
+      input.right_sliding_window_size = 0;
+    } else {
+      input.right_sliding_window_size = -1;
+    }
+  }
+  input.casual = casual;
+  input.isa = isa;
+  input.enable_kv_split = enable_kv_split;
+  TORCH_CHECK(casual, "Only supports casual mask for now.");
+
+  VLLM_DISPATCH_FLOATING_TYPES(dtype, "get_scheduler_metadata", [&]() {
+    CPU_ATTN_DISPATCH_CASE_HEADDIM(head_dim, [&] {
+      CPU_ATTN_DISPATCH_IMPL(isa, [&]() {
+        input.elem_size = sizeof(scalar_t);
+        input.q_buffer_elem_size = sizeof(attn_impl::q_buffer_t);
+        input.logits_buffer_elem_size = sizeof(attn_impl::logits_buffer_t);
+        input.output_buffer_elem_size =
+            sizeof(attn_impl::partial_output_buffer_t);
+        input.max_num_q_per_iter = attn_impl::MaxQHeadNumPerIteration;
+        input.kv_block_alignment = attn_impl::BlockSizeAlignment;
+      });
+    });
+  });
+
+  cpu_attention::AttentionScheduler scheduler;
+  torch::Tensor metadata = scheduler.schedule(input);
+  return metadata;
+}
+
+void cpu_attn_reshape_and_cache(
+    const torch::Tensor& key,    // [token_num, head_num, head_size]
+    const torch::Tensor& value,  // [token_num, head_num, head_size]
+    torch::Tensor&
+        key_cache,  // [num_blocks, num_kv_heads, block_size, head_size]
+    torch::Tensor&
+        value_cache,  // [num_blocks, num_kv_heads, block_size, head_size]
+    const torch::Tensor& slot_mapping, const std::string& isa) {
+  TORCH_CHECK_EQ(key.dim(), 3);
+  TORCH_CHECK_EQ(value.dim(), 3);
+  TORCH_CHECK_EQ(key_cache.dim(), 4);
+  TORCH_CHECK_EQ(value_cache.dim(), 4);
+  TORCH_CHECK_EQ(key.stride(2), 1);
+  TORCH_CHECK_EQ(value.stride(2), 1);
+
+  const int64_t token_num = key.size(0);
+  const int64_t key_token_num_stride = key.stride(0);
+  const int64_t value_token_num_stride = value.stride(0);
+  const int64_t head_num = value.size(1);
+  const int64_t key_head_num_stride = key.stride(1);
+  const int64_t value_head_num_stride = value.stride(1);
+  const int64_t num_blocks = key_cache.size(0);
+  const int64_t num_blocks_stride = key_cache.stride(0);
+  const int64_t cache_head_num_stride = key_cache.stride(1);
+  const int64_t block_size = key_cache.size(2);
+  const int64_t block_size_stride = key_cache.stride(2);
+  const int64_t head_dim = key.size(-1);
+
+  cpu_attention::ISA isa_tag = [&]() {
+    if (isa == "amx") {
+      return cpu_attention::ISA::AMX;
+    } else if (isa == "vec") {
+      return cpu_attention::ISA::VEC;
+    } else if (isa == "vec16") {
+      return cpu_attention::ISA::VEC16;
+    } else {
+      TORCH_CHECK(false, "Invalid ISA type: " + isa);
+    }
+  }();
+
+  VLLM_DISPATCH_FLOATING_TYPES(
+      key.scalar_type(), "cpu_attn_reshape_and_cache", [&]() {
+        CPU_ATTN_DISPATCH_CASE_HEADDIM(head_dim, [&] {
+          CPU_ATTN_DISPATCH_IMPL(isa_tag, [&]() {
+            attn_impl::reshape_and_cache(
+                key.data_ptr<scalar_t>(), value.data_ptr<scalar_t>(),
+                key_cache.data_ptr<scalar_t>(),
+                value_cache.data_ptr<scalar_t>(),
+                slot_mapping.data_ptr<int64_t>(), token_num,
+                key_token_num_stride, value_token_num_stride, head_num,
+                key_head_num_stride, value_head_num_stride, num_blocks,
+                num_blocks_stride, cache_head_num_stride, block_size,
+                block_size_stride);
+          });
+        });
+      });
+}
+
+void cpu_attention_with_kv_cache(
+    const torch::Tensor& query,  // [num_tokens, num_heads, head_size]
+    const torch::Tensor&
+        key_cache,  // [num_blocks, num_kv_heads, block_size, head_size]
+    const torch::Tensor&
+        value_cache,        // [num_blocks, num_kv_heads, block_size, head_size]
+    torch::Tensor& output,  // [num_tokens, num_heads, head_size]
+    const torch::Tensor& query_start_loc,  // [num_tokens + 1]
+    const torch::Tensor& seq_lens,         // [num_tokens]
+    const double scale, const bool causal,
+    const std::optional<torch::Tensor>& alibi_slopes,  // [num_heads]
+    const int64_t sliding_window_left, const int64_t sliding_window_right,
+    const torch::Tensor& block_table,  // [num_tokens, max_block_num]
+    const double softcap, const torch::Tensor& scheduler_metadata,
+    const std::optional<torch::Tensor>& s_aux  // [num_heads]
+) {
+  TORCH_CHECK_EQ(query.dim(), 3);
+  TORCH_CHECK_EQ(query.stride(2), 1);
+  TORCH_CHECK_EQ(key_cache.dim(), 4);
+  TORCH_CHECK_EQ(value_cache.dim(), 4);
+
+  cpu_attention::AttentionInput input;
+  input.metadata = reinterpret_cast<cpu_attention::AttentionMetadata*>(
+      scheduler_metadata.data_ptr());
+  input.num_tokens = query.size(0);
+  input.num_heads = query.size(1);
+  input.num_kv_heads = key_cache.size(1);
+  input.block_size = key_cache.size(2);
+  input.query = query.data_ptr();
+  input.query_num_tokens_stride = query.stride(0);
+  input.query_num_heads_stride = query.stride(1);
+  input.cache_num_blocks_stride = key_cache.stride(0);
+  input.cache_num_kv_heads_stride = key_cache.stride(1);
+  input.blt_num_tokens_stride = block_table.stride(0);
+  input.key_cache = key_cache.data_ptr();
+  input.value_cache = value_cache.data_ptr();
+  input.output = output.data_ptr();
+  input.query_start_loc = query_start_loc.data_ptr<int32_t>();
+  input.seq_lens = seq_lens.data_ptr<int32_t>();
+  input.block_table = block_table.data_ptr<int32_t>();
+  input.alibi_slopes =
+      alibi_slopes.has_value() ? alibi_slopes->data_ptr<float>() : nullptr;
+  // For now sink must be bf16
+  input.s_aux = s_aux.has_value() ? s_aux->data_ptr<c10::BFloat16>() : nullptr;
+  input.scale = scale;
+  input.causal = causal;
+  input.sliding_window_left = sliding_window_left;
+  input.sliding_window_right = sliding_window_right;
+  if (input.causal) {
+    // to make boundary calculation easier
+    input.sliding_window_right = 0;
+  }
+  float softcap_fp32 = softcap;
+  input.softcap = softcap_fp32;
+
+  VLLM_DISPATCH_FLOATING_TYPES(
+      query.scalar_type(), "cpu_attention_with_kv_cache", [&]() {
+        CPU_ATTN_DISPATCH_CASE_HEADDIM(query.size(2), [&] {
+          CPU_ATTN_DISPATCH_IMPL(input.metadata->isa, [&]() {
+            TORCH_CHECK_EQ(input.block_size % attn_impl::BlockSizeAlignment, 0);
+            cpu_attention::AttentionMainLoop<attn_impl> mainloop;
+            mainloop(&input);
+          });
+        });
+      });
+}
diff --git a/csrc/cpu/cpu_attn_amx.hpp b/csrc/cpu/cpu_attn_amx.hpp
new file mode 100644
index 000000000000..8da458b99119
--- /dev/null
+++ b/csrc/cpu/cpu_attn_amx.hpp
@@ -0,0 +1,511 @@
+#ifndef CPU_ATTN_AMX_HPP
+#define CPU_ATTN_AMX_HPP
+
+#include "cpu_attn_impl.hpp"
+
+namespace cpu_attention {
+namespace {
+// AMX specific
+constexpr static int64_t AMX_TILE_ROW_BYTES = 64;
+constexpr static int64_t AMX_TILE_ROW_NUM = 16;
+constexpr static int64_t AMX_TILE_BYTES = AMX_TILE_ROW_BYTES * AMX_TILE_ROW_NUM;
+
+typedef struct __tile_config {
+  uint8_t palette_id = 1;
+  uint8_t start_row = 0;
+  uint8_t reserved_0[14] = {0};
+  uint16_t colsb[16] = {0};
+  uint8_t rows[16] = {0};
+} __tilecfg;
+
+// 2-2-4 pattern, for 16 < m <= 32
+// TILE 0, 1: load A matrix, row num should be 16, m - 16
+// TILE 2, 3: load B matrix, row num should be 16
+// TILE 4, 5, 6, 7: store results C matrix, row num should be 16, 16, m - 16, m
+// - 16
+template <typename kv_cache_t>
+class TileGemm224 {
+ public:
+  template <AttentionGemmPhase phase, int32_t k_size>
+  FORCE_INLINE static void gemm(const int32_t m_size, void* __restrict__ a_tile,
+                                void* __restrict__ b_tile,
+                                float* __restrict__ c_tile, const int64_t lda,
+                                const int64_t ldb, const int64_t ldc,
+                                const int32_t block_size,
+                                const int32_t dynamic_k_size,
+                                const bool accum_c) {
+    TORCH_CHECK(false, "Unsupported kv cache type for TileGemm224");
+  }
+
+  FORCE_INLINE static void init_tile_config(int32_t m, __tilecfg& config) {
+    TORCH_CHECK(false, "Unsupported kv cache type for TileGemm224");
+  }
+};
+
+template <>
+class TileGemm224<c10::BFloat16> {
+ public:
+  template <AttentionGemmPhase phase, int32_t k_size>
+  FORCE_INLINE static void gemm(const int32_t m_size,
+                                c10::BFloat16* __restrict__ a_tile,
+                                c10::BFloat16* __restrict__ b_tile,
+                                float* __restrict__ c_tile, const int64_t lda,
+                                const int64_t ldb, const int64_t ldc,
+                                const int32_t block_size,
+                                const int32_t dynamic_k_size,
+                                const bool accum_c) {
+    const int32_t k_times =
+        dynamic_k_size / (AMX_TILE_ROW_NUM * 4 / sizeof(c10::BFloat16));
+    c10::BFloat16* __restrict__ a_tile_0 = a_tile;
+    c10::BFloat16* __restrict__ a_tile_1 = a_tile + lda * AMX_TILE_ROW_NUM;
+    const int64_t a_tile_stride = [&]() {
+      if constexpr (phase == AttentionGemmPhase::QK) {
+        // q_buffer is prepacked
+        return AMX_TILE_ROW_BYTES;
+      } else if constexpr (phase == AttentionGemmPhase::PV) {
+        // logits_buffer is row-major
+        return lda * sizeof(c10::BFloat16);
+      } else {
+        TORCH_CHECK(false, "Unreachable");
+      }
+    }();
+
+    c10::BFloat16* __restrict__ b_tile_2 = b_tile;
+    c10::BFloat16* __restrict__ b_tile_3 = [&]() {
+      if constexpr (phase == AttentionGemmPhase::QK) {
+        // k_cache is prepacked
+        return b_tile + (k_size * AMX_TILE_ROW_BYTES / 4);
+      } else if constexpr (phase == AttentionGemmPhase::PV) {
+        // v_cache is prepacked
+        return b_tile + (block_size * AMX_TILE_ROW_BYTES / 4);
+      } else {
+        TORCH_CHECK(false, "Unreachable");
+      }
+    }();
+    // k_cache, v_cache are prepacked
+    const int32_t b_tile_stride = AMX_TILE_ROW_BYTES;
+
+    // logits_buffer, output_buffer are not prepacked
+    float* __restrict__ c_tile_4 = c_tile;
+    float* __restrict__ c_tile_5 =
+        c_tile_4 + AMX_TILE_ROW_BYTES / sizeof(float);
+    float* __restrict__ c_tile_6 = c_tile + AMX_TILE_ROW_NUM * ldc;
+    float* __restrict__ c_tile_7 =
+        c_tile_6 + AMX_TILE_ROW_BYTES / sizeof(float);
+    const int32_t c_tile_stride = ldc * sizeof(float);
+
+    if (accum_c) {
+      _tile_loadd(4, c_tile_4, c_tile_stride);
+      _tile_loadd(5, c_tile_5, c_tile_stride);
+      _tile_loadd(6, c_tile_6, c_tile_stride);
+      _tile_loadd(7, c_tile_7, c_tile_stride);
+    } else {
+      _tile_zero(4);
+      _tile_zero(5);
+      _tile_zero(6);
+      _tile_zero(7);
+    }
+
+    for (int32_t k = 0; k < k_times; ++k) {
+      _tile_loadd(0, a_tile_0, a_tile_stride);
+      _tile_stream_loadd(2, b_tile_2, b_tile_stride);
+      _tile_dpbf16ps(4, 0, 2);
+      _tile_stream_loadd(3, b_tile_3, b_tile_stride);
+      _tile_dpbf16ps(5, 0, 3);
+      _tile_loadd(1, a_tile_1, a_tile_stride);
+      _tile_dpbf16ps(6, 1, 2);
+      _tile_dpbf16ps(7, 1, 3);
+
+      // update ptrs
+      if constexpr (phase == AttentionGemmPhase::QK) {
+        // Q buffer is prepacked
+        a_tile_0 += AMX_TILE_BYTES / sizeof(c10::BFloat16);
+        a_tile_1 += AMX_TILE_BYTES / sizeof(c10::BFloat16);
+      } else if constexpr (phase == AttentionGemmPhase::PV) {
+        // P buffer is not prepacked
+        a_tile_0 += AMX_TILE_ROW_BYTES / sizeof(c10::BFloat16);
+        a_tile_1 += AMX_TILE_ROW_BYTES / sizeof(c10::BFloat16);
+      } else {
+        TORCH_CHECK(false, "Unreachable");
+      }
+      b_tile_2 += AMX_TILE_BYTES / sizeof(c10::BFloat16);
+      b_tile_3 += AMX_TILE_BYTES / sizeof(c10::BFloat16);
+    }
+
+    _tile_stored(4, c_tile_4, c_tile_stride);
+    _tile_stored(5, c_tile_5, c_tile_stride);
+    _tile_stored(6, c_tile_6, c_tile_stride);
+    _tile_stored(7, c_tile_7, c_tile_stride);
+  }
+
+  FORCE_INLINE static void init_tile_config(int32_t m, __tilecfg& config) {
+    const int32_t m_0 = AMX_TILE_ROW_NUM;
+    const int32_t m_1 = m - AMX_TILE_ROW_NUM;
+    config.rows[0] = m_0;
+    config.rows[1] = m_1;
+    config.rows[2] = AMX_TILE_ROW_NUM;
+    config.rows[3] = AMX_TILE_ROW_NUM;
+    config.rows[4] = m_0;
+    config.rows[5] = m_0;
+    config.rows[6] = m_1;
+    config.rows[7] = m_1;
+    _tile_loadconfig(&config);
+  }
+};
+
+// 1-2-2 pattern, for 0 < m <= 16
+// TILE 0, (1): load A matrix, use extra 1 tile for prefetch, row num should be
+// m, m
+// TILE 2, 3, (4, 5): load B matrix, use extra 2 tiles for prefetch, row
+// num should be 16
+// TILE 6, 7, (6, 7): store results C matrix, row num should be
+// m
+template <typename kv_cache_t>
+class TileGemm122 {
+ public:
+  template <AttentionGemmPhase phase, int32_t k_size>
+  FORCE_INLINE static void gemm(const int32_t m_size, void* __restrict__ a_tile,
+                                void* __restrict__ b_tile,
+                                float* __restrict__ c_tile, const int64_t lda,
+                                const int64_t ldb, const int64_t ldc,
+                                const int32_t block_size,
+                                const int32_t dynamic_k_size,
+                                const bool accum_c) {
+    TORCH_CHECK(false, "Unsupported kv cache type for TileGemm122");
+  }
+
+  FORCE_INLINE static void init_tile_config(int32_t m, __tilecfg& config) {
+    TORCH_CHECK(false, "Unsupported kv cache type for TileGemm122");
+  }
+};
+
+template <>
+class TileGemm122<c10::BFloat16> {
+ public:
+  template <AttentionGemmPhase phase, int32_t k_size>
+  FORCE_INLINE static void gemm(const int32_t m_size,
+                                c10::BFloat16* __restrict__ a_tile,
+                                c10::BFloat16* __restrict__ b_tile,
+                                float* __restrict__ c_tile, const int64_t lda,
+                                const int64_t ldb, const int64_t ldc,
+                                const int32_t block_size,
+                                const int32_t dynamic_k_size,
+                                const bool accum_c) {
+    c10::BFloat16* __restrict__ a_tile_0 = a_tile;
+    c10::BFloat16* __restrict__ a_tile_1 = [&]() {
+      if constexpr (phase == AttentionGemmPhase::QK) {
+        // q_buffer is prepacked
+        return a_tile + AMX_TILE_BYTES / sizeof(c10::BFloat16);
+      } else if constexpr (phase == AttentionGemmPhase::PV) {
+        // logits_buffer is row-major
+        return a_tile + AMX_TILE_ROW_BYTES / sizeof(c10::BFloat16);
+      } else {
+        TORCH_CHECK(false, "Unreachable");
+      }
+    }();
+    const int64_t a_tile_stride = [&]() {
+      if constexpr (phase == AttentionGemmPhase::QK) {
+        // q_buffer is prepacked
+        return AMX_TILE_ROW_BYTES;
+      } else if constexpr (phase == AttentionGemmPhase::PV) {
+        // logits_buffer is row-major
+        return lda * sizeof(c10::BFloat16);
+      } else {
+        TORCH_CHECK(false, "Unreachable");
+      }
+    }();
+
+    c10::BFloat16* __restrict__ b_tile_2 = b_tile;
+    c10::BFloat16* __restrict__ b_tile_3 = [&]() {
+      if constexpr (phase == AttentionGemmPhase::QK) {
+        // k_cache is prepacked
+        return b_tile + (k_size * AMX_TILE_ROW_BYTES / 4);
+      } else if constexpr (phase == AttentionGemmPhase::PV) {
+        // v_cache is prepacked
+        return b_tile + (block_size * AMX_TILE_ROW_BYTES / 4);
+      } else {
+        TORCH_CHECK(false, "Unreachable");
+      }
+    }();
+    c10::BFloat16* __restrict__ b_tile_4 =
+        b_tile_2 + AMX_TILE_BYTES / sizeof(c10::BFloat16);
+    c10::BFloat16* __restrict__ b_tile_5 =
+        b_tile_3 + AMX_TILE_BYTES / sizeof(c10::BFloat16);
+    int64_t b_stride = AMX_TILE_ROW_BYTES;
+
+    float* __restrict__ c_tile_6 = c_tile;
+    float* __restrict__ c_tile_7 = c_tile + AMX_TILE_ROW_BYTES / sizeof(float);
+    int64_t c_stride = ldc * sizeof(float);
+
+    const int32_t k_times =
+        dynamic_k_size / (AMX_TILE_ROW_NUM * 4 / sizeof(c10::BFloat16));
+    const int32_t k_group_times = k_times / 2;
+    const bool has_tail = (k_times % 2 == 1);
+
+    if (accum_c) {
+      _tile_loadd(6, c_tile_6, c_stride);
+      _tile_loadd(7, c_tile_7, c_stride);
+    } else {
+      _tile_zero(6);
+      _tile_zero(7);
+    }
+
+    for (int32_t k = 0; k < k_group_times; ++k) {
+      _tile_loadd(0, a_tile_0, a_tile_stride);
+      _tile_stream_loadd(2, b_tile_2, b_stride);
+      _tile_dpbf16ps(6, 0, 2);
+      _tile_stream_loadd(3, b_tile_3, b_stride);
+      _tile_dpbf16ps(7, 0, 3);
+      _tile_loadd(1, a_tile_1, a_tile_stride);
+      _tile_stream_loadd(4, b_tile_4, b_stride);
+      _tile_dpbf16ps(6, 1, 4);
+      _tile_stream_loadd(5, b_tile_5, b_stride);
+      _tile_dpbf16ps(7, 1, 5);
+
+      // update ptrs
+      if constexpr (phase == AttentionGemmPhase::QK) {
+        // Q buffer is prepacked
+        a_tile_0 += 2 * AMX_TILE_BYTES / sizeof(c10::BFloat16);
+        a_tile_1 += 2 * AMX_TILE_BYTES / sizeof(c10::BFloat16);
+      } else if constexpr (phase == AttentionGemmPhase::PV) {
+        // P buffer is not prepacked
+        a_tile_0 += 2 * AMX_TILE_ROW_BYTES / sizeof(c10::BFloat16);
+        a_tile_1 += 2 * AMX_TILE_ROW_BYTES / sizeof(c10::BFloat16);
+      }
+      b_tile_2 += 2 * AMX_TILE_BYTES / sizeof(c10::BFloat16);
+      b_tile_3 += 2 * AMX_TILE_BYTES / sizeof(c10::BFloat16);
+      b_tile_4 += 2 * AMX_TILE_BYTES / sizeof(c10::BFloat16);
+      b_tile_5 += 2 * AMX_TILE_BYTES / sizeof(c10::BFloat16);
+    }
+
+    if (has_tail) {
+      _tile_loadd(0, a_tile_0, a_tile_stride);
+      _tile_stream_loadd(2, b_tile_2, b_stride);
+      _tile_dpbf16ps(6, 0, 2);
+      _tile_stream_loadd(3, b_tile_3, b_stride);
+      _tile_dpbf16ps(7, 0, 3);
+    }
+
+    _tile_stored(6, c_tile_6, c_stride);
+    _tile_stored(7, c_tile_7, c_stride);
+  }
+
+  FORCE_INLINE static void init_tile_config(int32_t m, __tilecfg& config) {
+    config.rows[0] = m;
+    config.rows[1] = m;
+    config.rows[2] = AMX_TILE_ROW_NUM;
+    config.rows[3] = AMX_TILE_ROW_NUM;
+    config.rows[4] = AMX_TILE_ROW_NUM;
+    config.rows[5] = AMX_TILE_ROW_NUM;
+    config.rows[6] = m;
+    config.rows[7] = m;
+    _tile_loadconfig(&config);
+  }
+};
+}  // namespace
+
+template <typename scalar_t, int64_t head_dim>
+class AttentionImpl<ISA::AMX, scalar_t, head_dim> {
+ public:
+  using query_t = scalar_t;
+  using q_buffer_t = scalar_t;
+  using kv_cache_t = scalar_t;
+  using logits_buffer_t = float;
+  using partial_output_buffer_t = float;
+  using prob_buffer_t = scalar_t;
+
+  constexpr static int64_t BlockSizeAlignment =
+      AMX_TILE_ROW_BYTES /
+      sizeof(kv_cache_t);  // KV token num unit of QK and PV phases
+  constexpr static int64_t HeadDimAlignment =
+      2 * (AMX_TILE_ROW_BYTES / 4);  // headdim num unit of PV phase
+  constexpr static int64_t MaxQHeadNumPerIteration = 32;
+  constexpr static int64_t HeadDim = head_dim;
+  constexpr static ISA ISAType = ISA::AMX;
+  constexpr static bool scale_on_logits = true;
+
+ public:
+  AttentionImpl() : current_q_head_num_(0) {
+    // Use all columns in AMX tiles
+    vec_op::unroll_loop<int, 8>([&](int i) { amx_tile_config_.colsb[i] = 64; });
+  }
+
+  ~AttentionImpl() { _tile_release(); }
+
+  template <template <typename tile_gemm_t> typename attention>
+  FORCE_INLINE void execute_attention(DEFINE_CPU_ATTENTION_PARAMS) {
+    if (q_head_num > AMX_TILE_ROW_NUM) {
+      if (q_head_num != current_q_head_num_) {
+        current_q_head_num_ = q_head_num;
+        TileGemm224<kv_cache_t>::init_tile_config(q_head_num, amx_tile_config_);
+      }
+      attention<TileGemm224<kv_cache_t>> attention_iteration;
+      attention_iteration(CPU_ATTENTION_PARAMS);
+    } else {
+      if (q_head_num != current_q_head_num_) {
+        current_q_head_num_ = q_head_num;
+        TileGemm122<kv_cache_t>::init_tile_config(q_head_num, amx_tile_config_);
+      }
+      attention<TileGemm122<kv_cache_t>> attention_iteration;
+      attention_iteration(CPU_ATTENTION_PARAMS);
+    }
+  }
+
+  // k_cache_token_group_stride: stride of K cache when move to next
+  // BlockSizeAlignment tokens in a block
+  constexpr static int64_t k_cache_token_group_stride(
+      const int32_t block_size) {
+    return BlockSizeAlignment * head_dim;
+  }
+
+  // v_cache_token_group_stride: stride of V cache when move to next
+  // BlockSizeAlignment tokens in a block
+  constexpr static int64_t v_cache_token_group_stride(
+      const int32_t block_size) {
+    return BlockSizeAlignment * (AMX_TILE_ROW_BYTES / 4);
+  }
+
+  // v_cache_head_group_stride: stride of V cache when move to next
+  // HeadDimAlignment head dims in a block
+  constexpr static int64_t v_cache_head_group_stride(const int32_t block_size) {
+    return block_size * HeadDimAlignment;
+  }
+
+  static void copy_q_heads_tile(
+      scalar_t* __restrict__ src,  // [q_num, q_heads_per_kv, head_size]
+      scalar_t* __restrict__ q_buffer, const int32_t q_num,
+      const int32_t q_heads_per_kv, const int64_t q_num_stride,
+      const int64_t q_head_stride, const float scale) {
+    constexpr int64_t bytes_per_head = head_dim * sizeof(scalar_t);
+    static_assert(bytes_per_head % AMX_TILE_ROW_BYTES == 0);
+    constexpr int64_t head_size_block_num = bytes_per_head / AMX_TILE_ROW_BYTES;
+    constexpr int64_t head_elem_num_pre_block =
+        AMX_TILE_ROW_BYTES / sizeof(scalar_t);
+
+    int32_t idx = 0;
+    int8_t* __restrict__ q_buffer_iter = reinterpret_cast<int8_t*>(q_buffer);
+    for (int32_t q_num_idx = 0; q_num_idx < q_num;
+         ++q_num_idx, src += q_num_stride) {
+      scalar_t* __restrict__ src_iter = src;
+      for (int32_t q_head_idx = 0; q_head_idx < q_heads_per_kv;
+           ++q_head_idx, src_iter += q_head_stride) {
+        vec_op::unroll_loop<int32_t, head_size_block_num>(
+            [&](int32_t head_size_block_idx) {
+              // Use INT8Vec64 for 64 bytes block
+              vec_op::INT8Vec64 vec(src_iter + head_size_block_idx *
+                                                   head_elem_num_pre_block);
+              vec.save(q_buffer_iter + head_size_block_idx * AMX_TILE_BYTES);
+            });
+
+        ++idx;
+        q_buffer_iter += AMX_TILE_ROW_BYTES;
+        if ((idx & (AMX_TILE_ROW_NUM - 1)) == 0) {
+          // head is in another amx tile
+          q_buffer_iter -= AMX_TILE_ROW_NUM * AMX_TILE_ROW_BYTES;
+          q_buffer_iter += head_size_block_num * AMX_TILE_BYTES;
+        }
+      }
+    }
+  }
+
+  // reshape KV to AMX friendly layout
+  static void reshape_and_cache(
+      const scalar_t* __restrict__ key, const scalar_t* __restrict__ value,
+      scalar_t* __restrict__ key_cache, scalar_t* __restrict__ value_cache,
+      const int64_t* __restrict__ slot_mapping, const int64_t token_num,
+      const int64_t key_token_num_stride, const int64_t value_token_num_stride,
+      const int64_t head_num, const int64_t key_head_num_stride,
+      const int64_t value_head_num_stride, const int64_t num_blocks,
+      const int64_t num_blocks_stride, const int64_t cache_head_num_stride,
+      const int64_t block_size, const int64_t block_size_stride) {
+    // For AMX 2D tiles, size of each line is 64 bytes
+    constexpr int64_t amx_tile_row_size = AMX_TILE_ROW_BYTES;
+    // For AMX B martix, N always is 16
+    constexpr int64_t amx_b_tile_n_size = AMX_TILE_ROW_BYTES / 4;
+    constexpr int64_t amx_b_tile_k_size = amx_tile_row_size / sizeof(scalar_t);
+    // For now suppose block_size is divisible by amx_tile_column_num
+    TORCH_CHECK_EQ(block_size % amx_b_tile_k_size, 0);
+
+#pragma omp parallel for collapse(2)
+    for (int64_t token_idx = 0; token_idx < token_num; ++token_idx) {
+      for (int64_t head_idx = 0; head_idx < head_num; ++head_idx) {
+        const int64_t pos = slot_mapping[token_idx];
+        if (pos < 0) {
+          // skip
+          continue;
+        }
+
+        const int64_t block_idx = pos / block_size;
+        const int64_t block_offset = pos % block_size;
+        {
+          // Write Key
+          // Head elements should be packed as quand-words and stored in token
+          // groups with (quadword_stride/4) tokens
+          constexpr int64_t token_num_per_group = amx_tile_row_size / 4;
+          static_assert(head_dim % (4 / sizeof(scalar_t)) == 0);
+          constexpr int64_t quadword_num = head_dim / (4 / sizeof(scalar_t));
+          const int32_t* key_start_quadword_ptr =
+              reinterpret_cast<const int32_t*>(
+                  key + token_idx * key_token_num_stride +
+                  head_idx * key_head_num_stride);
+          const int64_t group_idx = block_offset / token_num_per_group;
+          const int64_t group_offset = block_offset % token_num_per_group;
+          constexpr int64_t quadword_num_per_group =
+              token_num_per_group * quadword_num;
+          int32_t* key_cache_start_ptr =
+              reinterpret_cast<int32_t*>(key_cache +
+                                         block_idx * num_blocks_stride +
+                                         head_idx * cache_head_num_stride) +
+              group_idx * quadword_num_per_group + group_offset;
+
+#pragma GCC unroll 8
+          for (int64_t i = 0, j = 0; j < quadword_num;
+               i += token_num_per_group, ++j) {
+            key_cache_start_ptr[i] = key_start_quadword_ptr[j];
+          }
+        }
+        {
+          // Write Value
+          // Different from Key, block_size dimension is packed rather than
+          // head_size dimension block_size dimension is packed as quand-words;
+          constexpr int64_t token_num_per_sub_group = 4 / sizeof(scalar_t);
+          const int64_t token_num_per_group = block_size;
+          constexpr int64_t head_elems_per_group = amx_b_tile_n_size;
+          const int64_t group_size = token_num_per_group * head_elems_per_group;
+          // For now suppose head_dim is divisible by amx_b_tile_n_size
+          static_assert(head_dim % head_elems_per_group == 0);
+          constexpr int64_t group_num = head_dim / head_elems_per_group;
+          const int64_t sub_group_idx = block_offset / token_num_per_sub_group;
+          const int64_t sub_group_offset =
+              block_offset % token_num_per_sub_group;
+
+          const scalar_t* value_start_ptr = value +
+                                            token_idx * value_token_num_stride +
+                                            head_idx * value_head_num_stride;
+          scalar_t* value_cache_start_ptr =
+              value_cache + block_idx * num_blocks_stride +
+              head_idx * cache_head_num_stride +
+              sub_group_idx * token_num_per_sub_group * amx_b_tile_n_size +
+              sub_group_offset;
+
+          for (int64_t i = 0; i < group_num; ++i) {
+#pragma GCC unroll head_elems_per_group
+            for (int64_t j = 0, k = 0; j < head_elems_per_group;
+                 ++j, k += token_num_per_sub_group) {
+              value_cache_start_ptr[k] = value_start_ptr[j];
+            }
+            value_start_ptr += head_elems_per_group;
+            value_cache_start_ptr += group_size;
+          }
+        }
+      }
+    }
+  }
+
+ private:
+  alignas(64) __tilecfg amx_tile_config_;
+  int32_t current_q_head_num_;
+};
+}  // namespace cpu_attention
+
+#endif
diff --git a/csrc/cpu/cpu_attn_impl.hpp b/csrc/cpu/cpu_attn_impl.hpp
new file mode 100644
index 000000000000..8f4c78099802
--- /dev/null
+++ b/csrc/cpu/cpu_attn_impl.hpp
@@ -0,0 +1,1977 @@
+#ifndef CPU_ATTN_HPP
+#define CPU_ATTN_HPP
+
+#include <unistd.h>
+#include <type_traits>
+#include <cstddef>
+
+#include "cpu_types.hpp"
+#include "scratchpad_manager.h"
+#include "cpu_attn_macros.h"
+
+namespace cpu_attention {
+enum class ISA { AMX, VEC, VEC16 };
+
+template <ISA isa, typename scalar_t, int64_t head_dim>
+class AttentionImpl {};
+
+struct AttentionWorkItemGroup {
+  int32_t req_id;
+  int32_t q_token_id_start;
+  int32_t q_token_num;
+  int32_t kv_split_pos_start;
+  int32_t kv_split_pos_end;
+
+  int64_t total_kv_len;
+  int32_t split_id;
+  int32_t local_split_id;
+
+  AttentionWorkItemGroup(const int32_t req_id, const int32_t q_token_id_start,
+                         const int32_t kv_split_pos_start,
+                         const int32_t kv_split_pos_end)
+      : req_id(req_id),
+        q_token_id_start(q_token_id_start),
+        q_token_num(0),
+        kv_split_pos_start(kv_split_pos_start),
+        kv_split_pos_end(kv_split_pos_end),
+        total_kv_len(0),
+        split_id(-1),
+        local_split_id(0) {}
+
+  std::string to_string() const {
+    std::stringstream ss;
+    ss << '[' << "req_id: " << req_id << ",\n";
+    ss << "q_token_id_start: " << q_token_id_start << ",\n";
+    ss << "q_token_num: " << q_token_num << ",\n";
+    ss << "kv_split_pos_start: " << kv_split_pos_start << ",\n";
+    ss << "kv_split_pos_end: " << kv_split_pos_end << ",\n";
+    ss << "total_kv_len: " << total_kv_len << ",\n";
+    ss << "split_id: " << split_id << ",\n";
+    ss << "local_split_id: " << local_split_id << ",\n";
+    ss << ']';
+
+    return ss.str();
+  }
+};
+
+struct ReductionWorkItemGroup {
+  int32_t req_id;
+  int32_t q_token_id_start;
+  int32_t q_token_id_num;
+  int32_t split_start_id;
+  int32_t split_num;
+
+  ReductionWorkItemGroup(const int32_t req_id, const int32_t q_token_id_start,
+                         const int32_t q_token_id_num,
+                         const int32_t split_start_id)
+      : req_id(req_id),
+        q_token_id_start(q_token_id_start),
+        q_token_id_num(q_token_id_num),
+        split_start_id(split_start_id),
+        split_num(0) {}
+
+  std::string to_string() const {
+    std::stringstream ss;
+    ss << '[' << "req_id: " << req_id << ",\n";
+    ss << "q_token_id_start: " << q_token_id_start << ",\n";
+    ss << "q_token_id_num: " << q_token_id_num << ",\n";
+    ss << "split_start_id: " << split_start_id << ",\n";
+    ss << "split_num: " << split_num << ",\n";
+    ss << ']';
+
+    return ss.str();
+  }
+};
+
+struct AttentionMetadata {
+  std::atomic_int64_t counter;
+  char _padding1[56];
+  ISA isa;
+  int32_t workitem_group_num;
+  int32_t reduction_item_num;
+  int32_t reduction_split_num;
+  int32_t thread_num;
+  int32_t effective_thread_num;  // non-zero item num in workitem_num_per_thread
+  int32_t split_kv_q_token_num_threshold;
+  int64_t attention_scratchpad_size_per_thread;
+  int64_t reduction_scratchpad_size_per_kv_head;
+  AttentionWorkItemGroup* workitem_groups_ptr;
+  ReductionWorkItemGroup* reduction_items_ptr;
+  int32_t cu_workitem_num_per_thread[1025] = {
+      0};  // prefix sum of workitem_num_per_thread
+  char _padding2[56];
+
+  AttentionMetadata(ISA isa, int32_t workitem_group_num,
+                    int32_t reduction_item_num, int32_t reduction_split_num,
+                    int32_t split_kv_q_token_num_threshold)
+      : isa(isa),
+        workitem_group_num(workitem_group_num),
+        reduction_item_num(reduction_item_num),
+        reduction_split_num(reduction_split_num),
+        thread_num(omp_get_max_threads()),
+        effective_thread_num(thread_num),
+        split_kv_q_token_num_threshold(split_kv_q_token_num_threshold),
+        attention_scratchpad_size_per_thread(0),
+        reduction_scratchpad_size_per_kv_head(0),
+        workitem_groups_ptr(
+            (AttentionWorkItemGroup*)((char*)this + sizeof(AttentionMetadata))),
+        reduction_items_ptr(
+            (ReductionWorkItemGroup*)((char*)this + sizeof(AttentionMetadata) +
+                                      workitem_group_num *
+                                          sizeof(AttentionWorkItemGroup))),
+        counter(0) {
+    TORCH_CHECK_LE(thread_num, 1024);
+    static_assert(sizeof(AttentionMetadata) % 64 == 0);
+    TORCH_CHECK(reinterpret_cast<size_t>(this) % 64 == 0);
+  }
+
+  void reset_counter() { counter.store(0); }
+
+  int64_t acquire_counter() { return counter++; }
+
+  void print() const {
+    std::stringstream ss;
+    ss << "ISA: ";
+    switch (isa) {
+      case ISA::AMX:
+        ss << "AMX, ";
+        break;
+      case ISA::VEC:
+        ss << "VEC, ";
+        break;
+    }
+    ss << "workitem_group_num: " << workitem_group_num
+       << ", reduction_item_num: " << reduction_item_num
+       << ", reduction_split_num: " << reduction_split_num
+       << ", thread_num: " << thread_num
+       << ", effective_thread_num: " << effective_thread_num
+       << ", attention_scratchpad_size_per_thread: "
+       << attention_scratchpad_size_per_thread
+       << ", reduction_scratchpad_size_per_kv_head: "
+       << reduction_scratchpad_size_per_kv_head << ", workitem groups:\n";
+    for (int32_t i = 0; i < workitem_group_num; ++i) {
+      ss << (workitem_groups_ptr + i)->to_string() << ",\n";
+    }
+
+    ss << "cu_workitem_num_per_thread: [";
+    for (int32_t i = 0; i < thread_num + 1; ++i) {
+      ss << cu_workitem_num_per_thread[i] << ", ";
+    }
+    ss << "]\n";
+
+    ss << "reduction items: \n";
+
+    for (int32_t i = 0; i < reduction_item_num; ++i) {
+      ss << (reduction_items_ptr + i)->to_string() << ",\n";
+    }
+
+    std::printf("%s", ss.str().c_str());
+  }
+};
+
+// Thread attention scratchpad contains:
+//  - Q: q_tile_size * head_dim * q_buffer_elem_size, gather Q heads, especially
+//  for GQA
+//  - Q@K^T: max_num_q_per_iter * k_tile_size * logits_buffer_elem_size, logits
+//  - Intermediate outputs: q_tile_size * head_dim * output_buffer_elem_size + 2
+//  * q_tile_size * 4, partial output, max + sum (float)
+// Reduction scratchpad contains:
+//  - flags: bool array to indicate wether the split is finished
+//  - outputs: split_num * q_tile_size * head_dim * output_buffer_elem_size
+//  - max, sum: 2 * split_num * q_tile_size * 4
+class AttentionScratchPad {
+ public:
+  AttentionScratchPad(int64_t thread_id,
+                      const AttentionMetadata& attention_metadata,
+                      void* scratchpad_ptr)
+      : thread_scratchpad_ptr(
+            static_cast<int8_t*>(scratchpad_ptr) +
+            thread_id *
+                attention_metadata.attention_scratchpad_size_per_thread),
+        reduction_scratchpad_ptr(
+            static_cast<int8_t*>(scratchpad_ptr) +
+            attention_metadata.thread_num *
+                attention_metadata.attention_scratchpad_size_per_thread),
+        reduction_scratchpad_size_per_kv_head(
+            attention_metadata.reduction_scratchpad_size_per_kv_head) {}
+
+  // for attention
+  void update(const int64_t head_dim, const int64_t q_buffer_elem_size,
+              const int64_t logits_buffer_elem_size,
+              const int64_t output_buffer_elem_size,
+              const int64_t max_num_q_per_iter, const int64_t q_head_tile_size,
+              const int64_t kv_tile_size) {
+    int64_t buffer_offset = 0;
+    q_buffer_offset_ = buffer_offset;
+    buffer_offset +=
+        calcu_q_buffer_size(q_head_tile_size, head_dim, q_buffer_elem_size);
+    logits_buffer_offset_ = buffer_offset;
+    buffer_offset += calcu_logits_buffer_size(max_num_q_per_iter, kv_tile_size,
+                                              logits_buffer_elem_size);
+    output_buffer_offset_ = buffer_offset;
+    buffer_offset += calcu_partial_output_buffer_size(
+        q_head_tile_size, head_dim, output_buffer_elem_size);
+    max_buffer_offset_ = buffer_offset;
+    buffer_offset += calcu_partial_output_max_sum_buffer_size(q_head_tile_size);
+    sum_buffer_offset_ = buffer_offset;
+  }
+
+  // for reduction
+  void update(const int32_t kv_head_idx, const int32_t total_split_num,
+              const int64_t head_dim, const int64_t q_head_tile_size,
+              const int64_t output_buffer_elem_size) {
+    int64_t buffer_offset = kv_head_idx * reduction_scratchpad_size_per_kv_head;
+    reduce_flag_buffer_offset_ = buffer_offset;
+    buffer_offset += calcu_reduce_flag_buffer_size(total_split_num);
+    reduce_output_buffer_offset_ = buffer_offset;
+    buffer_offset += calcu_reduce_output_buffer_size(
+        total_split_num, q_head_tile_size, head_dim, output_buffer_elem_size);
+    reduce_max_buffer_offset_ = buffer_offset;
+    buffer_offset +=
+        calcu_reduce_max_sum_buffer_size(total_split_num, q_head_tile_size);
+    reduce_sum_buffer_offset_ = buffer_offset;
+  }
+
+  template <typename T>
+  T* get_q_buffer() {
+    return reinterpret_cast<T*>(thread_scratchpad_ptr + q_buffer_offset_);
+  }
+
+  float* get_logits_buffer() {
+    return reinterpret_cast<float*>(thread_scratchpad_ptr +
+                                    logits_buffer_offset_);
+  }
+
+  float* get_output_buffer() {
+    return reinterpret_cast<float*>(thread_scratchpad_ptr +
+                                    output_buffer_offset_);
+  }
+
+  float* get_max_buffer() {
+    return reinterpret_cast<float*>(thread_scratchpad_ptr + max_buffer_offset_);
+  }
+
+  float* get_sum_buffer() {
+    return reinterpret_cast<float*>(thread_scratchpad_ptr + sum_buffer_offset_);
+  }
+
+  volatile bool* get_reduce_flag_buffer() {
+    return reinterpret_cast<volatile bool*>(reduction_scratchpad_ptr +
+                                            reduce_flag_buffer_offset_);
+  }
+
+  float* get_reduce_output_buffer() {
+    return reinterpret_cast<float*>(reduction_scratchpad_ptr +
+                                    reduce_output_buffer_offset_);
+  }
+
+  float* get_reduce_max_buffer() {
+    return reinterpret_cast<float*>(reduction_scratchpad_ptr +
+                                    reduce_max_buffer_offset_);
+  }
+
+  float* get_reduce_sum_buffer() {
+    return reinterpret_cast<float*>(reduction_scratchpad_ptr +
+                                    reduce_sum_buffer_offset_);
+  }
+
+  int64_t get_thread_scratchpad_size() const {
+    return 2 * sum_buffer_offset_ - max_buffer_offset_;
+  }
+
+  int64_t get_reduction_scratchpad_size() const {
+    return 2 * reduce_sum_buffer_offset_ - reduce_max_buffer_offset_;
+  }
+
+ private:
+  static int64_t round_to_64(const int64_t num) {
+    return ((num + 63) >> 6) << 6;
+  }
+
+  static int64_t calcu_q_buffer_size(const int64_t q_tile_size,
+                                     const int64_t head_dim,
+                                     const int64_t elem_size) {
+    return round_to_64(q_tile_size * head_dim * elem_size);
+  }
+
+  static int64_t calcu_logits_buffer_size(const int64_t max_num_q_per_iter,
+                                          const int64_t k_tile_size,
+                                          const int64_t elem_size) {
+    return round_to_64(elem_size * max_num_q_per_iter * k_tile_size);
+  }
+
+  static int64_t calcu_partial_output_buffer_size(const int64_t q_tile_size,
+                                                  const int64_t head_dim,
+                                                  const int64_t elem_size) {
+    return round_to_64(q_tile_size * head_dim * elem_size);
+  }
+
+  static int64_t calcu_partial_output_max_sum_buffer_size(
+      const int64_t q_tile_size) {
+    return round_to_64(q_tile_size * sizeof(float));
+  }
+
+  static int64_t calcu_reduce_flag_buffer_size(const int64_t total_split_num) {
+    return round_to_64(total_split_num * sizeof(bool));
+  }
+
+  static int64_t calcu_reduce_max_sum_buffer_size(
+      const int64_t total_split_num, const int32_t q_head_tile_size) {
+    return round_to_64(total_split_num * q_head_tile_size * sizeof(float));
+  }
+
+  static int64_t calcu_reduce_output_buffer_size(
+      const int64_t total_split_num, const int64_t q_head_tile_size,
+      const int64_t head_dim, const int64_t output_buffer_elem_size) {
+    return round_to_64(total_split_num * q_head_tile_size * head_dim *
+                       output_buffer_elem_size);
+  }
+
+ private:
+  int8_t* thread_scratchpad_ptr;
+  int8_t* reduction_scratchpad_ptr;
+  int64_t reduction_scratchpad_size_per_kv_head;
+  // attention buffers
+  int64_t q_buffer_offset_;
+  int64_t logits_buffer_offset_;
+  int64_t output_buffer_offset_;
+  int64_t max_buffer_offset_;
+  int64_t sum_buffer_offset_;
+  // reduction buffers
+  int64_t reduce_flag_buffer_offset_;
+  int64_t reduce_output_buffer_offset_;
+  int64_t reduce_max_buffer_offset_;
+  int64_t reduce_sum_buffer_offset_;
+};
+
+class AttentionScheduler {
+ public:
+  struct ScheduleInput {
+    int32_t num_reqs;
+    int32_t elem_size;
+    int32_t q_buffer_elem_size;
+    int32_t logits_buffer_elem_size;
+    int32_t output_buffer_elem_size;
+    int32_t num_heads_q;
+    int32_t num_heads_kv;
+    int32_t head_dim;
+    int32_t* query_start_loc;
+    int32_t* seq_lens;
+    int32_t left_sliding_window_size;
+    int32_t right_sliding_window_size;
+    bool casual;
+    cpu_attention::ISA isa;
+    int32_t max_num_q_per_iter;  // max Q head num can be hold in registers
+    int32_t kv_block_alignment;  // context length alignment requirement
+    bool enable_kv_split;
+  };
+
+  static constexpr int32_t MaxQTileIterNum = 128;
+
+  AttentionScheduler() : available_cache_size_(get_available_l2_size()) {}
+
+  torch::Tensor schedule(const ScheduleInput& input) const {
+    const bool casual = input.casual;
+    const int32_t thread_num = omp_get_max_threads();
+    const int64_t cache_size = get_available_l2_size();
+    const int32_t max_num_q_per_iter = input.max_num_q_per_iter;
+    const int32_t kv_len_alignment = input.kv_block_alignment;
+    int32_t q_head_per_kv = input.num_heads_q / input.num_heads_kv;
+    const bool use_gqa = (max_num_q_per_iter % q_head_per_kv == 0);
+    if (!use_gqa) {
+      q_head_per_kv = 1;  // fallback to MHA
+    }
+    const int32_t min_split_kv_len =
+        ((max_num_q_per_iter * 4 + kv_len_alignment - 1) / kv_len_alignment) *
+        kv_len_alignment;
+    const int32_t max_num_q_token_per_iter = max_num_q_per_iter / q_head_per_kv;
+    const int64_t default_tile_size = calcu_default_tile_size(
+        cache_size, input.head_dim, input.elem_size, input.q_buffer_elem_size,
+        input.logits_buffer_elem_size, input.output_buffer_elem_size,
+        max_num_q_per_iter, max_num_q_per_iter);
+    const int32_t default_tile_token_num = default_tile_size / q_head_per_kv;
+    const int32_t split_kv_q_token_num_threshold =
+        input.enable_kv_split ? 1 : 0;
+    const int32_t left_sliding_window_size = input.left_sliding_window_size;
+    const int32_t right_sliding_window_size = input.right_sliding_window_size;
+    TORCH_CHECK_LE(split_kv_q_token_num_threshold * q_head_per_kv, 16);
+
+    // get total kv len
+    int64_t total_kv_len = 0;
+    for (int32_t req_id = 0; req_id < input.num_reqs; ++req_id) {
+      const int32_t seq_len = input.seq_lens[req_id];
+      const int32_t q_token_num =
+          input.query_start_loc[req_id + 1] - input.query_start_loc[req_id];
+      const int32_t q_start_pos = (casual ? (seq_len - q_token_num) : 0);
+      const int32_t kv_start_pos = 0;
+      const int32_t kv_end_pos = seq_len;
+
+      for (int32_t token_id = 0; token_id < q_token_num;
+           token_id += max_num_q_token_per_iter) {
+        const int32_t q_tile_token_num =
+            std::min(max_num_q_token_per_iter, q_token_num - token_id);
+        const int32_t q_tile_pos_left = q_start_pos + token_id;
+        const int32_t q_tile_pos_right = q_tile_pos_left + q_tile_token_num;
+        const auto [kv_tile_pos_left, kv_tile_pos_right] = calcu_kv_tile_pos(
+            kv_start_pos, kv_end_pos, q_tile_pos_left, q_tile_pos_right,
+            left_sliding_window_size, right_sliding_window_size);
+        const auto [aligned_kv_tile_pos_left, aligned_kv_tile_pos_right] =
+            align_kv_tile_pos(kv_tile_pos_left, kv_tile_pos_right,
+                              kv_len_alignment);
+
+        int32_t curr_kv_len =
+            aligned_kv_tile_pos_right - aligned_kv_tile_pos_left;
+        total_kv_len += curr_kv_len;
+      }
+    }
+    const int64_t kv_len_per_thread =
+        (((total_kv_len / thread_num) + kv_len_alignment - 1) /
+         kv_len_alignment) *
+        kv_len_alignment * (use_gqa ? input.num_heads_kv : input.num_heads_q);
+    std::vector<AttentionWorkItemGroup> workitems;
+    std::vector<ReductionWorkItemGroup> reduce_workitems;
+    workitems.reserve(1024);
+    reduce_workitems.reserve(1024);
+    std::vector<int32_t> workitem_num_per_thread(thread_num, 0);
+
+    // split tasks
+    int32_t curr_thread_id = 0;
+    int64_t remaining_kv_len = kv_len_per_thread;
+    int32_t cum_split_num = 0;
+    for (int32_t req_id = 0; req_id < input.num_reqs; ++req_id) {
+      const int32_t seq_len = input.seq_lens[req_id];
+      const int32_t q_token_num =
+          input.query_start_loc[req_id + 1] - input.query_start_loc[req_id];
+      const int32_t q_start_pos = (casual ? (seq_len - q_token_num) : 0);
+      const int32_t kv_start_pos = 0;
+      const int32_t kv_end_pos = seq_len;
+      int32_t local_split_id = 0;
+
+      AttentionWorkItemGroup curr_workitem(req_id, 0, 0, seq_len);
+      for (int32_t token_id = 0; token_id < q_token_num;
+           token_id += max_num_q_token_per_iter) {
+        const int32_t q_tile_token_num =
+            std::min(max_num_q_token_per_iter, q_token_num - token_id);
+        const int32_t q_tile_pos_left = q_start_pos + token_id;
+        const int32_t q_tile_pos_right = q_tile_pos_left + q_tile_token_num;
+        const auto [kv_tile_pos_left, kv_tile_pos_right] = calcu_kv_tile_pos(
+            kv_start_pos, kv_end_pos, q_tile_pos_left, q_tile_pos_right,
+            left_sliding_window_size, right_sliding_window_size);
+        const auto [aligned_kv_tile_pos_left, aligned_kv_tile_pos_right] =
+            align_kv_tile_pos(kv_tile_pos_left, kv_tile_pos_right,
+                              kv_len_alignment);
+        int32_t curr_kv_len =
+            aligned_kv_tile_pos_right - aligned_kv_tile_pos_left;
+        int32_t kv_token_pos_start = aligned_kv_tile_pos_left;
+
+        while (curr_kv_len > 0) {
+          if (curr_kv_len <= (remaining_kv_len + min_split_kv_len) ||
+              curr_thread_id == (thread_num - 1)) {
+            curr_workitem.q_token_num += q_tile_token_num;
+            curr_workitem.total_kv_len += curr_kv_len;
+            remaining_kv_len -= curr_kv_len;
+            curr_kv_len = 0;
+
+            if (remaining_kv_len < 0) {
+              // stop to accept more workitems
+              remaining_kv_len -= min_split_kv_len;
+            }
+
+            if (curr_workitem.kv_split_pos_start != 0) {
+              // got a partial kv spilt, need to create a single workitem
+              curr_workitem.split_id = cum_split_num;
+              curr_workitem.local_split_id = local_split_id;
+              workitems.emplace_back(curr_workitem);
+              ++workitem_num_per_thread[curr_thread_id];
+              ++reduce_workitems.back().split_num;
+              ++cum_split_num;
+
+              curr_workitem = AttentionWorkItemGroup(
+                  req_id, token_id + max_num_q_token_per_iter, 0, seq_len);
+            }
+
+            break;
+          }
+
+          if (remaining_kv_len < min_split_kv_len &&
+              (curr_workitem.total_kv_len > 0 ||
+               workitem_num_per_thread[curr_thread_id] > 0)) {
+            // remaining_kv_len is too short, and have allocated workitems, just
+            // leave to next thread
+            if (curr_workitem.total_kv_len > 0) {
+              workitems.emplace_back(curr_workitem);
+              ++workitem_num_per_thread[curr_thread_id];
+              curr_workitem =
+                  AttentionWorkItemGroup(req_id, token_id, 0, seq_len);
+            }
+
+            // switch to next thread
+            ++curr_thread_id;
+            remaining_kv_len = kv_len_per_thread;
+
+            // retry this iteration
+            continue;
+          }
+
+          // only split tail splits with q_tile_token_num <=
+          // split_kv_q_token_num_threshold
+          if (token_id + max_num_q_token_per_iter < q_token_num ||
+              q_tile_token_num > split_kv_q_token_num_threshold) {
+            // if requires a new q tile iteration and already has workitems,
+            // leave this workitem to next thread
+            if (curr_workitem.q_token_num % default_tile_token_num == 0 &&
+                (curr_workitem.total_kv_len > 0 ||
+                 workitem_num_per_thread[curr_thread_id] > 0)) {
+              if (curr_workitem.total_kv_len > 0) {
+                workitems.emplace_back(curr_workitem);
+                ++workitem_num_per_thread[curr_thread_id];
+              }
+              curr_workitem =
+                  AttentionWorkItemGroup(req_id, token_id, 0, seq_len);
+
+              // switch to next thread
+              ++curr_thread_id;
+              remaining_kv_len = kv_len_per_thread;
+            }
+
+            curr_workitem.q_token_num += q_tile_token_num;
+            curr_workitem.total_kv_len += curr_kv_len;
+            remaining_kv_len -= curr_kv_len;
+            curr_kv_len = 0;
+            break;
+          }
+
+          // split kv
+          if (curr_workitem.total_kv_len > 0) {
+            // write back curr workitem
+            workitems.emplace_back(curr_workitem);
+            ++workitem_num_per_thread[curr_thread_id];
+          }
+
+          if (kv_token_pos_start == aligned_kv_tile_pos_left) {
+            // first split, init the workitem
+            reduce_workitems.emplace_back(ReductionWorkItemGroup(
+                req_id, token_id, q_tile_token_num, cum_split_num));
+          }
+
+          int32_t spilt_size =
+              std::min(std::max(remaining_kv_len, (int64_t)min_split_kv_len),
+                       (int64_t)curr_kv_len);
+          curr_workitem =
+              AttentionWorkItemGroup(req_id, token_id, kv_token_pos_start,
+                                     kv_token_pos_start + spilt_size);
+          curr_workitem.q_token_num += q_tile_token_num;
+          curr_workitem.total_kv_len += spilt_size;
+          curr_workitem.split_id = cum_split_num;
+          curr_workitem.local_split_id = local_split_id;
+          workitems.emplace_back(curr_workitem);
+          ++workitem_num_per_thread[curr_thread_id];
+          ++reduce_workitems.back().split_num;
+          ++cum_split_num;
+          ++local_split_id;
+
+          kv_token_pos_start += spilt_size;
+          curr_kv_len -= spilt_size;
+          curr_workitem = AttentionWorkItemGroup(req_id, token_id,
+                                                 kv_token_pos_start, seq_len);
+
+          // switch to next thread
+          ++curr_thread_id;
+          remaining_kv_len = kv_len_per_thread;
+        }
+      }
+
+      if (curr_workitem.total_kv_len > 0) {
+        // write back curr workitem
+        workitems.emplace_back(curr_workitem);
+        ++workitem_num_per_thread[curr_thread_id];
+      }
+    }
+
+    int64_t metadata_tensor_size =
+        sizeof(AttentionMetadata) +
+        workitems.size() * sizeof(AttentionWorkItemGroup) +
+        reduce_workitems.size() * sizeof(ReductionWorkItemGroup);
+    auto options =
+        torch::TensorOptions().dtype(torch::kInt8).device(torch::kCPU);
+    torch::Tensor metadata_tensor =
+        torch::empty({metadata_tensor_size}, options);
+    AttentionMetadata* metadata_ptr = new (metadata_tensor.data_ptr())
+        AttentionMetadata(input.isa, workitems.size(), reduce_workitems.size(),
+                          cum_split_num, split_kv_q_token_num_threshold);
+    AttentionWorkItemGroup* workitem_groups_ptr =
+        metadata_ptr->workitem_groups_ptr;
+    ReductionWorkItemGroup* reduction_items_ptr =
+        metadata_ptr->reduction_items_ptr;
+    std::memcpy(workitem_groups_ptr, workitems.data(),
+                workitems.size() * sizeof(AttentionWorkItemGroup));
+    std::memcpy(reduction_items_ptr, reduce_workitems.data(),
+                reduce_workitems.size() * sizeof(ReductionWorkItemGroup));
+
+    int32_t effective_thread_num = 0;
+    for (; effective_thread_num < thread_num; ++effective_thread_num) {
+      if (workitem_num_per_thread[effective_thread_num] == 0) {
+        break;
+      }
+    }
+
+    std::memcpy(metadata_ptr->cu_workitem_num_per_thread + 1,
+                workitem_num_per_thread.data(),
+                workitem_num_per_thread.size() * sizeof(int32_t));
+    for (int32_t i = 1; i <= thread_num; ++i) {
+      metadata_ptr->cu_workitem_num_per_thread[i] +=
+          metadata_ptr->cu_workitem_num_per_thread[i - 1];
+    }
+    metadata_ptr->effective_thread_num = effective_thread_num;
+
+    {
+      // when q_tile_size = max_num_q_per_iter, requires max
+      // attention_scratchpad_size
+      AttentionScratchPad sc(0, *metadata_ptr, 0x0);
+      int64_t n = AttentionScheduler::calcu_tile_size_with_constant_q(
+          cache_size, input.head_dim, input.elem_size, input.q_buffer_elem_size,
+          input.logits_buffer_elem_size, input.output_buffer_elem_size,
+          max_num_q_per_iter, kv_len_alignment, max_num_q_per_iter, true);
+      sc.update(input.head_dim, input.q_buffer_elem_size,
+                input.logits_buffer_elem_size, input.output_buffer_elem_size,
+                max_num_q_per_iter, max_num_q_per_iter, n);
+      metadata_ptr->attention_scratchpad_size_per_thread =
+          ((sc.get_thread_scratchpad_size() + 63) / 64) * 64;
+
+      sc.update(0, metadata_ptr->reduction_split_num, input.head_dim,
+                q_head_per_kv * split_kv_q_token_num_threshold,
+                input.output_buffer_elem_size);
+      metadata_ptr->reduction_scratchpad_size_per_kv_head =
+          ((sc.get_reduction_scratchpad_size() + 63) / 64) * 64;
+    }
+    int64_t scratchpad_size =
+        metadata_ptr->attention_scratchpad_size_per_thread *
+            metadata_ptr->thread_num +
+        metadata_ptr->reduction_scratchpad_size_per_kv_head *
+            (use_gqa ? input.num_heads_kv : input.num_heads_q);
+    DNNLScratchPadManager::get_dnnl_scratchpad_manager()->realloc(
+        scratchpad_size);
+
+    // metadata_ptr->print();
+
+    // test out of boundary access
+    // {
+    //     float* cache_ptr =
+    //     DNNLScratchPadManager::get_dnnl_scratchpad_manager()->get_data<float>();
+    //     for (int64_t i = 0; i < scratchpad_size / sizeof(float); ++i) {
+    //         cache_ptr[i] = std::numeric_limits<float>::quiet_NaN();
+    //     }
+    // }
+
+    return metadata_tensor;
+  }
+
+  FORCE_INLINE static std::pair<int32_t, int32_t> calcu_kv_tile_pos(
+      int32_t kv_left_pos, int32_t kv_right_pos, int32_t q_left_pos,
+      int32_t q_right_pos, int32_t sliding_window_left,
+      int32_t sliding_window_right) {
+    if (sliding_window_left != -1) {
+      kv_left_pos = std::max(kv_left_pos, q_left_pos - sliding_window_left);
+    }
+    if (sliding_window_right != -1) {
+      kv_right_pos = std::min(kv_right_pos, q_right_pos + sliding_window_right);
+    }
+    return {kv_left_pos, kv_right_pos};
+  }
+
+  FORCE_INLINE static std::pair<int32_t, int32_t> align_kv_tile_pos(
+      int32_t kv_left_pos, int32_t kv_right_pos, int32_t align_factor) {
+    kv_left_pos = (kv_left_pos / align_factor) * align_factor;
+    kv_right_pos =
+        ((kv_right_pos + align_factor - 1) / align_factor) * align_factor;
+    return {kv_left_pos, kv_right_pos};
+  }
+
+  static int64_t calcu_default_tile_size(int64_t cache_size, int64_t head_dim,
+                                         int64_t elem_size,
+                                         int64_t q_buffer_elem_size,
+                                         int64_t logits_buffer_elem_size,
+                                         int64_t output_buffer_elem_size,
+                                         int64_t max_num_q_per_iter,
+                                         int64_t round_size) {
+    // For CPU, different from CUDA, Q@K^T results should also be hold in cache,
+    // using float32. Intermediate outputs should be float32 to be compatible
+    // with AMX Then the cache includes:
+    //  - Q: q_tile_size * head_dim * q_buffer_elem_size
+    //  - K, V: 2 * k_tile_size * head_dim * elem_size
+    //  - Q@K^T: max_num_q_per_iter * k_tile_size * logits_buffer_elem_size
+    //  - Intermediate outputs: q_tile_size * head_dim * output_buffer_elem_size
+    // By default, let tile_size = q_tile_size = k_tile_size. To record
+    // is_first_iter states in a static array, require the default tile <= 128 *
+    // max_num_q_per_iter
+
+    int64_t tile_size =
+        cache_size / (head_dim * (q_buffer_elem_size + 2 * elem_size +
+                                  output_buffer_elem_size) +
+                      max_num_q_per_iter * logits_buffer_elem_size);
+    tile_size = std::min(tile_size, MaxQTileIterNum * max_num_q_per_iter);
+    int64_t rounded_tile_size = (tile_size / round_size) * round_size;
+    return std::max(rounded_tile_size, round_size);
+  }
+
+  static int64_t calcu_tile_size_with_constant_q(
+      int64_t cache_size, int64_t head_dim, int64_t elem_size,
+      int64_t q_buffer_elem_size, int64_t logits_buffer_elem_size,
+      int64_t output_buffer_elem_size, int64_t max_num_q_per_iter,
+      int64_t round_size, int64_t q_tile_size, bool one_round) {
+    // calculate tile_size with known q_tile_size
+    // If one_round is True, the outer Q tile loop time is 1, then the K,V will
+    // not be included in the cache
+    int64_t tile_size;
+    if (one_round) {
+      tile_size =
+          (cache_size - q_tile_size * head_dim *
+                            (q_buffer_elem_size + output_buffer_elem_size)) /
+          (logits_buffer_elem_size * max_num_q_per_iter);
+    } else {
+      tile_size =
+          (cache_size - q_tile_size * head_dim *
+                            (q_buffer_elem_size + output_buffer_elem_size)) /
+          (logits_buffer_elem_size * max_num_q_per_iter +
+           2 * head_dim * elem_size);
+    }
+    int64_t rounded_tile_size = (tile_size / round_size) * round_size;
+    return std::max(rounded_tile_size, round_size);
+  }
+
+  static int64_t get_available_l2_size() {
+    static int64_t size = []() {
+      long l2_cache_size = sysconf(_SC_LEVEL2_CACHE_SIZE);
+      TORCH_CHECK_NE(l2_cache_size, -1);
+      return l2_cache_size >> 1;  // use 50% of L2 cache
+    }();
+    return size;
+  }
+
+ private:
+  int64_t available_cache_size_;
+};
+
+struct AttentionInput {
+  AttentionMetadata* metadata;
+  int32_t num_tokens;
+  int32_t num_heads;
+  int32_t num_kv_heads;
+  int32_t block_size;
+  void* query;
+  int64_t query_num_tokens_stride;
+  int64_t query_num_heads_stride;
+  int64_t cache_num_blocks_stride;
+  int64_t cache_num_kv_heads_stride;
+  int64_t blt_num_tokens_stride;
+  void* key_cache;
+  void* value_cache;
+  void* output;
+  int32_t* query_start_loc;
+  int32_t* seq_lens;
+  int32_t* block_table;
+  float* alibi_slopes;
+  c10::BFloat16* s_aux;
+  float scale;
+  bool causal;
+  int32_t sliding_window_left;
+  int32_t sliding_window_right;
+  float softcap;
+};
+
+#define DEFINE_CPU_ATTENTION_PARAMS                                         \
+  q_buffer_t *__restrict__ q_heads_buffer,                                  \
+      kv_cache_t *__restrict__ k_head_cache_ptr,                            \
+      kv_cache_t *__restrict__ v_head_cache_ptr,                            \
+      logits_buffer_t *__restrict__ logits_buffer,                          \
+      float *__restrict__ partial_q_buffer, float *__restrict__ max_buffer, \
+      float *__restrict__ sum_buffer, int32_t *__restrict__ block_table,    \
+      const int32_t kv_tile_start_pos, const int32_t kv_tile_end_pos,       \
+      const int32_t kv_tile_token_num,                                      \
+      const int64_t kv_cache_num_blocks_stride, const int32_t q_head_num,   \
+      const int32_t q_token_num, const int32_t q_tile_start_pos,            \
+      const int32_t q_heads_per_kv, const int32_t block_size,               \
+      const int32_t left_window_size, const int32_t right_window_size,      \
+      float scale, const float softcap_scale,                               \
+      const float *__restrict__ alibi_slopes, const bool is_first_iter,     \
+      const bool use_sink, const bool debug_info
+
+#define CPU_ATTENTION_PARAMS                                                  \
+  q_heads_buffer, k_head_cache_ptr, v_head_cache_ptr, logits_buffer,          \
+      partial_q_buffer, max_buffer, sum_buffer, block_table,                  \
+      kv_tile_start_pos, kv_tile_end_pos, kv_tile_token_num,                  \
+      kv_cache_num_blocks_stride, q_head_num, q_token_num, q_tile_start_pos,  \
+      q_heads_per_kv, block_size, left_window_size, right_window_size, scale, \
+      softcap_scale, alibi_slopes, is_first_iter, use_sink, debug_info
+
+enum class AttentionGemmPhase { QK, PV };
+
+template <typename T>
+struct VecTypeTrait {
+  using vec_t = void;
+};
+
+template <>
+struct VecTypeTrait<float> {
+  using vec_t = vec_op::FP32Vec16;
+};
+
+template <>
+struct VecTypeTrait<c10::BFloat16> {
+  using vec_t = vec_op::BF16Vec16;
+};
+
+template <>
+struct VecTypeTrait<c10::Half> {
+  using vec_t = vec_op::FP16Vec16;
+};
+
+template <typename T>
+void print_logits(const char* name, T* ptr, int32_t row, int32_t col,
+                  int32_t stride) {
+  std::stringstream ss;
+  ss << std::fixed << std::setprecision(5) << name << ": [\n";
+  auto* curr_logits_buffer = ptr;
+  for (int32_t m = 0; m < row; ++m) {
+    for (int32_t n = 0; n < col; ++n) {
+      ss << curr_logits_buffer[n] << ", ";
+    }
+    ss << "\n";
+    curr_logits_buffer += stride;
+  }
+  ss << "]\n";
+  std::printf("%s", ss.str().c_str());
+}
+
+template <typename attention_impl_t>
+class AttentionMainLoop {
+ public:
+  using query_t = typename attention_impl_t::query_t;
+  using q_buffer_t = typename attention_impl_t::q_buffer_t;
+  using kv_cache_t = typename attention_impl_t::kv_cache_t;
+  using logits_buffer_t = typename attention_impl_t::logits_buffer_t;
+  using partial_output_buffer_t =
+      typename attention_impl_t::partial_output_buffer_t;
+  using prob_buffer_t = typename attention_impl_t::prob_buffer_t;
+
+  static constexpr int64_t max_q_head_num_per_iter =
+      attention_impl_t::MaxQHeadNumPerIteration;
+  static constexpr int64_t blocksize_alignment =
+      attention_impl_t::BlockSizeAlignment;
+  static constexpr int64_t headdim_alignment =
+      attention_impl_t::HeadDimAlignment;
+  static constexpr int64_t head_dim = attention_impl_t::HeadDim;
+  static constexpr ISA ISAType = attention_impl_t::ISAType;
+  static constexpr bool scale_on_logits =
+      attention_impl_t::scale_on_logits;  // apply scale on logits, otherwise
+                                          // apply scale on q_buffer
+
+  template <typename tile_gemm_t>
+  class Attention {
+   public:
+    // Args:
+    //  - q_heads_buffer: [MaxQHeadNumPerIteration, head_dim]
+    //  - k_head_cache_ptr: [num_blocks, block_size * head_dim]
+    //  - v_head_cache_ptr: [num_blocks, block_size * head_dim]
+    //  - logits_buffer: [MaxQHeadNumPerIteration, kv_tile_token_num], store Q@K
+    //  - logits partial_q_buffer: [MaxQHeadNumPerIteration, head_dim], store
+    //  partial output
+    //  - max_buffer: [MaxQHeadNumPerIteration, 1], store max logits
+    //  - sum_buffer: [MaxQHeadNumPerIteration, 1], store sum of exp
+    //  - block_table
+    //  - kv_tile_start_pos: start position of KV cache, aligned to
+    //  BlockSizeAlignment
+    //  - kv_tile_end_pos: end position of KV cache, aligned to
+    //  BlockSizeAlignment
+    //  - kv_tile_token_num: KV token num, aligned to BlockSizeAlignment
+    //  - kv_cache_num_blocks_stride
+    //  - q_head_num: head num of q_tile
+    //  - q_token_num: token num of q_tile, should be q_head_num /
+    //  q_heads_per_kv
+    //  - q_tile_start_pos: start pos of the first token in q_heads_buffer
+    //  - q_heads_per_kv
+    //  - block_size
+    //  - left_window_size
+    //  - right_window_size
+    //  - scale
+    //  - softcap_scale
+    //  - alibi_slopes
+    //  - is_first_iter
+    //  - use_sink
+    //  - debug_info
+    void operator()(DEFINE_CPU_ATTENTION_PARAMS) {
+      // k_cache_token_group_stride: stride of K cache when move to next
+      // BlockSizeAlignment tokens in a block
+      const int64_t k_cache_token_group_stride =
+          attention_impl_t::k_cache_token_group_stride(block_size);
+      // v_cache_token_group_stride: stride of V cache when move to next
+      // BlockSizeAlignment tokens in a block
+      const int64_t v_cache_token_group_stride =
+          attention_impl_t::v_cache_token_group_stride(block_size);
+      // v_cache_head_group_stride: stride of V cache when move to next
+      // HeadDimAlignment head dims in a block
+      const int64_t v_cache_head_group_stride =
+          attention_impl_t::v_cache_head_group_stride(block_size);
+      const int32_t token_group_num = kv_tile_token_num / blocksize_alignment;
+      const int32_t token_group_num_per_block =
+          block_size / blocksize_alignment;
+      const int32_t start_block_idx = kv_tile_start_pos / block_size;
+      const int32_t start_block_offset = kv_tile_start_pos % block_size;
+      const int32_t start_block_group_offset =
+          start_block_offset / blocksize_alignment;
+      const int32_t end_block_idx =
+          (kv_tile_start_pos + kv_tile_token_num - 1) / block_size + 1;
+
+      // compute Q@K logits
+      {
+        int32_t curr_group_offset =
+            start_block_group_offset * k_cache_token_group_stride;
+        int32_t curr_group_num_in_block =
+            token_group_num_per_block - start_block_group_offset;
+        int32_t remaining_group_num = token_group_num;
+        logits_buffer_t* curr_logits_buffer = logits_buffer;
+        for (int32_t block_idx = start_block_idx; block_idx < end_block_idx;
+             ++block_idx) {
+          int32_t physical_block_idx = block_table[block_idx];
+          kv_cache_t* k_cache_block_ptr =
+              k_head_cache_ptr +
+              physical_block_idx * kv_cache_num_blocks_stride +
+              curr_group_offset;
+          curr_group_num_in_block =
+              std::min(remaining_group_num, curr_group_num_in_block);
+
+          for (int32_t block_group_idx = 0;
+               block_group_idx < curr_group_num_in_block; ++block_group_idx) {
+            // logits_tile = q_tile @ k_tile, [MaxQHeadNumPerIteration,
+            // BlockSizeAlignment] = [MaxQHeadNumPerIteration, head_dim] @
+            // [head_dim, BlockSizeAlignment]
+
+            // By default, logits_buffer, q_buffer and k_cache are row-major,
+            // but may be packed by ISA implementation.
+            tile_gemm_t::template gemm<AttentionGemmPhase::QK, head_dim>(
+                q_head_num, q_heads_buffer, k_cache_block_ptr,
+                curr_logits_buffer, head_dim, block_size, kv_tile_token_num,
+                block_size, head_dim, false);
+
+            if constexpr (scale_on_logits) {
+              float* __restrict__ scale_curr_logits_buffer = curr_logits_buffer;
+              vec_op::FP32Vec16 scale_vec(scale);
+              for (int32_t i = 0; i < q_head_num; ++i) {
+                static_assert(blocksize_alignment % 16 == 0);
+                constexpr int32_t vec_num = blocksize_alignment / 16;
+                vec_op::unroll_loop<int32_t, vec_num>([&](int32_t vec_idx) {
+                  vec_op::FP32Vec16 vec(scale_curr_logits_buffer +
+                                        vec_idx * 16);
+                  vec = vec * scale_vec;
+                  vec.save(scale_curr_logits_buffer + vec_idx * 16);
+                });
+                scale_curr_logits_buffer += kv_tile_token_num;
+              }
+            }
+
+            // Move buffer ptrs
+            k_cache_block_ptr += k_cache_token_group_stride;
+            curr_logits_buffer += blocksize_alignment;
+          }
+
+          // Update
+          remaining_group_num -= curr_group_num_in_block;
+          curr_group_offset = 0;
+          curr_group_num_in_block = token_group_num_per_block;
+        }
+      }
+
+      // process logits
+      {
+        // if (debug_info){
+        //     print_logits("raw logits", logits_buffer, q_head_num,
+        //     kv_tile_token_num, kv_tile_token_num);
+        // }
+
+        if (softcap_scale != 0.0f) {
+          apply_softcap(logits_buffer, kv_tile_token_num, q_head_num,
+                        kv_tile_token_num, softcap_scale);
+          // print_logits("softcap raw logits", logits_buffer, q_head_num,
+          // kv_tile_token_num, kv_tile_token_num);
+        }
+
+        if (alibi_slopes != nullptr) {
+          apply_alibi_slopes(logits_buffer, alibi_slopes, kv_tile_token_num,
+                             q_tile_start_pos, kv_tile_start_pos, q_token_num,
+                             kv_tile_token_num, q_heads_per_kv);
+
+          // print_logits("alibi raw logits", logits_buffer, q_head_num,
+          // kv_tile_token_num, kv_tile_token_num);
+        }
+
+        apply_mask(logits_buffer, kv_tile_token_num, q_tile_start_pos,
+                   kv_tile_start_pos, kv_tile_end_pos, q_token_num,
+                   q_heads_per_kv, left_window_size, right_window_size);
+
+        // if (debug_info){
+        // print_logits("masked logits", logits_buffer, q_head_num,
+        // kv_tile_token_num, kv_tile_token_num);
+        // print_logits("old_max", max_buffer, 1, q_head_num, q_head_num);
+        // print_logits("old_sum", sum_buffer, 1, q_head_num, q_head_num);
+        // }
+
+        apply_softmax(logits_buffer, partial_q_buffer, max_buffer, sum_buffer,
+                      kv_tile_token_num, q_head_num, kv_tile_token_num,
+                      is_first_iter, use_sink);
+
+        // if (debug_info){
+        //     print_logits("softmax logits",
+        //     reinterpret_cast<prob_buffer_t*>(logits_buffer), q_head_num,
+        //     kv_tile_token_num, kv_tile_token_num * sizeof(logits_buffer_t) /
+        //     sizeof(prob_buffer_t));
+        //     print_logits("new_max", max_buffer, 1, q_head_num, q_head_num);
+        //     print_logits("new_sum", sum_buffer, 1, q_head_num, q_head_num);
+        // }
+      }
+
+      // compute P@V
+      {
+        int32_t curr_group_offset =
+            start_block_group_offset * v_cache_token_group_stride;
+        int32_t curr_group_num_in_block =
+            token_group_num_per_block - start_block_group_offset;
+        int32_t remaining_group_num = token_group_num;
+        int32_t head_dim_group_num = head_dim / headdim_alignment;
+        prob_buffer_t* curr_prob_buffer =
+            reinterpret_cast<prob_buffer_t*>(logits_buffer);
+        int64_t prob_buffer_stride =
+            kv_tile_token_num *
+            (sizeof(logits_buffer_t) / sizeof(prob_buffer_t));
+        partial_output_buffer_t* curr_partial_q_buffer = partial_q_buffer;
+        bool accum_c = !is_first_iter;
+        for (int32_t block_idx = start_block_idx; block_idx < end_block_idx;
+             ++block_idx) {
+          int32_t physical_block_idx = block_table[block_idx];
+          kv_cache_t* v_cache_block_ptr =
+              v_head_cache_ptr +
+              physical_block_idx * kv_cache_num_blocks_stride +
+              curr_group_offset;
+          curr_group_num_in_block =
+              std::min(remaining_group_num, curr_group_num_in_block);
+          int32_t curr_token_num =
+              curr_group_num_in_block * blocksize_alignment;
+
+          for (int32_t head_dim_group_idx = 0;
+               head_dim_group_idx < head_dim_group_num; ++head_dim_group_idx) {
+            // output_tile = p_tile @ v_tile, [MaxQHeadNumPerIteration,
+            // HeadDimAlignment] = [MaxQHeadNumPerIteration, block_size] @
+            // [block_size, HeadDimAlignment]
+            tile_gemm_t::template gemm<AttentionGemmPhase::PV, -1>(
+                q_head_num, curr_prob_buffer, v_cache_block_ptr,
+                curr_partial_q_buffer, prob_buffer_stride, head_dim, head_dim,
+                block_size, curr_token_num, accum_c);
+
+            // Update
+            curr_partial_q_buffer += headdim_alignment;
+            v_cache_block_ptr += v_cache_head_group_stride;
+          }
+
+          // Update
+          remaining_group_num -= curr_group_num_in_block;
+          curr_group_offset = 0;
+          curr_group_num_in_block = token_group_num_per_block;
+          curr_prob_buffer += curr_token_num;
+          curr_partial_q_buffer = partial_q_buffer;
+          accum_c = true;
+        }
+      }
+      //   if (debug_info) {
+      //     print_logits("output", partial_q_buffer, q_head_num, head_dim,
+      //     head_dim);
+      //   }
+    }
+
+    void apply_mask(logits_buffer_t* __restrict__ logits_buffer,
+                    const int64_t logits_buffer_stride,
+                    const int32_t q_tile_start_pos,
+                    const int32_t kv_tile_start_pos,
+                    const int32_t kv_tile_end_pos, const int32_t q_token_num,
+                    const int32_t q_heads_per_kv,
+                    const int32_t sliding_window_left,
+                    const int32_t sliding_window_right) {
+      // Apply mask
+      constexpr logits_buffer_t neg_inf =
+          -std::numeric_limits<logits_buffer_t>::infinity();
+      logits_buffer_t* __restrict__ curr_logits_buffer = logits_buffer;
+      int32_t curr_token_pos = q_tile_start_pos;
+      for (int32_t token_idx = 0; token_idx < q_token_num; ++token_idx) {
+        int32_t left_kv_pos = [&]() {
+          int32_t pos = kv_tile_start_pos;
+          if (sliding_window_left != -1) {
+            pos = std::max(pos, curr_token_pos - sliding_window_left);
+          }
+          return pos;
+        }();
+
+        int32_t right_kv_pos = [&]() {
+          int32_t pos = kv_tile_end_pos;
+          if (sliding_window_right != -1) {
+            pos = std::min(pos,
+                           std::max(kv_tile_start_pos,
+                                    curr_token_pos + sliding_window_right + 1));
+          }
+          return pos;
+        }();
+
+        int32_t left_invalid_token_num = left_kv_pos - kv_tile_start_pos;
+        int32_t right_invalid_token_num = kv_tile_end_pos - right_kv_pos;
+        for (int32_t head_idx = 0; head_idx < q_heads_per_kv; ++head_idx) {
+          logits_buffer_t* __restrict__ curr_logits_buffer_tail =
+              curr_logits_buffer + right_kv_pos - kv_tile_start_pos;
+          for (int32_t i = 0; i < left_invalid_token_num; ++i) {
+            curr_logits_buffer[i] = neg_inf;
+          }
+          for (int32_t i = 0; i < right_invalid_token_num; ++i) {
+            curr_logits_buffer_tail[i] = neg_inf;
+          }
+
+          curr_logits_buffer += logits_buffer_stride;
+        }
+
+        ++curr_token_pos;
+      }
+    }
+
+    void apply_softmax(logits_buffer_t* __restrict__ logits_buffer,
+                       float* __restrict__ partial_q_buffer,
+                       float* __restrict__ max_buffer,
+                       float* __restrict__ sum_buffer,
+                       const int64_t logits_buffer_stride, int32_t q_head_num,
+                       int32_t kv_tile_token_num, bool is_first_iter,
+                       bool use_sink) {
+#ifdef DEFINE_FAST_EXP
+      DEFINE_FAST_EXP
+#endif
+      using prob_buffer_vec_t = typename VecTypeTrait<prob_buffer_t>::vec_t;
+      static_assert(sizeof(prob_buffer_t) <= sizeof(logits_buffer_t));
+
+      logits_buffer_t* __restrict__ curr_logits_buffer = logits_buffer;
+      float* __restrict__ curr_partial_q_buffer = partial_q_buffer;
+      const int32_t vec_num = kv_tile_token_num / 16;
+      const int32_t head_vec_num = head_dim / 16;
+      for (int32_t i = 0; i < q_head_num; ++i) {
+        float init_max_val = max_buffer[i];
+        float init_sum_val = sum_buffer[i];
+
+        // apply scale and compute max
+        vec_op::FP32Vec16 max_vec(init_max_val);
+        {
+          logits_buffer_t* __restrict__ curr_logits_buffer_iter =
+              curr_logits_buffer;
+          for (int32_t j = 0; j < vec_num; ++j) {
+            vec_op::FP32Vec16 vec(curr_logits_buffer_iter);
+            max_vec = vec.max(max_vec);
+
+            curr_logits_buffer_iter += 16;
+          }
+        }
+        float new_max_val = max_vec.reduce_max();
+        float rescale_factor = init_max_val - new_max_val;
+
+        // use same rescale threshold with FA4.
+        // https://github.com/Dao-AILab/flash-attention/blob/1b8e1e641c6a179be9a0538b7f40fd595050b735/flash_attn/cute/flash_fwd_sm100.py#L1271
+        bool need_rescale = rescale_factor < -8.0;
+        if (!need_rescale) {
+          new_max_val = init_max_val;
+        } else {
+          max_buffer[i] = new_max_val;
+        }
+
+        // sub max, compute exp and sum
+        max_vec = vec_op::FP32Vec16(new_max_val);
+        vec_op::FP32Vec16 sum_vec(0.0);
+        {
+          logits_buffer_t* __restrict__ curr_logits_buffer_iter =
+              curr_logits_buffer;
+          prob_buffer_t* __restrict__ curr_prob_buffer_iter =
+              reinterpret_cast<prob_buffer_t*>(curr_logits_buffer);
+          for (int32_t j = 0; j < vec_num; ++j) {
+            vec_op::FP32Vec16 vec(curr_logits_buffer_iter);
+            vec = vec - max_vec;
+
+            // compute exp
+#ifdef DEFINE_FAST_EXP
+            vec = fast_exp(vec);
+            prob_buffer_vec_t output_vec(vec);
+            output_vec.save(curr_prob_buffer_iter);
+#else
+            vec.save(curr_logits_buffer_iter);
+            for (int32_t k = 0; k < 16; ++k) {
+              curr_logits_buffer_iter[k] = std::exp(curr_logits_buffer_iter[k]);
+            }
+            vec = vec_op::FP32Vec16(curr_logits_buffer_iter);
+#endif
+
+            sum_vec = sum_vec + vec;
+
+            curr_logits_buffer_iter += 16;
+            curr_prob_buffer_iter += 16;
+          }
+        }
+        float new_sum_val = sum_vec.reduce_sum();
+
+        // rescale sum and partial outputs
+        if (need_rescale) {
+          // compute rescale factor
+#ifdef DEFINE_FAST_EXP
+          vec_op::FP32Vec16 rescale_factor_vec(rescale_factor);
+          rescale_factor_vec = fast_exp(rescale_factor_vec);
+          rescale_factor = rescale_factor_vec.get_last_elem();
+#else
+          rescale_factor = std::exp(rescale_factor);
+          vec_op::FP32Vec16 rescale_factor_vec(rescale_factor);
+#endif
+
+          // rescale sum
+          new_sum_val += rescale_factor * init_sum_val;
+
+          // rescale output
+          if (!is_first_iter) {
+            float* __restrict__ curr_partial_q_buffer_iter =
+                curr_partial_q_buffer;
+            for (int32_t j = 0; j < head_vec_num; ++j) {
+              vec_op::FP32Vec16 vec(curr_partial_q_buffer_iter);
+              vec = vec * rescale_factor_vec;
+              vec.save(curr_partial_q_buffer_iter);
+
+              curr_partial_q_buffer_iter += 16;
+            }
+          }
+        } else {
+          new_sum_val += init_sum_val;
+        }
+
+        sum_buffer[i] = new_sum_val;
+
+        curr_logits_buffer += logits_buffer_stride;
+        curr_partial_q_buffer += head_dim;
+      }
+    }
+
+    void apply_softcap(logits_buffer_t* __restrict__ logits_buffer,
+                       const int64_t logits_buffer_stride, int32_t q_head_num,
+                       int32_t kv_tile_token_num, float softcap_scale) {
+#ifdef DEFINE_FAST_EXP
+      DEFINE_FAST_EXP
+#endif
+      float inv_softcap_scale = 1.0 / softcap_scale;
+      vec_op::FP32Vec16 softcap_scale_vec(softcap_scale);
+      vec_op::FP32Vec16 inv_softcap_scale_vec(inv_softcap_scale);
+      vec_op::FP32Vec16 ones_vec(1.0);
+      logits_buffer_t* __restrict__ curr_logits_buffer = logits_buffer;
+      const int32_t vec_num = kv_tile_token_num / 16;
+      for (int32_t i = 0; i < q_head_num; ++i) {
+        logits_buffer_t* __restrict__ curr_logits_buffer_iter =
+            curr_logits_buffer;
+        for (int32_t j = 0; j < vec_num; ++j) {
+          vec_op::FP32Vec16 vec(curr_logits_buffer_iter);
+          vec = vec * inv_softcap_scale_vec;
+
+#ifdef DEFINE_FAST_EXP
+          vec = fast_exp(vec);
+          vec_op::FP32Vec16 inv_vec = ones_vec / vec;
+          vec = (vec - inv_vec) / (vec + inv_vec);
+#else
+          vec.save(curr_logits_buffer_iter);
+          for (int k = 0; k < 16; ++k) {
+            curr_logits_buffer_iter[k] = std::tanh(curr_logits_buffer_iter[k]);
+          }
+          vec = vec_op::FP32Vec16(curr_logits_buffer_iter);
+#endif
+          vec = vec * softcap_scale_vec;
+          vec.save(curr_logits_buffer_iter);
+
+          curr_logits_buffer_iter += 16;
+        }
+
+        curr_logits_buffer += logits_buffer_stride;
+      }
+    }
+
+    void apply_alibi_slopes(logits_buffer_t* __restrict__ logits_buffer,
+                            const float* __restrict__ alibi_slopes,
+                            const int64_t logits_buffer_stride,
+                            const int32_t q_tile_start_pos,
+                            const int32_t kv_tile_start_pos,
+                            const int32_t q_token_num,
+                            const int32_t kv_tile_token_num,
+                            const int32_t q_heads_per_kv) {
+      alignas(64) constexpr float initial_arange_vals[16] = {
+          0.0f, 1.0f, 2.0f,  3.0f,  4.0f,  5.0f,  6.0f,  7.0f,
+          8.0f, 9.0f, 10.0f, 11.0f, 12.0f, 13.0f, 14.0f, 15.0f};
+      const int32_t vec_num = kv_tile_token_num / 16;
+
+      vec_op::FP32Vec16 initial_arange_vals_vec(initial_arange_vals);
+      initial_arange_vals_vec =
+          initial_arange_vals_vec + vec_op::FP32Vec16((float)kv_tile_start_pos);
+      vec_op::FP32Vec16 pos_offset_vec(16.0);
+      logits_buffer_t* __restrict__ curr_logits_buffer = logits_buffer;
+      for (int32_t i = 0; i < q_token_num; ++i) {
+        vec_op::FP32Vec16 curr_q_pos_vec((float)(i + q_tile_start_pos));
+        for (int32_t j = 0; j < q_heads_per_kv; ++j) {
+          vec_op::FP32Vec16 alibi_scale_vec(alibi_slopes[j]);
+          vec_op::FP32Vec16 curr_kv_pos_vec(initial_arange_vals_vec);
+          logits_buffer_t* __restrict__ curr_logits_buffer_iter =
+              curr_logits_buffer;
+          for (int32_t k = 0; k < vec_num; ++k) {
+            vec_op::FP32Vec16 alibi_bias_vec =
+                alibi_scale_vec * (curr_kv_pos_vec - curr_q_pos_vec);
+            vec_op::FP32Vec16 vec(curr_logits_buffer_iter);
+            vec = vec + alibi_bias_vec;
+
+            vec.save(curr_logits_buffer_iter);
+
+            curr_kv_pos_vec = curr_kv_pos_vec + pos_offset_vec;
+            curr_logits_buffer_iter += 16;
+          }
+          curr_logits_buffer += logits_buffer_stride;
+        }
+      }
+    }
+  };
+
+ public:
+  void operator()(const AttentionInput* input) {
+    const int thread_num = omp_get_max_threads();
+    TORCH_CHECK_EQ(input->metadata->thread_num, thread_num);
+    std::atomic<int32_t> guard_counter(0);
+    std::atomic<int32_t>* guard_counter_ptr = &guard_counter;
+
+#pragma omp parallel for schedule(static, 1)
+    for (int thread_id = 0; thread_id < thread_num; ++thread_id) {
+      AttentionMetadata& metadata = *input->metadata;
+      if (metadata.workitem_group_num == 0) {
+        continue;
+      }
+
+      attention_impl_t attn_impl;
+
+      // general information
+      const int32_t q_head_num = input->num_heads;
+      const int32_t kv_head_num = input->num_kv_heads;
+      const int32_t q_heads_per_kv = q_head_num / kv_head_num;
+      const bool use_gqa =
+          (max_q_head_num_per_iter % q_heads_per_kv == 0) ? true : false;
+      const int32_t actual_kv_head_num = use_gqa ? kv_head_num : q_head_num;
+      const int32_t actual_q_heads_per_kv = use_gqa ? q_heads_per_kv : 1;
+      TORCH_CHECK_LE(actual_q_heads_per_kv, max_q_head_num_per_iter);
+      const int32_t max_q_token_num_per_iter =
+          max_q_head_num_per_iter / actual_q_heads_per_kv;
+      const int64_t q_token_num_stride = input->query_num_tokens_stride;
+      const int64_t q_head_num_stride = input->query_num_heads_stride;
+      const int64_t kv_cache_head_num_stride = input->cache_num_kv_heads_stride;
+      const int64_t kv_cache_block_num_stride = input->cache_num_blocks_stride;
+      const int32_t sliding_window_left = input->sliding_window_left;
+      const int32_t sliding_window_right = input->sliding_window_right;
+      const int32_t block_size = input->block_size;
+      const float scale = input->scale;
+      const float softcap_scale = input->softcap;
+      const float* alibi_slopes = input->alibi_slopes;
+      const c10::BFloat16* s_aux = input->s_aux;
+
+      const bool casual = input->causal;
+      int32_t* const block_table = input->block_table;
+      const int64_t block_table_stride = input->blt_num_tokens_stride;
+
+      // init buffers
+      void* scratchpad_ptr =
+          DNNLScratchPadManager::get_dnnl_scratchpad_manager()
+              ->get_data<void>();
+      AttentionScratchPad buffer_manager(thread_id, metadata, scratchpad_ptr);
+
+      const int32_t total_reduction_split_num = metadata.reduction_split_num;
+      if (metadata.reduction_split_num > 0) {
+        // reset split flag
+        for (int32_t head_idx = thread_id; head_idx < actual_kv_head_num;
+             head_idx += thread_num) {
+          buffer_manager.update(head_idx, total_reduction_split_num, head_dim,
+                                0, sizeof(partial_output_buffer_t));
+          volatile bool* __restrict__ curr_flag_ptr =
+              buffer_manager.get_reduce_flag_buffer();
+          for (int32_t split_idx = 0; split_idx < total_reduction_split_num;
+               ++split_idx) {
+            curr_flag_ptr[split_idx] = false;
+          }
+        }
+      }
+
+      const int64_t available_cache_size =
+          AttentionScheduler::get_available_l2_size();
+      const int32_t default_tile_size =
+          AttentionScheduler::calcu_default_tile_size(
+              available_cache_size, head_dim, sizeof(kv_cache_t),
+              sizeof(q_buffer_t), sizeof(logits_buffer_t),
+              sizeof(partial_output_buffer_t), max_q_head_num_per_iter,
+              max_q_head_num_per_iter);
+      const int32_t default_q_tile_token_num =
+          default_tile_size / actual_q_heads_per_kv;
+
+      AttentionWorkItemGroup* const workitem_groups =
+          metadata.workitem_groups_ptr;
+      const int32_t* cu_workitem_num_per_thread =
+          metadata.cu_workitem_num_per_thread;
+      ReductionWorkItemGroup* const reduction_items =
+          metadata.reduction_items_ptr;
+
+      const int32_t effective_thread_num = metadata.effective_thread_num;
+      const int32_t reduction_item_num = metadata.reduction_item_num;
+      const int32_t split_kv_q_token_num_threshold =
+          metadata.split_kv_q_token_num_threshold;
+      const int32_t workitem_groups_counter_num =
+          actual_kv_head_num * effective_thread_num;
+      const int32_t reduction_items_counter_num =
+          actual_kv_head_num * reduction_item_num;
+      const int32_t total_counter_num =
+          workitem_groups_counter_num + reduction_items_counter_num;
+
+      if (metadata.reduction_split_num > 0) {
+        ++(*guard_counter_ptr);
+        while (guard_counter_ptr->load() != thread_num) {
+#ifdef FAST_SPINNING
+          FAST_SPINNING
+#else
+          std::this_thread::yield();
+#endif
+        }
+      }
+
+      // main loop
+      for (;;) {
+        int64_t task_idx = metadata.acquire_counter();
+
+        if (task_idx >= total_counter_num) {
+          // no more tasks, leave loop
+          break;
+        }
+
+        if (task_idx < workitem_groups_counter_num) {
+          // attention task
+          // map task_idx to workitem_groups
+          const int32_t kv_head_idx = task_idx / effective_thread_num;
+          const int32_t thread_offset = task_idx % effective_thread_num;
+          AttentionWorkItemGroup* const curr_workitem_groups =
+              workitem_groups + cu_workitem_num_per_thread[thread_offset];
+          const int32_t curr_workitem_groups_num =
+              cu_workitem_num_per_thread[thread_offset + 1] -
+              cu_workitem_num_per_thread[thread_offset];
+
+          const int32_t q_head_start_idx = kv_head_idx * actual_q_heads_per_kv;
+
+          for (int32_t workitem_group_idx = 0;
+               workitem_group_idx < curr_workitem_groups_num;
+               ++workitem_group_idx) {
+            AttentionWorkItemGroup* const current_workitem_group =
+                &curr_workitem_groups[workitem_group_idx];
+
+            const int32_t current_group_idx = current_workitem_group->req_id;
+            const int32_t kv_start_pos =
+                current_workitem_group->kv_split_pos_start;
+            const int32_t kv_end_pos = current_workitem_group->kv_split_pos_end;
+            const int32_t curr_spilt_id = current_workitem_group->split_id;
+            const int32_t q_token_id_start =
+                current_workitem_group->q_token_id_start;
+            const int32_t q_token_num = current_workitem_group->q_token_num;
+
+            // taskgroup general information
+            const int32_t q_end = input->query_start_loc[current_group_idx + 1];
+            const int32_t q_start = input->query_start_loc[current_group_idx];
+            const int32_t seq_len = input->seq_lens[current_group_idx];
+            const int32_t q_start_pos =
+                (casual ? seq_len - (q_end - q_start) : 0);
+            const int32_t block_num = (seq_len + block_size - 1) / block_size;
+            // Only apply sink for the first KV split
+            bool use_sink = (s_aux != nullptr &&
+                             current_workitem_group->local_split_id == 0);
+
+            for (int32_t q_token_offset = 0; q_token_offset < q_token_num;
+                 q_token_offset += default_q_tile_token_num) {
+              bool first_iter_flag[AttentionScheduler::MaxQTileIterNum];
+              for (int32_t i = 0; i < AttentionScheduler::MaxQTileIterNum;
+                   ++i) {
+                first_iter_flag[i] = true;
+              }
+
+              const int32_t q_token_start_idx =
+                  q_start + q_token_offset + q_token_id_start;
+              const int32_t actual_q_token_num = std::min(
+                  default_q_tile_token_num, q_token_num - q_token_offset);
+              const int32_t q_head_tile_size =
+                  actual_q_token_num * actual_q_heads_per_kv;
+              const int32_t rounded_q_head_tile_size =
+                  ((q_head_tile_size + max_q_head_num_per_iter - 1) /
+                   max_q_head_num_per_iter) *
+                  max_q_head_num_per_iter;
+              const int32_t kv_tile_size =
+                  AttentionScheduler::calcu_tile_size_with_constant_q(
+                      available_cache_size, head_dim, sizeof(kv_cache_t),
+                      sizeof(q_buffer_t), sizeof(logits_buffer_t),
+                      sizeof(partial_output_buffer_t), max_q_head_num_per_iter,
+                      blocksize_alignment, rounded_q_head_tile_size,
+                      rounded_q_head_tile_size <= max_q_head_num_per_iter);
+
+              // update buffers
+              buffer_manager.update(
+                  head_dim, sizeof(q_buffer_t), sizeof(logits_buffer_t),
+                  sizeof(partial_output_buffer_t), max_q_head_num_per_iter,
+                  rounded_q_head_tile_size, kv_tile_size);
+              q_buffer_t* q_buffer = buffer_manager.get_q_buffer<q_buffer_t>();
+              float* logits_buffer = buffer_manager.get_logits_buffer();
+              float* partial_q_buffer = buffer_manager.get_output_buffer();
+              float* max_buffer = buffer_manager.get_max_buffer();
+              float* sum_buffer = buffer_manager.get_sum_buffer();
+
+              const int32_t q_tile_start_pos =
+                  q_start_pos + q_token_offset + q_token_id_start;
+              const int32_t q_tile_end_pos =
+                  q_tile_start_pos + actual_q_token_num;
+              const auto [kv_tile_start_pos, kv_tile_end_pos] =
+                  AttentionScheduler::calcu_kv_tile_pos(
+                      kv_start_pos, kv_end_pos, q_tile_start_pos,
+                      q_tile_end_pos, sliding_window_left,
+                      sliding_window_right);
+              const auto [rounded_kv_tile_start_pos, rounded_kv_tile_end_pos] =
+                  AttentionScheduler::align_kv_tile_pos(
+                      kv_tile_start_pos, kv_tile_end_pos, blocksize_alignment);
+
+              int32_t curr_kv_head_idx =
+                  use_gqa ? kv_head_idx
+                          : (kv_head_idx /
+                             q_heads_per_kv);  // for GQA disabled case
+
+              // std::printf("thread_id: %d, req_id: %d, q_token_start: %d,
+              // q_token_end: %d, q_head_start: %d, q_head_end: %d, kv_head_idx:
+              // %d, kv_pos_start: %d, kv_pos_end: %d\n",
+              //                 thread_id, current_group_idx,
+              //                 q_token_start_idx, q_token_start_idx +
+              //                 actual_q_token_num, q_head_start_idx,
+              //                 q_head_start_idx + actual_q_heads_per_kv,
+              //                 curr_kv_head_idx, kv_tile_start_pos,
+              //                 kv_tile_end_pos);
+
+              // move buffers
+              kv_cache_t* curr_k_cache =
+                  reinterpret_cast<kv_cache_t*>(input->key_cache) +
+                  curr_kv_head_idx * kv_cache_head_num_stride;
+              kv_cache_t* curr_v_cache =
+                  reinterpret_cast<kv_cache_t*>(input->value_cache) +
+                  curr_kv_head_idx * kv_cache_head_num_stride;
+              query_t* const q_tile_ptr =
+                  reinterpret_cast<query_t*>(input->query) +
+                  q_token_start_idx * q_token_num_stride +
+                  q_head_start_idx * q_head_num_stride;
+              size_t output_buffer_offset =
+                  q_token_start_idx * q_head_num * head_dim +
+                  q_head_start_idx * head_dim;
+              int32_t* curr_block_table =
+                  block_table + current_group_idx * block_table_stride;
+              const float* curr_alibi_slopes =
+                  (alibi_slopes != nullptr ? alibi_slopes + q_head_start_idx
+                                           : nullptr);
+              const c10::BFloat16* curr_s_aux =
+                  (s_aux != nullptr ? s_aux + q_head_start_idx : nullptr);
+
+              // copy the Q tile to q_buffer, the logical layout of q_buffer is
+              // [actual_q_token_num, actual_q_heads_per_kv, head_dim]
+              {
+                attn_impl.copy_q_heads_tile(
+                    q_tile_ptr, q_buffer, actual_q_token_num,
+                    actual_q_heads_per_kv, q_token_num_stride,
+                    q_head_num_stride, scale);
+              }
+
+              if (use_sink) {
+                alignas(64) float s_aux_fp32[16];
+                vec_op::BF16Vec16 vec_bf16(curr_s_aux);
+                vec_op::FP32Vec16 vec_fp32(vec_bf16);
+                vec_fp32.save(s_aux_fp32);
+
+                float* __restrict__ curr_sum_buffer = sum_buffer;
+                float* __restrict__ curr_max_buffer = max_buffer;
+                for (int32_t token_idx = 0; token_idx < actual_q_token_num;
+                     ++token_idx) {
+                  for (int32_t head_idx = 0; head_idx < actual_q_heads_per_kv;
+                       ++head_idx) {
+                    curr_sum_buffer[head_idx] = 1.0f;
+                    curr_max_buffer[head_idx] = s_aux_fp32[head_idx];
+                  }
+
+                  curr_sum_buffer += actual_q_heads_per_kv;
+                  curr_max_buffer += actual_q_heads_per_kv;
+                }
+              } else {
+                float* __restrict__ curr_sum_buffer = sum_buffer;
+                float* __restrict__ curr_max_buffer = max_buffer;
+                for (int32_t token_idx = 0; token_idx < actual_q_token_num;
+                     ++token_idx) {
+                  for (int32_t head_idx = 0; head_idx < actual_q_heads_per_kv;
+                       ++head_idx) {
+                    curr_sum_buffer[head_idx] = 0.0f;
+                    curr_max_buffer[head_idx] =
+                        std::numeric_limits<float>::lowest();
+                  }
+
+                  curr_sum_buffer += actual_q_heads_per_kv;
+                  curr_max_buffer += actual_q_heads_per_kv;
+                }
+              }
+
+              // compute loop
+              for (int32_t kv_tile_pos = rounded_kv_tile_start_pos;
+                   kv_tile_pos < rounded_kv_tile_end_pos;
+                   kv_tile_pos += kv_tile_size) {
+                const int32_t kv_tile_pos_left = kv_tile_pos;
+                const int32_t kv_tile_pos_right = std::min(
+                    kv_tile_pos_left + kv_tile_size, rounded_kv_tile_end_pos);
+                for (int32_t q_head_tile_token_offset = 0;
+                     q_head_tile_token_offset < actual_q_token_num;
+                     q_head_tile_token_offset += max_q_token_num_per_iter) {
+                  const int32_t q_tile_pos_left =
+                      q_tile_start_pos + q_head_tile_token_offset;
+                  const int32_t q_tile_token_num =
+                      std::min(max_q_token_num_per_iter,
+                               actual_q_token_num - q_head_tile_token_offset);
+                  const int32_t q_tile_head_offset =
+                      q_head_tile_token_offset * actual_q_heads_per_kv;
+                  const int32_t q_tile_head_num =
+                      q_tile_token_num * actual_q_heads_per_kv;
+                  const int32_t q_tile_pos_right =
+                      q_tile_pos_left + q_tile_token_num;
+                  const auto [actual_kv_tile_pos_left,
+                              actual_kv_tile_pos_right] =
+                      AttentionScheduler::calcu_kv_tile_pos(
+                          kv_tile_pos_left, kv_tile_pos_right, q_tile_pos_left,
+                          q_tile_pos_right, sliding_window_left,
+                          sliding_window_right);
+                  const int32_t q_iter_idx =
+                      q_head_tile_token_offset / max_q_token_num_per_iter;
+
+                  if (actual_kv_tile_pos_right <= actual_kv_tile_pos_left) {
+                    continue;
+                  }
+
+                  // align kv_pos to blocksize_alignment
+                  const auto [aligned_actual_kv_tile_pos_left,
+                              aligned_actual_kv_tile_pos_right] =
+                      AttentionScheduler::align_kv_tile_pos(
+                          actual_kv_tile_pos_left, actual_kv_tile_pos_right,
+                          blocksize_alignment);
+                  const int32_t actual_kv_token_num =
+                      aligned_actual_kv_tile_pos_right -
+                      aligned_actual_kv_tile_pos_left;
+
+                  //   std::printf("\tq_iter_idx: %d, q_token_start: %d,
+                  //   q_token_end: %d, q_token_num: %d, q_head_num: %d,
+                  //   q_pos_start: %d, q_pos_end: %d, kv_pos_start: %d,
+                  //   kv_pos_end: %d\n",
+                  //             q_iter_idx, q_token_start_idx +
+                  //             q_head_tile_token_offset,  q_token_start_idx +
+                  //             q_head_tile_token_offset + q_tile_token_num,
+                  //             q_tile_token_num, q_tile_head_num,
+                  //             q_tile_pos_left, q_tile_pos_right,
+                  //             aligned_actual_kv_tile_pos_left,
+                  //             aligned_actual_kv_tile_pos_right);
+
+                  // Move buffers
+                  q_buffer_t* curr_q_heads_buffer =
+                      q_buffer + q_tile_head_offset * head_dim;
+                  float* curr_partial_q_buffer =
+                      partial_q_buffer + q_tile_head_offset * head_dim;
+                  float* curr_max_buffer = max_buffer + q_tile_head_offset;
+                  float* curr_sum_buffer = sum_buffer + q_tile_head_offset;
+
+                  bool debug_info = false;
+                  //   bool debug_info = (
+                  //     q_head_start_idx == 4 &&
+                  //     (q_token_start_idx + q_head_tile_token_offset) <=
+                  //     4
+                  //     && (q_token_start_idx + q_head_tile_token_offset +
+                  //     q_tile_token_num) > 4
+                  //   );
+                  // if (debug_info) {
+                  //   std::printf("\tq_iter_idx: %d, q_token_start: %d,"
+                  //   "q_token_end: %d, q_token_num: %d, q_head_num: %d,"
+                  //   "q_pos_start: %d, q_pos_end: %d, kv_pos_start: %d,"
+                  //   "kv_pos_end: %d\n",
+                  //             q_iter_idx, q_token_start_idx +
+                  //             q_head_tile_token_offset,  q_token_start_idx
+                  //             + q_head_tile_token_offset +
+                  //             q_tile_token_num, q_tile_token_num,
+                  //             q_tile_head_num, q_tile_pos_left,
+                  //             q_tile_pos_right,
+                  //             aligned_actual_kv_tile_pos_left,
+                  //             aligned_actual_kv_tile_pos_right);
+                  // }
+
+                  attn_impl.template execute_attention<Attention>(
+                      curr_q_heads_buffer, curr_k_cache, curr_v_cache,
+                      logits_buffer, curr_partial_q_buffer, curr_max_buffer,
+                      curr_sum_buffer, curr_block_table,
+                      aligned_actual_kv_tile_pos_left,
+                      aligned_actual_kv_tile_pos_right, actual_kv_token_num,
+                      kv_cache_block_num_stride, q_tile_head_num,
+                      q_tile_token_num, q_tile_pos_left, actual_q_heads_per_kv,
+                      block_size, sliding_window_left, sliding_window_right,
+                      scale, softcap_scale, curr_alibi_slopes,
+                      first_iter_flag[q_iter_idx], use_sink, debug_info);
+                  first_iter_flag[q_iter_idx] = false;
+                }
+              }
+
+              // write back partial results to output buffer or reduction buffer
+              {
+                if (curr_spilt_id == -1) {
+                  final_output(partial_q_buffer,
+                               reinterpret_cast<query_t*>(input->output) +
+                                   output_buffer_offset,
+                               sum_buffer, actual_q_heads_per_kv,
+                               actual_q_token_num, q_head_num);
+                } else {
+                  const int32_t stride =
+                      actual_q_heads_per_kv * split_kv_q_token_num_threshold;
+                  buffer_manager.update(kv_head_idx, total_reduction_split_num,
+                                        head_dim, stride, sizeof(float));
+                  volatile bool* split_flag_buffer =
+                      buffer_manager.get_reduce_flag_buffer() + curr_spilt_id;
+                  float* split_output_buffer =
+                      buffer_manager.get_reduce_output_buffer() +
+                      curr_spilt_id * stride * head_dim;
+                  float* split_max_buffer =
+                      buffer_manager.get_reduce_max_buffer() +
+                      curr_spilt_id * stride;
+                  float* split_sum_buffer =
+                      buffer_manager.get_reduce_sum_buffer() +
+                      curr_spilt_id * stride;
+
+                  partial_output(partial_q_buffer, max_buffer, sum_buffer,
+                                 q_head_tile_size, split_output_buffer,
+                                 split_max_buffer, split_sum_buffer,
+                                 split_flag_buffer);
+                }
+              }
+            }
+          }
+        } else {
+          task_idx -= workitem_groups_counter_num;
+          const int32_t kv_head_idx = task_idx / reduction_item_num;
+          const int32_t item_offset = task_idx % reduction_item_num;
+          ReductionWorkItemGroup* const curr_workitem_groups =
+              reduction_items + item_offset;
+          const int32_t curr_output_token_idx =
+              curr_workitem_groups->q_token_id_start;
+          const int32_t curr_output_token_num =
+              curr_workitem_groups->q_token_id_num;
+          const int32_t curr_split_id = curr_workitem_groups->split_start_id;
+          const int32_t curr_split_num = curr_workitem_groups->split_num;
+          const int32_t current_group_idx = curr_workitem_groups->req_id;
+          const int32_t curr_output_head_num =
+              curr_output_token_num * actual_q_heads_per_kv;
+
+          const int32_t q_start = input->query_start_loc[current_group_idx];
+          const int32_t q_token_start_idx = q_start + curr_output_token_idx;
+          const int32_t q_head_start_idx = kv_head_idx * actual_q_heads_per_kv;
+          size_t output_buffer_offset =
+              q_token_start_idx * q_head_num * head_dim +
+              q_head_start_idx * head_dim;
+
+          const int32_t stride =
+              actual_q_heads_per_kv * split_kv_q_token_num_threshold;
+          buffer_manager.update(kv_head_idx, total_reduction_split_num,
+                                head_dim, stride, sizeof(float));
+          volatile bool* split_flag_buffer =
+              buffer_manager.get_reduce_flag_buffer() + curr_split_id;
+          float* split_output_buffer =
+              buffer_manager.get_reduce_output_buffer() +
+              curr_split_id * stride * head_dim;
+          float* split_max_buffer =
+              buffer_manager.get_reduce_max_buffer() + curr_split_id * stride;
+          float* split_sum_buffer =
+              buffer_manager.get_reduce_sum_buffer() + curr_split_id * stride;
+
+          reduce_splits(split_output_buffer, split_max_buffer, split_sum_buffer,
+                        split_flag_buffer, stride, curr_output_head_num,
+                        curr_split_num);
+          final_output(
+              split_output_buffer,
+              reinterpret_cast<query_t*>(input->output) + output_buffer_offset,
+              split_sum_buffer, actual_q_heads_per_kv, curr_output_token_num,
+              q_head_num);
+        }
+      }
+    }
+    // Reset counter for next call
+    input->metadata->reset_counter();
+  }
+
+  void reduce_splits(float* __restrict__ split_output_buffer,
+                     float* __restrict__ split_max_buffer,
+                     float* __restrict__ split_sum_buffer,
+                     volatile bool* __restrict__ flags,
+                     const int32_t head_num_per_split,
+                     const int32_t curr_head_num, const int32_t split_num) {
+#ifdef DEFINE_FAST_EXP
+    DEFINE_FAST_EXP
+#endif
+    // restrict curr_head_num <= 16 in the scheduler
+    // elems in split_max_buffer, split_sum_buffer are not cache alignment, use
+    // local buffers to reduce false-sharing
+    alignas(64) float local_max[16];
+    alignas(64) float local_sum[16];
+
+    float* __restrict__ curr_split_output_buffer = split_output_buffer;
+    float* __restrict__ curr_split_max_buffer = split_max_buffer;
+    float* __restrict__ curr_split_sum_buffer = split_sum_buffer;
+    constexpr int32_t head_dim_group_num = head_dim / 16;
+    for (int32_t split_idx = 0; split_idx < split_num; ++split_idx) {
+      while (!flags[split_idx]) {
+#ifdef FAST_SPINNING
+        FAST_SPINNING
+#else
+        std::this_thread::yield();
+#endif
+      }
+      std::atomic_thread_fence(std::memory_order_acquire);
+
+      if (split_idx > 0) {
+        float* __restrict__ curr_output_buffer = split_output_buffer;
+        float* __restrict__ curr_split_output_buffer_iter =
+            curr_split_output_buffer;
+        for (int32_t head_idx = 0; head_idx < curr_head_num; ++head_idx) {
+          float final_max = local_max[head_idx];
+          float curr_max = curr_split_max_buffer[head_idx];
+          float final_sum = local_sum[head_idx];
+          float curr_sum = curr_split_sum_buffer[head_idx];
+          float* __restrict__ non_scale_output_iter =
+              final_max > curr_max ? curr_output_buffer
+                                   : curr_split_output_buffer_iter;
+          float* __restrict__ scale_output_iter =
+              final_max > curr_max ? curr_split_output_buffer_iter
+                                   : curr_output_buffer;
+          float rescale_factor = final_max > curr_max ? curr_max - final_max
+                                                      : final_max - curr_max;
+
+#ifdef DEFINE_FAST_EXP
+          vec_op::FP32Vec16 rescale_factor_vec(rescale_factor);
+          rescale_factor_vec = fast_exp(rescale_factor_vec);
+          rescale_factor = rescale_factor_vec.get_last_elem();
+#else
+          rescale_factor = std::exp(rescale_factor);
+          vec_op::FP32Vec16 rescale_factor_vec(rescale_factor);
+#endif
+
+          local_sum[head_idx] = final_max > curr_max
+                                    ? final_sum + rescale_factor * curr_sum
+                                    : rescale_factor * final_sum + curr_sum;
+
+          final_max = std::max(final_max, curr_max);
+          local_max[head_idx] = final_max;
+          for (int32_t i = 0; i < head_dim_group_num; ++i) {
+            vec_op::FP32Vec16 non_scale_vec(non_scale_output_iter);
+            vec_op::FP32Vec16 scale_vec(scale_output_iter);
+            vec_op::FP32Vec16 final_vec =
+                non_scale_vec + scale_vec * rescale_factor_vec;
+            final_vec.save(curr_output_buffer);
+
+            non_scale_output_iter += 16;
+            scale_output_iter += 16;
+            curr_output_buffer += 16;
+          }
+          curr_split_output_buffer_iter += head_dim;
+        }
+      } else {
+        vec_op::FP32Vec16 final_max(split_max_buffer);
+        final_max.save(local_max);
+        vec_op::FP32Vec16 final_sum(split_sum_buffer);
+        final_sum.save(local_sum);
+      }
+
+      curr_split_output_buffer += head_num_per_split * head_dim;
+      curr_split_max_buffer += head_num_per_split;
+      curr_split_sum_buffer += head_num_per_split;
+    }
+    // write back final max and sum
+    for (int32_t i = 0; i < curr_head_num; ++i) {
+      split_max_buffer[i] = local_max[i];
+      split_sum_buffer[i] = local_sum[i];
+    }
+  }
+
+  void partial_output(float* __restrict__ partial_output_buffer,
+                      float* __restrict__ partial_max_buffer,
+                      float* __restrict__ partial_sum_buffer,
+                      int32_t curr_head_num,
+                      float* __restrict__ split_output_buffer,
+                      float* __restrict__ split_max_buffer,
+                      float* __restrict__ split_sum_buffer,
+                      volatile bool* __restrict__ flag) {
+    float* __restrict__ curr_partial_output_buffer = partial_output_buffer;
+    float* __restrict__ curr_split_output_buffer = split_output_buffer;
+    constexpr int32_t head_dim_group_num = head_dim / 16;
+    for (int32_t i = 0; i < curr_head_num; ++i) {
+      split_max_buffer[i] = partial_max_buffer[i];
+      split_sum_buffer[i] = partial_sum_buffer[i];
+      for (int32_t j = 0; j < head_dim_group_num; ++j) {
+        vec_op::FP32Vec16 vec(curr_partial_output_buffer);
+        vec.save(curr_split_output_buffer);
+
+        curr_partial_output_buffer += 16;
+        curr_split_output_buffer += 16;
+      }
+    }
+    std::atomic_thread_fence(std::memory_order_release);
+    *flag = true;
+  }
+
+  void final_output(float* __restrict__ partial_q_buffer,
+                    query_t* __restrict__ curr_output_buffer,
+                    float* __restrict__ sum_buffer,
+                    const int32_t q_heads_per_kv,
+                    const int32_t actual_q_token_num,
+                    const int32_t q_head_num) {
+    // final output
+    using output_vec_t = typename VecTypeTrait<query_t>::vec_t;
+
+    float* __restrict__ curr_partial_output_buffer = partial_q_buffer;
+    float* __restrict__ curr_sum_buffer = sum_buffer;
+    constexpr int32_t group_num_per_head = head_dim / 16;
+    const int32_t partial_q_buffer_stride = q_heads_per_kv * head_dim;
+    const int32_t output_buffer_stride = q_head_num * head_dim;
+    for (int32_t token_idx = 0; token_idx < actual_q_token_num; ++token_idx) {
+      float* __restrict__ curr_partial_output_buffer_iter =
+          curr_partial_output_buffer;
+      query_t* __restrict__ curr_output_buffer_iter = curr_output_buffer;
+      for (int32_t head_idx = 0; head_idx < q_heads_per_kv; ++head_idx) {
+        vec_op::FP32Vec16 inv_sum_scale_vec(1.0 / *curr_sum_buffer);
+
+        for (int32_t i = 0; i < group_num_per_head; ++i) {
+          vec_op::FP32Vec16 vec(curr_partial_output_buffer_iter);
+          // divide the final sum val of softmax here
+          vec = inv_sum_scale_vec * vec;
+
+          // cast to query type
+          output_vec_t output_vec(vec);
+          output_vec.save(curr_output_buffer_iter);
+
+          // update
+          curr_partial_output_buffer_iter += 16;
+          curr_output_buffer_iter += 16;
+        }
+
+        // update
+        curr_sum_buffer += 1;
+      }
+
+      // update
+      curr_partial_output_buffer += partial_q_buffer_stride;
+      curr_output_buffer += output_buffer_stride;
+    }
+  }
+};
+
+}  // namespace cpu_attention
+
+#endif
diff --git a/csrc/cpu/cpu_attn_macros.h b/csrc/cpu/cpu_attn_macros.h
new file mode 100644
index 000000000000..6458e4341937
--- /dev/null
+++ b/csrc/cpu/cpu_attn_macros.h
@@ -0,0 +1,63 @@
+#ifndef CPU_ATTN_MACROS_H
+#define CPU_ATTN_MACROS_H
+
+// x86_64
+#ifdef __x86_64__
+  #define FAST_SPINNING _mm_pause();
+
+  #ifdef __AVX512F__
+    #define DEFINE_FAST_EXP                                                    \
+      const __m512 vec_factorial_1 = _mm512_set1_ps(0.999999701f);             \
+      const __m512 vec_factorial_2 = _mm512_set1_ps(0.499991506f);             \
+      const __m512 vec_factorial_3 = _mm512_set1_ps(0.166676521f);             \
+      const __m512 vec_factorial_4 = _mm512_set1_ps(0.0418978221f);            \
+      const __m512 vec_factorial_5 = _mm512_set1_ps(0.00828929059f);           \
+      const __m512 vec_exp_log2ef =                                            \
+          _mm512_castsi512_ps(_mm512_set1_epi32(0x3fb8aa3b));                  \
+      const __m512 vec_half = _mm512_set1_ps(0.5f);                            \
+      const __m512 vec_one = _mm512_set1_ps(1.f);                              \
+      const __m512 vec_zero = _mm512_set1_ps(0.f);                             \
+      const __m512 vec_two = _mm512_set1_ps(2.f);                              \
+      const __m512 vec_ln2f =                                                  \
+          _mm512_castsi512_ps(_mm512_set1_epi32(0x3f317218));                  \
+      const __m512 vec_ln_flt_min =                                            \
+          _mm512_castsi512_ps(_mm512_set1_epi32(0xc2aeac50));                  \
+      const __m512 vec_ln_flt_max =                                            \
+          _mm512_castsi512_ps(_mm512_set1_epi32(0x42b17218));                  \
+      const __m512i vec_127 = _mm512_set1_epi32(0x0000007f);                   \
+      const int n_mantissa_bits = 23;                                          \
+      auto fast_exp = [&](vec_op::FP32Vec16& vec) __attribute__((              \
+                          always_inline)) {                                    \
+        __m512 values = vec.reg;                                               \
+        auto less_ln_flt_min_mask =                                            \
+            _mm512_cmp_ps_mask(values, vec_ln_flt_min, 1 /*_CMP_LT_OS*/);      \
+        auto vec_src = _mm512_min_ps(values, vec_ln_flt_max);                  \
+        vec_src = _mm512_max_ps(vec_src, vec_ln_flt_min);                      \
+        auto vec_fx = _mm512_fmadd_ps(vec_src, vec_exp_log2ef, vec_half);      \
+        auto vec_fx_i = _mm512_cvt_roundps_epi32(                              \
+            vec_fx, _MM_FROUND_TO_NEG_INF | _MM_FROUND_NO_EXC);                \
+        vec_fx = _mm512_cvtepi32_ps(vec_fx_i);                                 \
+        auto vec_exp_poly = _mm512_fnmadd_ps(vec_fx, vec_ln2f, vec_src);       \
+        auto vec_res =                                                         \
+            _mm512_fmadd_ps(vec_exp_poly, vec_factorial_5, vec_factorial_4);   \
+        vec_res = _mm512_fmadd_ps(vec_exp_poly, vec_res, vec_factorial_3);     \
+        vec_res = _mm512_fmadd_ps(vec_exp_poly, vec_res, vec_factorial_2);     \
+        vec_res = _mm512_fmadd_ps(vec_exp_poly, vec_res, vec_factorial_1);     \
+        vec_res = _mm512_fmadd_ps(vec_exp_poly, vec_res, vec_one);             \
+        auto vec_exp_number = _mm512_sub_ps(vec_fx, vec_one);                  \
+        auto vec_exp_number_i = _mm512_cvtps_epi32(vec_exp_number);            \
+        auto vec_two_pow_n_i = _mm512_add_epi32(vec_exp_number_i, vec_127);    \
+        vec_two_pow_n_i = _mm512_slli_epi32(vec_two_pow_n_i, n_mantissa_bits); \
+        auto vec_two_pow_n = _mm512_castsi512_ps(vec_two_pow_n_i);             \
+        vec_two_pow_n = _mm512_mask_blend_ps(less_ln_flt_min_mask,             \
+                                             vec_two_pow_n, vec_zero);         \
+        vec_res = _mm512_mul_ps(vec_res, vec_two_pow_n);                       \
+        vec_res = _mm512_mul_ps(vec_res, vec_two);                             \
+        vec_op::FP32Vec16 res(vec_res);                                        \
+        return res;                                                            \
+      };
+  #endif
+
+#endif
+
+#endif
\ No newline at end of file
diff --git a/csrc/cpu/cpu_attn_vec.hpp b/csrc/cpu/cpu_attn_vec.hpp
new file mode 100644
index 000000000000..479313f0e19f
--- /dev/null
+++ b/csrc/cpu/cpu_attn_vec.hpp
@@ -0,0 +1,248 @@
+#ifndef CPU_ATTN_VEC_HPP
+#define CPU_ATTN_VEC_HPP
+
+#include "cpu_attn_impl.hpp"
+
+namespace cpu_attention {
+
+namespace {
+// 8-2-16 pattern, 8 regs for A, 2 regs for B, 16 regs for C, [8, K] @ [k, 32]
+template <typename kv_cache_t>
+class TileGemm82 {
+ public:
+  template <AttentionGemmPhase phase, int32_t k_size>
+  FORCE_INLINE static void gemm(const int32_t m_size,
+                                float* __restrict__ a_tile,
+                                kv_cache_t* __restrict__ b_tile,
+                                float* __restrict__ c_tile, const int64_t lda,
+                                const int64_t ldb, const int64_t ldc,
+                                const int32_t block_size,
+                                const int32_t dynamic_k_size,
+                                const bool accum_c) {
+    switch (m_size) {
+      case 1:
+        gemm_micro<1>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+      case 2:
+        gemm_micro<2>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+      case 3:
+      case 4:
+        gemm_micro<4>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+      case 5:
+      case 6:
+        gemm_micro<6>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+      case 7:
+      case 8:
+        gemm_micro<8>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+    }
+  }
+
+  template <int32_t M>
+  static void gemm_micro(float* __restrict__ a_tile,
+                         kv_cache_t* __restrict__ b_tile,
+                         float* __restrict__ c_tile, const int64_t lda,
+                         const int64_t ldb, const int64_t ldc,
+                         const int32_t block_size, const int32_t dynamic_k_size,
+                         const bool accum_c) {
+    static_assert(0 < M <= 8);
+    using load_vec_t = typename VecTypeTrait<kv_cache_t>::vec_t;
+
+    kv_cache_t* __restrict__ curr_b_0 = b_tile;
+    kv_cache_t* __restrict__ curr_b_1 = b_tile + 16;
+    float* __restrict__ curr_c_0 = c_tile;
+    float* __restrict__ curr_c_1 = c_tile + 16;
+
+    vec_op::FP32Vec16 c_regs[M * 2];
+    if (accum_c) {
+      float* __restrict__ curr_m_c_0 = curr_c_0;
+      float* __restrict__ curr_m_c_1 = curr_c_1;
+      vec_op::unroll_loop<int32_t, M>([&](int32_t i) {
+        c_regs[i * 2] = vec_op::FP32Vec16(curr_m_c_0);
+        c_regs[i * 2 + 1] = vec_op::FP32Vec16(curr_m_c_1);
+
+        // update
+        curr_m_c_0 += ldc;
+        curr_m_c_1 += ldc;
+      });
+    }
+
+    float* __restrict__ curr_a = a_tile;
+    for (int32_t k = 0; k < dynamic_k_size; ++k) {
+      load_vec_t b_0_reg(curr_b_0);
+      vec_op::FP32Vec16 fp32_b_0_reg(b_0_reg);
+      load_vec_t b_1_reg(curr_b_1);
+      vec_op::FP32Vec16 fp32_b_1_reg(b_1_reg);
+
+      float* __restrict__ curr_m_a = curr_a;
+      vec_op::unroll_loop<int32_t, M>([&](int32_t i) {
+        float v = *curr_m_a;
+        vec_op::FP32Vec16 a_reg(v);
+        c_regs[i * 2] = c_regs[i * 2] + a_reg * fp32_b_0_reg;
+        c_regs[i * 2 + 1] = c_regs[i * 2 + 1] + a_reg * fp32_b_1_reg;
+
+        // update
+        curr_m_a += lda;
+      });
+
+      // update
+      curr_a += 1;
+      curr_b_0 += ldb;
+      curr_b_1 += ldb;
+    }
+
+    vec_op::unroll_loop<int32_t, M>([&](int32_t i) {
+      c_regs[i * 2].save(curr_c_0);
+      c_regs[i * 2 + 1].save(curr_c_1);
+
+      // update
+      curr_c_0 += ldc;
+      curr_c_1 += ldc;
+    });
+  }
+};
+}  // namespace
+
+// This is a general but naive implementation based on vector instructions
+template <typename scalar_t, int64_t head_dim>
+class AttentionImpl<ISA::VEC, scalar_t, head_dim> {
+ public:
+  using query_t = scalar_t;
+  using q_buffer_t = float;
+  using kv_cache_t = scalar_t;
+  using logits_buffer_t = float;
+  using partial_output_buffer_t = float;
+  using prob_buffer_t = float;
+
+  constexpr static int64_t BlockSizeAlignment =
+      32;  // KV token num unit of QK and PV phases
+  constexpr static int64_t HeadDimAlignment =
+      32;  // headdim num unit of PV phase
+  constexpr static int64_t MaxQHeadNumPerIteration = 8;
+  constexpr static int64_t HeadDim = head_dim;
+  constexpr static ISA ISAType = ISA::VEC;
+  constexpr static bool scale_on_logits = false;  // apply scale on q_buffer
+
+ public:
+  template <template <typename tile_gemm_t> typename attention>
+  FORCE_INLINE void execute_attention(DEFINE_CPU_ATTENTION_PARAMS) {
+    attention<TileGemm82<kv_cache_t>> attention_iteration;
+    attention_iteration(CPU_ATTENTION_PARAMS);
+  }
+
+  // k_cache_token_group_stride: stride of K cache when move to next
+  // BlockSizeAlignment tokens in a block
+  constexpr static int64_t k_cache_token_group_stride(
+      const int32_t block_size) {
+    return BlockSizeAlignment;  // layout of k_cache block is [head_dim,
+                                // block_size], row-major
+  }
+
+  // v_cache_token_group_stride: stride of V cache when move to next
+  // BlockSizeAlignment tokens in a block
+  constexpr static int64_t v_cache_token_group_stride(
+      const int32_t block_size) {
+    return head_dim * BlockSizeAlignment;  // layout of v_cache is [block_size,
+                                           // head_dim], row-major
+  }
+
+  // v_cache_head_group_stride: stride of V cache when move to next
+  // HeadDimAlignment head dims in a block
+  constexpr static int64_t v_cache_head_group_stride(const int32_t block_size) {
+    return HeadDimAlignment;  // layout of v_cache is [block_size, head_dim],
+                              // row-major
+  }
+
+  // Copy q to q_buffer and cast it to fp32
+  static void copy_q_heads_tile(
+      scalar_t* __restrict__ src,  // [q_num, q_heads_per_kv, head_size]
+      float* __restrict__ q_buffer, const int32_t q_num,
+      const int32_t q_heads_per_kv, const int64_t q_num_stride,
+      const int64_t q_head_stride, float scale) {
+    static_assert(head_dim % 16 == 0);
+    constexpr int32_t unroll_size = head_dim / 16;
+    using load_vec_t = typename VecTypeTrait<scalar_t>::vec_t;
+
+    vec_op::FP32Vec16 scale_vec(scale);
+    for (int32_t q_num_idx = 0; q_num_idx < q_num; ++q_num_idx) {
+      for (int32_t q_head_idx = 0; q_head_idx < q_heads_per_kv; ++q_head_idx) {
+        scalar_t* __restrict__ curr_q =
+            src + q_num_idx * q_num_stride + q_head_idx * q_head_stride;
+        float* __restrict__ curr_q_buffer =
+            q_buffer + q_num_idx * q_heads_per_kv * head_dim +
+            q_head_idx * head_dim;
+
+        vec_op::unroll_loop<int32_t, unroll_size>([&](int32_t i) {
+          load_vec_t vec(curr_q);
+          vec_op::FP32Vec16 fp32_vec(vec);
+          fp32_vec = fp32_vec * scale_vec;
+          fp32_vec.save(curr_q_buffer);
+
+          curr_q += 16;
+          curr_q_buffer += 16;
+        });
+      }
+    }
+  }
+
+  // reshape K as column-major and V as row-major
+  static void reshape_and_cache(
+      const scalar_t* __restrict__ key, const scalar_t* __restrict__ value,
+      scalar_t* __restrict__ key_cache, scalar_t* __restrict__ value_cache,
+      const int64_t* __restrict__ slot_mapping, const int64_t token_num,
+      const int64_t key_token_num_stride, const int64_t value_token_num_stride,
+      const int64_t head_num, const int64_t key_head_num_stride,
+      const int64_t value_head_num_stride, const int64_t num_blocks,
+      const int64_t num_blocks_stride, const int64_t cache_head_num_stride,
+      const int64_t block_size, const int64_t block_size_stride) {
+#pragma omp parallel for collapse(2)
+    for (int64_t token_idx = 0; token_idx < token_num; ++token_idx) {
+      for (int64_t head_idx = 0; head_idx < head_num; ++head_idx) {
+        const int64_t pos = slot_mapping[token_idx];
+        if (pos < 0) {
+          // skip
+          continue;
+        }
+
+        const int64_t block_idx = pos / block_size;
+        const int64_t block_offset = pos % block_size;
+        {
+          // Write Key as column-major
+          const scalar_t* key_start_ptr = key +
+                                          token_idx * key_token_num_stride +
+                                          head_idx * key_head_num_stride;
+          scalar_t* key_cache_start_ptr =
+              key_cache + block_idx * num_blocks_stride +
+              head_idx * cache_head_num_stride + block_offset;
+
+#pragma GCC unroll 8
+          for (int64_t i = 0, j = 0; i < head_dim; ++i, j += block_size) {
+            key_cache_start_ptr[j] = key_start_ptr[i];
+          }
+        }
+        {
+          // Write Value as row-major
+          const scalar_t* value_start_ptr = value +
+                                            token_idx * value_token_num_stride +
+                                            head_idx * value_head_num_stride;
+          scalar_t* value_cache_start_ptr =
+              value_cache + block_idx * num_blocks_stride +
+              head_idx * cache_head_num_stride + block_offset * head_dim;
+          std::memcpy(value_cache_start_ptr, value_start_ptr,
+                      sizeof(scalar_t) * head_dim);
+        }
+      }
+    }
+  }
+};
+}  // namespace cpu_attention
+
+#endif
diff --git a/csrc/cpu/cpu_attn_vec16.hpp b/csrc/cpu/cpu_attn_vec16.hpp
new file mode 100644
index 000000000000..7402312c0924
--- /dev/null
+++ b/csrc/cpu/cpu_attn_vec16.hpp
@@ -0,0 +1,171 @@
+#ifndef CPU_ATTN_VEC16_HPP
+#define CPU_ATTN_VEC16_HPP
+
+#include "cpu_attn_vec.hpp"
+
+namespace cpu_attention {
+
+namespace {
+// 16-1-16 pattern, 16 regs for A, 1 regs for B, 16 regs for C, [16, K] @ [k,
+// 16]
+template <typename kv_cache_t>
+class TileGemm161 {
+ public:
+  template <AttentionGemmPhase phase, int32_t k_size>
+  FORCE_INLINE static void gemm(const int32_t m_size,
+                                float* __restrict__ a_tile,
+                                kv_cache_t* __restrict__ b_tile,
+                                float* __restrict__ c_tile, const int64_t lda,
+                                const int64_t ldb, const int64_t ldc,
+                                const int32_t block_size,
+                                const int32_t dynamic_k_size,
+                                const bool accum_c) {
+    switch (m_size) {
+      case 1:
+        gemm_micro<1>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+      case 2:
+        gemm_micro<2>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+      case 3:
+      case 4:
+        gemm_micro<4>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+      case 5:
+      case 6:
+        gemm_micro<6>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+      case 7:
+      case 8:
+        gemm_micro<8>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                      dynamic_k_size, accum_c);
+        break;
+      case 9:
+      case 10:
+      case 11:
+      case 12:
+        gemm_micro<12>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                       dynamic_k_size, accum_c);
+        break;
+      case 13:
+      case 14:
+      case 15:
+      case 16:
+        gemm_micro<16>(a_tile, b_tile, c_tile, lda, ldb, ldc, block_size,
+                       dynamic_k_size, accum_c);
+        break;
+    }
+  }
+
+  template <int32_t M>
+  static void gemm_micro(float* __restrict__ a_tile,
+                         kv_cache_t* __restrict__ b_tile,
+                         float* __restrict__ c_tile, const int64_t lda,
+                         const int64_t ldb, const int64_t ldc,
+                         const int32_t block_size, const int32_t dynamic_k_size,
+                         const bool accum_c) {
+    static_assert(0 < M <= 16);
+    using load_vec_t = typename VecTypeTrait<kv_cache_t>::vec_t;
+
+    kv_cache_t* __restrict__ curr_b_0 = b_tile;
+    float* __restrict__ curr_c_0 = c_tile;
+
+    vec_op::FP32Vec16 c_regs[M];
+    if (accum_c) {
+      float* __restrict__ curr_m_c_0 = curr_c_0;
+      vec_op::unroll_loop<int32_t, M>([&](int32_t i) {
+        c_regs[i] = vec_op::FP32Vec16(curr_m_c_0);
+
+        // update
+        curr_m_c_0 += ldc;
+      });
+    }
+
+    float* __restrict__ curr_a = a_tile;
+    for (int32_t k = 0; k < dynamic_k_size; ++k) {
+      load_vec_t b_0_reg(curr_b_0);
+      vec_op::FP32Vec16 fp32_b_0_reg(b_0_reg);
+
+      float* __restrict__ curr_m_a = curr_a;
+      vec_op::unroll_loop<int32_t, M>([&](int32_t i) {
+        float v = *curr_m_a;
+        vec_op::FP32Vec16 a_reg(v);
+        c_regs[i] = c_regs[i] + a_reg * fp32_b_0_reg;
+
+        // update
+        curr_m_a += lda;
+      });
+
+      // update
+      curr_a += 1;
+      curr_b_0 += ldb;
+    }
+
+    vec_op::unroll_loop<int32_t, M>([&](int32_t i) {
+      c_regs[i].save(curr_c_0);
+
+      // update
+      curr_c_0 += ldc;
+    });
+  }
+};
+}  // namespace
+
+// This is a general but naive implementation based on vector instructions
+template <typename scalar_t, int64_t head_dim>
+class AttentionImpl<ISA::VEC16, scalar_t, head_dim>
+    : public AttentionImpl<ISA::VEC, scalar_t, head_dim> {
+ public:
+  using query_t = scalar_t;
+  using q_buffer_t = float;
+  using kv_cache_t = scalar_t;
+  using logits_buffer_t = float;
+  using partial_output_buffer_t = float;
+  using prob_buffer_t = float;
+
+  constexpr static int64_t BlockSizeAlignment =
+      16;  // KV token num unit of QK and PV phases
+  constexpr static int64_t HeadDimAlignment =
+      16;  // headdim num unit of PV phase
+  constexpr static int64_t MaxQHeadNumPerIteration = 16;
+  constexpr static int64_t HeadDim = head_dim;
+  constexpr static ISA ISAType = ISA::VEC16;
+  constexpr static bool scale_on_logits = false;  // apply scale on q_buffer
+
+ public:
+  template <template <typename tile_gemm_t> typename attention>
+  FORCE_INLINE void execute_attention(DEFINE_CPU_ATTENTION_PARAMS) {
+    attention<TileGemm161<kv_cache_t>> attention_iteration;
+    attention_iteration(CPU_ATTENTION_PARAMS);
+  }
+
+  // k_cache_token_group_stride: stride of K cache when move to next
+  // BlockSizeAlignment tokens in a block
+  constexpr static int64_t k_cache_token_group_stride(
+      const int32_t block_size) {
+    return BlockSizeAlignment;  // layout of k_cache block is [head_dim,
+                                // block_size], row-major
+  }
+
+  // v_cache_token_group_stride: stride of V cache when move to next
+  // BlockSizeAlignment tokens in a block
+  constexpr static int64_t v_cache_token_group_stride(
+      const int32_t block_size) {
+    return head_dim * BlockSizeAlignment;  // layout of v_cache is [block_size,
+                                           // head_dim], row-major
+  }
+
+  // v_cache_head_group_stride: stride of V cache when move to next
+  // HeadDimAlignment head dims in a block
+  constexpr static int64_t v_cache_head_group_stride(const int32_t block_size) {
+    return HeadDimAlignment;  // layout of v_cache is [block_size, head_dim],
+                              // row-major
+  }
+};
+}  // namespace cpu_attention
+
+#endif
diff --git a/csrc/cpu/cpu_types_x86.hpp b/csrc/cpu/cpu_types_x86.hpp
index 982f7c07a13b..7ddf028e6e13 100644
--- a/csrc/cpu/cpu_types_x86.hpp
+++ b/csrc/cpu/cpu_types_x86.hpp
@@ -40,6 +40,23 @@ namespace vec_op {
 
 #define FORCE_INLINE __attribute__((always_inline)) inline
 
+// Function to get the timestamp using RDTSCP
+FORCE_INLINE uint64_t bench_timestamp() {
+  unsigned int cycles_low, cycles_high;
+  asm volatile(
+      ".intel_syntax noprefix\n\t"
+      "CPUID\n\t"        // Serialize instruction stream to ensure previous
+                         // instructions complete
+      "RDTSCP\n\t"       // Read TSC and core ID
+      "mov %0, edx\n\t"  // Store high 32 bits of TSC
+      "mov %1, eax\n\t"  // Store low 32 bits of TSC
+      ".att_syntax"
+      : "=r"(cycles_high), "=r"(cycles_low)::"rax", "rbx", "rcx",
+        "rdx"  // Clobbered registers
+  );
+  return (uint64_t)cycles_high << 32 | cycles_low;
+}
+
 namespace {
 template <typename T, T... indexes, typename F>
 constexpr void unroll_loop_item(std::integer_sequence<T, indexes...>, F&& f) {
@@ -407,6 +424,8 @@ struct FP32Vec16 : public Vec<FP32Vec16> {
 
   float reduce_min() const { return _mm512_reduce_min_ps(reg); }
 
+  float get_last_elem() const { return _mm512_cvtss_f32(reg); }
+
   template <int group_size>
   float reduce_sub_sum(int idx) {
     static_assert(VEC_ELEM_NUM % group_size == 0);
@@ -446,9 +465,6 @@ struct FP32Vec16 : public Vec<FP32Vec16> {
 
   explicit FP32Vec16(__m256 low, __m256 high) : reg_low(low), reg_high(high) {}
 
-  explicit FP32Vec16(const FP32Vec16& data)
-      : reg_low(data.reg_low), reg_high(data.reg_high) {}
-
   explicit FP32Vec16(const FP32Vec4& data)
       : reg_low((__m256)_mm256_inserti128_si256(
             _mm256_castsi128_si256((__m128i)data.reg), (__m128i)data.reg, 1)),
@@ -504,6 +520,32 @@ struct FP32Vec16 : public Vec<FP32Vec16> {
                      _mm256_div_ps(reg_high, b.reg_high));
   }
 
+  FP32Vec16 max(const FP32Vec16& b) const {
+    return FP32Vec16(_mm256_max_ps(reg_low, b.reg_low),
+                     _mm256_max_ps(reg_high, b.reg_high));
+  }
+
+  float reduce_max() const {
+    __m256 v = _mm256_max_ps(reg_low, reg_high);
+    // Permute to compare elements within 128-bit lanes
+    __m256 v_shuffled = _mm256_permute_ps(
+        v, 0b00001011);  // Swap halves within each 128-bit lane
+    __m256 v_max = _mm256_max_ps(v, v_shuffled);
+
+    v_shuffled = _mm256_permute_ps(
+        v_max, 0b00000001);  // Shuffle elements within each 128-bit lane
+    v_max = _mm256_max_ps(v_max, v_shuffled);
+
+    // Permute to compare elements between 128-bit lanes
+    v_shuffled =
+        _mm256_permute2f128_ps(v_max, v_max, 0b00000001);  // Swap 128-bit lanes
+    v_max = _mm256_max_ps(v_max, v_shuffled);
+
+    // At this point, the maximum value is present in all elements of v_max.
+    // Extract the first element for the scalar result.
+    return _mm256_cvtss_f32(v_max);  // Extract the lowest 32-bit float
+  }
+
   float reduce_sum() const {
     FP32Vec8 low = FP32Vec8(reg_low);
     FP32Vec8 high = FP32Vec8(reg_high);
@@ -642,7 +684,7 @@ inline FP16Vec16::FP16Vec16(const FP32Vec16& v)
 inline FP16Vec16::FP16Vec16(const FP32Vec16& v)
     : reg(_mm256_insertf128_si256(
           _mm256_castsi128_si256(FP16Vec8(FP32Vec8(v.reg_low)).reg),
-          FP16Vec8(FP32Vec8(v.reg_low)).reg, 1)) {}
+          FP16Vec8(FP32Vec8(v.reg_high)).reg, 1)) {}
 #endif
 
 #ifdef __AVX512BF16__
diff --git a/csrc/cpu/dnnl_helper.cpp b/csrc/cpu/dnnl_helper.cpp
index bb43aeee2eaf..02a8072ccf30 100644
--- a/csrc/cpu/dnnl_helper.cpp
+++ b/csrc/cpu/dnnl_helper.cpp
@@ -5,6 +5,7 @@
 #include "common/memory.hpp"
 
 #include "dnnl_helper.h"
+#include "scratchpad_manager.h"
 
 static dnnl::engine& default_engine() {
   static dnnl::engine engine(dnnl::engine::kind::cpu, 0);
@@ -22,23 +23,6 @@ void release_dnnl_matmul_handler(int64_t handler) {
   delete ptr;
 }
 
-DNNLScratchPadManager::DNNLScratchPadManager() : size_(0), ptr_(nullptr) {
-  this->realloc(allocation_unit * 128);
-}
-
-void DNNLScratchPadManager::realloc(size_t new_size) {
-  new_size = round(new_size);
-  if (new_size > size_) {
-    ptr_ = std::aligned_alloc(64, new_size);
-    size_ = new_size;
-  }
-}
-
-DNNLScratchPadManager* DNNLScratchPadManager::get_dnnl_scratchpad_manager() {
-  static DNNLScratchPadManager manager;
-  return &manager;
-}
-
 template <typename KT, typename VT>
 class DNNLPrimitiveCache {
  public:
diff --git a/csrc/cpu/dnnl_helper.h b/csrc/cpu/dnnl_helper.h
index 58ffe7a19bd4..b841ed73058e 100644
--- a/csrc/cpu/dnnl_helper.h
+++ b/csrc/cpu/dnnl_helper.h
@@ -59,30 +59,6 @@ constexpr inline dnnl::memory::data_type get_dnnl_type() {
   return DNNLType<std::decay_t<T>>::type;
 }
 
-class DNNLScratchPadManager {
- public:
-  static constexpr size_t allocation_unit = 4 * 1024 * 1024;  // 4KB
-
-  static DNNLScratchPadManager* get_dnnl_scratchpad_manager();
-
-  DNNLScratchPadManager();
-
-  template <typename T>
-  T* get_data() {
-    return reinterpret_cast<T*>(ptr_);
-  }
-
-  static size_t round(size_t size) {
-    return ((size + allocation_unit - 1) / allocation_unit) * allocation_unit;
-  }
-
-  void realloc(size_t new_size);
-
- private:
-  size_t size_;
-  void* ptr_;
-};
-
 class DNNLMatMulPrimitiveHandler {
  public:
   virtual ~DNNLMatMulPrimitiveHandler() = default;
diff --git a/csrc/cpu/scratchpad_manager.cpp b/csrc/cpu/scratchpad_manager.cpp
new file mode 100644
index 000000000000..05cd435f34b7
--- /dev/null
+++ b/csrc/cpu/scratchpad_manager.cpp
@@ -0,0 +1,23 @@
+#include <cstdlib>
+
+#include "scratchpad_manager.h"
+
+DNNLScratchPadManager::DNNLScratchPadManager() : size_(0), ptr_(nullptr) {
+  this->realloc(allocation_unit * 128);
+}
+
+void DNNLScratchPadManager::realloc(size_t new_size) {
+  new_size = round(new_size);
+  if (new_size > size_) {
+    if (ptr_ != nullptr) {
+      std::free(ptr_);
+    }
+    ptr_ = std::aligned_alloc(64, new_size);
+    size_ = new_size;
+  }
+}
+
+DNNLScratchPadManager* DNNLScratchPadManager::get_dnnl_scratchpad_manager() {
+  static DNNLScratchPadManager manager;
+  return &manager;
+}
diff --git a/csrc/cpu/scratchpad_manager.h b/csrc/cpu/scratchpad_manager.h
new file mode 100644
index 000000000000..0ecf59192f84
--- /dev/null
+++ b/csrc/cpu/scratchpad_manager.h
@@ -0,0 +1,31 @@
+#ifndef SCRATCHPAD_MANAGER_H
+#define SCRATCHPAD_MANAGER_H
+
+#include <cstddef>
+#include <cstdio>
+
+class DNNLScratchPadManager {
+ public:
+  static constexpr size_t allocation_unit = 4 * 1024;  // 4KB
+
+  static DNNLScratchPadManager* get_dnnl_scratchpad_manager();
+
+  DNNLScratchPadManager();
+
+  template <typename T>
+  T* get_data() {
+    return reinterpret_cast<T*>(ptr_);
+  }
+
+  static size_t round(size_t size) {
+    return ((size + allocation_unit - 1) / allocation_unit) * allocation_unit;
+  }
+
+  void realloc(size_t new_size);
+
+ private:
+  size_t size_;
+  void* ptr_;
+};
+
+#endif
diff --git a/csrc/cpu/shm.cpp b/csrc/cpu/shm.cpp
index 7e64e1c52198..e43aa203777a 100644
--- a/csrc/cpu/shm.cpp
+++ b/csrc/cpu/shm.cpp
@@ -192,7 +192,7 @@ class SHMManager {
                       const int group_size)
       : _rank(rank),
         _group_size(group_size),
-        _thread_num(torch::get_num_threads()),
+        _thread_num(omp_get_max_threads()),
         _shm_names({""}),
         _shared_mem_ptrs({nullptr}),
         _shm_ctx(nullptr) {
diff --git a/csrc/cpu/torch_bindings.cpp b/csrc/cpu/torch_bindings.cpp
index 9df19d1ac392..5e2aa7069256 100644
--- a/csrc/cpu/torch_bindings.cpp
+++ b/csrc/cpu/torch_bindings.cpp
@@ -74,25 +74,35 @@ at::Tensor int8_scaled_mm_with_quant(at::Tensor& mat1, at::Tensor& mat2,
                                      const std::optional<at::Tensor>& bias,
                                      at::ScalarType out_dtype, bool is_vnni);
 
+torch::Tensor get_scheduler_metadata(
+    const int64_t num_req, const int64_t num_heads_q,
+    const int64_t num_heads_kv, const int64_t head_dim,
+    const torch::Tensor& seq_lens, at::ScalarType dtype,
+    const torch::Tensor& query_start_loc, const bool casual,
+    const int64_t window_size, const std::string& isa_hint,
+    const bool enable_kv_split);
+
+void cpu_attn_reshape_and_cache(const torch::Tensor& key,
+                                const torch::Tensor& value,
+                                torch::Tensor& key_cache,
+                                torch::Tensor& value_cache,
+                                const torch::Tensor& slot_mapping,
+                                const std::string& isa);
+
+void cpu_attention_with_kv_cache(
+    const torch::Tensor& query, const torch::Tensor& key_cache,
+    const torch::Tensor& value_cache, torch::Tensor& output,
+    const torch::Tensor& query_start_loc, const torch::Tensor& seq_lens,
+    const double scale, const bool causal,
+    const std::optional<torch::Tensor>& alibi_slopes,
+    const int64_t sliding_window_left, const int64_t sliding_window_right,
+    const torch::Tensor& block_table, const double softcap,
+    const torch::Tensor& scheduler_metadata,
+    const std::optional<torch::Tensor>& s_aux);
+
 TORCH_LIBRARY_EXPAND(TORCH_EXTENSION_NAME, ops) {
   // vLLM custom ops
 
-  // Attention ops
-  // Compute the attention between an input query and the cached keys/values
-  // using PagedAttention.
-  ops.def(
-      "paged_attention_v1("
-      "    Tensor! out, Tensor query, Tensor key_cache,"
-      "    Tensor value_cache, int num_kv_heads, float scale,"
-      "    Tensor block_tables, Tensor seq_lens, int block_size,"
-      "    int max_seq_len, Tensor? alibi_slopes,"
-      "    str kv_cache_dtype, Tensor k_scale, Tensor v_scale,"
-      "    int tp_rank, int blocksparse_local_blocks,"
-      "    int blocksparse_vert_stride, int blocksparse_block_size,"
-      "    int blocksparse_head_sliding_step) -> ()");
-
-  ops.impl("paged_attention_v1", torch::kCPU, &paged_attention_v1);
-
   ops.def(
       "dynamic_4bit_int_moe("
       "Tensor x, Tensor topk_ids, Tensor topk_weights,"
@@ -102,20 +112,6 @@ TORCH_LIBRARY_EXPAND(TORCH_EXTENSION_NAME, ops) {
 
   ops.impl("dynamic_4bit_int_moe", torch::kCPU, &dynamic_4bit_int_moe_cpu);
 
-  // PagedAttention V2.
-  ops.def(
-      "paged_attention_v2("
-      "    Tensor! out, Tensor! exp_sums, Tensor! max_logits,"
-      "    Tensor! tmp_out, Tensor query, Tensor key_cache,"
-      "    Tensor value_cache, int num_kv_heads, float scale,"
-      "    Tensor block_tables, Tensor seq_lens, int block_size,"
-      "    int max_seq_len, Tensor? alibi_slopes,"
-      "    str kv_cache_dtype, Tensor k_scale, Tensor v_scale,"
-      "    int tp_rank, int blocksparse_local_blocks,"
-      "    int blocksparse_vert_stride, int blocksparse_block_size,"
-      "    int blocksparse_head_sliding_step) -> ()");
-  ops.impl("paged_attention_v2", torch::kCPU, &paged_attention_v2);
-
   // Activation ops
 
   // Activation function used in SwiGLU.
@@ -259,37 +255,26 @@ TORCH_LIBRARY_EXPAND(TORCH_EXTENSION_NAME, ops) {
   ops.impl("int8_scaled_mm_with_quant", torch::kCPU,
            &int8_scaled_mm_with_quant);
 #endif
-}
 
-TORCH_LIBRARY_EXPAND(CONCAT(TORCH_EXTENSION_NAME, _cache_ops), cache_ops) {
-  // Cache ops
-  // Swap in (out) the cache blocks from src to dst.
-  cache_ops.def(
-      "swap_blocks(Tensor src, Tensor! dst, Tensor block_mapping) -> ()");
-  cache_ops.impl("swap_blocks", torch::kCPU, &swap_blocks);
-
-  // Copy the cache blocks from src to dst.
-  cache_ops.def(
-      "copy_blocks(Tensor(a!)[] key_caches, Tensor[](b!) value_caches, "
-      "Tensor block_mapping) -> ()");
-  cache_ops.impl("copy_blocks", torch::kCPU, &copy_blocks);
-
-  // Reshape the key and value tensors and cache them.
-  cache_ops.def(
-      "reshape_and_cache(Tensor key, Tensor value,"
-      "                  Tensor! key_cache, Tensor! value_cache,"
-      "                  Tensor slot_mapping,"
-      "                  str kv_cache_dtype,"
-      "                  Tensor k_scale, Tensor v_scale) -> ()");
-  cache_ops.impl("reshape_and_cache", torch::kCPU, &reshape_and_cache);
-
-  cache_ops.def(
-      "concat_and_cache_mla(Tensor kv_c, Tensor k_pe,"
-      "                     Tensor! kv_cache,"
-      "                     Tensor slot_mapping,"
-      "                     str kv_cache_dtype,"
-      "                     Tensor scale) -> ()");
-  cache_ops.impl("concat_and_cache_mla", torch::kCPU, &concat_and_cache_mla);
+  // CPU attention kernels
+  ops.def(
+      "get_scheduler_metadata(int num_req, int num_heads_q, int num_heads_kv, "
+      "int head_dim, Tensor seq_lens, ScalarType dtype, Tensor "
+      "query_start_loc, bool casual, int window_size, str isa_hint, bool "
+      "enable_kv_split) -> Tensor",
+      &get_scheduler_metadata);
+  ops.def(
+      "cpu_attn_reshape_and_cache(Tensor key, Tensor value, Tensor(a2!) "
+      "key_cache, Tensor(a3!) value_cache, Tensor slot_mapping, str "
+      "isa) -> ()",
+      &cpu_attn_reshape_and_cache);
+  ops.def(
+      "cpu_attention_with_kv_cache(Tensor query, Tensor key_cache, Tensor "
+      "value_cache, Tensor(a3!) output, Tensor query_start_loc, Tensor "
+      "seq_lens, float scale, bool causal, Tensor? alibi_slopes, SymInt "
+      "sliding_window_left, SymInt sliding_window_right, Tensor block_table, "
+      "float softcap, Tensor sheduler_metadata, Tensor? s_aux) -> ()",
+      &cpu_attention_with_kv_cache);
 }
 
 TORCH_LIBRARY_EXPAND(CONCAT(TORCH_EXTENSION_NAME, _utils), utils) {
diff --git a/docker/Dockerfile.cpu b/docker/Dockerfile.cpu
index adaf8a3c5b08..4c961defaeda 100644
--- a/docker/Dockerfile.cpu
+++ b/docker/Dockerfile.cpu
@@ -17,6 +17,7 @@
 #   VLLM_CPU_DISABLE_AVX512=false (default)|true
 #   VLLM_CPU_AVX512BF16=false (default)|true
 #   VLLM_CPU_AVX512VNNI=false (default)|true
+#   VLLM_CPU_AMXBF16=false (default)|true
 #
 
 ######################### COMMON BASE IMAGE #########################
@@ -92,6 +93,9 @@ ENV VLLM_CPU_AVX512BF16=${VLLM_CPU_AVX512BF16}
 # Support for building with AVX512VNNI ISA: docker build --build-arg VLLM_CPU_AVX512VNNI="true" ...
 ARG VLLM_CPU_AVX512VNNI=0
 ENV VLLM_CPU_AVX512VNNI=${VLLM_CPU_AVX512VNNI}
+# Support for building with AMXBF16 ISA: docker build --build-arg VLLM_CPU_AMXBF16="true" ...
+ARG VLLM_CPU_AMXBF16=0
+ENV VLLM_CPU_AMXBF16=${VLLM_CPU_AMXBF16}
 
 WORKDIR /workspace/vllm
 
diff --git a/docs/getting_started/installation/cpu.md b/docs/getting_started/installation/cpu.md
index dbfefa9a1fe5..e8bfca0e5e88 100644
--- a/docs/getting_started/installation/cpu.md
+++ b/docs/getting_started/installation/cpu.md
@@ -171,6 +171,8 @@ This value is 4GB by default. Larger space can support more concurrent requests,
 
 First of all, please make sure the thread-binding and KV cache space are properly set and take effect. You can check the thread-binding by running a vLLM benchmark and observing CPU cores usage via `htop`.
 
+Use multiples of 32 as `--block-size`, which is 128 by default.
+
 Inference batch size is an important parameter for the performance. A larger batch usually provides higher throughput, a smaller batch provides lower latency. Tuning the max batch size starting from the default value to balance throughput and latency is an effective way to improve vLLM CPU performance on specific platforms. There are two important related parameters in vLLM:
 
 - `--max-num-batched-tokens`, defines the limit of token numbers in a single batch, has more impacts on the first token performance. The default value is set as:
diff --git a/tests/kernels/attention/test_attention_selector.py b/tests/kernels/attention/test_attention_selector.py
index 29cc81be12e4..3b8e939300a2 100644
--- a/tests/kernels/attention/test_attention_selector.py
+++ b/tests/kernels/attention/test_attention_selector.py
@@ -35,7 +35,7 @@ def clear_cache():
 DEVICE_REGULAR_ATTN_BACKENDS = {
     "cuda": ["XFORMERS", "FLASHINFER", "FLASH_ATTN"],
     "hip": ["ROCM_ATTN"],
-    "cpu": ["TORCH_SDPA"],
+    "cpu": ["CPU_ATTN"],
 }
 
 DEVICE_MLA_BLOCK_SIZES = {
@@ -86,7 +86,7 @@ def test_env(
         if device == "cpu":
             with patch("vllm.platforms.current_platform", CpuPlatform()):
                 backend = get_attn_backend(16, torch.float16, None, block_size)
-            assert backend.get_name() == "TORCH_SDPA"
+            assert backend.get_name() == "CPU_ATTN"
 
         elif device == "hip":
             with patch("vllm.platforms.current_platform", RocmPlatform()):
@@ -224,7 +224,7 @@ def test_fp32_fallback(device: str):
     if device == "cpu":
         with patch("vllm.platforms.current_platform", CpuPlatform()):
             backend = get_attn_backend(16, torch.float32, None, 16)
-        assert backend.get_name() == "TORCH_SDPA"
+        assert backend.get_name() == "CPU_ATTN"
 
     elif device == "cuda":
         with patch("vllm.platforms.current_platform", CudaPlatform()):
diff --git a/tests/kernels/attention/test_cpu_attn.py b/tests/kernels/attention/test_cpu_attn.py
new file mode 100644
index 000000000000..fb3b1799ba48
--- /dev/null
+++ b/tests/kernels/attention/test_cpu_attn.py
@@ -0,0 +1,575 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import functools
+import math
+
+import pytest
+import torch
+
+from vllm.platforms import current_platform
+
+if not current_platform.is_cpu():
+    pytest.skip("skipping CPU-only tests", allow_module_level=True)
+
+from vllm._custom_ops import (
+    cpu_attention_with_kv_cache,
+    cpu_attn_get_scheduler_metadata,
+    cpu_attn_reshape_and_cache,
+)
+
+NUM_HEADS = [
+    (4, 4),
+    (8, 2),
+    (9, 3),
+]
+HEAD_SIZES = [96, 128]
+QTYPES = [torch.bfloat16, torch.half, torch.float32]
+SLIDING_WINDOWS = [None, 256]
+NUM_BLOCKS = [
+    1024,
+]
+SEQ_LENS = [  # (q_len, kv_len)
+    [(1, 213), (1, 1), (1, 312), (1, 7), (1, 7812)],  # decode batch
+    [(2345, 2345), (5, 5), (3, 16), (134, 5131)],  # prefill batch
+    [(992, 2456), (1, 1234), (98, 1145), (1, 4162), (2345, 2345)],  # mixed batch
+]
+
+
+# rand number generation takes too much time, cache rand tensors
+@functools.lru_cache(maxsize=128, typed=False)
+def tensor_cache(
+    elem_num: int,
+    dtype: torch.dtype,
+) -> torch.Tensor:
+    tensor = torch.randn(elem_num, dtype=dtype)
+
+    return tensor
+
+
+def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
+    closest_power_of_2 = 2 ** math.floor(math.log2(total_num_heads))
+    base = torch.tensor(
+        2 ** (-(2 ** -(math.log2(closest_power_of_2) - 3))),
+        dtype=torch.float32,
+    )
+    powers = torch.arange(1, 1 + closest_power_of_2, dtype=torch.int32)
+    slopes = torch.pow(base, powers)
+
+    if closest_power_of_2 != total_num_heads:
+        extra_base = torch.tensor(
+            2 ** (-(2 ** -(math.log2(2 * closest_power_of_2) - 3))),
+            dtype=torch.float32,
+        )
+        num_remaining_heads = min(
+            closest_power_of_2, total_num_heads - closest_power_of_2
+        )
+        extra_powers = torch.arange(
+            start=1, end=1 + 2 * num_remaining_heads, step=2, dtype=torch.int32
+        )
+        slopes = torch.cat([slopes, torch.pow(extra_base, extra_powers)], dim=0)
+    return slopes.float()
+
+
+def ref_paged_attn(
+    query: torch.Tensor,
+    key_cache: torch.Tensor,
+    value_cache: torch.Tensor,
+    query_lens: list[int],
+    kv_lens: list[int],
+    block_tables: torch.Tensor,
+    scale: float,
+    sliding_window: int | None = None,
+    soft_cap: float | None = None,
+    alibi_slopes: torch.Tensor | None = None,
+    s_aux: torch.Tensor | None = None,
+) -> torch.Tensor:
+    num_seqs = len(query_lens)
+    block_tables = block_tables.cpu().numpy()
+    _, block_size, num_kv_heads, head_size = key_cache.shape
+    dtype = query.dtype
+
+    outputs: list[torch.Tensor] = []
+    start_idx = 0
+
+    if alibi_slopes is not None:
+        alibi_slopes = alibi_slopes[:, None, None]
+
+    if s_aux is not None:
+        s_aux = s_aux.float()
+        s_aux = s_aux[:, None, None]
+
+    for i in range(num_seqs):
+        query_len = query_lens[i]
+        kv_len = kv_lens[i]
+        q = query[start_idx : start_idx + query_len].float()
+        q *= scale
+
+        num_kv_blocks = (kv_len + block_size - 1) // block_size
+        block_indices = block_tables[i, :num_kv_blocks]
+
+        k = key_cache[block_indices].view(-1, num_kv_heads, head_size)
+        k = k[:kv_len].float()
+        v = value_cache[block_indices].view(-1, num_kv_heads, head_size)
+        v = v[:kv_len].float()
+
+        if q.shape[1] != k.shape[1]:
+            k = torch.repeat_interleave(k, q.shape[1] // k.shape[1], dim=1)
+            v = torch.repeat_interleave(v, q.shape[1] // v.shape[1], dim=1)
+        attn = torch.einsum("qhd,khd->hqk", q, k).float()
+        empty_mask = torch.ones(query_len, kv_len)
+        mask = torch.triu(empty_mask, diagonal=kv_len - query_len + 1).bool()
+
+        if sliding_window is not None:
+            sliding_window_mask = (
+                torch.triu(
+                    empty_mask, diagonal=kv_len - (query_len + sliding_window) + 1
+                )
+                .bool()
+                .logical_not()
+            )
+            mask |= sliding_window_mask
+
+        if soft_cap is not None:
+            attn = soft_cap * torch.tanh(attn / soft_cap)
+
+        if alibi_slopes is not None:
+            q_start_pos = kv_len - query_len
+            q_pos = q_start_pos + torch.arange(0, query_len)[None, :, None]
+            kv_pos = torch.arange(0, kv_len)[None, None, :]
+            dist = q_pos - kv_pos
+            alibi_bias = -alibi_slopes * dist
+            attn += alibi_bias
+
+        attn.masked_fill_(mask, float("-inf"))
+
+        if s_aux is not None:
+            s_aux_ext = s_aux.repeat(1, query_len, 1)
+            attn = torch.cat((s_aux_ext, attn), dim=-1)
+
+        attn = torch.softmax(attn, dim=-1)
+
+        if s_aux is not None:
+            attn = attn[:, :, 1:]
+
+        out = torch.einsum("hqk,khd->qhd", attn, v).to(dtype=dtype)
+
+        outputs.append(out)
+        start_idx += query_len
+
+    return torch.cat(outputs, dim=0)
+
+
+@torch.inference_mode()
+def varlen_with_paged_kv(
+    seq_lens: list[tuple[int, int]],
+    num_heads: tuple[int, int],
+    head_size: int,
+    sliding_window: int | None,
+    dtype: torch.dtype,
+    block_size: int,
+    soft_cap: float | None,
+    num_blocks: int,
+    use_alibi: bool,
+    use_sink: bool,
+    isa: str,
+) -> None:
+    current_platform.seed_everything(0)
+    num_seqs = len(seq_lens)
+    query_lens = [x[0] for x in seq_lens]
+    kv_lens = [x[1] for x in seq_lens]
+    num_query_heads = num_heads[0]
+    num_kv_heads = num_heads[1]
+    assert num_query_heads % num_kv_heads == 0
+    max_kv_len = max(kv_lens)
+    window_size = (sliding_window - 1, 0) if sliding_window is not None else (-1, -1)
+    scale = head_size**-0.5
+    token_num = sum(query_lens)
+
+    # for n heads the set of slopes is the geometric sequence that starts
+    # 2^(-8/n)
+    alibi_slopes = _get_alibi_slopes(num_query_heads) if use_alibi else None
+
+    s_aux = (
+        15 * torch.rand((num_query_heads,), dtype=torch.bfloat16) if use_sink else None
+    )
+
+    query = tensor_cache(
+        elem_num=token_num * num_query_heads * head_size,
+        dtype=dtype,
+    )
+    query = query.view(
+        token_num,
+        num_query_heads,
+        head_size,
+    )
+
+    key_value = tensor_cache(
+        elem_num=2 * num_blocks * num_kv_heads * block_size * head_size,
+        dtype=dtype,
+    )
+    key_value = key_value.view(
+        2,
+        num_blocks,
+        block_size,
+        num_kv_heads,
+        head_size,
+    )
+    key_cache, value_cache = key_value.unbind(0)
+
+    # KV cache for CPU attention
+    packed_key_cache = torch.empty(
+        num_blocks, num_kv_heads, block_size, head_size, dtype=dtype
+    )
+    packed_value_cache = torch.empty_like(packed_key_cache)
+
+    cu_query_lens = torch.tensor([0] + query_lens, dtype=torch.int32).cumsum(
+        dim=0, dtype=torch.int32
+    )
+    kv_lens_tensor = torch.tensor(kv_lens, dtype=torch.int32)
+    max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
+    block_tables = torch.randint(
+        0, num_blocks, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
+
+    # use reshape_and_cache to pack key_cache and value_cache
+    slot_mapping = torch.arange(0, num_blocks * block_size, dtype=torch.int64)
+    cpu_attn_reshape_and_cache(
+        key=key_cache.view(-1, num_kv_heads, head_size),
+        value=value_cache.view(-1, num_kv_heads, head_size),
+        key_cache=packed_key_cache,
+        value_cache=packed_value_cache,
+        slot_mapping=slot_mapping,
+        isa=isa,
+    )
+
+    metadata = cpu_attn_get_scheduler_metadata(
+        num_reqs=num_seqs,
+        num_heads=num_query_heads,
+        num_kv_heads=num_kv_heads,
+        head_dim=head_size,
+        seq_lens=kv_lens_tensor,
+        dtype=dtype,
+        query_start_loc=cu_query_lens,
+        causal=True,
+        sliding_window_size=sliding_window if sliding_window is not None else -1,
+        isa=isa,
+        enable_kv_split=False,
+    )
+
+    out_without_split = torch.empty_like(query)
+    cpu_attention_with_kv_cache(
+        query=query,
+        key_cache=packed_key_cache,
+        value_cache=packed_value_cache,
+        output=out_without_split,
+        query_start_loc=cu_query_lens,
+        seq_lens=kv_lens_tensor,
+        scale=scale,
+        causal=True,
+        alibi_slopes=alibi_slopes,
+        sliding_window=window_size,
+        block_table=block_tables,
+        softcap=soft_cap if soft_cap is not None else 0,
+        scheduler_metadata=metadata,
+        s_aux=s_aux,
+    )
+
+    metadata = cpu_attn_get_scheduler_metadata(
+        num_reqs=num_seqs,
+        num_heads=num_query_heads,
+        num_kv_heads=num_kv_heads,
+        head_dim=head_size,
+        seq_lens=kv_lens_tensor,
+        dtype=dtype,
+        query_start_loc=cu_query_lens,
+        causal=True,
+        sliding_window_size=sliding_window if sliding_window is not None else -1,
+        isa=isa,
+        enable_kv_split=True,
+    )
+
+    out_with_split = torch.empty_like(query)
+    cpu_attention_with_kv_cache(
+        query=query,
+        key_cache=packed_key_cache,
+        value_cache=packed_value_cache,
+        output=out_with_split,
+        query_start_loc=cu_query_lens,
+        seq_lens=kv_lens_tensor,
+        scale=scale,
+        causal=True,
+        alibi_slopes=alibi_slopes,
+        sliding_window=window_size,
+        block_table=block_tables,
+        softcap=soft_cap if soft_cap is not None else 0,
+        scheduler_metadata=metadata,
+        s_aux=s_aux,
+    )
+
+    ref_output = ref_paged_attn(
+        query=query,
+        key_cache=key_cache,
+        value_cache=value_cache,
+        query_lens=query_lens,
+        kv_lens=kv_lens,
+        block_tables=block_tables,
+        scale=scale,
+        sliding_window=sliding_window,
+        soft_cap=soft_cap,
+        alibi_slopes=alibi_slopes,
+        s_aux=s_aux,
+    )
+
+    atol, rtol = 1.5e-2, 1e-2
+    (
+        torch.testing.assert_close(out_with_split, ref_output, atol=atol, rtol=rtol),
+        f"{torch.max(torch.abs(out_with_split - ref_output))}",
+    )
+    (
+        torch.testing.assert_close(out_without_split, ref_output, atol=atol, rtol=rtol),
+        f"{torch.max(torch.abs(out_without_split - ref_output))}",
+    )
+
+
+@pytest.mark.parametrize("seq_lens", SEQ_LENS)
+@pytest.mark.parametrize("num_heads", NUM_HEADS)
+@pytest.mark.parametrize("head_size", HEAD_SIZES)
+@pytest.mark.parametrize("block_size", [96, 128])
+@pytest.mark.parametrize("sliding_window", SLIDING_WINDOWS)
+@pytest.mark.parametrize("dtype", QTYPES)
+@pytest.mark.parametrize("soft_cap", [None])
+@pytest.mark.parametrize("num_blocks", NUM_BLOCKS)
+@pytest.mark.parametrize("use_alibi", [False])
+@pytest.mark.parametrize("use_sink", [False])
+@pytest.mark.parametrize("isa", ["vec"])
+def test_varlen_with_paged_kv_normal_vec(
+    seq_lens: list[tuple[int, int]],
+    num_heads: tuple[int, int],
+    head_size: int,
+    sliding_window: int | None,
+    dtype: torch.dtype,
+    block_size: int,
+    soft_cap: float | None,
+    num_blocks: int,
+    use_alibi: bool,
+    use_sink: bool,
+    isa: str,
+) -> None:
+    varlen_with_paged_kv(
+        seq_lens=seq_lens,
+        num_heads=num_heads,
+        head_size=head_size,
+        sliding_window=sliding_window,
+        dtype=dtype,
+        block_size=block_size,
+        soft_cap=soft_cap,
+        num_blocks=num_blocks,
+        use_alibi=use_alibi,
+        use_sink=use_sink,
+        isa=isa,
+    )
+
+
+@pytest.mark.parametrize("seq_lens", SEQ_LENS)
+@pytest.mark.parametrize("num_heads", NUM_HEADS)
+@pytest.mark.parametrize("head_size", HEAD_SIZES)
+@pytest.mark.parametrize("block_size", [96, 128])
+@pytest.mark.parametrize("sliding_window", SLIDING_WINDOWS)
+@pytest.mark.parametrize("dtype", [torch.bfloat16])
+@pytest.mark.parametrize("soft_cap", [None])
+@pytest.mark.parametrize("num_blocks", NUM_BLOCKS)
+@pytest.mark.parametrize("use_alibi", [False])
+@pytest.mark.parametrize("use_sink", [False])
+@pytest.mark.parametrize("isa", ["amx"])
+@pytest.mark.skipif(
+    not torch._C._cpu._is_amx_tile_supported(), reason="no AMX support."
+)
+def test_varlen_with_paged_kv_normal_amx(
+    seq_lens: list[tuple[int, int]],
+    num_heads: tuple[int, int],
+    head_size: int,
+    sliding_window: int | None,
+    dtype: torch.dtype,
+    block_size: int,
+    soft_cap: float | None,
+    num_blocks: int,
+    use_alibi: bool,
+    use_sink: bool,
+    isa: str,
+) -> None:
+    varlen_with_paged_kv(
+        seq_lens=seq_lens,
+        num_heads=num_heads,
+        head_size=head_size,
+        sliding_window=sliding_window,
+        dtype=dtype,
+        block_size=block_size,
+        soft_cap=soft_cap,
+        num_blocks=num_blocks,
+        use_alibi=use_alibi,
+        use_sink=use_sink,
+        isa=isa,
+    )
+
+
+@pytest.mark.parametrize("seq_lens", SEQ_LENS)
+@pytest.mark.parametrize("num_heads", NUM_HEADS)
+@pytest.mark.parametrize("head_size", HEAD_SIZES)
+@pytest.mark.parametrize("block_size", [48])
+@pytest.mark.parametrize("sliding_window", SLIDING_WINDOWS)
+@pytest.mark.parametrize("dtype", [torch.bfloat16])
+@pytest.mark.parametrize("soft_cap", [None])
+@pytest.mark.parametrize("num_blocks", NUM_BLOCKS)
+@pytest.mark.parametrize("use_alibi", [False])
+@pytest.mark.parametrize("use_sink", [False])
+@pytest.mark.parametrize("isa", ["vec16"])
+def test_varlen_with_paged_kv_normal_vec16(
+    seq_lens: list[tuple[int, int]],
+    num_heads: tuple[int, int],
+    head_size: int,
+    sliding_window: int | None,
+    dtype: torch.dtype,
+    block_size: int,
+    soft_cap: float | None,
+    num_blocks: int,
+    use_alibi: bool,
+    use_sink: bool,
+    isa: str,
+) -> None:
+    varlen_with_paged_kv(
+        seq_lens=seq_lens,
+        num_heads=num_heads,
+        head_size=head_size,
+        sliding_window=sliding_window,
+        dtype=dtype,
+        block_size=block_size,
+        soft_cap=soft_cap,
+        num_blocks=num_blocks,
+        use_alibi=use_alibi,
+        use_sink=use_sink,
+        isa=isa,
+    )
+
+
+@pytest.mark.parametrize("seq_lens", SEQ_LENS)
+@pytest.mark.parametrize("num_heads", NUM_HEADS)
+@pytest.mark.parametrize("head_size", [96])
+@pytest.mark.parametrize("block_size", [128])
+@pytest.mark.parametrize("sliding_window", SLIDING_WINDOWS)
+@pytest.mark.parametrize("dtype", [torch.bfloat16])
+@pytest.mark.parametrize("soft_cap", [50])
+@pytest.mark.parametrize("num_blocks", NUM_BLOCKS)
+@pytest.mark.parametrize("use_alibi", [False])
+@pytest.mark.parametrize("use_sink", [False])
+@pytest.mark.parametrize(
+    "isa", ["amx"] if torch._C._cpu._is_amx_tile_supported() else ["vec"]
+)
+def test_varlen_with_paged_kv_softcap(
+    seq_lens: list[tuple[int, int]],
+    num_heads: tuple[int, int],
+    head_size: int,
+    sliding_window: int | None,
+    dtype: torch.dtype,
+    block_size: int,
+    soft_cap: float | None,
+    num_blocks: int,
+    use_alibi: bool,
+    use_sink: bool,
+    isa: str,
+) -> None:
+    varlen_with_paged_kv(
+        seq_lens=seq_lens,
+        num_heads=num_heads,
+        head_size=head_size,
+        sliding_window=sliding_window,
+        dtype=dtype,
+        block_size=block_size,
+        soft_cap=soft_cap,
+        num_blocks=num_blocks,
+        use_alibi=use_alibi,
+        use_sink=use_sink,
+        isa=isa,
+    )
+
+
+@pytest.mark.parametrize("seq_lens", SEQ_LENS)
+@pytest.mark.parametrize("num_heads", NUM_HEADS)
+@pytest.mark.parametrize("head_size", [96])
+@pytest.mark.parametrize("block_size", [128])
+@pytest.mark.parametrize("sliding_window", SLIDING_WINDOWS)
+@pytest.mark.parametrize("dtype", [torch.bfloat16])
+@pytest.mark.parametrize("soft_cap", [None])
+@pytest.mark.parametrize("num_blocks", NUM_BLOCKS)
+@pytest.mark.parametrize("use_alibi", [True])
+@pytest.mark.parametrize("use_sink", [False])
+@pytest.mark.parametrize(
+    "isa", ["amx"] if torch._C._cpu._is_amx_tile_supported() else ["vec"]
+)
+def test_varlen_with_paged_kv_alibi(
+    seq_lens: list[tuple[int, int]],
+    num_heads: tuple[int, int],
+    head_size: int,
+    sliding_window: int | None,
+    dtype: torch.dtype,
+    block_size: int,
+    soft_cap: float | None,
+    num_blocks: int,
+    use_alibi: bool,
+    use_sink: bool,
+    isa: str,
+) -> None:
+    varlen_with_paged_kv(
+        seq_lens=seq_lens,
+        num_heads=num_heads,
+        head_size=head_size,
+        sliding_window=sliding_window,
+        dtype=dtype,
+        block_size=block_size,
+        soft_cap=soft_cap,
+        num_blocks=num_blocks,
+        use_alibi=use_alibi,
+        use_sink=use_sink,
+        isa=isa,
+    )
+
+
+@pytest.mark.parametrize("seq_lens", SEQ_LENS)
+@pytest.mark.parametrize("num_heads", NUM_HEADS)
+@pytest.mark.parametrize("head_size", [96])
+@pytest.mark.parametrize("block_size", [128])
+@pytest.mark.parametrize("sliding_window", SLIDING_WINDOWS)
+@pytest.mark.parametrize("dtype", [torch.bfloat16])
+@pytest.mark.parametrize("soft_cap", [None])
+@pytest.mark.parametrize("num_blocks", NUM_BLOCKS)
+@pytest.mark.parametrize("use_alibi", [False])
+@pytest.mark.parametrize("use_sink", [True])
+@pytest.mark.parametrize(
+    "isa", ["amx"] if torch._C._cpu._is_amx_tile_supported() else ["vec"]
+)
+def test_varlen_with_paged_kv_sink(
+    seq_lens: list[tuple[int, int]],
+    num_heads: tuple[int, int],
+    head_size: int,
+    sliding_window: int | None,
+    dtype: torch.dtype,
+    block_size: int,
+    soft_cap: float | None,
+    num_blocks: int,
+    use_alibi: bool,
+    use_sink: bool,
+    isa: str,
+) -> None:
+    varlen_with_paged_kv(
+        seq_lens=seq_lens,
+        num_heads=num_heads,
+        head_size=head_size,
+        sliding_window=sliding_window,
+        dtype=dtype,
+        block_size=block_size,
+        soft_cap=soft_cap,
+        num_blocks=num_blocks,
+        use_alibi=use_alibi,
+        use_sink=use_sink,
+        isa=isa,
+    )
diff --git a/tests/kernels/test_onednn.py b/tests/kernels/test_onednn.py
index c9eca1f86d3a..4e681ca6ac83 100644
--- a/tests/kernels/test_onednn.py
+++ b/tests/kernels/test_onednn.py
@@ -1,6 +1,5 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-"""Integration tests for FlexAttention backend vs default backend"""
 
 import pytest
 import torch
diff --git a/tests/models/language/generation/test_common.py b/tests/models/language/generation/test_common.py
index ad37d1ad82c0..0cdb7c9a603f 100644
--- a/tests/models/language/generation/test_common.py
+++ b/tests/models/language/generation/test_common.py
@@ -38,7 +38,11 @@
     [
         pytest.param(
             "bigscience/bloom-560m",  # bloom - testing alibi slopes
-            marks=[pytest.mark.core_model, pytest.mark.slow_test],
+            marks=[
+                pytest.mark.core_model,
+                pytest.mark.slow_test,
+                pytest.mark.cpu_model,
+            ],
         ),
         pytest.param(
             "openai-community/gpt2",  # gpt2
@@ -55,6 +59,10 @@
                 pytest.mark.slow_test,
             ],
         ),
+        pytest.param(
+            "google/gemma-2-2b-it",  # test hybrid attention
+            marks=[pytest.mark.cpu_model],
+        ),
         pytest.param(
             "zai-org/chatglm3-6b",  # chatglm (text-only)
         ),
@@ -64,7 +72,6 @@
         ),
         pytest.param(
             "openbmb/MiniCPM3-4B",
-            # fused_moe not supported on CPU
             marks=[pytest.mark.core_model, large_gpu_mark(min_gb=32)],
         ),
         pytest.param(
@@ -93,11 +100,7 @@
         pytest.param("bigcode/starcoder2-3b"),  # starcoder2
         pytest.param(
             "TitanML/tiny-mixtral",  # mixtral
-            marks=[pytest.mark.core_model],
-        ),
-        pytest.param(
-            "allenai/OLMoE-1B-7B-0924-Instruct",
-            marks=[pytest.mark.cpu_model],
+            marks=[pytest.mark.core_model, pytest.mark.cpu_model],
         ),
         pytest.param("swiss-ai/Apertus-8B-Instruct-2509"),  # apertus
     ],
diff --git a/tests/models/language/pooling/test_embedding.py b/tests/models/language/pooling/test_embedding.py
index c8deffbf66db..d1b1c8d3ddf0 100644
--- a/tests/models/language/pooling/test_embedding.py
+++ b/tests/models/language/pooling/test_embedding.py
@@ -23,8 +23,7 @@
         ),
         pytest.param(
             "intfloat/e5-mistral-7b-instruct",
-            # CPU v1 doesn't support sliding window
-            marks=[pytest.mark.core_model],
+            marks=[pytest.mark.core_model, pytest.mark.cpu_model],
         ),
         pytest.param(
             "ssmits/Qwen2-7B-Instruct-embed-base", marks=[pytest.mark.cpu_model]
diff --git a/tests/models/registry.py b/tests/models/registry.py
index 8f19a048677e..644d0619215f 100644
--- a/tests/models/registry.py
+++ b/tests/models/registry.py
@@ -243,7 +243,9 @@ def check_available_online(
     "FalconH1ForCausalLM": _HfExamplesInfo("tiiuae/Falcon-H1-0.5B-Base"),
     "FlexOlmoForCausalLM": _HfExamplesInfo("allenai/Flex-reddit-2x7B-1T"),
     "GemmaForCausalLM": _HfExamplesInfo("google/gemma-1.1-2b-it"),
-    "Gemma2ForCausalLM": _HfExamplesInfo("google/gemma-2-9b"),
+    "Gemma2ForCausalLM": _HfExamplesInfo(
+        "google/gemma-2-9b", extras={"tiny": "google/gemma-2-2b-it"}
+    ),
     "Gemma3ForCausalLM": _HfExamplesInfo("google/gemma-3-1b-it"),
     "Gemma3nForCausalLM": _HfExamplesInfo("google/gemma-3n-E2B-it"),
     "GlmForCausalLM": _HfExamplesInfo("zai-org/glm-4-9b-chat-hf"),
diff --git a/vllm/_custom_ops.py b/vllm/_custom_ops.py
index 136a3193efb5..7d70c01cefbb 100644
--- a/vllm/_custom_ops.py
+++ b/vllm/_custom_ops.py
@@ -2583,6 +2583,88 @@ def onednn_scaled_mm(
     return output
 
 
+def cpu_attn_get_scheduler_metadata(
+    num_reqs: int,
+    num_heads: int,
+    num_kv_heads: int,
+    head_dim: int,
+    seq_lens: torch.Tensor,
+    dtype: torch.dtype,
+    query_start_loc: torch.Tensor,
+    causal: bool,
+    sliding_window_size: int,
+    isa: str,
+    enable_kv_split: bool,
+) -> torch.Tensor:
+    sheduler_metadata = torch.ops._C.get_scheduler_metadata(
+        num_reqs,
+        num_heads,
+        num_kv_heads,
+        head_dim,
+        seq_lens,
+        dtype,
+        query_start_loc,
+        causal,
+        sliding_window_size,
+        isa,
+        enable_kv_split,
+    )
+    return sheduler_metadata
+
+
+def cpu_attn_reshape_and_cache(
+    key: torch.Tensor,
+    value: torch.Tensor,
+    key_cache: torch.Tensor,
+    value_cache: torch.Tensor,
+    slot_mapping: torch.Tensor,
+    isa: str,
+) -> None:
+    torch.ops._C.cpu_attn_reshape_and_cache(
+        key,
+        value,
+        key_cache,
+        value_cache,
+        slot_mapping,
+        isa,
+    )
+
+
+def cpu_attention_with_kv_cache(
+    query: torch.Tensor,
+    key_cache: torch.Tensor,
+    value_cache: torch.Tensor,
+    output: torch.Tensor,
+    query_start_loc: torch.Tensor,
+    seq_lens: torch.Tensor,
+    scale: float,
+    causal: bool,
+    alibi_slopes: torch.Tensor | None,
+    sliding_window: tuple[int, int],
+    block_table: torch.Tensor,
+    softcap: float,
+    scheduler_metadata: torch.Tensor,
+    s_aux: torch.Tensor | None,
+) -> None:
+    torch.ops._C.cpu_attention_with_kv_cache(
+        query,
+        key_cache,
+        value_cache,
+        output,
+        query_start_loc,
+        seq_lens,
+        scale,
+        causal,
+        alibi_slopes,
+        sliding_window[0],
+        sliding_window[1],
+        block_table,
+        softcap,
+        scheduler_metadata,
+        s_aux,
+    )
+
+
 if hasattr(torch.ops._qutlass_C, "matmul_mxf4_bf16_tn"):
 
     @register_fake("_qutlass_C::matmul_mxf4_bf16_tn")
diff --git a/vllm/attention/backends/registry.py b/vllm/attention/backends/registry.py
index 768d15cb9c82..f07a6059be37 100644
--- a/vllm/attention/backends/registry.py
+++ b/vllm/attention/backends/registry.py
@@ -49,7 +49,7 @@ class AttentionBackendEnum(enum.Enum, metaclass=_AttentionBackendEnumMeta):
     ROCM_AITER_FA = (
         "vllm.v1.attention.backends.rocm_aiter_fa.AiterFlashAttentionBackend"
     )
-    TORCH_SDPA = "vllm.v1.attention.backends.cpu_attn.TorchSDPABackend"
+    TORCH_SDPA = ""  # this tag is only used for ViT
     FLASHINFER = "vllm.v1.attention.backends.flashinfer.FlashInferBackend"
     FLASHINFER_MLA = (
         "vllm.v1.attention.backends.mla.flashinfer_mla.FlashInferMLABackend"
@@ -70,6 +70,7 @@ class AttentionBackendEnum(enum.Enum, metaclass=_AttentionBackendEnumMeta):
         "vllm.v1.attention.backends.rocm_aiter_unified_attn."
         "RocmAiterUnifiedAttentionBackend"
     )
+    CPU_ATTN = "vllm.v1.attention.backends.cpu_attn.CPUAttentionBackend"
     # Placeholder for third-party/custom backends - must be registered before use
     CUSTOM = ""
 
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index d3913553320f..0a82745bf55a 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -1726,9 +1726,6 @@ def _check_feature_supported(self, model_config: ModelConfig):
                 )
                 _raise_unsupported_error(feature_name=name)
 
-        if current_platform.is_cpu() and model_config.get_sliding_window() is not None:
-            _raise_unsupported_error(feature_name="sliding window (CPU backend)")
-
     def _set_default_args(
         self, usage_context: UsageContext, model_config: ModelConfig
     ) -> None:
diff --git a/vllm/platforms/cpu.py b/vllm/platforms/cpu.py
index 3dec6da89702..2f3249633710 100644
--- a/vllm/platforms/cpu.py
+++ b/vllm/platforms/cpu.py
@@ -8,7 +8,6 @@
 import subprocess
 import sys
 from dataclasses import dataclass
-from importlib.util import find_spec
 from typing import TYPE_CHECKING
 
 import regex as re
@@ -139,16 +138,15 @@ def get_attn_backend_cls(
     ) -> str:
         from vllm.attention.backends.registry import AttentionBackendEnum
 
-        if selected_backend and selected_backend != AttentionBackendEnum.TORCH_SDPA:
+        if selected_backend and selected_backend != AttentionBackendEnum.CPU_ATTN:
             logger.info("Cannot use %s backend on CPU.", selected_backend)
         if use_mla:
             raise NotImplementedError("MLA is not supported on CPU.")
         if use_sparse:
             raise NotImplementedError("Sparse Attention is not supported on CPU.")
-        logger.info("Using Torch SDPA backend.")
         if not use_v1:
             raise ValueError("CPU backend only supports V1.")
-        return AttentionBackendEnum.TORCH_SDPA.get_path()
+        return AttentionBackendEnum.CPU_ATTN.get_path()
 
     @classmethod
     def get_device_total_memory(cls, device_id: int = 0) -> int:
@@ -186,15 +184,13 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
 
         cache_config = vllm_config.cache_config
 
-        ipex_available = find_spec("intel_extension_for_pytorch") is not None
+        if cache_config.block_size is None:
+            cache_config.block_size = 128
 
-        if cache_config and cache_config.block_size is None:
-            cache_config.block_size = 128 if ipex_available else 16
-
-        if not ipex_available and cache_config.block_size != 16:
-            raise RuntimeError(
-                f"--block-size={cache_config.block_size} requires"
-                " intel_extension_for_pytorch"
+        if cache_config.block_size % 32 != 0:
+            logger.warning(
+                "CPU backend prefers block_size is multiples of 32, "
+                "otherwise the performance is not optimized."
             )
 
         scheduler_config = vllm_config.scheduler_config
@@ -207,22 +203,11 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
                 "backend is not compatible with FP8 KV cache."
             )
 
-        if cache_config.cache_dtype == "fp8_e4m3":
-            cache_config.cache_dtype = "fp8_e5m2"
-            logger.warning(
-                "CPU backend doesn't support fp8_e4m3 KV cache type, cast to fp8_e5m2."
-            )
-
-        if (
-            cache_config.cache_dtype != "auto"
-            and model_config is not None
-            and model_config.dtype == torch.half
-        ):
+        if cache_config.cache_dtype != "auto":
             logger.warning(
-                "FP8 KV cache on the CPU backend only does not"
-                " support fp16 for now, cast to bf16."
+                "CPU backend doesn't support KV cache quantization fallback to auto."
             )
-            model_config.dtype = torch.bfloat16
+            cache_config.cache_dtype = "auto"
 
         cache_config.cpu_kvcache_space_bytes = CpuPlatform.get_device_total_memory()
 
diff --git a/vllm/utils/__init__.py b/vllm/utils/__init__.py
index b5a7fea2c357..9b0045279a67 100644
--- a/vllm/utils/__init__.py
+++ b/vllm/utils/__init__.py
@@ -57,7 +57,6 @@ def __dir__() -> list[str]:
 # Possible string values of STR_BACKEND_ENV_VAR
 # register, corresponding to possible backends
 STR_FLASHINFER_ATTN_VAL: str = "FLASHINFER"
-STR_TORCH_SDPA_ATTN_VAL: str = "TORCH_SDPA"
 STR_XFORMERS_ATTN_VAL: str = "XFORMERS"
 STR_FLASH_ATTN_VAL: str = "FLASH_ATTN"
 STR_INVALID_VAL: str = "INVALID"
diff --git a/vllm/v1/attention/backends/cpu_attn.py b/vllm/v1/attention/backends/cpu_attn.py
index 0057a7e22882..674398e19c4c 100644
--- a/vllm/v1/attention/backends/cpu_attn.py
+++ b/vllm/v1/attention/backends/cpu_attn.py
@@ -1,22 +1,21 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from dataclasses import dataclass
-from typing import ClassVar, Optional
+from typing import ClassVar
 
-import numpy as np
 import torch
-from torch.nn.functional import scaled_dot_product_attention
 
+from vllm import _custom_ops as ops
 from vllm.attention.backends.abstract import (
     AttentionBackend,
     AttentionImpl,
     AttentionLayer,
-    AttentionMetadata,
     AttentionType,
     is_quantized_kv_cache,
 )
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
+from vllm.platforms import CpuArchEnum, current_platform
 from vllm.v1.attention.backends.utils import (
     AttentionMetadataBuilder,
     CommonAttentionMetadata,
@@ -24,44 +23,38 @@
 )
 from vllm.v1.kv_cache_interface import AttentionSpec
 
-try:
-    import intel_extension_for_pytorch.llm.modules as ipex_modules
-
-    _use_ipex = True
-# AttributeError is to handle a bug in ipex
-# https://github.com/intel/intel-extension-for-pytorch/pull/813
-except (ImportError, AttributeError):
-    _use_ipex = False
-
-from vllm import _custom_ops as ops
-
 logger = init_logger(__name__)
 
+_CPU_ARCH_PREFER_MIXED_BATCH = (CpuArchEnum.X86,)
+
 
-class TorchSDPABackend(AttentionBackend):
-    accept_output_buffer: bool = False
+class CPUAttentionBackend(AttentionBackend):
+    accept_output_buffer: bool = True
     supported_dtypes: ClassVar[list[torch.dtype]] = [
         torch.float16,
         torch.bfloat16,
         torch.float32,
     ]
 
+    @classmethod
+    def get_supported_dtypes(cls) -> list[torch.dtype]:
+        return [torch.float16, torch.bfloat16, torch.float32]
+
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
-        attn_impl = _get_paged_attn_impl()
-        return attn_impl.get_supported_head_sizes()
+        return [32, 64, 96, 128, 160, 192, 224, 256]
 
     @staticmethod
     def get_name() -> str:
-        return "TORCH_SDPA"
+        return "CPU_ATTN"
 
     @staticmethod
-    def get_impl_cls() -> type["TorchSDPABackendImpl"]:
-        return TorchSDPABackendImpl
+    def get_impl_cls() -> type["CPUAttentionBackendImpl"]:
+        return CPUAttentionBackendImpl
 
     @staticmethod
-    def get_builder_cls() -> type["TorchSDPAMetadataBuilderV1"]:
-        return TorchSDPAMetadataBuilderV1
+    def get_builder_cls() -> type["CPUAttentionMetadataBuilder"]:
+        return CPUAttentionMetadataBuilder
 
     @staticmethod
     def get_kv_cache_shape(
@@ -71,9 +64,7 @@ def get_kv_cache_shape(
         head_size: int,
         cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
-        return _get_paged_attn_impl().get_kv_cache_shape(
-            num_blocks, block_size, num_kv_heads, head_size
-        )
+        return 2, num_blocks, num_kv_heads, block_size, head_size
 
     @staticmethod
     def use_cascade_attention(*args, **kwargs) -> bool:
@@ -81,264 +72,26 @@ def use_cascade_attention(*args, **kwargs) -> bool:
 
 
 @dataclass
-class TorchSDPAMetadata(AttentionMetadata):
-    """Attention metadata for prefill and decode batched together."""
-
-    # Total number of prefill requests.
-    num_prefills: int
-    # Number of prefill tokens.
-    num_prefill_tokens: int
-    # Number of decode tokens. Note that it is equivalent to the number of
-    # decode requests.
-    num_decode_tokens: int
-    # (num_tokens,). The indices of the token slots that input tokens will be
-    # stored into. E.g., if `slot_mapping` is [35, 2, 17] and the block size
-    # is 16, the three tokens are stored in the 3rd slot in block 2, 2nd slot
-    # in block 0, and 1st slot in block 1, respectively.
+class CPUAttentionMetadata:
+    isa: str
+    num_actual_tokens: int  # Number of tokens excluding padding.
+    max_query_len: int
+    query_start_loc: torch.Tensor
+    max_seq_len: int
+    seq_lens: torch.Tensor
+    block_table: torch.Tensor
     slot_mapping: torch.Tensor
-    """Metadata for PagedAttention."""
-    # (batch_size,). The length of sequences (entire tokens seen so far) per
-    # sequence.
-    decode_seq_lens_tensor: torch.Tensor | None
-    # Maximum sequence length in the batch. 0 if it is prefill-only batch.
-    decode_max_seq_len: int
-    # (batch_size, max_blocks_per_seq).
-    # Block addresses per sequence. (Seq id -> list of physical block)
-    # E.g., [0, 1, 2] means tokens are stored in 0th, 1st, and 2nd blocks
-    # in the kv cache. Each block can contain up to block_size tokens.
-    # 2nd dimensions are padded up to max_blocks_per_seq if it is cuda-graph
-    # captured.
-    decode_block_tables: torch.Tensor | None
-    """Metadata for TorchSDPABackend.
-    """
-    # Currently, input sequences can only contain all prompts
-    # or all decoding. True if all sequences are prompts.
-    chunked_prefill: bool
-    seq_lens: list[int] | None = None  # For non-chunked prefill
-
-    # For chunked prefill only
-    max_query_len: int | None = None
-    prefill_max_seq_len: int | None = None
-    prefill_query_start_loc: torch.Tensor | None = None
-    prefill_seq_start_loc: torch.Tensor | None = None
-    prefill_block_tables: torch.Tensor | None = None
-
-    # For V1 logits index only
-    query_start_loc: torch.Tensor | None = None
-
-    # Begin encoder attn & enc/dec cross-attn fields...
-    # Encoder sequence lengths representation
-    encoder_seq_lens: list[int] | None = None
-    encoder_seq_lens_tensor: torch.Tensor | None = None
-
-    # Maximum sequence length among encoder sequences
-    max_encoder_seq_len: int | None = None
-
-    # Number of tokens input to encoder
-    num_encoder_tokens: int | None = None
-
-    # Cross-attention memory-mapping data structures: slot mapping
-    # and block tables
-    cross_slot_mapping: torch.Tensor | None = None
-    cross_block_tables: torch.Tensor | None = None
-
-    def __post_init__(self):
-        # Set during the execution of the first attention op.
-        # It is a list because it is needed to set per prompt
-        # when alibi slopes is used. It is because of the limitation
-        # from xformer API.
-        # will not appear in the __repr__ and __init__
-        self.attn_bias: list[torch.Tensor] | None = None
-        self.encoder_attn_bias: list[torch.Tensor] | None = None
-        self.cross_attn_bias: list[torch.Tensor] | None = None
-
-    @property
-    def is_all_encoder_attn_metadata_set(self):
-        """
-        All attention metadata required for encoder attention is set.
-        """
-        return (
-            (self.encoder_seq_lens is not None)
-            and (self.encoder_seq_lens_tensor is not None)
-            and (self.max_encoder_seq_len is not None)
-        )
-
-    @property
-    def is_all_cross_attn_metadata_set(self):
-        """
-        All attention metadata required for enc/dec cross-attention is set.
-
-        Superset of encoder attention required metadata.
-        """
-        return (
-            self.is_all_encoder_attn_metadata_set
-            and (self.cross_slot_mapping is not None)
-            and (self.cross_block_tables is not None)
-        )
-
-    @property
-    def prefill_metadata(self) -> Optional["TorchSDPAMetadata"]:
-        if self.num_prefill_tokens == 0:
-            return None
-        return self
-
-    @property
-    def decode_metadata(self) -> Optional["TorchSDPAMetadata"]:
-        if self.num_decode_tokens == 0:
-            return None
-        return self
-
-    def get_seq_lens(
-        self,
-        attn_type: str,
-    ):
-        """
-        Extract appropriate sequence lengths from attention metadata
-        according to attention type.
-
-        Arguments:
-
-        * attn_metadata: Attention metadata structure associated with attention
-        * attn_type: encoder attention, decoder self-attention,
-                    encoder/decoder cross-attention
-
-        Returns:
-        * Appropriate sequence lengths tensor for query
-        * Appropriate sequence lengths tensor for key & value
-        """
-
-        if (
-            attn_type == AttentionType.DECODER
-            or attn_type == AttentionType.ENCODER_ONLY
-        ):
-            seq_lens_q = self.seq_lens
-            seq_lens_kv = self.seq_lens
-        elif attn_type == AttentionType.ENCODER:
-            seq_lens_q = self.encoder_seq_lens
-            seq_lens_kv = self.encoder_seq_lens
-        elif attn_type == AttentionType.ENCODER_DECODER:
-            seq_lens_q = self.seq_lens
-            seq_lens_kv = self.encoder_seq_lens
-        else:
-            raise AttributeError(f"Invalid attention type {str(attn_type)}")
-        return seq_lens_q, seq_lens_kv
-
-    def get_attn_bias(
-        self,
-        attn_type: str,
-    ) -> list[torch.Tensor] | None:
-        """
-        Extract appropriate attention bias from attention metadata
-        according to attention type.
-
-        Arguments:
-
-        * attn_metadata: Attention metadata structure associated with attention
-        * attn_type: encoder attention, decoder self-attention,
-                    encoder/decoder cross-attention
-
-        Returns:
-        * Appropriate attention bias value given the attention type
-        """
-
-        if (
-            attn_type == AttentionType.DECODER
-            or attn_type == AttentionType.ENCODER_ONLY
-        ):
-            return self.attn_bias
-        elif attn_type == AttentionType.ENCODER:
-            return self.encoder_attn_bias
-        elif attn_type == AttentionType.ENCODER_DECODER:
-            return self.cross_attn_bias
-        else:
-            raise AttributeError(f"Invalid attention type {str(attn_type)}")
-
-    def set_attn_bias(
-        self,
-        attn_bias: list[torch.Tensor],
-        attn_type: str,
-    ) -> None:
-        """
-        Update appropriate attention bias field of attention metadata,
-        according to attention type.
-
-        Arguments:
-
-        * attn_metadata: Attention metadata structure associated with attention
-        * attn_bias: The desired attention bias value
-        * attn_type: encoder attention, decoder self-attention,
-                    encoder/decoder cross-attention
-        """
-
-        if (
-            attn_type == AttentionType.DECODER
-            or attn_type == AttentionType.ENCODER_ONLY
-        ):
-            self.attn_bias = attn_bias
-        elif attn_type == AttentionType.ENCODER:
-            self.encoder_attn_bias = attn_bias
-        elif attn_type == AttentionType.ENCODER_DECODER:
-            self.cross_attn_bias = attn_bias
-        else:
-            raise AttributeError(f"Invalid attention type {str(attn_type)}")
-
-    def get_seq_len_block_table_args(
-        self,
-        attn_type: str,
-    ) -> tuple:
-        """
-        The particular choice of sequence-length- and block-table-related
-        attributes which should be extracted from attn_metadata is dependent
-        on the type of attention operation.
-
-        Decoder attn -> select entirely decoder self-attention-related fields
-        Encoder/decoder cross-attn -> select encoder sequence lengths &
-                                    cross-attn block-tables fields
-        Encoder attn -> select encoder sequence lengths fields & no block tables
-
-        Arguments:
-
-        * attn_metadata: Attention metadata structure associated with attention
-        * is_prompt: True if prefill, False otherwise
-        * attn_type: encoder attention, decoder self-attention,
-                    encoder/decoder cross-attention
-
-        Returns:
-
-        * Appropriate sequence-lengths tensor
-        * Appropriate max sequence-length scalar
-        * Appropriate block tables (or None)
-        """
-
-        if (
-            attn_type == AttentionType.DECODER
-            or attn_type == AttentionType.ENCODER_ONLY
-        ):
-            # Decoder self-attention
-            # Choose max_seq_len based on whether we are in prompt_run
-            return (
-                self.decode_seq_lens_tensor,
-                self.decode_max_seq_len,
-                self.decode_block_tables,
-            )
-        elif attn_type == AttentionType.ENCODER_DECODER:
-            # Enc/dec cross-attention KVs match encoder sequence length;
-            # cross-attention utilizes special "cross" block tables
-            return (
-                self.encoder_seq_lens_tensor,
-                self.max_encoder_seq_len,
-                self.cross_block_tables,
-            )
-        elif attn_type == AttentionType.ENCODER:
-            # No block tables associated with encoder attention
-            return (self.encoder_seq_lens_tensor, self.max_encoder_seq_len, None)
-        else:
-            raise AttributeError(f"Invalid attention type {str(attn_type)}")
+    scheduler_metadata: torch.Tensor | None
+    causal: bool = True
 
+    # can be removed after deprecate sdpa
+    use_sdpa_prefill: bool = False
+    num_decode_tokens: int = 0
+    sdpa_attn_masks: list[torch.Tensor | None] | None = None
+    sdpa_start_loc: torch.Tensor | None = None
 
-class TorchSDPAMetadataBuilderV1(AttentionMetadataBuilder[TorchSDPAMetadata]):
-    reorder_batch_threshold: int = 1
 
+class CPUAttentionMetadataBuilder(AttentionMetadataBuilder[CPUAttentionMetadata]):
     def __init__(
         self,
         kv_cache_spec: AttentionSpec,
@@ -348,80 +101,104 @@ def __init__(
     ) -> None:
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
 
-        self.scheduler_config = vllm_config.scheduler_config
-        self._init_reorder_batch_threshold(1, False)
+        self.use_sdpa_prefill = False
+        reorder_batch_threshold = None
+        if current_platform.get_cpu_architecture() not in _CPU_ARCH_PREFER_MIXED_BATCH:
+            # in this case, decode seqs are reordered to the front of prefill seqs
+            # to split decode and prefill. Then use SDPA for prefill and
+            # cpu_attention_with_kv_cache for decode
+            reorder_batch_threshold = 1
+            self.use_sdpa_prefill = True
 
-        self.seq_start_loc_cpu = torch.zeros(
-            vllm_config.scheduler_config.max_num_seqs + 1,
-            dtype=torch.int32,
-            device="cpu",
+        self._init_reorder_batch_threshold(reorder_batch_threshold, False)
+
+        self.kv_cache_spec = kv_cache_spec
+        self.vllm_config = vllm_config
+
+        parallel_config = vllm_config.parallel_config
+        self.num_kv_heads = vllm_config.model_config.get_num_kv_heads(parallel_config)
+        self.num_heads = vllm_config.model_config.get_num_attention_heads(
+            parallel_config
         )
-        self.seq_start_loc_np = self.seq_start_loc_cpu.numpy()
+        self.head_dim = kv_cache_spec.head_size
+        self.dtype = vllm_config.model_config.dtype
+        self.window_size = getattr(kv_cache_spec, "sliding_window", -1)
+        if self.window_size is None:
+            self.window_size = -1
+        self.block_size = vllm_config.cache_config.block_size
+        self.isa = _get_attn_isa(self.dtype, self.block_size)
 
     def build(
         self,
         common_prefix_len: int,
         common_attn_metadata: CommonAttentionMetadata,
         fast_build: bool = False,
-    ) -> TorchSDPAMetadata:
+    ) -> CPUAttentionMetadata:
         num_reqs = common_attn_metadata.num_reqs
+        num_actual_tokens = common_attn_metadata.num_actual_tokens
         max_query_len = common_attn_metadata.max_query_len
-
-        seq_lens_cpu = common_attn_metadata.seq_lens_cpu
-        seq_lens_np = seq_lens_cpu.numpy()
-
-        query_start_loc_cpu = common_attn_metadata.query_start_loc_cpu
-        query_start_loc_np = query_start_loc_cpu.numpy()
-
-        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-            split_decodes_and_prefills(
-                common_attn_metadata,
-                decode_threshold=self.reorder_batch_threshold,
-                require_uniform=True,
-            )
-        )
-
-        max_prefill_seq_len = (
-            seq_lens_np[num_decodes:num_reqs].max().item() if num_prefills > 0 else 0
-        )
-        max_decode_seq_len = (
-            seq_lens_np[:num_decodes].max().item() if num_prefills < num_reqs else 0
-        )
-        self.seq_start_loc_np[0] = 0
-        np.cumsum(seq_lens_np, out=self.seq_start_loc_np[1 : num_reqs + 1])
-
-        slot_mapping = common_attn_metadata.slot_mapping.long()
+        max_seq_len = common_attn_metadata.max_seq_len
+        query_start_loc = common_attn_metadata.query_start_loc
+        seq_lens = common_attn_metadata.seq_lens
         block_table_tensor = common_attn_metadata.block_table_tensor
-        query_start_loc_np = query_start_loc_cpu.numpy()
-        query_start_loc_np[num_decodes : num_reqs + 1] -= num_decode_tokens
+        slot_mapping = common_attn_metadata.slot_mapping
+        causal = common_attn_metadata.causal
+
+        sdpa_start_loc = query_start_loc
+        num_decode_tokens = 0
+        if self.use_sdpa_prefill and causal:
+            # Decoder, need reorder and truncate
+            assert self.reorder_batch_threshold
+            (num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens) = (
+                split_decodes_and_prefills(
+                    common_attn_metadata,
+                    decode_threshold=self.reorder_batch_threshold,
+                    require_uniform=True,
+                )
+            )
+            num_reqs = num_decodes
+            sdpa_start_loc = sdpa_start_loc[num_decodes:] - num_decode_tokens
+            seq_lens = seq_lens[:num_decodes]
+            query_start_loc = query_start_loc[: num_decodes + 1]
+            block_table_tensor = block_table_tensor[:num_decodes]
+
+        sheduler_metadata = None
+        if causal:
+            # for decode batch, use the custom kernel
+            sheduler_metadata = ops.cpu_attn_get_scheduler_metadata(
+                num_reqs=num_reqs,
+                num_heads=self.num_heads,
+                num_kv_heads=self.num_kv_heads,
+                head_dim=self.head_dim,
+                seq_lens=seq_lens,
+                dtype=self.dtype,
+                query_start_loc=query_start_loc,
+                causal=causal,
+                sliding_window_size=self.window_size,
+                isa=self.isa,
+                enable_kv_split=True,
+            )
 
-        attn_metadata = TorchSDPAMetadata(
-            num_prefills=num_prefills,
-            num_prefill_tokens=num_prefill_tokens,
-            num_decode_tokens=num_decode_tokens,
-            slot_mapping=slot_mapping,
-            # to ensure inference when chunked_prefill is disabled
-            seq_lens=seq_lens_cpu.tolist()[num_decodes:],  # prefill
-            decode_seq_lens_tensor=seq_lens_cpu[:num_decodes],  # decode
-            decode_max_seq_len=max_decode_seq_len,  # decode
-            decode_block_tables=block_table_tensor[:num_decodes],  # decode
-            chunked_prefill=self.scheduler_config.chunked_prefill_enabled,
+        attn_metadata = CPUAttentionMetadata(
+            isa=self.isa,
+            num_actual_tokens=num_actual_tokens,
             max_query_len=max_query_len,
-            prefill_max_seq_len=max_prefill_seq_len,
-            prefill_query_start_loc=query_start_loc_cpu[
-                num_decodes : num_reqs + 1
-            ],  # prefill
-            prefill_seq_start_loc=self.seq_start_loc_cpu[
-                num_decodes : num_reqs + 1
-            ],  # prefill
-            prefill_block_tables=block_table_tensor[num_decodes:num_reqs],  # prefill
-            query_start_loc=query_start_loc_cpu[: num_reqs + 1],  # for logits index
+            query_start_loc=query_start_loc,
+            max_seq_len=max_seq_len,
+            seq_lens=seq_lens,
+            block_table=block_table_tensor,
+            slot_mapping=slot_mapping,
+            scheduler_metadata=sheduler_metadata,
+            causal=causal,
+            use_sdpa_prefill=self.use_sdpa_prefill,
+            num_decode_tokens=num_decode_tokens,
+            sdpa_start_loc=sdpa_start_loc,
         )
 
         return attn_metadata
 
 
-class TorchSDPABackendImpl(AttentionImpl[TorchSDPAMetadata]):
+class CPUAttentionBackendImpl(AttentionImpl):
     def __init__(
         self,
         num_heads: int,
@@ -434,37 +211,48 @@ def __init__(
         logits_soft_cap: float | None = None,
         attn_type: str = AttentionType.DECODER,
         kv_sharing_target_layer_name: str | None = None,
+        sinks: torch.Tensor | None = None,
     ) -> None:
-        if kv_sharing_target_layer_name is not None:
-            raise NotImplementedError("KV sharing is not supported in V0.")
-        if logits_soft_cap is not None:
-            logger.warning_once(
-                "Torch SPDA does not support logits soft cap. "
-                "Outputs may be slightly off."
-            )
-        self.paged_attn_impl = _get_paged_attn_impl()
+        self.kv_sharing_target_layer_name = kv_sharing_target_layer_name
         self.num_heads = num_heads
         self.head_size = head_size
         self.scale = float(scale)
+        if logits_soft_cap is not None and attn_type in (
+            AttentionType.ENCODER,
+            AttentionType.ENCODER_ONLY,
+        ):
+            logger.warning_once(
+                "CPU_ATTN does not support logits softcap for"
+                " ENCODER and ENCODER_ONLY, outputs may be slightly off"
+            )
+        if logits_soft_cap is None:
+            logits_soft_cap = 0
+        self.logits_soft_cap = logits_soft_cap
+
         self.num_kv_heads = num_kv_heads
         if alibi_slopes is not None:
             alibi_slopes = torch.tensor(alibi_slopes, dtype=torch.float32)
         self.alibi_slopes = alibi_slopes
-        self.sliding_window = sliding_window
+        if sliding_window is None:
+            self.sliding_window = (-1, -1)
+        elif attn_type == AttentionType.ENCODER_ONLY:
+            self.sliding_window = (sliding_window - 1, sliding_window - 1)
+        else:
+            self.sliding_window = (sliding_window - 1, 0)
         self.kv_cache_dtype = kv_cache_dtype
-
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
-        self.need_mask = (
-            self.alibi_slopes is not None or self.sliding_window is not None
-        )
 
-        if is_quantized_kv_cache(kv_cache_dtype) and not _use_ipex:
-            raise NotImplementedError(
-                "Torch SDPA backend FP8 KV cache requires "
-                "intel_extension_for_pytorch support."
-            )
+        if is_quantized_kv_cache(kv_cache_dtype):
+            raise NotImplementedError("FP8 KV cache is unsupported in CPU_ATTN")
         self.attn_type = attn_type
 
+        self.sinks = sinks
+        if self.sinks is not None:
+            assert self.sinks.shape[0] == num_heads, (
+                "Sinks must have the same number of heads as the number of "
+                "heads in the layer"
+            )
+
     def forward(
         self,
         layer: AttentionLayer,
@@ -472,196 +260,130 @@ def forward(
         key: torch.Tensor,
         value: torch.Tensor,
         kv_cache: torch.Tensor,
-        attn_metadata: TorchSDPAMetadata,  # type: ignore
+        attn_metadata: CPUAttentionMetadata | None,
         output: torch.Tensor | None = None,
         output_scale: torch.Tensor | None = None,
         output_block_scale: torch.Tensor | None = None,
     ) -> torch.Tensor:
-        """Forward pass with torch SDPA and PagedAttention.
+        """Forward pass for CPU attention backend.
 
         Args:
-            query: shape = [num_tokens, num_heads * head_size]
-            key: shape = [num_tokens, num_kv_heads * head_size]
-            value: shape = [num_tokens, num_kv_heads * head_size]
+            query: shape = [num_tokens, num_heads, head_size]
+            key: shape = [num_tokens, num_kv_heads, head_size]
+            value: shape = [num_tokens, num_kv_heads, head_size]
             kv_cache: shape =
-                [2, num_blocks, block_size * num_kv_heads * head_size]
-                NOTE: kv_cache will be an empty tensor with shape [0]
-                for profiling run.
+                [2, num_blocks, num_kv_heads, block_size, head_size]
             attn_metadata: Metadata for attention.
         Returns:
             shape = [num_tokens, num_heads * head_size]
         """
+        assert output is not None, "Output tensor must be provided."
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
                 "fused output quantization is not yet supported"
-                " for TorchSDPABackendImpl"
+                " for CPUAttentionBackendImpl"
             )
 
         # For warming-up
         if attn_metadata is None:
-            return query
-
-        attn_type = self.attn_type
-        if attn_type == AttentionType.ENCODER and (
-            not attn_metadata.is_all_encoder_attn_metadata_set
-        ):
-            raise AttributeError(
-                "Encoder attention requires setting encoder metadata attributes."
-            )
-        elif attn_type == AttentionType.ENCODER_DECODER and (
-            not attn_metadata.is_all_cross_attn_metadata_set
-        ):
-            raise AttributeError(
-                "Encoder/decoder cross-attention "
-                "requires setting cross-attention "
-                "metadata attributes."
+            return output
+
+        num_actual_tokens = attn_metadata.num_actual_tokens
+
+        # Handle encoder attention differently - no KV cache needed
+        if self.attn_type in (AttentionType.ENCODER_ONLY, AttentionType.ENCODER):
+            # For encoder attention,
+            return self._run_sdpa_forward(
+                query[:num_actual_tokens],
+                key[:num_actual_tokens],
+                value[:num_actual_tokens],
+                output[:num_actual_tokens],
+                attn_metadata,
+                self.attn_type,
             )
 
-        # Reshape the query, key, and value tensors.
-        query = query.view(-1, self.num_heads, self.head_size)
-        if key is not None:
-            assert value is not None
-            key = key.view(-1, self.num_kv_heads, self.head_size)
-            value = value.view(-1, self.num_kv_heads, self.head_size)
-        else:
-            assert value is None
-
-        if attn_type != AttentionType.ENCODER and kv_cache.numel() > 0:
-            # KV-cache during decoder-self- or
-            # encoder-decoder-cross-attention, but not
-            # during encoder attention.
-            #
-            # Even if there are no new key/value pairs to cache,
-            # we still need to break out key_cache and value_cache
-            # i.e. for later use by paged attention
-            key_cache, value_cache = self.paged_attn_impl.split_kv_cache(
-                kv_cache, self.num_kv_heads, self.head_size
-            )
+        # For decoder and cross-attention, use KV cache, size are
+        # [num_blocks, num_kv_heads, block_size, head_size]
+        key_cache, value_cache = kv_cache.unbind(0)
 
-            if (key is not None) and (value is not None):
-                if attn_type == AttentionType.ENCODER_DECODER:
-                    # Update cross-attention KV cache (prefill-only)
-                    # During cross-attention decode, key & value will be None,
-                    # preventing this IF-statement branch from running
-                    updated_slot_mapping = attn_metadata.cross_slot_mapping
-                else:
-                    # Update self-attention KV cache (prefill/decode)
-                    updated_slot_mapping = attn_metadata.slot_mapping
-
-                self.paged_attn_impl.write_to_paged_cache(
-                    key,
-                    value,
-                    key_cache,
-                    value_cache,
-                    updated_slot_mapping,
-                    self.kv_cache_dtype,
-                    layer._k_scale,
-                    layer._v_scale,
-                )
+        # key and value may be None in the case of cross attention. They are
+        # calculated once based on the output from the encoder and then cached
+        # in KV cache.
+        if (
+            self.kv_sharing_target_layer_name is None
+            and key is not None
+            and value is not None
+        ):
+            ops.cpu_attn_reshape_and_cache(
+                key,
+                value,
+                key_cache,
+                value_cache,
+                attn_metadata.slot_mapping,
+                attn_metadata.isa,
+            )
 
-        if attn_type != AttentionType.ENCODER:
-            # Decoder self-attention supports chunked prefill.
-            # Encoder/decoder cross-attention requires no chunked
-            # prefill (100% prefill or 100% decode tokens, no mix)
-            num_prefill_tokens = attn_metadata.num_prefill_tokens
+        if attn_metadata.use_sdpa_prefill:
+            assert self.sinks is None, "Attention sink is unsupported in SDPA prefill"
             num_decode_tokens = attn_metadata.num_decode_tokens
-        else:
-            # Encoder attention - chunked prefill is not applicable;
-            # derive token-count from query shape & and treat them
-            # as 100% prefill tokens
-            assert attn_metadata.num_encoder_tokens is not None
-            num_prefill_tokens = attn_metadata.num_encoder_tokens
-            num_decode_tokens = 0
-
-        if attn_type == AttentionType.DECODER:
-            # Only enforce this shape-constraint for decoder
-            # self-attention
-            assert key.shape[0] == num_prefill_tokens + num_decode_tokens
-            assert value.shape[0] == num_prefill_tokens + num_decode_tokens
-
-        output = torch.empty_like(query)
-        if prefill_meta := attn_metadata.prefill_metadata:
-            if not prefill_meta.prefill_metadata.chunked_prefill:  # type: ignore
-                assert attn_metadata.seq_lens is not None
-                self._run_sdpa_forward(
-                    output, query, key, value, prefill_meta, attn_type=attn_type
-                )
-            else:
-                # prefix-enabled attention
-                assert not self.need_mask
-                import intel_extension_for_pytorch.llm.modules as ipex_modules
-
-                output = torch.empty_like(query)
-                ipex_modules.PagedAttention.flash_attn_varlen_func(
-                    output[prefill_meta.num_decode_tokens :, :, :],
-                    query[prefill_meta.num_decode_tokens :, :, :],
-                    key_cache,
-                    value_cache,
-                    prefill_meta.prefill_query_start_loc,
-                    prefill_meta.prefill_seq_start_loc,
-                    prefill_meta.max_query_len,
-                    prefill_meta.prefill_max_seq_len,
-                    self.scale,
-                    True,
-                    prefill_meta.prefill_block_tables,
-                    self.alibi_slopes,
-                )
-        if decode_meta := attn_metadata.decode_metadata:
-            assert attn_type != AttentionType.ENCODER_ONLY, (
-                "Encoder-only models should not have decode metadata."
+            self._run_sdpa_forward(
+                query[num_decode_tokens:num_actual_tokens],
+                key[num_decode_tokens:num_actual_tokens],
+                value[num_decode_tokens:num_actual_tokens],
+                output[num_decode_tokens:num_actual_tokens],
+                attn_metadata,
+                self.attn_type,
             )
-            # Decoding run.
-            (
-                seq_lens_arg,
-                max_seq_len_arg,
-                block_tables_arg,
-            ) = decode_meta.get_seq_len_block_table_args(attn_type)
-
-            self.paged_attn_impl.forward_decode(
-                output[: attn_metadata.num_decode_tokens, :, :],
-                query[: attn_metadata.num_decode_tokens, :, :],
-                key_cache,
-                value_cache,
-                block_tables_arg,
-                seq_lens_arg,
-                max_seq_len_arg,
-                self.kv_cache_dtype,
-                self.num_kv_heads,
-                self.scale,
-                self.alibi_slopes,
-                layer._k_scale,
-                layer._v_scale,
+            num_actual_tokens = num_decode_tokens
+
+        if num_actual_tokens > 0:
+            ops.cpu_attention_with_kv_cache(
+                query=query[:num_actual_tokens],
+                key_cache=key_cache,
+                value_cache=value_cache,
+                output=output[:num_actual_tokens],  # type: ignore
+                query_start_loc=attn_metadata.query_start_loc,
+                seq_lens=attn_metadata.seq_lens,
+                scale=self.scale,
+                causal=attn_metadata.causal,
+                alibi_slopes=self.alibi_slopes,  # type: ignore
+                sliding_window=self.sliding_window,
+                block_table=attn_metadata.block_table,
+                softcap=self.logits_soft_cap,
+                scheduler_metadata=attn_metadata.scheduler_metadata,
+                s_aux=self.sinks,
             )
 
-        # Reshape the output tensor.
-        return output.view(-1, self.num_heads * self.head_size)
+        return output
 
     def _run_sdpa_forward(
         self,
-        output: torch.Tensor,
         query: torch.Tensor,
         key: torch.Tensor,
         value: torch.Tensor,
-        attn_metadata: TorchSDPAMetadata,
-        attn_type: str = AttentionType.DECODER,
-    ) -> None:
-        attn_masks = attn_metadata.get_attn_bias(attn_type)
+        output: torch.Tensor,
+        attn_metadata: CPUAttentionMetadata,
+        attn_type: str,
+    ) -> torch.Tensor:
+        attn_masks = attn_metadata.sdpa_attn_masks
         if attn_masks is None:
             if self.alibi_slopes is not None:
                 attn_masks = _make_alibi_bias(
                     self.alibi_slopes,
                     query.dtype,
-                    attn_metadata.seq_lens,  # type: ignore
+                    attn_metadata.sdpa_start_loc,
                 )
-            elif self.sliding_window is not None:
+            elif self.sliding_window[0] != -1 or self.sliding_window[1] != -1:
                 assert attn_metadata.seq_lens is not None
                 attn_masks = _make_sliding_window_bias(
-                    attn_metadata.seq_lens, self.sliding_window, query.dtype
+                    attn_metadata.sdpa_start_loc,
+                    self.sliding_window[0],
+                    self.sliding_window[1],
+                    query.dtype,
                 )
             else:
-                seq_lens, _ = attn_metadata.get_seq_lens(attn_type)
-                attn_masks = [None] * len(seq_lens)
-            attn_metadata.set_attn_bias(attn_masks, attn_type)
+                attn_masks = [None] * (attn_metadata.sdpa_start_loc.size(0) - 1)  # type: ignore
+            attn_metadata.sdpa_attn_masks = attn_masks
 
         query = query.movedim(0, query.dim() - 2)
         key = key.movedim(0, key.dim() - 2)
@@ -673,21 +395,16 @@ def _run_sdpa_forward(
 
         causal_attn = attn_type == AttentionType.DECODER
 
-        seq_lens_q, seq_lens_kv = attn_metadata.get_seq_lens(attn_type)
-        # Incoming Q and KV contain decoded tokens as well, hence start at an offset
-        # equal to num_decode_tokens since decode requests appear first
-        start_q, start_kv = (
-            attn_metadata.num_decode_tokens,
-            attn_metadata.num_decode_tokens,
-        )
-        for seq_len_q, seq_len_kv, mask in zip(seq_lens_q, seq_lens_kv, attn_masks):
-            end_q = start_q + seq_len_q
-            end_kv = start_kv + seq_len_kv
+        sdpa_start_loc = attn_metadata.sdpa_start_loc.numpy()  # type: ignore
+        for i in range(len(attn_masks)):
+            mask = attn_masks[i]
+            start_q = sdpa_start_loc[i]
+            end_q = sdpa_start_loc[i + 1]
             sub_out = (
-                scaled_dot_product_attention(
+                torch.nn.functional.scaled_dot_product_attention(
                     query[None, :, start_q:end_q, :],
-                    key[None, :, start_kv:end_kv, :],
-                    value[None, :, start_kv:end_kv, :],
+                    key[None, :, start_q:end_q, :],
+                    value[None, :, start_q:end_q, :],
                     attn_mask=mask,
                     dropout_p=0.0,
                     is_causal=causal_attn and mask is None,
@@ -697,17 +414,20 @@ def _run_sdpa_forward(
                 .movedim(query.dim() - 2, 0)
             )
             output[start_q:end_q, :, :] = sub_out
-            start_q, start_kv = end_q, end_kv
+        return output
 
 
 def _make_alibi_bias(
     alibi_slopes: torch.Tensor,
     dtype: torch.dtype,
-    seq_lens: list[int],
+    sdpa_start_loc: torch.Tensor,
 ) -> list[torch.Tensor]:
     attn_biases: list[torch.Tensor] = []
-    for seq_len in seq_lens:
-        bias = torch.arange(seq_len, dtype=dtype)
+    seq_num = sdpa_start_loc.size(0) - 1
+    sdpa_start_loc = sdpa_start_loc.numpy()  # type: ignore
+    for i in range(seq_num):
+        seq_len = sdpa_start_loc[i + 1] - sdpa_start_loc[i]
+        bias = torch.arange(seq_len, dtype=dtype)  # type: ignore
         # NOTE(zhuohan): HF uses
         #     `bias = bias[None, :].repeat(seq_len, 1)`
         # here. We find that both biases give the same results, but
@@ -719,7 +439,7 @@ def _make_alibi_bias(
         bias = bias[None, :].repeat((num_heads, 1, 1))
         bias.mul_(alibi_slopes[:, None, None]).unsqueeze_(0)
         inf_mask = (
-            torch.empty((1, seq_len, seq_len), dtype=bias.dtype)
+            torch.empty((1, seq_len, seq_len), dtype=bias.dtype)  # type: ignore
             .fill_(-torch.inf)
             .triu_(diagonal=1)
         )
@@ -729,210 +449,37 @@ def _make_alibi_bias(
 
 
 def _make_sliding_window_bias(
-    seq_lens: list[int],
-    window_size: int | None,
+    sdpa_start_loc: torch.Tensor,
+    left_window_size: int,
+    right_window_size: int,
     dtype: torch.dtype,
 ) -> list[torch.Tensor]:
     attn_biases: list[torch.Tensor] = []
-    for seq_len in seq_lens:
-        tensor = torch.full(
-            (1, seq_len, seq_len),
-            dtype=dtype,
+    seq_num = sdpa_start_loc.size(0) - 1
+    sdpa_start_loc = sdpa_start_loc.numpy()  # type: ignore
+    for i in range(seq_num):
+        seq_len = sdpa_start_loc[i + 1] - sdpa_start_loc[i]
+        mask = torch.full(  # type: ignore
+            (1, seq_len, seq_len),  # type: ignore
             fill_value=1,
+            dtype=dtype,
         )
-        shift = 0
-        mask = torch.tril(tensor, diagonal=shift).to(dtype)  # type: ignore
-        if window_size is not None:
-            mask = torch.triu(mask, diagonal=shift - window_size + 1)
+
+        if right_window_size != -1:
+            mask = torch.tril(mask, diagonal=right_window_size)
+        if left_window_size != -1:
+            mask = torch.triu(mask, diagonal=-left_window_size)
         mask = torch.log(mask)
-        attn_biases.append(mask.to(dtype))
+        attn_biases.append(mask)
 
     return attn_biases
 
 
-class _PagedAttention:
-    @staticmethod
-    def get_supported_head_sizes() -> list[int]:
-        return [32, 64, 80, 96, 112, 128, 192, 256]
-
-    @staticmethod
-    def get_kv_cache_shape(
-        num_blocks: int,
-        block_size: int,
-        num_kv_heads: int,
-        head_size: int,
-        *args,
-    ) -> tuple[int, ...]:
-        return 2, num_blocks, block_size * num_kv_heads * head_size
-
-    @staticmethod
-    def split_kv_cache(
-        kv_cache: torch.Tensor,
-        num_kv_heads: int,
-        head_size: int,
-        *args,
-    ) -> tuple[torch.Tensor, torch.Tensor]:
-        x = 16 // kv_cache.element_size()
-        num_blocks = kv_cache.shape[1]
-
-        key_cache = kv_cache[0]
-        key_cache = key_cache.view(num_blocks, num_kv_heads, head_size // x, -1, x)
-        value_cache = kv_cache[1]
-        value_cache = value_cache.view(num_blocks, num_kv_heads, head_size, -1)
-        return key_cache, value_cache
-
-    @staticmethod
-    def write_to_paged_cache(
-        key: torch.Tensor,
-        value: torch.Tensor,
-        key_cache: torch.Tensor,
-        value_cache: torch.Tensor,
-        slot_mapping: torch.Tensor,
-        kv_cache_dtype: str,
-        k_scale: torch.Tensor,
-        v_scale: torch.Tensor,
-        *args,
-    ) -> None:
-        ops.reshape_and_cache(
-            key,
-            value,
-            key_cache,
-            value_cache,
-            slot_mapping.flatten(),
-            kv_cache_dtype,
-            k_scale,
-            v_scale,
-        )
-
-    @staticmethod
-    def forward_decode(
-        output: torch.Tensor,
-        query: torch.Tensor,
-        key_cache: torch.Tensor,
-        value_cache: torch.Tensor,
-        block_tables: torch.Tensor,
-        context_lens: torch.Tensor,
-        max_context_len: int,
-        kv_cache_dtype: str,
-        num_kv_heads: int,
-        scale: float,
-        alibi_slopes: torch.Tensor | None,
-        k_scale: torch.Tensor,
-        v_scale: torch.Tensor,
-        *args,
-    ) -> None:
-        tp_rank: int = 0
-        blocksparse_local_blocks: int = 0
-        blocksparse_vert_stride: int = 0
-        blocksparse_block_size: int = 64
-        blocksparse_head_sliding_step: int = 0
-        block_size = value_cache.shape[3]
-
-        ops.paged_attention_v1(
-            output,
-            query,
-            key_cache,
-            value_cache,
-            num_kv_heads,
-            scale,
-            block_tables,
-            context_lens,
-            block_size,
-            max_context_len,
-            alibi_slopes,
-            kv_cache_dtype,
-            k_scale,
-            v_scale,
-            tp_rank,
-            blocksparse_local_blocks,
-            blocksparse_vert_stride,
-            blocksparse_block_size,
-            blocksparse_head_sliding_step,
-        )
-
-
-class _IPEXPagedAttention(_PagedAttention):
-    @staticmethod
-    def get_supported_head_sizes() -> list[int]:
-        return []
-
-    @staticmethod
-    def split_kv_cache(
-        kv_cache: torch.Tensor,
-        num_kv_heads: int,
-        head_size: int,
-        *args,
-    ) -> tuple[torch.Tensor, torch.Tensor]:
-        num_blocks = kv_cache.shape[1]
-
-        key_cache = kv_cache[0]
-        key_cache = key_cache.view(num_blocks, num_kv_heads, -1, head_size)
-        value_cache = kv_cache[1]
-        value_cache = value_cache.view(num_blocks, num_kv_heads, -1, head_size)
-        return key_cache, value_cache
-
-    @staticmethod
-    def write_to_paged_cache(
-        key: torch.Tensor,
-        value: torch.Tensor,
-        key_cache: torch.Tensor,
-        value_cache: torch.Tensor,
-        slot_mapping: torch.Tensor,
-        kv_cache_dtype: str,
-        k_scale: torch.Tensor,
-        v_scale: torch.Tensor,
-        *args,
-    ) -> None:
-        ipex_modules.PagedAttention.reshape_and_cache(
-            key, value, key_cache, value_cache, slot_mapping.flatten().int()
-        )
-
-    @staticmethod
-    def forward_decode(
-        output: torch.Tensor,
-        query: torch.Tensor,
-        key_cache: torch.Tensor,
-        value_cache: torch.Tensor,
-        block_tables: torch.Tensor,
-        context_lens: torch.Tensor,
-        max_context_len: int,
-        kv_cache_dtype: str,
-        num_kv_heads: int,
-        scale: float,
-        alibi_slopes: torch.Tensor | None,
-        k_scale: torch.Tensor,
-        v_scale: torch.Tensor,
-        *args,
-    ) -> None:
-        block_size = value_cache.shape[2]
-        head_mapping = (
-            torch.arange(
-                0,
-                num_kv_heads,
-                device="cpu",
-                dtype=torch.int32,
-            )
-            .view(num_kv_heads, 1)
-            .repeat_interleave(query.size(1) // num_kv_heads)
-            .flatten()
-        )
-        ipex_modules.PagedAttention.single_query_cached_kv_attention(
-            output,
-            query.contiguous(),
-            key_cache,
-            value_cache,
-            head_mapping,
-            scale,
-            block_tables,
-            context_lens,
-            block_size,
-            max_context_len,
-            alibi_slopes,
-        )
-
-
-def _get_paged_attn_impl():
-    if _use_ipex:
-        return _IPEXPagedAttention
+def _get_attn_isa(dtype: torch.dtype, block_size: int) -> str:
+    supports_amx = torch._C._cpu._is_amx_tile_supported()
+    if supports_amx and dtype in (torch.bfloat16,) and block_size % 32 == 0:
+        return "amx"
+    elif block_size % 32 == 0:
+        return "vec"
     else:
-        return _PagedAttention
+        return "vec16"
diff --git a/vllm/v1/attention/backends/utils.py b/vllm/v1/attention/backends/utils.py
index 07dfbc766acd..751c5c15a4c9 100644
--- a/vllm/v1/attention/backends/utils.py
+++ b/vllm/v1/attention/backends/utils.py
@@ -265,7 +265,7 @@ def __init__(
 
     def _init_reorder_batch_threshold(
         self,
-        reorder_batch_threshold: int = 1,
+        reorder_batch_threshold: int | None = 1,
         supports_spec_as_decode: bool = False,
         supports_dcp_with_varlen: bool = False,
     ) -> None:
diff --git a/vllm/v1/worker/cpu_model_runner.py b/vllm/v1/worker/cpu_model_runner.py
index 5aebfec06dfd..ceb1cf64b588 100644
--- a/vllm/v1/worker/cpu_model_runner.py
+++ b/vllm/v1/worker/cpu_model_runner.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from contextlib import contextmanager
-from typing import TYPE_CHECKING, Any
+from typing import Any
 
 import torch
 import torch.nn as nn
@@ -12,9 +12,6 @@
 from vllm.v1.utils import CpuGpuBuffer
 from vllm.v1.worker.gpu_model_runner import GPUModelRunner
 
-if TYPE_CHECKING:
-    from vllm.v1.core.sched.output import SchedulerOutput
-
 logger = init_logger(__name__)
 
 
@@ -31,15 +28,6 @@ def __init__(self, vllm_config: VllmConfig, device: torch.device):
 
         self._postprocess_tensors()
 
-    # Note: Remove the override after new attention backend finished
-    def _may_reorder_batch(self, scheduler_output: "SchedulerOutput") -> None:
-        if len(self.kv_cache_config.kv_cache_groups) > 1:
-            raise ValueError(
-                "Multiple KVCacheGroups is not"
-                "currently supported with CPU model runner."
-            )
-        super()._may_reorder_batch(scheduler_output)
-
     def _postprocess_tensors(self) -> None:
         # Note: replace device tensors with cpu tensors
         def replace_tensor(obj: Any, cpu_attr_name: str, device_attr_name) -> None:

From 9f0247cfa40a52356aa7860c163c062eb086d266 Mon Sep 17 00:00:00 2001
From: Andreas Karatzas <akaratza@amd.com>
Date: Tue, 11 Nov 2025 20:34:36 -0600
Subject: [PATCH 088/183] `VLLM_USE_TRITON_FLASH_ATTN` V0 variable deprecation
 (#27611)

Signed-off-by: Andreas Karatzas <akaratza@amd.com>
Signed-off-by: Andreas Karatzas <Andreas.Karatzas@amd.com>
---
 .../scripts/hardware_ci/run-amd-test.sh       |   8 +-
 tests/kernels/test_triton_flash_attention.py  | 516 ----------
 .../language/pooling/test_classification.py   |   6 -
 .../models/language/pooling/test_embedding.py |   7 -
 .../pooling/test_mm_classifier_conversion.py  |  13 -
 tests/models/language/pooling/test_reward.py  |   6 -
 .../multimodal/generation/test_common.py      |   8 -
 .../generation/test_phi4_multimodal.py        |   7 -
 .../multimodal/generation/test_phi4mm.py      |   7 -
 tests/quantization/test_quark.py              |   5 -
 vllm/attention/ops/triton_flash_attention.py  | 932 ------------------
 vllm/envs.py                                  |   6 -
 vllm/platforms/rocm.py                        |  21 +-
 vllm/usage/usage_lib.py                       |   1 -
 vllm/v1/attention/backends/mla/triton_mla.py  |  55 +-
 15 files changed, 11 insertions(+), 1587 deletions(-)
 delete mode 100644 tests/kernels/test_triton_flash_attention.py
 delete mode 100644 vllm/attention/ops/triton_flash_attention.py

diff --git a/.buildkite/scripts/hardware_ci/run-amd-test.sh b/.buildkite/scripts/hardware_ci/run-amd-test.sh
index 58fd435691f4..0e5b21ddf25b 100755
--- a/.buildkite/scripts/hardware_ci/run-amd-test.sh
+++ b/.buildkite/scripts/hardware_ci/run-amd-test.sh
@@ -78,17 +78,13 @@ HF_MOUNT="/root/.cache/huggingface"
 commands=$@
 echo "Commands:$commands"
 
-if [[ $commands == *"pytest -v -s basic_correctness/test_basic_correctness.py"* ]]; then
-  commands=${commands//"pytest -v -s basic_correctness/test_basic_correctness.py"/"VLLM_USE_TRITON_FLASH_ATTN=0 pytest -v -s basic_correctness/test_basic_correctness.py"}
-fi
+commands=${commands//"pytest -v -s basic_correctness/test_basic_correctness.py"/"pytest -v -s basic_correctness/test_basic_correctness.py"}
 
 if [[ $commands == *"pytest -v -s models/test_registry.py"* ]]; then
   commands=${commands//"pytest -v -s models/test_registry.py"/"pytest -v -s models/test_registry.py -k 'not BambaForCausalLM and not GritLM and not Mamba2ForCausalLM and not Zamba2ForCausalLM'"}
 fi
 
-if [[ $commands == *"pytest -v -s compile/test_basic_correctness.py"* ]]; then
-  commands=${commands//"pytest -v -s compile/test_basic_correctness.py"/"VLLM_USE_TRITON_FLASH_ATTN=0 pytest -v -s compile/test_basic_correctness.py"}
-fi
+commands=${commands//"pytest -v -s compile/test_basic_correctness.py"/"pytest -v -s compile/test_basic_correctness.py"}
 
 if [[ $commands == *"pytest -v -s lora"* ]]; then
   commands=${commands//"pytest -v -s lora"/"VLLM_ROCM_CUSTOM_PAGED_ATTN=0 pytest -v -s lora"}
diff --git a/tests/kernels/test_triton_flash_attention.py b/tests/kernels/test_triton_flash_attention.py
deleted file mode 100644
index 4b0bbb992d2e..000000000000
--- a/tests/kernels/test_triton_flash_attention.py
+++ /dev/null
@@ -1,516 +0,0 @@
-# SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-"""Tests for the triton_flash_attention kernel
-
-Run `pytest tests/kernels/test_triton_flash_attention.py`.
-"""
-
-import pytest
-import torch
-
-from vllm.attention.ops.triton_flash_attention import (
-    SUPPORTED_LAYOUTS,
-    MetaData,
-    compute_alibi_tensor,
-    scale_fp8,
-    triton_attention_rocm,
-)
-from vllm.platforms import current_platform
-
-
-class ReferenceAttention:
-    def __init__(
-        self, Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, use_alibi, dtype, input_metadata
-    ):
-        self.Z = Z
-        self.HQ = HQ
-        self.HK = HK
-        self.N_CTX_Q = N_CTX_Q
-        self.N_CTX_K = N_CTX_K
-        self.D_HEAD = D_HEAD
-        self.use_alibi = use_alibi
-        self.dtype = dtype
-        self.input_metadata = input_metadata
-
-    def fwd(self, q, k, v):
-        scores = (
-            torch.einsum("bhqd,bhkd->bhqk", q, k).float() * self.input_metadata.sm_scale
-        )
-        if self.input_metadata.causal:
-            mask = torch.tril(
-                torch.ones(self.N_CTX_Q, self.N_CTX_K, device="cuda"),
-                diagonal=self.N_CTX_K - self.N_CTX_Q,
-            )
-            scores[:, :, mask == 0] = float("-inf")
-
-        if self.input_metadata.bias is not None:
-            scores += self.input_metadata.bias
-
-        if self.use_alibi:
-            scores += compute_alibi_tensor(
-                self.input_metadata.alibi_slopes, self.N_CTX_Q, self.N_CTX_K
-            )
-
-        p = torch.softmax(scores, dim=-1)
-        if self.input_metadata.causal:
-            # If N_CTX_Q > N_CTX_K, there's at least one row of all -infs going
-            # into softmax. This creates a row of NaNs as -inf - -inf == NaN.
-            # So we fix this by converting the NaNs to 0s, which is what they
-            # should be out of the softmax.
-            nan_mask = torch.isnan(p)
-            p[nan_mask == 1] = 0
-        ref_out = torch.einsum("bhqk,bhkd->bhqd", p.to(self.dtype), v)
-        # compare
-        if self.input_metadata.layout == "bshd":
-            ref_out = ref_out.transpose(1, 2).clone()
-        return ref_out
-
-    def fwd_fp8(self, q_quantized, k_quantized, v_quantized):
-        q = (q_quantized.to(torch.float16) * self.input_metadata.q_descale).to(
-            self.dtype
-        )
-        k = (k_quantized.to(torch.float16) * self.input_metadata.k_descale).to(
-            self.dtype
-        )
-        v = (v_quantized.to(torch.float16) * self.input_metadata.v_descale).to(
-            self.dtype
-        )
-        result = self.fwd(q, k, v)
-        if self.input_metadata.o_scale is not None:
-            result, _ = scale_fp8(result, self.input_metadata.o_scale)
-        return result
-
-    def fwd_fp8_kv(self, q, k_quantized, v_quantized):
-        k_descale, v_descale = (
-            self.input_metadata.k_descale,
-            self.input_metadata.v_descale,
-        )
-        k_dequantized = (
-            k_quantized.to(torch.float32) * k_descale.to(torch.float32)
-        ).to(self.dtype)
-        v_dequantized = (
-            v_quantized.to(torch.float32) * v_descale.to(torch.float32)
-        ).to(self.dtype)
-        return self.fwd(q, k_dequantized, v_dequantized)
-
-    def varlen_fwd(self, q, k, v, is_mqa=False):
-        ref_out = torch.empty_like(q)
-        if is_mqa:
-            # Make KV look like HQ/HK "groups" of HK. Later, we will reshape so
-            # the size aligns with Q.
-            k_ref = k.view(k.shape[0], k.shape[1], 1, k.shape[2]).expand(
-                -1, -1, self.HQ // self.HK, -1
-            )
-            v_ref = v.view(v.shape[0], v.shape[1], 1, v.shape[2]).expand(
-                -1, -1, self.HQ // self.HK, -1
-            )
-        else:
-            k_ref = k
-            v_ref = v
-
-        for i in range(0, self.input_metadata.num_contexts):
-            start_q, start_k = (
-                self.input_metadata.cu_seqlens_q[i],
-                self.input_metadata.cu_seqlens_k[i],
-            )
-            end_q, end_k = (
-                self.input_metadata.cu_seqlens_q[i + 1],
-                self.input_metadata.cu_seqlens_k[i + 1],
-            )
-            k_curr = k_ref[start_k:end_k]
-            v_curr = v_ref[start_k:end_k]
-            if is_mqa:
-                k_curr = k_curr.reshape(k_curr.shape[0], -1, k_curr.shape[3])
-                v_curr = v_curr.reshape(v_curr.shape[0], -1, v_curr.shape[3])
-            scores = torch.einsum("qhd,khd->qhk", q[start_q:end_q], k_curr).float()
-            p = torch.softmax(scores * self.input_metadata.sm_scale, dim=-1).half()
-            ref_out[start_q:end_q] = torch.einsum("qhk,khd->qhd", p, v_curr)
-        return ref_out
-
-
-def quantize_input(q, k, v, fp8_kv=False, use_o_scale=False):
-    q_descale = None
-    if not fp8_kv:
-        q, q_descale = scale_fp8(q)
-    k, k_descale = scale_fp8(k)
-    v, v_descale = scale_fp8(v)
-
-    # In real world use case, the p scale would be a parameter trained by the
-    # model.
-    p_scale = None
-
-    o_scale = torch.rand(1, device="cuda", requires_grad=False) if use_o_scale else None
-
-    return q, k, v, q_descale, k_descale, v_descale, p_scale, o_scale
-
-
-def input_helper(
-    Z,
-    HQ,
-    HK,
-    N_CTX_Q,
-    N_CTX_K,
-    D_HEAD,
-    dtype,
-    layout=None,
-    use_alibi=None,
-    causal=None,
-    is_fp8=False,
-    fp8_kv=False,
-    use_o_scale=False,
-    use_bias=False,
-):
-    assert layout in SUPPORTED_LAYOUTS, "Got unsupported layout."
-
-    current_platform.seed_everything(0)
-
-    # Initialize q, k, v
-    if layout == "bhsd":
-        q_tensor_shape = (Z, HQ, N_CTX_Q, D_HEAD)
-        k_tensor_shape = (Z, HK, N_CTX_K, D_HEAD)
-    elif layout == "bshd":
-        q_tensor_shape = (Z, N_CTX_Q, HQ, D_HEAD)
-        k_tensor_shape = (Z, N_CTX_K, HK, D_HEAD)
-
-    if use_alibi:
-        # for n heads the set of slopes is the geometric sequence that starts
-        # 2^(-8/n)
-        alibi_slopes = torch.tensor(
-            [2 ** (-8 / HQ * i) for i in range(1, HQ + 1)],
-            dtype=torch.float32,
-            device="cuda",
-        ).repeat(Z, 1)
-    else:
-        alibi_slopes = None
-
-    if use_bias:
-        bias = torch.randn(
-            (1, HQ, N_CTX_Q, N_CTX_K), dtype=dtype, device="cuda", requires_grad=False
-        )
-    else:
-        bias = None
-
-    q = torch.randn(q_tensor_shape, dtype=dtype, device="cuda", requires_grad=False)
-    k = torch.randn(k_tensor_shape, dtype=dtype, device="cuda", requires_grad=False)
-    v = torch.randn(k_tensor_shape, dtype=dtype, device="cuda", requires_grad=False)
-
-    if is_fp8:
-        (q, k, v, q_descale, k_descale, v_descale, p_scale, o_scale) = quantize_input(
-            q, k, v, use_o_scale=use_o_scale, fp8_kv=fp8_kv
-        )
-    else:
-        q_descale = k_descale = v_descale = p_scale = o_scale = None
-
-    input_metadata = MetaData(
-        sm_scale=D_HEAD**-0.5,
-        max_seqlens_q=N_CTX_Q,
-        max_seqlens_k=N_CTX_K,
-        layout=layout,
-        alibi_slopes=alibi_slopes,
-        alibi_batch=Z,
-        alibi_nheads=HQ,
-        q_descale=q_descale,
-        k_descale=k_descale,
-        v_descale=v_descale,
-        p_scale=p_scale,
-        o_scale=o_scale,
-        bias=bias,
-        seqlen_q=N_CTX_Q,
-        seqlen_k=N_CTX_K,
-    )
-    return q, k, v, input_metadata
-
-
-def varlen_input_helper(
-    Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, dtype, equal_seqlens=False
-):
-    current_platform.seed_everything(0)
-
-    # Random sequence lengths. Using N_CTX as kind of max of sum of individual
-    # seqs
-    if not equal_seqlens:
-        max_seqlens_q = N_CTX_Q // Z
-        max_seqlens_k = N_CTX_K // Z
-        seqlens_q = torch.randint(1, max_seqlens_q + 1, (Z,), dtype=torch.int32)
-        seqlens_k = torch.randint(1, max_seqlens_k + 1, (Z,), dtype=torch.int32)
-    else:
-        seqlens_q = torch.full((Z,), N_CTX_Q // Z)
-        seqlens_k = torch.full((Z,), N_CTX_K // Z)
-
-    # Calculate cumulative sequence lengths
-    cu_seqlens_q = torch.cat(
-        [
-            torch.tensor([0], dtype=torch.int32),
-            seqlens_q.cumsum(dim=0, dtype=torch.int32),
-        ]
-    )
-    cu_seqlens_k = torch.cat(
-        [
-            torch.tensor([0], dtype=torch.int32),
-            seqlens_k.cumsum(dim=0, dtype=torch.int32),
-        ]
-    )
-    cu_seqlens_q = cu_seqlens_q.to(device="cuda")
-    cu_seqlens_k = cu_seqlens_k.to(device="cuda")
-
-    # Initialize q, k, v with variable lengths
-    total_q = cu_seqlens_q[-1].item()
-    total_k = cu_seqlens_k[-1].item()
-    q = (
-        torch.randn((total_q, HQ, D_HEAD), dtype=dtype, device="cuda")
-        .normal_(mean=0.0, std=0.5)
-        .requires_grad_()
-    )
-    k = (
-        torch.randn((total_k, HK, D_HEAD), dtype=dtype, device="cuda")
-        .normal_(mean=0.0, std=0.5)
-        .requires_grad_()
-    )
-    v = (
-        torch.randn((total_k, HK, D_HEAD), dtype=dtype, device="cuda")
-        .normal_(mean=0.0, std=0.5)
-        .requires_grad_()
-    )
-    sm_scale = D_HEAD**-0.5
-    input_metadata = MetaData(sm_scale=sm_scale)
-    input_metadata.set_varlen_params(cu_seqlens_q, cu_seqlens_k)
-    return q, k, v, input_metadata
-
-
-@pytest.mark.parametrize(
-    "Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD",
-    [
-        (1, 48, 12, 1, 1, 64),
-        (4, 4, 4, 128, 128, 65),
-        (16, 48, 48, 1, 1, 128),
-        (64, 48, 24, 3, 3, 128),
-        (4, 4, 4, 113, 123, 1),
-    ],
-)
-@pytest.mark.parametrize("causal", [True, False])
-@pytest.mark.parametrize("use_alibi", [True, False])
-@pytest.mark.parametrize("layout", ["bshd"])
-def test_op_fwd(
-    Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, causal, use_alibi, layout, dtype=torch.float16
-):
-    current_platform.seed_everything(0)
-    q, k, v, input_metadata = input_helper(
-        Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, dtype, layout, use_alibi, causal
-    )
-
-    o = torch.empty_like(q)
-
-    # triton implementation
-    tri_out, _ = triton_attention_rocm(q, k, v, o, input_metadata)
-
-    # Transpose here if layout is bshd so we have same reference code for all
-    # layouts
-    if layout == "bshd":
-        q = q.transpose(1, 2).clone()
-        k = k.transpose(1, 2).clone()
-        v = v.transpose(1, 2).clone()
-    # Replicate K and V if using MQA/GQA
-    if HQ != HK:
-        k = (
-            k.view(k.shape[0], k.shape[1], -1, k.shape[2], k.shape[3])
-            .expand(-1, -1, HQ // HK, -1, -1)
-            .reshape(k.shape[0], -1, k.shape[2], k.shape[3])
-        )
-        v = (
-            v.view(v.shape[0], v.shape[1], -1, v.shape[2], v.shape[3])
-            .expand(-1, -1, HQ // HK, -1, -1)
-            .reshape(v.shape[0], -1, v.shape[2], v.shape[3])
-        )
-
-    ref_impl = ReferenceAttention(
-        Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, use_alibi, dtype, input_metadata
-    )
-    ref_out = ref_impl.fwd(q, k, v)
-
-    torch.testing.assert_close(ref_out, tri_out, atol=2e-2, rtol=2e-2)
-
-
-@pytest.mark.parametrize(
-    "Z, H, N_CTX_Q, N_CTX_K, D_HEAD",
-    [
-        (4, 48, 1, 1, 64),
-        (4, 48, 1, 1, 128),
-        (4, 48, 3, 3, 128),
-        (4, 4, 128, 128, 65),
-    ],
-)
-@pytest.mark.parametrize("causal", [True, False])
-@pytest.mark.parametrize("layout", ["bhsd"])
-@pytest.mark.parametrize("use_o_scale", [True, False])
-@pytest.mark.skipif(
-    torch.cuda.get_device_capability() < (9, 0),
-    reason="Triton FP8 requires CUDA 9.0 or higher",
-)
-def test_op_fwd_fp8(
-    Z, H, N_CTX_Q, N_CTX_K, D_HEAD, causal, layout, use_o_scale, dtype=torch.float32
-):
-    current_platform.seed_everything(0)
-
-    # Disable grad to save memory it won't run into OOM on CI machine.
-    # q, k, v, input_metadata = input_helper(Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD,
-    # dtype, layout)
-
-    q_quantized, k_quantized, v_quantized, input_metadata = input_helper(
-        Z,
-        H,
-        H,
-        N_CTX_Q,
-        N_CTX_K,
-        D_HEAD,
-        dtype,
-        causal=causal,
-        layout=layout,
-        is_fp8=True,
-        use_o_scale=use_o_scale,
-    )
-
-    o = torch.empty_like(q_quantized) if use_o_scale else None
-
-    tri_out, _ = triton_attention_rocm(
-        q_quantized, k_quantized, v_quantized, o, input_metadata
-    )
-
-    ref_impl = ReferenceAttention(
-        Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD, False, dtype, input_metadata
-    )
-    ref_out = ref_impl.fwd_fp8(q_quantized, k_quantized, v_quantized)
-
-    # compare
-    torch.testing.assert_close(
-        ref_out.to(torch.float32), tri_out.to(torch.float32), atol=7e-2, rtol=2e-1
-    )
-
-
-@pytest.mark.parametrize(
-    "Z, H, N_CTX_Q, N_CTX_K, D_HEAD",
-    [
-        (4, 48, 1, 1, 64),
-        (4, 48, 1, 1, 128),
-        (4, 48, 3, 3, 128),
-        (4, 4, 128, 128, 65),
-        (4, 4, 113, 123, 1),
-    ],
-)
-@pytest.mark.parametrize("causal", [True, False])
-@pytest.mark.parametrize("layout", ["bhsd"])
-def test_op_fwd_fp8_kv(
-    Z, H, N_CTX_Q, N_CTX_K, D_HEAD, causal, layout, dtype=torch.float32
-):
-    current_platform.seed_everything(0)
-
-    q, k_quantized, v_quantized, input_metadata = input_helper(
-        Z,
-        H,
-        H,
-        N_CTX_Q,
-        N_CTX_K,
-        D_HEAD,
-        dtype,
-        causal=causal,
-        layout=layout,
-        is_fp8=True,
-        fp8_kv=True,
-    )
-
-    o = torch.empty_like(q)
-
-    tri_out, _ = triton_attention_rocm(q, k_quantized, v_quantized, o, input_metadata)
-
-    ref_impl = ReferenceAttention(
-        Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD, False, dtype, input_metadata
-    )
-    ref_out = ref_impl.fwd_fp8_kv(q, k_quantized, v_quantized)
-
-    torch.testing.assert_close(ref_out, tri_out, atol=3e-2, rtol=8e-1)
-
-
-@pytest.mark.parametrize(
-    "Z, H, N_CTX_Q, N_CTX_K, D_HEAD",
-    [
-        (4, 48, 1, 1, 64),
-        (4, 48, 1, 1, 128),
-        (4, 48, 3, 3, 128),
-        (4, 4, 128, 128, 65),
-    ],
-)
-@pytest.mark.parametrize("causal", [True, False])
-@pytest.mark.parametrize("use_bias", [True])
-@pytest.mark.parametrize("dtype", [torch.bfloat16])
-def test_op_fwd_bias(Z, H, N_CTX_Q, N_CTX_K, D_HEAD, causal, use_bias, dtype):
-    current_platform.seed_everything(0)
-    q, k, v, input_metadata = input_helper(
-        Z,
-        H,
-        H,
-        N_CTX_Q,
-        N_CTX_K,
-        D_HEAD,
-        dtype,
-        layout="bhsd",
-        causal=causal,
-        use_bias=use_bias,
-    )
-    o = torch.empty_like(q)
-
-    # triton implementation
-    tri_out, _ = triton_attention_rocm(q, k, v, o, input_metadata)
-
-    ref_impl = ReferenceAttention(
-        Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD, False, dtype, input_metadata
-    )
-    ref_out = ref_impl.fwd(q, k, v)
-
-    # compare
-    torch.testing.assert_close(ref_out, tri_out, atol=2e-2, rtol=2e-2)
-
-
-# NOTE: Uses thd layout, so also tests thd.
-@pytest.mark.parametrize(
-    "Z, H, N_CTX, D_HEAD",
-    [(1, 48, 256, 64), (4, 48, 512, 64), (16, 48, 512, 64), (64, 48, 128, 128)],
-)
-@pytest.mark.parametrize("causal", [True, False])
-def test_op_varlen_fwd(Z, H, N_CTX, D_HEAD, causal, dtype=torch.float16):
-    q, k, v, input_metadata = varlen_input_helper(Z, H, H, N_CTX, N_CTX, D_HEAD, dtype)
-
-    tri_out = torch.empty_like(q)
-    triton_attention_rocm(q, k, v, tri_out, input_metadata)
-
-    ref_impl = ReferenceAttention(
-        Z, H, H, N_CTX, N_CTX, D_HEAD, False, dtype, input_metadata
-    )
-    ref_out = ref_impl.varlen_fwd(q, k, v, is_mqa=False)
-
-    torch.testing.assert_close(ref_out, tri_out, atol=2e-2, rtol=2e-2)
-
-
-# NOTE: Uses thd layout, so also tests thd.
-@pytest.mark.parametrize(
-    "Z, HQ, HK, N_CTX, D_HEAD",
-    [
-        (2, 48, 24, 128, 64),
-        (4, 48, 12, 256, 64),
-        (4, 48, 4, 512, 64),
-        (4, 64, 16, 128, 128),
-    ],
-)
-@pytest.mark.parametrize("causal", [False])
-def test_op_varlen_mqa_fwd(Z, HQ, HK, N_CTX, D_HEAD, causal, dtype=torch.float16):
-    q, k, v, input_metadata = varlen_input_helper(
-        Z, HQ, HK, N_CTX, N_CTX, D_HEAD, dtype
-    )
-
-    tri_out = torch.empty_like(q)
-    triton_attention_rocm(q, k, v, tri_out, input_metadata)
-
-    ref_impl = ReferenceAttention(
-        Z, HQ, HK, N_CTX, N_CTX, D_HEAD, False, dtype, input_metadata
-    )
-    ref_out = ref_impl.varlen_fwd(q, k, v, is_mqa=True)
-
-    torch.testing.assert_close(ref_out, tri_out, atol=2e-2, rtol=2e-2)
diff --git a/tests/models/language/pooling/test_classification.py b/tests/models/language/pooling/test_classification.py
index 471826f214d0..2723bb21de97 100644
--- a/tests/models/language/pooling/test_classification.py
+++ b/tests/models/language/pooling/test_classification.py
@@ -27,13 +27,7 @@ def test_models(
     example_prompts,
     model: str,
     dtype: str,
-    monkeypatch,
 ) -> None:
-    if current_platform.is_rocm():
-        # ROCm Triton FA does not currently support sliding window attention
-        # switch to use ROCm CK FA backend
-        monkeypatch.setenv("VLLM_USE_TRITON_FLASH_ATTN", "False")
-
     with vllm_runner(model, max_model_len=512, dtype=dtype) as vllm_model:
         vllm_outputs = vllm_model.classify(example_prompts)
 
diff --git a/tests/models/language/pooling/test_embedding.py b/tests/models/language/pooling/test_embedding.py
index d1b1c8d3ddf0..93b9843311d3 100644
--- a/tests/models/language/pooling/test_embedding.py
+++ b/tests/models/language/pooling/test_embedding.py
@@ -4,7 +4,6 @@
 import pytest
 
 from vllm.config import PoolerConfig
-from vllm.platforms import current_platform
 
 from ...utils import check_embeddings_close
 
@@ -51,13 +50,7 @@ def test_models(
     vllm_runner,
     example_prompts,
     model,
-    monkeypatch,
 ) -> None:
-    if model == "BAAI/bge-multilingual-gemma2" and current_platform.is_rocm():
-        # ROCm Triton FA does not currently support sliding window attention
-        # switch to use ROCm CK FA backend
-        monkeypatch.setenv("VLLM_USE_TRITON_FLASH_ATTN", "False")
-
     vllm_extra_kwargs = {}
     if model == "ssmits/Qwen2-7B-Instruct-embed-base":
         vllm_extra_kwargs["pooler_config"] = PoolerConfig(
diff --git a/tests/models/language/pooling/test_mm_classifier_conversion.py b/tests/models/language/pooling/test_mm_classifier_conversion.py
index 91be6cd09d33..2482452645ef 100644
--- a/tests/models/language/pooling/test_mm_classifier_conversion.py
+++ b/tests/models/language/pooling/test_mm_classifier_conversion.py
@@ -2,18 +2,11 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from vllm.config.pooler import PoolerConfig
-from vllm.platforms import current_platform
 
 
 def test_idefics_multimodal(
     vllm_runner,
-    monkeypatch,
 ) -> None:
-    if current_platform.is_rocm():
-        # ROCm Triton FA does not currently support sliding window attention
-        # switch to use ROCm CK FA backend
-        monkeypatch.setenv("VLLM_USE_TRITON_FLASH_ATTN", "False")
-
     prompts = [
         "Hello, my name is",
         "The president of the United States is",
@@ -59,13 +52,7 @@ def update_config(config):
 
 def test_gemma_multimodal(
     vllm_runner,
-    monkeypatch,
 ) -> None:
-    if current_platform.is_rocm():
-        # ROCm Triton FA does not currently support sliding window attention
-        # switch to use ROCm CK FA backend
-        monkeypatch.setenv("VLLM_USE_TRITON_FLASH_ATTN", "False")
-
     messages = [
         {
             "role": "system",
diff --git a/tests/models/language/pooling/test_reward.py b/tests/models/language/pooling/test_reward.py
index 46504d025c26..c42186c7db9a 100644
--- a/tests/models/language/pooling/test_reward.py
+++ b/tests/models/language/pooling/test_reward.py
@@ -76,7 +76,6 @@ def test_prm_models(
     math_step_prompts,
     model: str,
     dtype: str,
-    monkeypatch,
 ) -> None:
     check_transformers_version(
         "Qwen/Qwen2.5-Math-PRM-7B", max_transformers_version="4.53.2"
@@ -85,11 +84,6 @@ def test_prm_models(
     if current_platform.is_cpu():
         pytest.skip("CPU only supports V1")
 
-    if current_platform.is_rocm():
-        # ROCm Triton FA does not currently support sliding window attention
-        # switch to use ROCm CK FA backend
-        monkeypatch.setenv("VLLM_USE_TRITON_FLASH_ATTN", "False")
-
     with vllm_runner(model, max_model_len=1024, dtype=dtype) as vllm_model:
         vllm_outputs = vllm_model.reward(math_step_prompts)
 
diff --git a/tests/models/multimodal/generation/test_common.py b/tests/models/multimodal/generation/test_common.py
index 4c79ac318ffb..de74acf3b8a5 100644
--- a/tests/models/multimodal/generation/test_common.py
+++ b/tests/models/multimodal/generation/test_common.py
@@ -5,7 +5,6 @@
 """
 
 import math
-import os
 from collections import defaultdict
 from pathlib import PosixPath
 
@@ -38,13 +37,6 @@
     VLMTestType,
 )
 
-# This hack is needed for phi3v & paligemma models
-# ROCm Triton FA can run into shared memory issues with these models,
-# use other backends in the meantime
-# FIXME (mattwong, gshtrasb, hongxiayan)
-if current_platform.is_rocm():
-    os.environ["VLLM_USE_TRITON_FLASH_ATTN"] = "0"
-
 COMMON_BROADCAST_SETTINGS = {
     "test_type": VLMTestType.IMAGE,
     "dtype": "half",
diff --git a/tests/models/multimodal/generation/test_phi4_multimodal.py b/tests/models/multimodal/generation/test_phi4_multimodal.py
index cbc7dfca0234..62456221711e 100644
--- a/tests/models/multimodal/generation/test_phi4_multimodal.py
+++ b/tests/models/multimodal/generation/test_phi4_multimodal.py
@@ -11,7 +11,6 @@
 from vllm.assets.image import ImageAsset
 from vllm.lora.request import LoRARequest
 from vllm.multimodal.image import rescale_image_size
-from vllm.platforms import current_platform
 
 from ....conftest import (
     IMAGE_ASSETS,
@@ -46,12 +45,6 @@
 
 target_dtype = "half"
 
-# ROCm Triton FA can run into shared memory issues with these models,
-# use other backends in the meantime
-# FIXME (mattwong, gshtrasb, hongxiayan)
-if current_platform.is_rocm():
-    os.environ["VLLM_USE_TRITON_FLASH_ATTN"] = "0"
-
 
 def run_test(
     hf_runner: type[HfRunner],
diff --git a/tests/models/multimodal/generation/test_phi4mm.py b/tests/models/multimodal/generation/test_phi4mm.py
index 5619cecc081d..665bed512392 100644
--- a/tests/models/multimodal/generation/test_phi4mm.py
+++ b/tests/models/multimodal/generation/test_phi4mm.py
@@ -14,7 +14,6 @@
 from vllm.logprobs import SampleLogprobs
 from vllm.lora.request import LoRARequest
 from vllm.multimodal.image import convert_image_mode, rescale_image_size
-from vllm.platforms import current_platform
 
 from ....conftest import (
     IMAGE_ASSETS,
@@ -68,12 +67,6 @@ def vllm_to_hf_output(
 
 target_dtype = "half"
 
-# ROCm Triton FA can run into shared memory issues with these models,
-# use other backends in the meantime
-# FIXME (mattwong, gshtrasb, hongxiayan)
-if current_platform.is_rocm():
-    os.environ["VLLM_USE_TRITON_FLASH_ATTN"] = "0"
-
 
 def run_test(
     hf_runner: type[HfRunner],
diff --git a/tests/quantization/test_quark.py b/tests/quantization/test_quark.py
index 0af27aff9359..334f9a65e4c0 100644
--- a/tests/quantization/test_quark.py
+++ b/tests/quantization/test_quark.py
@@ -8,7 +8,6 @@
 """
 
 import importlib.metadata
-import os
 from dataclasses import dataclass
 from importlib.util import find_spec
 
@@ -246,8 +245,6 @@ def test_mxfp4_gsm8k_correctness(config: AccuracyTestConfig):
     task = "gsm8k"
     rtol = 0.03
 
-    os.environ["VLLM_USE_TRITON_FLASH_ATTN"] = "0"
-
     results = lm_eval.simple_evaluate(
         model="vllm",
         model_args=config.get_model_args(tp_size=8, model_max_len=38768),
@@ -263,8 +260,6 @@ def test_mxfp4_gsm8k_correctness(config: AccuracyTestConfig):
         and measured_value + rtol > EXPECTED_VALUE
     ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
 
-    del os.environ["VLLM_USE_TRITON_FLASH_ATTN"]
-
 
 @pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE, reason="amd-quark>=0.9 is not available")
 @pytest.mark.parametrize("float_dtype", [torch.bfloat16, torch.float16])
diff --git a/vllm/attention/ops/triton_flash_attention.py b/vllm/attention/ops/triton_flash_attention.py
deleted file mode 100644
index c0ab35d07b1f..000000000000
--- a/vllm/attention/ops/triton_flash_attention.py
+++ /dev/null
@@ -1,932 +0,0 @@
-#!/usr/bin/env python
-# SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-"""
-Fused Attention
-===============
-
-This is a Triton implementation of the Flash Attention v2 algorithm from Tri Dao
-(https://tridao.me/publications/flash2/flash2.pdf)
-Credits: OpenAI kernel team, AMD ML Frameworks Triton team
-
-Features supported:
-
-1) Fwd with causal masking
-2) Any sequence lengths without padding (currently fwd kernel only)
-3) Support for different sequence lengths for q and k
-4) Nested tensor API currently does not support dropout or bias.
-
-Not currently supported:
-
-1) Non power of two head dims
-
-"""
-
-import torch
-
-from vllm.platforms import current_platform
-from vllm.triton_utils import tl, triton
-
-# Avoid misleading ROCm warning.
-if current_platform.is_rocm():
-    from vllm.platforms.rocm import on_gfx1x
-else:
-    on_gfx1x = lambda *args, **kwargs: False
-
-torch_dtype: tl.constexpr = torch.float16
-
-
-@triton.jit
-def cdiv_fn(x, y):
-    return (x + y - 1) // y
-
-
-@triton.jit
-def max_fn(x, y):
-    return tl.math.max(x, y)
-
-
-@triton.jit
-def dropout_offsets(philox_seed, philox_offset, dropout_p, m, n, stride):
-    ms = tl.arange(0, m)
-    ns = tl.arange(0, n)
-    return philox_offset + ms[:, None] * stride + ns[None, :]
-
-
-@triton.jit
-def dropout_rng(philox_seed, philox_offset, dropout_p, m, n, stride):
-    rng_offsets = dropout_offsets(
-        philox_seed, philox_offset, dropout_p, m, n, stride
-    ).to(tl.uint32)
-    # TODO: use tl.randint for better performance
-    return tl.rand(philox_seed, rng_offsets)
-
-
-@triton.jit
-def dropout_mask(philox_seed, philox_offset, dropout_p, m, n, stride):
-    rng_output = dropout_rng(philox_seed, philox_offset, dropout_p, m, n, stride)
-    rng_keep = rng_output > dropout_p
-    return rng_keep
-
-
-@triton.jit
-def load_fn(block_ptr, first, second, pad):
-    if first and second:
-        tensor = tl.load(block_ptr, boundary_check=(0, 1), padding_option=pad)
-    elif first:
-        tensor = tl.load(block_ptr, boundary_check=(0,), padding_option=pad)
-    elif second:
-        tensor = tl.load(block_ptr, boundary_check=(1,), padding_option=pad)
-    else:
-        tensor = tl.load(block_ptr)
-    return tensor
-
-
-@triton.jit
-def _attn_fwd_inner(
-    acc,
-    l_i,
-    m_i,
-    q,
-    K_block_ptr,
-    V_block_ptr,
-    start_m,
-    actual_seqlen_k,
-    dropout_p,
-    philox_seed,
-    batch_philox_offset,
-    encoded_softmax_block_ptr,
-    block_min,
-    block_max,
-    offs_n_causal,
-    masked_blocks,
-    n_extra_tokens,
-    bias_ptr,
-    IS_CAUSAL: tl.constexpr,
-    BLOCK_M: tl.constexpr,
-    BLOCK_DMODEL: tl.constexpr,
-    BLOCK_N: tl.constexpr,
-    OFFS_M: tl.constexpr,
-    OFFS_N: tl.constexpr,
-    PRE_LOAD_V: tl.constexpr,
-    MASK_STEPS: tl.constexpr,
-    ENABLE_DROPOUT: tl.constexpr,
-    RETURN_ENCODED_SOFTMAX: tl.constexpr,
-    PADDED_HEAD: tl.constexpr,
-    USE_FP8: tl.constexpr,
-    qk_scale,
-    p_descale,
-):
-    # loop over k, v, and update accumulator
-    for start_n in range(block_min, block_max, BLOCK_N):
-        # For padded blocks, we will overrun the tensor size if
-        # we load all BLOCK_N. For others, the blocks are all within range.
-        k = load_fn(
-            K_block_ptr,
-            PADDED_HEAD,
-            MASK_STEPS and (n_extra_tokens != 0),
-            "zero",
-        )
-        if PRE_LOAD_V:
-            v = load_fn(
-                V_block_ptr,
-                MASK_STEPS and (n_extra_tokens != 0),
-                PADDED_HEAD,
-                "zero",
-            )
-        qk = tl.zeros([BLOCK_M, BLOCK_N], dtype=tl.float32)
-        # We start from end of seqlen_k so only the first iteration would need
-        # to be checked for padding if it is not a multiple of block_n
-        # TODO: This can be optimized to only be true for the padded block.
-        if MASK_STEPS:  # noqa: SIM102
-            # If this is the last block / iteration, we want to
-            # mask if the sequence length is not a multiple of block size
-            # a solution is to always do BLOCK_M // BLOCK_N + 1 steps
-            # if not is_modulo_mn. last step might get wasted but that is okay.
-            # check if this masking works for that case.
-            if (start_n + BLOCK_N == block_max) and (n_extra_tokens != 0):
-                boundary_m = tl.full([BLOCK_M], actual_seqlen_k, dtype=tl.int32)
-                size_n = start_n + OFFS_N[None, :]
-                mask = size_n < boundary_m[:, None]
-                qk = tl.where(mask, qk, float("-inf"))
-        if IS_CAUSAL:
-            causal_boundary = start_n + offs_n_causal
-            causal_mask = OFFS_M[:, None] >= causal_boundary[None, :]
-            qk = tl.where(causal_mask, qk, float("-inf"))
-        # -- compute qk ----
-        qk += tl.dot(q, k)
-        if USE_FP8:
-            qk *= qk_scale
-        if bias_ptr is not None:
-            bias = load_fn(
-                bias_ptr, False, MASK_STEPS and (n_extra_tokens != 0), "zero"
-            )
-            # While bias is added after multiplying qk with sm_scale, our
-            # optimization to use 2^x instead of e^x results in an additional
-            # scale factor of log2(e) which we must also multiply the bias with.
-            qk += bias * 1.44269504089
-        m_ij = tl.maximum(m_i, tl.max(qk, 1))
-        qk = qk - m_ij[:, None]
-        p = tl.math.exp2(qk)
-
-        # CAVEAT: Must update l_ij before applying dropout
-        l_ij = tl.sum(p, 1)
-        if ENABLE_DROPOUT:
-            philox_offset = (
-                batch_philox_offset
-                + start_m * BLOCK_M * actual_seqlen_k
-                + start_n
-                - BLOCK_N
-            )
-            keep = dropout_mask(
-                philox_seed,
-                philox_offset,
-                dropout_p,
-                BLOCK_M,
-                BLOCK_N,
-                actual_seqlen_k,
-            )
-            if RETURN_ENCODED_SOFTMAX:
-                tl.store(
-                    encoded_softmax_block_ptr,
-                    tl.where(keep, p, -p).to(encoded_softmax_block_ptr.type.element_ty),
-                )
-            p = tl.where(keep, p, 0.0)
-        elif RETURN_ENCODED_SOFTMAX:
-            tl.store(
-                encoded_softmax_block_ptr,
-                p.to(encoded_softmax_block_ptr.type.element_ty),
-            )
-        # -- update output accumulator --
-        alpha = tl.math.exp2(m_i - m_ij)
-        acc = acc * alpha[:, None]
-        if not PRE_LOAD_V:
-            v = load_fn(
-                V_block_ptr,
-                MASK_STEPS and (n_extra_tokens != 0),
-                PADDED_HEAD,
-                "zero",
-            )
-        # -- update m_i and l_i
-        l_i = l_i * alpha + l_ij
-        # update m_i and l_i
-        m_i = m_ij
-
-        if USE_FP8:
-            p *= p_descale
-
-        acc += tl.dot(p.to(V_block_ptr.type.element_ty), v)
-
-        V_block_ptr = tl.advance(V_block_ptr, (BLOCK_N, 0))
-        K_block_ptr = tl.advance(K_block_ptr, (0, BLOCK_N))
-        if bias_ptr is not None:
-            bias_ptr = tl.advance(bias_ptr, (0, BLOCK_N))
-        if RETURN_ENCODED_SOFTMAX:
-            encoded_softmax_block_ptr = tl.advance(
-                encoded_softmax_block_ptr, (0, BLOCK_N)
-            )
-    return acc, l_i, m_i
-
-
-def get_cdna_autotune_configs():
-    return [
-        triton.Config(
-            {"BLOCK_M": 256, "BLOCK_N": 64, "waves_per_eu": 2, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=8,
-        ),
-        triton.Config(
-            {"BLOCK_M": 128, "BLOCK_N": 128, "waves_per_eu": 2, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=4,
-        ),
-        triton.Config(
-            {"BLOCK_M": 256, "BLOCK_N": 128, "waves_per_eu": 2, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=8,
-        ),
-        triton.Config(
-            {"BLOCK_M": 128, "BLOCK_N": 64, "waves_per_eu": 1, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=4,
-        ),
-        triton.Config(
-            {"BLOCK_M": 128, "BLOCK_N": 64, "waves_per_eu": 3, "PRE_LOAD_V": True},
-            num_stages=1,
-            num_warps=4,
-        ),
-        triton.Config(
-            {"BLOCK_M": 128, "BLOCK_N": 64, "waves_per_eu": 3, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=4,
-        ),
-        triton.Config(
-            {"BLOCK_M": 64, "BLOCK_N": 64, "waves_per_eu": 4, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=8,
-        ),
-        triton.Config(
-            {"BLOCK_M": 32, "BLOCK_N": 32, "waves_per_eu": 4, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=8,
-        ),
-        # TODO: This config fails with head_size not pow2 with data mismatches.
-        #    triton.Config({'BLOCK_M': 32, 'BLOCK_N': 16, 'waves_per_eu': 1,
-        #                   'PRE_LOAD_V': False}, num_stages=1, num_warps=4),
-        # Fails in AccelerateAMDMatmul (Triton) assert when using FP8:
-        # triton.Config(
-        #     {
-        #         "BLOCK_M": 16,
-        #         "BLOCK_N": 16,
-        #         "waves_per_eu": 1,
-        #         "PRE_LOAD_V": False,
-        #     },
-        #     num_stages=1,
-        #     num_warps=4,
-        # ),
-    ], ["IS_CAUSAL", "dropout_p", "BLOCK_DMODEL", "USE_FP8"]
-
-
-def get_rdna_autotune_configs():
-    return [
-        triton.Config(
-            {"BLOCK_M": 32, "BLOCK_N": 32, "waves_per_eu": 4, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=2,
-        ),
-        triton.Config(
-            {"BLOCK_M": 32, "BLOCK_N": 32, "waves_per_eu": 2, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=2,
-        ),
-        triton.Config(
-            {"BLOCK_M": 32, "BLOCK_N": 16, "waves_per_eu": 4, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=2,
-        ),
-        triton.Config(
-            {"BLOCK_M": 32, "BLOCK_N": 16, "waves_per_eu": 2, "PRE_LOAD_V": False},
-            num_stages=1,
-            num_warps=2,
-        ),
-        # Fails in AccelerateAMDMatmul (Triton) assert when using FP8:
-        # triton.Config(
-        #     {
-        #         'BLOCK_M': 16,
-        #         'BLOCK_N': 16,
-        #         'waves_per_eu': 4,
-        #         'PRE_LOAD_V': False
-        #     },
-        #     num_stages=1,
-        #     num_warps=2),
-        # triton.Config(
-        #     {
-        #         'BLOCK_M': 16,
-        #         'BLOCK_N': 16,
-        #         'waves_per_eu': 2,
-        #         'PRE_LOAD_V': False
-        #     },
-        #     num_stages=1,
-        #     num_warps=2),
-        # # Fall-back config.
-        # triton.Config(
-        #     {
-        #         'BLOCK_M': 16,
-        #         'BLOCK_N': 16,
-        #         'waves_per_eu': 1,
-        #         'PRE_LOAD_V': False
-        #     },
-        #     num_stages=1,
-        #     num_warps=2),
-    ], ["IS_CAUSAL", "dropout_p", "BLOCK_DMODEL", "USE_FP8"]
-
-
-def get_autotune_configs():
-    if on_gfx1x():
-        return get_rdna_autotune_configs()
-    else:
-        return get_cdna_autotune_configs()
-
-
-autotune_configs, autotune_keys = get_autotune_configs()
-
-float8_info = torch.finfo(current_platform.fp8_dtype())
-
-
-@triton.autotune(
-    configs=autotune_configs,
-    key=autotune_keys,
-)
-@triton.jit
-def attn_fwd(
-    Q,
-    K,
-    V,
-    bias,
-    sm_scale,
-    q_scale,
-    k_scale,
-    v_scale,
-    p_scale,
-    p_descale,
-    o_descale,
-    L,
-    Out,
-    stride_qz: tl.int64,
-    stride_qh: tl.int64,
-    stride_qm: tl.int64,
-    stride_qk: tl.int64,
-    stride_kz: tl.int64,
-    stride_kh: tl.int64,
-    stride_kn: tl.int64,
-    stride_kk: tl.int64,
-    stride_vz: tl.int64,
-    stride_vh: tl.int64,
-    stride_vk: tl.int64,
-    stride_vn: tl.int64,
-    stride_oz: tl.int64,
-    stride_oh: tl.int64,
-    stride_om: tl.int64,
-    stride_on: tl.int64,
-    stride_bz: tl.int64,
-    stride_bh: tl.int64,
-    stride_bm: tl.int64,
-    stride_bn: tl.int64,
-    cu_seqlens_q,
-    cu_seqlens_k,
-    dropout_p,
-    philox_seed,
-    philox_offset_base,
-    encoded_softmax,
-    HQ: tl.constexpr,
-    HK: tl.constexpr,
-    ACTUAL_BLOCK_DMODEL: tl.constexpr,
-    MAX_SEQLENS_Q: tl.constexpr,
-    MAX_SEQLENS_K: tl.constexpr,
-    VARLEN: tl.constexpr,
-    IS_CAUSAL: tl.constexpr,
-    BLOCK_M: tl.constexpr,
-    BLOCK_DMODEL: tl.constexpr,
-    USE_FP8: tl.constexpr,
-    USE_FP8_OUT: tl.constexpr,
-    BLOCK_N: tl.constexpr,
-    PRE_LOAD_V: tl.constexpr,
-    BIAS_TYPE: tl.constexpr,
-    ENABLE_DROPOUT: tl.constexpr,
-    RETURN_ENCODED_SOFTMAX: tl.constexpr,
-    FP8_MIN: tl.constexpr = float8_info.min,
-    FP8_MAX: tl.constexpr = float8_info.max,
-):
-    start_m = tl.program_id(0)
-    off_h_q = tl.program_id(1)
-    off_z = tl.program_id(2)
-    offs_m = start_m * BLOCK_M + tl.arange(0, BLOCK_M)
-    offs_n = tl.arange(0, BLOCK_N)
-    if VARLEN:
-        cu_seqlens_q_start = tl.load(cu_seqlens_q + off_z)
-        cu_seqlens_q_end = tl.load(cu_seqlens_q + off_z + 1)
-        seqlen_q = cu_seqlens_q_end - cu_seqlens_q_start
-        # We have a one-size-fits-all grid in id(0). Some seqlens might be too
-        # small for all start_m so for those we return early.
-        if start_m * BLOCK_M > seqlen_q:
-            return
-        cu_seqlens_k_start = tl.load(cu_seqlens_k + off_z)
-        cu_seqlens_k_end = tl.load(cu_seqlens_k + off_z + 1)
-        seqlen_k = cu_seqlens_k_end - cu_seqlens_k_start
-    else:
-        cu_seqlens_q_start = 0
-        cu_seqlens_k_start = 0
-        seqlen_q = MAX_SEQLENS_Q
-        seqlen_k = MAX_SEQLENS_K
-
-    # Now we compute whether we need to exit early due to causal masking.
-    # This is because for seqlen_q > seqlen_k, M rows of the attn scores
-    # are completely masked, resulting in 0s written to the output, and
-    # inf written to LSE. We don't need to do any GEMMs in this case.
-    # This block of code determines what N is, and if this WG is operating
-    # on those M rows.
-    n_blocks = cdiv_fn(seqlen_k, BLOCK_N)
-    if IS_CAUSAL:
-        # If seqlen_q == seqlen_k, the attn scores are a square matrix.
-        # If seqlen_q != seqlen_k, attn scores are rectangular which means
-        # the causal mask boundary is bottom right aligned, and ends at either
-        # the top edge (seqlen_q < seqlen_k) or left edge.
-        # This captures the decrease in n_blocks if we have a rectangular attn
-        # matrix
-        n_blocks_seqlen = cdiv_fn(
-            (start_m + 1) * BLOCK_M + seqlen_k - seqlen_q, BLOCK_N
-        )
-        # This is what adjusts the block_max for the current WG, only
-        # if IS_CAUSAL. Otherwise we want to always iterate through all n_blocks
-        n_blocks = min(n_blocks, n_blocks_seqlen)
-        # If we have no blocks after adjusting for seqlen deltas, this WG is
-        # part of the blocks that are all 0. We exit early.
-        if n_blocks <= 0:
-            o_offset = (
-                off_z * stride_oz + cu_seqlens_q_start * stride_om + off_h_q * stride_oh
-            )
-            O_block_ptr = tl.make_block_ptr(
-                base=Out + o_offset,
-                shape=(seqlen_q, BLOCK_DMODEL),
-                strides=(stride_om, stride_on),
-                offsets=(start_m * BLOCK_M, 0),
-                block_shape=(BLOCK_M, BLOCK_DMODEL),
-                order=(1, 0),
-            )
-            acc = tl.zeros([BLOCK_M, BLOCK_DMODEL], dtype=Out.type.element_ty)
-            # We still need to write 0s to the result
-            # tl.store(O_block_ptr,
-            # acc.to(Out.type.element_ty), boundary_check=(0,1))
-            # l_ptrs = L + off_z * HQ * MAX_SEQLENS_Q + off_h_q * MAX_SEQLENS_Q
-            #          + offs_m
-            # We store inf to LSE, not -inf because in the bwd pass,
-            # we subtract this
-            # from qk which makes it -inf, such that exp(qk - inf) = 0
-            # for these masked blocks.
-            # l = tl.full([BLOCK_M], value=float("inf"), dtype=tl.float32)
-            # tl.store(l_ptrs, l)
-            # TODO: Should dropout and return encoded softmax be handled here?
-            return
-
-    # If MQA / GQA, set the K and V head offsets appropriately.
-    GROUP_SIZE: tl.constexpr = HQ // HK
-    off_h_k = off_h_q // GROUP_SIZE if GROUP_SIZE != 1 else off_h_q
-
-    n_extra_tokens = 0
-    if seqlen_k < BLOCK_N:
-        n_extra_tokens = BLOCK_N - seqlen_k
-    elif seqlen_k % BLOCK_N:
-        n_extra_tokens = seqlen_k % BLOCK_N
-    padded_head = ACTUAL_BLOCK_DMODEL != BLOCK_DMODEL
-
-    # Compute pointers for all the tensors used in this kernel.
-    q_offset = off_z * stride_qz + off_h_q * stride_qh + cu_seqlens_q_start * stride_qm
-    Q_block_ptr = tl.make_block_ptr(
-        base=Q + q_offset,
-        shape=(seqlen_q, ACTUAL_BLOCK_DMODEL),
-        strides=(stride_qm, stride_qk),
-        offsets=(start_m * BLOCK_M, 0),
-        block_shape=(BLOCK_M, BLOCK_DMODEL),
-        order=(1, 0),
-    )
-    k_offset = off_z * stride_kz + off_h_k * stride_kh + cu_seqlens_k_start * stride_kn
-    K_block_ptr = tl.make_block_ptr(
-        base=K + k_offset,
-        shape=(ACTUAL_BLOCK_DMODEL, seqlen_k),
-        strides=(stride_kk, stride_kn),
-        offsets=(0, 0),
-        block_shape=(BLOCK_DMODEL, BLOCK_N),
-        order=(0, 1),
-    )
-    v_offset = off_z * stride_vz + off_h_k * stride_vh + cu_seqlens_k_start * stride_vk
-    V_block_ptr = tl.make_block_ptr(
-        base=V + v_offset,
-        shape=(seqlen_k, ACTUAL_BLOCK_DMODEL),
-        strides=(stride_vk, stride_vn),
-        offsets=(0, 0),
-        block_shape=(BLOCK_N, BLOCK_DMODEL),
-        order=(1, 0),
-    )
-    if BIAS_TYPE != 0:
-        bias_ptr = tl.make_block_ptr(
-            base=bias + off_h_q * stride_bh,
-            shape=(seqlen_q, seqlen_k),
-            strides=(stride_bm, stride_bn),
-            offsets=(start_m * BLOCK_M, 0),
-            block_shape=(BLOCK_M, BLOCK_N),
-            order=(1, 0),
-        )
-    else:
-        bias_ptr = None
-    if ENABLE_DROPOUT:
-        batch_philox_offset = (
-            philox_offset_base + (off_z * HQ + off_h_q) * seqlen_q * seqlen_k
-        )
-    else:
-        batch_philox_offset = 0
-    # We can ask to return the dropout mask without actually doing any dropout.
-    # In this case, we return an invalid pointer so indicate the mask is not i
-    # valid.
-    # TODO: Fix encoded softmax. It currently uses just h_q in the base offset.
-    if RETURN_ENCODED_SOFTMAX:
-        encoded_softmax_block_ptr = tl.make_block_ptr(
-            base=encoded_softmax + off_h_q * seqlen_q * seqlen_k,
-            shape=(seqlen_q, seqlen_k),
-            strides=(seqlen_k, 1),
-            offsets=(start_m * BLOCK_M, 0),
-            block_shape=(BLOCK_M, BLOCK_N),
-            order=(1, 0),
-        )
-    else:
-        encoded_softmax_block_ptr = 0
-    # initialize pointer to m and l
-    m_i = tl.full([BLOCK_M], float("-inf"), dtype=tl.float32)
-    l_i = tl.full([BLOCK_M], 1.0, dtype=tl.float32)
-    acc = tl.zeros([BLOCK_M, BLOCK_DMODEL], dtype=tl.float32)
-    # scale sm_scale by log_2(e) and use 2^x in the loop as we do not
-    # have native e^x support in HW.
-    qk_scale = sm_scale * 1.44269504089
-    # Q is loaded once at the beginning and shared by all N blocks.
-    q = load_fn(Q_block_ptr, True, padded_head, "zero")
-    if not USE_FP8:
-        q = (q * qk_scale).to(Q_block_ptr.type.element_ty)
-        acc_scale = 1.0
-    else:
-        qk_scale *= q_scale * k_scale
-        acc_scale = p_scale * v_scale
-
-    # Here we compute how many full and masked blocks we have.
-    padded_block_k = n_extra_tokens != 0
-    is_modulo_mn = not padded_block_k and (seqlen_q % BLOCK_M == 0)
-    if IS_CAUSAL:
-        # There are always at least BLOCK_M // BLOCK_N masked blocks.
-        # Additionally there might be one more due to dissimilar seqlens.
-        masked_blocks = BLOCK_M // BLOCK_N + (not is_modulo_mn)
-    else:
-        # Padding on Q does not need to be masked in the FA loop.
-        masked_blocks = padded_block_k
-    # if IS_CAUSAL, not is_modulo_mn does not always result in an additional
-    # block. In this case we might exceed n_blocks so pick the min.
-    masked_blocks = min(masked_blocks, n_blocks)
-    n_full_blocks = n_blocks - masked_blocks
-    block_min = 0
-    block_max = n_blocks * BLOCK_N
-    # Compute for full blocks. Here we set causal to false regardless of its
-    # value because there is no masking. Similarly we do not need padding.
-    if n_full_blocks > 0:
-        block_max = (n_blocks - masked_blocks) * BLOCK_N
-        acc, l_i, m_i = _attn_fwd_inner(
-            acc,
-            l_i,
-            m_i,
-            q,
-            K_block_ptr,
-            V_block_ptr,
-            start_m,
-            seqlen_k,
-            dropout_p,
-            philox_seed,
-            batch_philox_offset,
-            encoded_softmax_block_ptr,
-            # _, _, offs_n_causal, masked_blocks, n_extra_tokens, _
-            block_min,
-            block_max,
-            0,
-            0,
-            0,
-            bias_ptr,
-            # IS_CAUSAL, ....
-            False,
-            BLOCK_M,
-            BLOCK_DMODEL,
-            BLOCK_N,
-            offs_m,
-            offs_n,
-            # _, MASK_STEPS, ...
-            PRE_LOAD_V,
-            False,
-            ENABLE_DROPOUT,
-            RETURN_ENCODED_SOFTMAX,
-            padded_head,
-            USE_FP8,
-            qk_scale,
-            p_descale,
-        )
-        block_min = block_max
-        block_max = n_blocks * BLOCK_N
-
-    tl.debug_barrier()
-    # Remaining blocks, if any, are full / not masked.
-    if masked_blocks > 0:
-        offs_n_causal = offs_n + (seqlen_q - seqlen_k) if IS_CAUSAL else 0
-        K_block_ptr = tl.advance(K_block_ptr, (0, n_full_blocks * BLOCK_N))
-        V_block_ptr = tl.advance(V_block_ptr, (n_full_blocks * BLOCK_N, 0))
-        if bias_ptr is not None:
-            bias_ptr = tl.advance(bias_ptr, (0, n_full_blocks * BLOCK_N))
-        if RETURN_ENCODED_SOFTMAX:
-            encoded_softmax_block_ptr = tl.advance(
-                encoded_softmax_block_ptr, (0, n_full_blocks)
-            )
-        acc, l_i, m_i = _attn_fwd_inner(
-            acc,
-            l_i,
-            m_i,
-            q,
-            K_block_ptr,
-            V_block_ptr,
-            start_m,
-            seqlen_k,
-            dropout_p,
-            philox_seed,
-            batch_philox_offset,
-            encoded_softmax_block_ptr,
-            block_min,
-            block_max,
-            offs_n_causal,
-            masked_blocks,
-            n_extra_tokens,
-            bias_ptr,
-            IS_CAUSAL,
-            BLOCK_M,
-            BLOCK_DMODEL,
-            BLOCK_N,
-            offs_m,
-            offs_n,
-            # _, MASK_STEPS, ...
-            PRE_LOAD_V,
-            True,
-            ENABLE_DROPOUT,
-            RETURN_ENCODED_SOFTMAX,
-            padded_head,
-            USE_FP8,
-            qk_scale,
-            p_descale,
-        )
-    # epilogue
-
-    if USE_FP8:
-        acc *= acc_scale
-    acc = acc / l_i[:, None]
-    if ENABLE_DROPOUT:
-        acc = acc / (1 - dropout_p)
-    # If seqlen_q > seqlen_k but the delta is not a multiple of BLOCK_M,
-    # then we have one block with a row of all NaNs which come from computing
-    # softmax over a row of all -infs (-inf - inf = NaN). We check for that here
-    # and store 0s where there are NaNs as these rows should've been zeroed out.
-    end_m_idx = (start_m + 1) * BLOCK_M
-    start_m_idx = start_m * BLOCK_M
-    causal_start_idx = seqlen_q - seqlen_k
-    if USE_FP8_OUT:
-        acc *= o_descale
-        acc = tl.clamp(acc, FP8_MIN, FP8_MAX)
-    acc = acc.to(Out.type.element_ty)
-    if IS_CAUSAL:  # noqa: SIM102
-        if causal_start_idx > start_m_idx and causal_start_idx < end_m_idx:
-            out_mask_boundary = tl.full(
-                (BLOCK_DMODEL,), causal_start_idx, dtype=tl.int32
-            )
-            mask_m_offsets = start_m_idx + tl.arange(0, BLOCK_M)
-            out_ptrs_mask = mask_m_offsets[:, None] >= out_mask_boundary[None, :]
-            z = tl.zeros((1,), tl.float32)
-            acc = tl.where(out_ptrs_mask, acc, z.to(acc.type.element_ty))
-    # write back LSE
-    # l_ptrs = L + off_z * HQ * MAX_SEQLENS_Q + off_h_q * MAX_SEQLENS_Q + offs_m
-    # If seqlen_q not multiple of BLOCK_M, we need to mask out the last
-    # few rows. This is only true for the last M block. For others,
-    # overflow_size will be -ve
-    # overflow_size = end_m_idx - seqlen_q
-    # if overflow_size > 0:
-    #    boundary = tl.full((BLOCK_M,), BLOCK_M - overflow_size, dtype=tl.int32)
-    #    # This is a > check because mask being 0 blocks the store.
-    #    l_ptrs_mask = boundary > tl.arange(0, BLOCK_M)
-    #    tl.store(l_ptrs, m_i + tl.math.log2(l_i), mask=l_ptrs_mask)
-    # else:
-    #    tl.store(l_ptrs, m_i + tl.math.log2(l_i))
-
-    # write back O
-    o_offset = off_z * stride_oz + cu_seqlens_q_start * stride_om + off_h_q * stride_oh
-    O_block_ptr = tl.make_block_ptr(
-        base=Out + o_offset,
-        shape=(seqlen_q, ACTUAL_BLOCK_DMODEL),
-        strides=(stride_om, stride_on),
-        offsets=(start_m * BLOCK_M, 0),
-        block_shape=(BLOCK_M, BLOCK_DMODEL),
-        order=(1, 0),
-    )
-    # Need boundary check on this to make sure the padding from the
-    # Q and KV tensors in both dims are not part of what we store back.
-    # TODO: Do the boundary check optionally.
-    tl.store(O_block_ptr, acc, boundary_check=(0, 1))
-
-
-def check_args(
-    q,
-    k,
-    v,
-    o,
-    varlen=True,
-    max_seqlens=None,
-    cu_seqlens_q=None,
-    cu_seqlens_k=None,
-):
-    assert q.dim() == k.dim() and q.dim() == v.dim()
-    if varlen:
-        assert q.dim() == 3
-        total_q, nheads_q, head_size = q.shape
-        total_k, nheads_k, _ = k.shape
-        assert cu_seqlens_q is not None
-        assert cu_seqlens_k is not None
-        assert len(cu_seqlens_q) == len(cu_seqlens_k)
-    else:
-        assert q.dim() == 4
-        batch, nheads_q, seqlen_q, head_size = q.shape
-        _, nheads_k, seqlen_k, _ = k.shape
-        assert max_seqlens > 0
-    assert k.shape == v.shape
-    assert q.shape[-1] == k.shape[-1] and q.shape[-1] == v.shape[-1]
-    # TODO: Change assert if we support qkl f8 and v f16
-    assert q.dtype == k.dtype and q.dtype == v.dtype
-    assert head_size <= 256
-    assert o.shape == q.shape
-    assert (nheads_q % nheads_k) == 0
-
-
-class _attention(torch.autograd.Function):
-    @staticmethod
-    def forward(
-        ctx,
-        q,
-        k,
-        v,
-        o,
-        cu_seqlens_q,
-        cu_seqlens_k,
-        max_seqlens_q,
-        max_seqlens_k,
-        causal=False,
-        sm_scale=1.0,
-        bias=None,
-        fp8_scales=None,
-        fp8_out_scale=None,
-    ):
-        if fp8_scales is not None:
-            use_fp8 = True
-            (q_scale, k_scale, v_scale, p_scale) = fp8_scales
-            float8 = current_platform.fp8_dtype()
-
-            def check_and_convert(t, scale):
-                if t.dtype != float8:
-                    descale = 1.0 / scale
-                    ts = (t * descale).clamp(min=float8_info.min, max=float8_info.max)
-                    return ts.to(float8)
-                else:
-                    return t
-
-            q = check_and_convert(q, q_scale)
-            k = check_and_convert(k, k_scale)
-            v = check_and_convert(v, v_scale)
-        else:
-            use_fp8 = False
-            q_scale = k_scale = v_scale = p_scale = 1.0
-
-        if o is None:
-            o = torch.empty_like(q, dtype=v.dtype)
-
-        check_args(
-            q,
-            k,
-            v,
-            o,
-            varlen=True,
-            cu_seqlens_q=cu_seqlens_q,
-            cu_seqlens_k=cu_seqlens_k,
-        )
-        if True:  # varlen
-            total_q, nheads_q, head_size = q.shape
-            total_k, nheads_k, _ = k.shape
-            batch = len(cu_seqlens_q) - 1
-            q_strides = (0, q.stride(1), q.stride(0), q.stride(2))
-            k_strides = (0, k.stride(1), k.stride(0), k.stride(2))
-            v_strides = (0, v.stride(1), v.stride(0), v.stride(2))
-            o_strides = (0, o.stride(1), o.stride(0), o.stride(2))
-        else:
-            batch, seqlen_q, nheads_q, head_size = q.shape
-            _, seqlen_k, nheads_k, _ = k.shape
-            q_strides = (q.stride(0), q.stride(2), q.stride(1), q.stride(3))
-            k_strides = (k.stride(0), k.stride(2), k.stride(1), k.stride(3))
-            v_strides = (v.stride(0), v.stride(2), v.stride(1), v.stride(3))
-            o_strides = (o.stride(0), o.stride(2), o.stride(1), o.stride(3))
-
-        # Get closest power of 2 over or equal to 32.
-        unpadded_head_dims = {32, 64, 128, 256}
-        if head_size not in unpadded_head_dims:
-            padded_d_model = None
-            for i in unpadded_head_dims:
-                if i > head_size:
-                    padded_d_model = i
-                    break
-            assert padded_d_model is not None
-        else:
-            padded_d_model = head_size
-
-        grid = lambda META: (
-            triton.cdiv(max_seqlens_q, META["BLOCK_M"]),
-            nheads_q,
-            batch,
-        )
-
-        encoded_softmax = None
-
-        # Seed the RNG so we get reproducible results for testing.
-        philox_seed = 0x1BF52
-        philox_offset = 0x1D4B42
-
-        if bias is not None:
-            bias_strides = (
-                bias.stride(0),
-                bias.stride(1),
-                bias.stride(2),
-                bias.stride(3),
-            )
-        else:
-            bias_strides = (0, 0, 0, 0)
-
-        p_descale = 1.0 / p_scale
-        o_descale = 1.0 / fp8_out_scale.item() if fp8_out_scale is not None else 1.0
-
-        arg_max_seqlens_q = 0 if on_gfx1x() else max_seqlens_q
-        arg_max_seqlens_k = 0 if on_gfx1x() else max_seqlens_k
-
-        attn_fwd[grid](
-            q,
-            k,
-            v,
-            bias,
-            sm_scale,
-            q_scale,
-            k_scale,
-            v_scale,
-            p_scale,
-            p_descale,
-            o_descale,
-            None,
-            o,
-            *q_strides,
-            *k_strides,
-            *v_strides,
-            *o_strides,
-            *bias_strides,
-            cu_seqlens_q,
-            cu_seqlens_k,
-            dropout_p=0.0,
-            philox_seed=philox_seed,
-            philox_offset_base=philox_offset,
-            encoded_softmax=encoded_softmax,
-            HQ=nheads_q,
-            HK=nheads_k,
-            ACTUAL_BLOCK_DMODEL=head_size,
-            MAX_SEQLENS_Q=arg_max_seqlens_q,
-            MAX_SEQLENS_K=arg_max_seqlens_k,
-            IS_CAUSAL=causal,
-            VARLEN=True,
-            BLOCK_DMODEL=padded_d_model,
-            BIAS_TYPE=0 if bias is None else 1,
-            ENABLE_DROPOUT=False,
-            RETURN_ENCODED_SOFTMAX=False,
-            USE_FP8=use_fp8,
-            USE_FP8_OUT=fp8_out_scale is not None,
-        )
-
-        ctx.grid = grid
-        ctx.sm_scale = sm_scale
-        ctx.BLOCK_DMODEL = head_size
-        ctx.causal = causal
-        ctx.dropout_p = 0.0
-        ctx.philox_seed = philox_seed
-        ctx.philox_offset = philox_offset
-        ctx.encoded_softmax = encoded_softmax
-        ctx.return_encoded_softmax = False
-        return o, encoded_softmax
-
-
-triton_attention = _attention.apply
diff --git a/vllm/envs.py b/vllm/envs.py
index 2aa6afcabf28..b99e2524318f 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -18,7 +18,6 @@
     VLLM_RINGBUFFER_WARNING_INTERVAL: int = 60
     VLLM_NCCL_SO_PATH: str | None = None
     LD_LIBRARY_PATH: str | None = None
-    VLLM_USE_TRITON_FLASH_ATTN: bool = True
     VLLM_V1_USE_PREFILL_DECODE_ATTENTION: bool = False
     VLLM_FLASH_ATTN_VERSION: int | None = None
     LOCAL_RANK: int = 0
@@ -521,10 +520,6 @@ def get_vllm_port() -> int | None:
     # when `VLLM_NCCL_SO_PATH` is not set, vllm will try to find the nccl
     # library file in the locations specified by `LD_LIBRARY_PATH`
     "LD_LIBRARY_PATH": lambda: os.environ.get("LD_LIBRARY_PATH", None),
-    # flag to control if vllm should use triton flash attention
-    "VLLM_USE_TRITON_FLASH_ATTN": lambda: (
-        os.environ.get("VLLM_USE_TRITON_FLASH_ATTN", "True").lower() in ("true", "1")
-    ),
     # Use separate prefill and decode kernels for V1 attention instead of
     # the unified triton kernel.
     "VLLM_V1_USE_PREFILL_DECODE_ATTENTION": lambda: (
@@ -1554,7 +1549,6 @@ def compute_hash() -> str:
         "VLLM_PP_LAYER_PARTITION",
         "VLLM_MLA_DISABLE",
         "VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH",
-        "VLLM_USE_TRITON_FLASH_ATTN",
         "VLLM_USE_TRITON_AWQ",
         "VLLM_DP_RANK",
         "VLLM_DP_SIZE",
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index 5318bdb8b36c..f5f6808258ec 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -49,25 +49,8 @@
 
 # Models partially supported by ROCm.
 # Architecture -> Reason.
-_ROCM_SWA_REASON = (
-    "Sliding window attention (SWA) is not yet supported in "
-    "Triton flash attention. For half-precision SWA support, "
-    "please use CK flash attention by setting "
-    "`VLLM_USE_TRITON_FLASH_ATTN=0`"
-)
-_ROCM_PARTIALLY_SUPPORTED_MODELS: dict[str, str] = {
-    "Qwen2ForCausalLM": _ROCM_SWA_REASON,
-    "MistralForCausalLM": _ROCM_SWA_REASON,
-    "MixtralForCausalLM": _ROCM_SWA_REASON,
-    "PaliGemmaForConditionalGeneration": (
-        "ROCm flash attention does not yet fully support 32-bit precision on PaliGemma"
-    ),
-    "Phi3VForCausalLM": (
-        "ROCm Triton flash attention may run into compilation errors due to "
-        "excessive use of shared memory. If this happens, disable Triton FA "
-        "by setting `VLLM_USE_TRITON_FLASH_ATTN=0`"
-    ),
-}
+_ROCM_SWA_REASON = ()
+_ROCM_PARTIALLY_SUPPORTED_MODELS: dict[str, str] = {}
 _ROCM_DEVICE_ID_NAME_MAP: dict[str, str] = {
     "0x74a0": "AMD_Instinct_MI300A",
     "0x74a1": "AMD_Instinct_MI300X",
diff --git a/vllm/usage/usage_lib.py b/vllm/usage/usage_lib.py
index 4eddaf56d81a..69226763aafe 100644
--- a/vllm/usage/usage_lib.py
+++ b/vllm/usage/usage_lib.py
@@ -37,7 +37,6 @@
 
 _USAGE_ENV_VARS_TO_COLLECT = [
     "VLLM_USE_MODELSCOPE",
-    "VLLM_USE_TRITON_FLASH_ATTN",
     "VLLM_ATTENTION_BACKEND",
     "VLLM_USE_FLASHINFER_SAMPLER",
     "VLLM_PP_LAYER_PARTITION",
diff --git a/vllm/v1/attention/backends/mla/triton_mla.py b/vllm/v1/attention/backends/mla/triton_mla.py
index 0149639e8c0b..54ad3acb93ed 100644
--- a/vllm/v1/attention/backends/mla/triton_mla.py
+++ b/vllm/v1/attention/backends/mla/triton_mla.py
@@ -5,22 +5,18 @@
 
 import torch
 
-from vllm import envs
 from vllm.attention.backends.abstract import (
     AttentionLayer,
     AttentionType,
     is_quantized_kv_cache,
 )
 from vllm.attention.ops.triton_decode_attention import decode_attention_fwd
-from vllm.attention.ops.triton_flash_attention import triton_attention
 from vllm.config.cache import CacheDType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
     vllm_is_batch_invariant,
 )
-from vllm.platforms import current_platform
 from vllm.platforms.interface import DeviceCapability
-from vllm.triton_utils import HAS_TRITON
 from vllm.v1.attention.backends.mla.common import (
     MLACommonBackend,
     MLACommonImpl,
@@ -99,55 +95,18 @@ def __init__(
                 "TritonMLA V1 with FP8 KV cache not yet supported"
             )
 
-        self.use_triton_flash_attn = envs.VLLM_USE_TRITON_FLASH_ATTN
-        self.triton_fa_func = triton_attention if HAS_TRITON else None
-
-    def _flash_attn_varlen_diff_headdims_rocm(
-        self, q, k, v, softmax_scale=None, **kwargs
+    def _flash_attn_varlen_diff_headdims(
+        self, q, k, v, return_softmax_lse=False, softmax_scale=None, **kwargs
     ):
-        assert self.triton_fa_func is not None
-
-        # Triton Attention requires a padded V
-        padded_v = torch.nn.functional.pad(v, [0, q.shape[-1] - v.shape[-1]], value=0)
-        # The output of triton_attention is a tuple of
-        # [output_tensor, encoded_softmax] where encoded_softmax is always None
-        output_tensor, _ = self.triton_fa_func(
+        return super()._flash_attn_varlen_diff_headdims(
             q,
             k,
-            padded_v,
-            None,  # output
-            kwargs["cu_seqlens_q"],
-            kwargs["cu_seqlens_k"],
-            kwargs["max_seqlen_q"],
-            kwargs["max_seqlen_k"],
-            kwargs["causal"],
-            softmax_scale,
-            None,  # bias
+            v,
+            return_softmax_lse=return_softmax_lse,
+            softmax_scale=softmax_scale,
+            **kwargs,
         )
 
-        return output_tensor
-
-    def _flash_attn_varlen_diff_headdims(
-        self, q, k, v, return_softmax_lse=False, softmax_scale=None, **kwargs
-    ):
-        if (
-            current_platform.is_rocm()
-            and self.use_triton_flash_attn
-            and not return_softmax_lse
-        ):
-            return self._flash_attn_varlen_diff_headdims_rocm(
-                q, k, v, softmax_scale=softmax_scale, **kwargs
-            )
-        else:
-            return super()._flash_attn_varlen_diff_headdims(
-                q,
-                k,
-                v,
-                return_softmax_lse=return_softmax_lse,
-                softmax_scale=softmax_scale,
-                **kwargs,
-            )
-
     def _forward_decode(
         self,
         q: torch.Tensor | tuple[torch.Tensor, torch.Tensor],

From cbb799e314178abf2fa99e7306087198c5f43580 Mon Sep 17 00:00:00 2001
From: Lukas Geiger <lukas.geiger94@gmail.com>
Date: Wed, 12 Nov 2025 02:55:10 +0000
Subject: [PATCH 089/183] [Model][Qwen3VL] Simplify `get_mrope_input_positions`
 using numpy (#28302)

Signed-off-by: Lukas Geiger <lukas.geiger94@gmail.com>
---
 vllm/model_executor/models/qwen3_vl.py | 44 +++++++-------------------
 1 file changed, 11 insertions(+), 33 deletions(-)

diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index d880e6015e5d..87494c6735cd 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -1432,13 +1432,11 @@ def get_mrope_input_positions(
         vision_start_token_id = hf_config.vision_start_token_id
         spatial_merge_size = hf_config.vision_config.spatial_merge_size
 
-        input_tokens_tensor = torch.tensor(input_tokens)
-        vision_start_indices = torch.argwhere(
-            input_tokens_tensor == vision_start_token_id
-        ).squeeze(1)
-        vision_tokens = input_tokens_tensor[vision_start_indices + 1]
-        image_nums = (vision_tokens == image_token_id).sum()
-        video_nums = (vision_tokens == video_token_id).sum()
+        input_tokens_array = np.array(input_tokens)
+        vision_start_mask = input_tokens_array == vision_start_token_id
+        vision_tokens = input_tokens_array[vision_start_mask.nonzero()[0] + 1]
+        image_nums = np.count_nonzero(vision_tokens == image_token_id)
+        video_nums = np.count_nonzero(vision_tokens == video_token_id)
         llm_pos_ids_list: list = []
 
         st = 0
@@ -1474,43 +1472,23 @@ def get_mrope_input_positions(
 
             st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+                np.broadcast_to(np.arange(text_len), (3, text_len)) + st_idx
             )
 
-            t_index = (
-                torch.arange(llm_grid_t)
-                .view(-1, 1)
-                .expand(-1, llm_grid_h * llm_grid_w)
-                .flatten()
-            )
-            h_index = (
-                torch.arange(llm_grid_h)
-                .view(1, -1, 1)
-                .expand(llm_grid_t, -1, llm_grid_w)
-                .flatten()
-            )
-            w_index = (
-                torch.arange(llm_grid_w)
-                .view(1, 1, -1)
-                .expand(llm_grid_t, llm_grid_h, -1)
-                .flatten()
-            )
-            llm_pos_ids_list.append(
-                torch.stack([t_index, h_index, w_index]) + text_len + st_idx
-            )
+            grid_indices = np.indices((llm_grid_t, llm_grid_h, llm_grid_w))
+            llm_pos_ids_list.append(grid_indices.reshape(3, -1) + text_len + st_idx)
             st = ed + llm_grid_t * llm_grid_h * llm_grid_w
 
         if st < len(input_tokens):
             st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             text_len = len(input_tokens) - st
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+                np.broadcast_to(np.arange(text_len), (3, text_len)) + st_idx
             )
 
-        llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
+        llm_positions = np.concatenate(llm_pos_ids_list, axis=1).reshape(3, -1)
         mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
-
-        return llm_positions, mrope_position_delta
+        return torch.from_numpy(llm_positions), mrope_position_delta
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model

From 4ccffe561f0bc9fe007fdaafe8342171592db7db Mon Sep 17 00:00:00 2001
From: Chenguang Zheng <645327136@qq.com>
Date: Wed, 12 Nov 2025 10:58:33 +0800
Subject: [PATCH 090/183] [Core] Encoder separation for Encode-Prefill-Decode
 Disaggregation (#25233)

Signed-off-by: n00909098 <nguyen.kha.long@huawei.com>
Signed-off-by: knlnguyen1802 <knlnguyen1802@gmail.com>
Signed-off-by: herotai214 <herotai214@gmail.com>
Signed-off-by: Khuong Le <khuong.le.manh@huawei.com>
Signed-off-by: Khuong Le <lemanhkhuong2611@gmail.com>
Co-authored-by: n00909098 <nguyen.kha.long@huawei.com>
Co-authored-by: knlnguyen1802 <knlnguyen1802@gmail.com>
Co-authored-by: herotai214 <herotai214@gmail.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Co-authored-by: Khuong Le <khuong.le.manh@huawei.com>
Co-authored-by: Khuong Le <lemanhkhuong2611@gmail.com>
---
 .../disagg_encoder/disagg_encoder_flow.png    |  Bin 0 -> 85914 bytes
 docs/features/disagg_encoder.md               |   75 ++
 .../disaggregated_encoder/README.md           |  119 ++
 .../disagg_1e1p1d_example.sh                  |  221 ++++
 .../disagg_1e1pd_example.sh                   |  186 +++
 .../disaggregated_encoder/disagg_epd_proxy.py |  606 +++++++++
 tests/v1/core/test_scheduler.py               | 1099 ++++++++++++++++-
 tests/v1/core/utils.py                        |   75 +-
 tests/v1/ec_connector/integration/README.md   |  171 +++
 tests/v1/ec_connector/integration/hato.jpg    |  Bin 0 -> 841034 bytes
 .../integration/run_epd_correctness_test.sh   |  476 +++++++
 .../integration/test_epd_correctness.py       |  305 +++++
 .../unit/test_ec_shared_storage_connector.py  |  609 +++++++++
 tests/v1/engine/test_engine_core.py           |  146 +++
 vllm/config/__init__.py                       |    3 +
 vllm/config/ec_transfer.py                    |  110 ++
 vllm/config/vllm.py                           |    7 +
 vllm/distributed/ec_transfer/__init__.py      |   14 +
 .../ec_transfer/ec_connector/__init__.py      |    0
 .../ec_transfer/ec_connector/base.py          |  247 ++++
 .../ec_transfer/ec_connector/factory.py       |   88 ++
 .../ec_connector/shared_storage_connector.py  |  201 +++
 .../ec_transfer/ec_transfer_state.py          |   46 +
 vllm/engine/arg_utils.py                      |    7 +
 vllm/model_executor/warmup/kernel_warmup.py   |   16 +-
 vllm/v1/core/sched/output.py                  |    5 +
 vllm/v1/core/sched/scheduler.py               |   56 +-
 vllm/v1/outputs.py                            |   46 +
 .../worker/ec_connector_model_runner_mixin.py |   87 ++
 vllm/v1/worker/gpu_model_runner.py            |   40 +-
 vllm/v1/worker/gpu_worker.py                  |    5 +
 31 files changed, 5025 insertions(+), 41 deletions(-)
 create mode 100644 docs/assets/features/disagg_encoder/disagg_encoder_flow.png
 create mode 100644 docs/features/disagg_encoder.md
 create mode 100644 examples/online_serving/disaggregated_encoder/README.md
 create mode 100644 examples/online_serving/disaggregated_encoder/disagg_1e1p1d_example.sh
 create mode 100644 examples/online_serving/disaggregated_encoder/disagg_1e1pd_example.sh
 create mode 100644 examples/online_serving/disaggregated_encoder/disagg_epd_proxy.py
 create mode 100644 tests/v1/ec_connector/integration/README.md
 create mode 100644 tests/v1/ec_connector/integration/hato.jpg
 create mode 100644 tests/v1/ec_connector/integration/run_epd_correctness_test.sh
 create mode 100644 tests/v1/ec_connector/integration/test_epd_correctness.py
 create mode 100644 tests/v1/ec_connector/unit/test_ec_shared_storage_connector.py
 create mode 100644 vllm/config/ec_transfer.py
 create mode 100644 vllm/distributed/ec_transfer/__init__.py
 create mode 100644 vllm/distributed/ec_transfer/ec_connector/__init__.py
 create mode 100644 vllm/distributed/ec_transfer/ec_connector/base.py
 create mode 100644 vllm/distributed/ec_transfer/ec_connector/factory.py
 create mode 100644 vllm/distributed/ec_transfer/ec_connector/shared_storage_connector.py
 create mode 100644 vllm/distributed/ec_transfer/ec_transfer_state.py
 create mode 100644 vllm/v1/worker/ec_connector_model_runner_mixin.py

diff --git a/docs/assets/features/disagg_encoder/disagg_encoder_flow.png b/docs/assets/features/disagg_encoder/disagg_encoder_flow.png
new file mode 100644
index 0000000000000000000000000000000000000000..2951468c11d9a55f98af4c26eda60cebebb169f4
GIT binary patch
literal 85914
zcmeEP2UwF?)((gYC;}>|h=d}dBGLsE2}PudpeRU}-U+=K2q;aEq9|Pu6+~$&B0V6z
zHz^h%^eP=BwB)~$#9`Fknce+&cbuJh=9x)uzH+~F&VA20?>YD5rt*0iDoO@Q2n0eU
zCwt~11hRz_0wHxF-vUN<TQ$vr|B={Vl#zs_H!zMuAg0G1q^~$wxfq*S8bR3krPe>O
z^YNI%?H$<p&#?3H>DkyEH#E~TvD34%KW=U00EWQtdL~BJgaZ`eZf2I2dhC2>1&{N9
zpAM^;SsTKg?ZL<Mm%x8`dB8BgB=`h=I3ck9(dC4|5ilZQV`FKgW~8rR2CjQnkYDIH
z{|PXBSV8uZ;yHFcDe&3S%)$u#PsYf=0**gL%G3^S1xC*D^79=Bm;Q236+L4;JF^X!
zz|Yai$j;sjZoU2(e8R{1j)PJB5B3InmPYHtyz3+Sa63aIyY(UP41DbT((F7E;86U(
z{8EJH2Vbo9z`ei7MHz^Ii*UM`;rbZd#8KJO1#YaOXMLI1#^JoKlIewSuSUG4m5Yp>
zo{gy@+|bApT-eZM{SthFLWEfwx~`9i@QSQY(!`E<pD$D7<G~N8n7I)jg*fVHW@u!;
zelB5t4sf`ogPF~*2MyrX)<y;dB@zzQv$Ml%?#lxbhK%8sgr_46*nkKB)e-msmG4A~
zA5}9mbTC~%R#=cQJ^Z+=k(r4p@y@(FgkP-mhzAn}>`nE6A+4YPWoV;T*5yc)rX3s(
zuD3yH8-FGqWaT1dWQiB{H*y4a^N*kVRT_3*R{~+$|J3E|_=Wh)d5le^g!qJ|3``^(
zl_mJO_}3M0@8C+bS0h6pYr<E!or5Xd1a7ToDgDc+q#fMR+RzBEGW@Fh<(PADxD6QO
z1%u{B4i2sa!_jkefP*1Z2P;d$ui$a)T(98IKQ0J<`SMkraJesE&frZIfARHicr(R+
zTc4|q-Y@bXh{zu9XlFn$nIAqT;W!69I}?B}UySdE#}O6=UIyz&eL3;(YyB79%NPON
z0FMUrZ)aqw=V0cv@hSk)2zGDs^*B6M{2pb3V+f}8_veDg*KaKFhtElnhm)SABVmfl
zc5oLkar}ff7{jks?QCl1V5DNB_eIps09$^o*1xG90Fw?z1oZi51xh%bONg)p2++lg
zmmhx8&c6V`*D=!#AaH_k+#g2=1Y7(0b#OxDr_})n1-`NPKPCJLtUu;&!k^&!aesRF
zBgkXJ(o-=oH8OOx1Q8nF2}|H1Bn{1+z(*7O$HQ{g0AQr84L~4e2Li<P0{|p%IOaP$
z`oke7FL9Or{K!c#)BkDp{luV4NH#Wv8GlO975bf^EBrqKx&(P_ShWO5m9w^Y(6a_X
z<+r~04~L=re;y1aSltF~{P|trx9a<eF_f2(J^a~0l$VfN{ATFNOGs(|^sy^ZBLC3J
zRX+36#;qcMo{XPpqyMX_`<d~UkaPU$@s>ac|2Ezda_B!l-V!9TVbLm|`FTQCUVdSM
z3;p@?e%|kSo1a=0KQkT@n9~ib;-ZnQqY<d-ew)Ps>L1UdZK(g~S(=&Pi>3ykyo0Za
zO5zIyW}v<&LHNPS%+L^DkCOaR#o^ak;ri`<P!sxpEINFx9}<@kF(lbgbRgCjHr5>Y
z|8O-2-tUv}@APG4Z76{+(&80lsb_C*X7Fq6{Z9G+>yBZAbcv<ijnXBK{q9oR-!Gl5
zm+{vBi!Y-o!_7ed0Ur;s@I;Ke2{yn-tSJ)<O6xU9!ddvD!f)60e&d#W#3%e)w_JD9
z|HLi%LE8f;D1NP1{(Z?1j{Z_t{H-H@XZevp0d7DKeMd7(LtR400NhR&6jDLM$2Y~9
zpC3y2h|odQDG?(!7&|Y~)HYf>@i?Nn{r79gc<aUMXM+;IQ`lcv@}=eJ8!Y*DVe|6~
zfJTTf!X&Eq{~t|G5Uq+}dHnp}-14VI6Ta`e8T3Je*f(HesQ2dtly4|$exhI62q;8H
z@&^Z$?=!8x0A*v0u>Se?1Sdpn{`bKNFAvcp5k1+r_xySB<iAs(bTM<d0%C4LPaOEB
z4!+@=>5RbVUpnIOU+^OTyA5&wdhq?9iK>OaaY_P2r26+6?r+}mr?p%D@A310B&z1+
z`Nj+K5y5Gr7bM!+AKMEO!?F!w_5V&Z!^<N?Fk+%t5g~AX8x=_ei9fg^zo*Fl3TJ*-
zI0IsfUt0k`aXJ6{+yXD(iQl;APwN*1zR!>TGQ{6!hynt?E}oqDHpu<|&(nFoyC)Iu
zh{pd<8{+yi^GgAGR}b|1f8CE@gQq&}@iy`I>Al}4GeKeoN`UaMGW*8}QQ~C3V`6!~
zy8%%^|JV(_(3<O__&tyP-{wpO2pvBg;sPTVBLhc=@B8L{ewy^VMIcBF@HWH&f4Gv1
zt)#N8u`sX5C3R<OIX)9XIW;aDE<*hBCu$t{;bRi4a~+#NdJ53whsP0|?0+yp#RJK2
z@4ov|5c%gy96x-{?^o+ZBP%%AKIH(n!*6f=wzTo<s@jk0o*N3N>u3Lai=INn<wbz;
zue+)?tiZ2h8zXVzc|>>hAFWjUP!|N7+kl)uxh{T=#(^K|;`_ZDe_k&pAV^372}_8d
z7)@?iLd4awaRq&w?fmyw&|j(S_p$HyBR^o~1q6ScRSFO@TOvCC|0fV9cz@%T|8)NF
z9}Izih#lWIuh;``3VbP#fgaeu_nlAu`QzXdM0g+|$X9-R1A=_*PWod*2=N^g|JgwJ
zZ$?V%>+bIaszkQ<HzQi!Kj8+hA1*(lL^i}x(o$0E@A!b*eYg7la1kwtR)5Xrd<|bW
zt|mOJgW#QK<7y(VLLzAY_Z>2^74|>7n!db_V?&V={~ix@LM`%NesRZ-ZH~ZQ{`M*)
zBwT;`#PSE5NPenSC`e@Me*V0YxC!rP1;lSv@e`+&#F%%3D!y|_e>Efio@PY8Z=K!0
zBSZPMAO7x^KW&D>`&Xj;eOmne$PW_bZ`)G^g#QCQvBJb)kC<M4f774W6u;l$|5L>Y
z-$m;`v3DYx*<aoX0RP|q_Xn`>eVggO-#vj=kUy(`!e_Sl<aUE0+8G%b;a^nv=Oxj2
z`H9R00p<mX`rVlK6S;wndH)}ei0Avhmi0fNKpvvPhzcY&N&bWiB=iGpSb=|b5?es{
z+kymv$o~no_kH>DuQc;}kNyKk{%xo&DD)qQ@4xfpKe+2p8{qT(m1}-)dEbxxz!twZ
z3u1Q}k>LOT=RE#)M;q~;Kd&KvUzh!RplA)Z#=qLZP|qH`aupO0@LQZV^fvvvY_xu%
zA9OnX>pcGk??a@dH^zR%vH#3QsBh^HLA)X3BXy#6{2MIt+cf99d;Yu@`ThF^4lCI>
zfIroM|N9Qge9GXz_J9ul6DK{w#9kvJwMB%u4QBtf9=g%)|EoEVi^@f~`DJMZIWtEt
z+Y=}F_0Q_55&s0nhKTv^!OQP{XUR7R!pHL+%KW~z@D1<L_|<FZi2$-uxWuvl45$bQ
z5~`;J8{j8yuKM?Z%D1-^Ag12LTmI9SvhLac&6^hlc?iDjTZ#R43-RxYJifjDSMmH~
z*Z;3?UHCGAzwsAQh+Sg8{Oy^I>*&j`#J_g4{sZ9z{9g!K-+;nIm%<K#Fhk_dNL+H!
z`E*}5S-a8^SGgnS%5AL~`v+BIF=7<k*_Br$j@&eqn!6f$+3*~jRA_?T0&~p8P>c76
z8=yj)j|`kRo3%#sY-=Dr=hdT@+vaJuYRW%wdmflZ<`sAA%xxX>Q%{3Pxn6qIISm_6
zwu>xIW}1Aii_Q|;v%S6WnsNIwqGPe{y~+K;Ma72P@nC2hS-P%_ejBODxyhs$>l)$x
zDsl&l$KSYIp00FpO1pLU6ZKfey`v1!Cj-m-<L{;3#>j><shqhHlJp?Y?mR-^bpHp=
zo<|=jkD<g+TCwUDY{!=FxLK#2+!NxQ=Jq-MoR04JgYpO?@7<)`10$T$R7<wX+_Qr6
zH)-5eMntw233#-~D0HZ~AzBvhF+rEZFOWAF33q60cCQWfv)|W{r7D5e7<k(*osB<G
z^KFL)s%4zp86h>FsD3*p@A;DNZm;K|6i--5#u8aqNfjQ!84NLrGht#Hd8n5Du=I?1
zOjGtPNt@%Px$Q?sG<`*5Yi-iAD3{w=<6j@o!yot|8r42~PY0RXzyBe3eL!ccPrcA%
za&Mn=!gLhM+;qKrt}wX2WiI6oil1-B&oSP?J+aacWwiS`VS0Q6y;{EZX_uR_>6czP
zHgn+*Y@g2x&zN7XJ%FZhH&Y!*I&O(#k!C(-Sn^cX)9opFQE|&i%$9u~W~+}w!trx_
zJkEJqY@X{84PkoWEY!n%u@-69QCU?_(gLmV2fj|q$U-D`=uTpMM-(zyg&g(fsE&~8
zvFti8P1>p;joBQ27A;UUt<cZm{t7=w4sG4hnFRPgpB}>Wwz~>P^lDkq&8JC=S!p|b
zIZ)6&ZIH7NYgZ|BMmL%+_vyA6xGXLCwkVsUJ0IvAE#ZDHu$&~}tIGfzeUylw<LI({
z2(^3dVKTz>jH*g=w-0NiJb-h}nvFly#2=V8YQd#Dx)5;+#j@OzTBWG{4j~mFex=G=
z<u+vDBCUs4VzUqx-)aj+4$6g}qa0rSBbsMf2-D+|Vj|dp#cd_cJze+%trT@FmgF;v
zI%lYwBaEf3$4Z9wUnDD$JQN#1mK+f<z3o^K$}F@uqC#oe6hB8Ly!xfke3Wkp)7v*o
zw1GgxhrE$+{DBtB8ntR}YlFdXf0O{HoywjQ=ulP~dcNLE2gM67dFx&^n^(NC{Vx;!
z%S8V&(SHF&WuHZq`cdaUiT7}esz{LX>-5^RRW)&L<WWdo{uJt3eZOi<S;n=o)+5fd
z19I6OYs*o79?PRotXDoySmUs3lW(>{Q<LB6D=4%$zo;@|q=M}`d5+Ep4{<{Gj;jty
zqxs~CAhd7xj<7u{RM%c^d8qOH)UA;uHO=@aJjkWwyTR+M@$3AqT6rj|a<Jz-Ju`En
z&g#ud1@6LuhPcz?C#*gUq-*8&y|#Sc_j%%DwmI8%<MJ_mg=S~3JG&hZub!#CeR?k*
zT)6X@D-NAO^IiYtwim%|d4jqx&fh<Dsxb3mjE<F=>PUOLzLS(rhN<e|j9V<y4;V>C
zxx~fg3o%JIaIQ;(5fP83bZ2OgVMnzbdn>z~K3YvKbm%%q9M`tXcb?LTW7DFtU7jDc
zK94+?bF?o=sN3e0(<htp_B4Amrb4I_?lBiLSrbqRMIx5ugD~a+D^o?t@_Tf81@X=w
zUt86x8DU(yuT7nHp6nD68mI}~{FuQpdAGaFX6~yrt7QH>dgOR-hW2iWjAU@Ht=j$-
z&=q>?mP!QNz+*>$nr{fOcFRgsPtep1d{5<C_)tBefDgD_JF>^w5RxMcJH=K*V3?4%
z(@0$njj?Fbc*N|@Ydv0DJDVTLblql?>HG*U>e9Y#yEJQ*?KrOLyo#AgKSCSdgqg{A
zny@ozh#gI$s`NSJjq7SME<fPh+3PgfIeI=;xc3CSyHk*NGH*ORU9PXAz-6ZIS@vBG
z@wfr0#F3a-*+hySH3~$65#A@EB>A3dZ*i}c-S$sBg4{w&(awj+@{&{&l`^WE7<vC|
zQ-#_2L9N@k3z`Iv_Z7K{Cd~B4U!WC|^wm<g#jY;VHRg<jEY4M``5$AJ`7Fgg8gn|A
zbXQ3RWFSC67VpXE5>;LZEQjBw{Tj$blts<?tVS!e2qB%^OwI@uerQQ;N=qyM<XfQA
zoT{v|54cAW(iTlm&jB}zApbqOh!^>8Z*&!#kv&eUbph)2lt_zYOeH$H8dpZ$%JeqX
zA4)bkoIlraDnI4a>XZr;Q|O7XU^=Rf7QC^?2J-i{J5;wM=|&~nE_C`-A^(HFW2lma
zm_w!6s0FUYPnnH**CumKM3!9@y@d<gqUm~7FU-VxSc*=WtEqbXAy!iO`%F|ZoSdu3
z%=Eabnc}I<1DbQn6wB%R9`|hO;kXjJJ>d(4?mNhHdNYs>^cUF_1KEte3V$%=@P73E
zzOH$5g-prp*YuhDXWiN?GfR-<E}!1Lpv&`x^TR*9s(#qbZ_jj*toXV(e(^3-zuloG
z=WQZUhFok+CC_$oTWC`=5u?e+)de`C-JO?2=w`Sc8lTQ&6}9h6%kCayDw%-R9T4Kg
z&-SeBYHR@J#KoP@&IO=$Ub%IX<(}@UGR9>MBQb5z$H12~^_0b6mG>!CcI%8(f1Rz?
zGn9z_6|3N#GgMETv0OsNg^QH+T{eOr3x=r`>n*!i#Ts1|hctNaHD#+>-)XO}c8$|r
zT_MAv494Q6$8w-4MK1-k?&npBstn&fi9GMFV$dwALut~mC+R8Qk>&GY_q){<Mk-dy
z+!j<M(Qfa%a_rI&CT*BJ$MHOq`^$}P#%qPhxG*<t%t@U)!E^fi9>U+&Q^vcjS{W<C
zU)$5Y3uUd!qMv)EB!01QUg$b@Yo2W>U#vr8{!3Pm^W~#&pPWkQ+qE$5DTZ6Qv6VVc
z7q{Fosf!)d&GU0!IqQ!rp5VszapO^Ce>M__rK_ieIg5&6d(MA2%O;1W@48b1w=8Ae
zn)1TpNxRJ$hB24=KHFt<!uYMz>1PlYZE{7npX_HckV>L6XPn1R;f!uKCBMstqXVd=
z`aezt8HHNJmMsRd&)1h{47%Fc#SKQFph<>;uY%WXxeMo8v_f{=H>uIGtG};;*5Wmb
zmDvg8GOHGO(0$J2iF3uyycw|<I%{{EvUQwZM$@g?hhxq&V#5d4iYj$g7o5jrPvaC1
zaLdU=)8S;8cQ-2`msJ+);T~_@S7$0GJ9F(hQ4|Nnl0P9&eL(h%C_P_G)5ng+W1r@4
z4#Fw(A^2<d)Rj`hv<6}>iUihv2-G<5L_hpc#~~#cWwx9&t2s`ELYsK3d_?EPuYEF^
z9BWIlZqF7dq4VjD$zOx#R-#9!6a{crp>Rb1e(lVOf$Fg11ve?}eJZpgIlE8wr`%Hw
zgsYY|G(zKs`#Pr87?y_Xz1@WehA+<)EvlXOiR>FP%-Q*@@t_WWrO=|vf?`T~mP~{{
zJdNT0qJ-sYl3P3D48Qj>Rri&ASHah+L8+?SX11!McC6WZuU@vpa<slLm=TLx?7o(9
zjeDO^PKT<+44eE&zRRWMvjYR7Dea}XWdM!y;XU=&f_4la+b?A8kWu(qV=<Kz8B?vD
z@8p<)n?otnuI^0#%&1X`&B5*|Sgn4I)W+5pt=3-fh+K@GT#Uqw9ffA1k)&ar8C|yb
zhFaBh7lv!e8<wuf$5ObnKYQtPj@_Z({h_9<2e9C*al22n>|?H~mYL?A@qv@?GoM&o
z#MrlaWU`{PU2-1DxL7~^JU4t~;j*KVG|o$-H=LL0YUji(e0r_gv*>Omx@7RS43lj}
z!EDW}-$Crl5sc<p6sCkXtxNw|cy%Q`SN|BuPR3^A-5lo?*<x$pX+ju}c(;{_?0k5U
z4hrGAq-um!R4U*ohesm#nNgS3-+e?RX=YnHR)#=zQ9G+}4FCe*-dZ^}y}td+*GyK8
zEmRR$Rr48sJwz(Daw>7g@10)AXJ}--+m>_w8AURc_I^v))ka+BL}%{X`@*&*R^0`z
zx$k+$-}6dcR%&w|IcX5WNsA6;m_Ux~8{Q=rxe)E6SvNly1TWoV{dAAHb==nF?2$l=
zvPM`2eIHzMiE~hrt8i&3rZ(G4gEOv&8%Of#E{uKtJ|9+fsG-`m>K@(9cw9#1G{b~$
z|4MfFYR?Voybhdmx2wsLd7=yV$Vy@nck0llqV|F$Yh)a@n|6i&b7?`xJT^^eZME_A
zqLy=aR<y2ttMYkw`?5!lJA^GRf1WF7%2ss$f-x&<vG(&t7hpz%cblARFnjLjtD-W^
zMX_C}oSX>jHG3V-;l{u*hF~ZjWCF1KoXhBz?Hsjh@c9L$q_yfBIH#s~u!NklJ!Uu_
zV+R(daM-DQ<Vu)6ZldKbwM0cg<VkB;+Q;c{TuzfE?>Vi}P($Yac3yE%Xq+iR?4ga|
znbkK+1@Q7l*_%^0P#?O7(9B%mA6>cTqFEj+k4Ql-CHl_&h3qDm>6zt19-Vx2s{fJ3
z{9BHy9(rAvm}=~eJmC-?XIzlsYQp?G>U+N|8rdLUA#^6|WXC|N!LmlVnuRx~?Xn=f
zC{M~+L_Z7GS49+8FubK4+OQ+Y#LA~7_;3PT!~5jf;Q`TF?iu%>74)mXwO+G|Y^6Y5
z&VJulaIJaW+EQU8)9$#!m+cn%ILeS5+uNnoDH9Yk7R%-y2Ub2DP%}R7?s#ccK)u+N
zA^oDUwC)l4WAri<T`uuC9_15C{flXVPqQ%1?DN{9&qmL-);OyMRc0^6bv)NhQ%_i0
zb+z2Qy*Yc-SemAgIvM%06Q(|0nc)P#hI58h0`HqP>7*<Z%xE@CuPheABF*!<c<+-C
z$ihP<mGgabX3=9IEa<b8P_jiBhJyNbNDN)dgq7I1I<&|4<3V3d-pwbmPQut2R;<&x
zHBIIU^!6ya_z<)1wCH7M@e=&gvSzGze4BOk2z*})?keXk&GDdty=^KB2Qr6P4dly&
z9-kcsPHyTxf-23)NE#W0y(gJzo{D}xj>POcPrpeCd2wbg9@lyL^E(56gPX9}0}PF<
z8bKnjy-@~zEhi3f40}wJQJFNR;T|j%^K}LvvzDy0P@RVhH5JiGbf!iQ-k3fXg$lM!
zHCUr5nykzi#XeiGx#w3z*G^N^5NO}LT>EtDp@rs2riQ$>v*;5GTnYQ9cENBL?Q_^e
z(avfsJCz#bk0!tyTvUdi-J8-76dRvf<1THq(3*z<CxsPN9cEdMHdRe^H1grj!GY!L
zP_*2Zk@r!;NAq<3%GwnP^IL#K5bV=ei~?2~l{XMT>Hbz0kNEYC1&5Y*tEqyJP~50J
zyU!2xKA^e+im1;wH^}0Y@zqhM6??3pvat9_Wucy~vcOfoEL%0G;hM1zbQoD;C17&;
z+{cdV$j=eDs71vY%wxD|P+7J^^n%x?)UYaPlw5<{Nb5aqCv2?P*h(VKW(hmT*>`S5
zZGIr<r9LpT)j>|QFga|^Pull|g|=BM{7^$)Kp`?qyGZ@^O4g~NXchF!d+*!LZLAeC
zq#sG6rEgXXqr9yPlnQ2QD7!h%tKjhHJ7Cd<NiE7)s0(n_{rna$kF_uIaPgdrQ}4x{
zm~v7|csr<+u3518Zljef?JX{zicvQ4!jZRk!!U^Gq-BFNAy|s`%pT;n_9?|)%@k}+
zk$Pk5G}@9%&0v0N5sJ2Wi>^dNftyDSZoSIwX5^#Gi72fSTIr`w9~R^+*`(T$_p&5q
z4^m3V1`|`X6tmwWe%aFNlKb4{51*pGh|G73<f>K}Mr^fLvo#^9#GZ4t03Q!fH5x>L
zc}r)cMqXx1pf_&IL;AnKJr_V+&1>i96sEYJ_p-Jj{;f>rY72a1K{vm2jv3J|m7cnH
zu8wl56jSg7i5x_Q^bd6@!|L)9tzEWMHkqi-_Ya&<HYyB#sc{~fSoY?f8To@L0j(!-
zS?iLEqAO5}O?s)&YM*W_jeE~7h5GblaMd++S!!PJZR!X*r41?0H!k+kqKnBqb#GP$
z)sgEOFJ7dJk_wKodw9AdaDxdB#$CR}Awg4I!Vc-uAu*2o<5=vy;d?8y=lAg)Ux;K_
zPO3O&hB#W}y68%^xFcjL12z><Y_pOy9UG{AO*1*AiDr5`HIwLw$J)3qH!PyM<EqPK
zSkdN7xP2sg!7T9CC7X&%xn!3YB^QgRvro@JjhCQBNw^vKbZI7^WY}Yz)qrq_%Oqw|
zWHs*DRBM(7D=N#p6&d+1BNxN8<|TpqEadJ!WOj0X>|vYv<04h9anug?P3);qbEK>&
z!~Fe|e)L0)qmSCGH`6e<xfhiQ3O`ow-Ct}`xTWD)KZ<&}dxt@RF<7gWbVW(mLdr8p
zu>1BGVamB<i?ZV3$^#w~!Q;oDptxG?)AnliiMF|(ot{md3&o<YjJxCBEt|@rUx=79
zs!0lUbDZ20A6R$o1bX+vWl8jrKBiM9X^0N<s`^=RtzBZe3d4;mV;?Ou^^e_^t|(u8
zv@P3L!?3{Hz#>XZa<c5XuouI^&LXdnqAnqUWsK&~4A&0dU?mZ2%S=`=+oMY#E=r+y
zqgpCTl%iQ(`)}jv)!Aoy@DqSu6#?{Wuv(P!O3o2h3G|WVZebIJ*eAk`{`-gG&LcJ_
z<3Lcf1L`_(n=U)%_@maG%Ni}tTD~V`5@OD4OR0V#btlITEQ$eMAoiI*{KAFhkBuVR
z=)#5{KSiduEcETC>OEnJ-Jid<;=i)Bb0vNejYQWke@@4J)TpPN8f+W7ncv^5dC{X=
z9bK_d6jH=Knm+<XOnc2`)6Hb;N^w86Sh(12KiqJC9HqxJIX*eOEnDu$1?|KIuG=cr
zf<0<?oR+fiR55BcU{r(Fy>^6RcvOTsciH^e;U?#!FFA*;eC93<@0)4MSle2&_2LXy
z&+1g4reXL6v(=+%Bd5fq?z1&3K1mngbQm`m%xB3^!?PikL^eb@PiGn4xl$isgX_n-
z*Z1G`72q7I-vyIxLFc1khg;A|#jxj&?Q3nN?vec_WZt>`VfX4|gz^DZl5ex$AM3td
zDvaH_^%(Qp5h;c7Qzw-ZHuZ8`iae+HCH0Fk<T*tJQa>WMTN?^rpKPulM|aW75?ng&
z`Laj<<69T|Rn4T)w(my|_yF!<Axa%j`sbxAR(!(q-jc4Dw;v%LB$tJgkS2~NBB?t(
zGE30Im{0FBkBhz%5~ayPr%qF+7Pu{p1)S@@Cfpcf((Qg|rHC3GJWKs_UeVtMzJ`gp
zEcROE$@$zc4yBXGd$Nc-eN)v_$W?oi5~UzbiF@tNUM&`V${0bGw<FA7D2C>qeeY<+
z(R@CTuN*^miEGW=t?5tCU3H_!ggDI$rl6WsK*%RxY5h%#DKF!PjqsfHSh`L$UHklj
zyWEGM-ZyVxL&U4yMq%Rb{F>mZWz_Mpi=u%nYN~b790E+MZM$dEA|<tErb<6x>CbDv
zwp2$=s1&KwGVw4{9u@6r!F9uAg>{}($SKIV3r16VFkD`9KmVmBF*z0~c5429+>7$C
zHNH!Osn<hlOq)rEFAndUYmi!|HcOj9AuR=8J(zmeDG(whR6m9%Akqu*1ca@T&ure_
zi)1ylq1~ip@*TArXqV`h>b)6uRqjURshluTtonGXu-TEcDbmD_vV>_1$)sipc|6nc
z=nemKHcylhCCS%x9`0j*bMBVwmzeQyi==yhCcfB0Ie3}(G5K9K=EBY7che)XCfQFp
zX0l@2!;r?(Ip!ro2ZliA&NSDq3C{(7CucbBTHY3Em)AZ;RF`ly0St@jTtA#s(}0{Q
z*ZY|ZT(d^)(z?QxWb&~lb>^xVP4S5jS+(~?>?@Y+NpULu0F=y&Welp@4)|F+E-4k}
z;d#PSj%%_pNIXyY_-VLE9E)_Qt6Y*rr1+@YXpt@S+WurPlPlTQ+Rk@u@T8W;+fpIA
z-~*@HpANz2c3ZazOfB}loPGO5Dc|bj>)fFILV2gJeHO+|TOsZGV)kG;I!S9_aD(=H
zbZfhkcN(c^pm&Pg)7s?0ZWf`dfG=5aW<;jbHD}+7BUUSX5uCC1_f6{DJe`;)I!5CC
zyzN7qlBX-%UC^-C3>wYOmL3|F2{Echu*O<^C96%lP{{a8F{dU)UzYZ;jJVr2n&b=I
zYYMOSkY~S_ve2f~kwP0wN7D+g3Op5=R8&zUZPis=ewz`5ddvUX<)yCgv)Iei7xr;!
z^d0LJebl~!ebLr*2W4R2D!ijh;Mwv@Y%0FK)75rrvLMFTXZBg~K+WccSe+m@vk5B1
zj)AQ6vF0N&HzMwe^l(VuH0uk+18~xX@`hAU;<5Nz;z6-D>}=pSFT}4JuF+E`WP-q|
zdGriGQ;N9|0h&6#LX&vmF-XcAsb(QXfxoJIe^vMX6xF?L$_azSUVy)f(fF$MU&Uxb
zF<Lv5b+M$5Bd~a3T=tj(ZEiDW50!_*uAYUf1t^SxXuj%M`OjMyI^^ksLR9S5f*R%9
zWf2DzLXJFqBcr0MEy5ud9cMd1H+{isGrcZU_jp5U7Hv2}?sT^5{lLn6)zfGP_cS(o
zU6px%mII8<6f~V$q#<I<$)LRSE}$qwGrIxrBfIPyPqS7X5JSAX4?}hruFlr7_Pt;t
z%h=k^>A9-L<_Sv<i6%=fik?^3+(v?UEG;*iEC+$MJ#PF!6R8N%y|^!$T)9!`nOvr%
ziqHPWav{!DrB3qcdM`rUmA5e7p~i70^I;wtC+Ss{(8R6HRji&c!%;mhhOx%zzJXJl
zNe}{?FAu#s3xTSu#3D4AJ-IcNZ|?Qm`5?|rRXE^kvi65l)~cC(UCwC7Yo9-jGSJ7I
zu(E>}%=mtMVIULH`P%AZc+B2-kL9NyQSSMt+?O2|SMUxw!($<3a;6eG<xzyhc`V|Y
zHBPnkoUKeQ#RpEiy~@`x=tg*SrD<m8rKn}(**I1X)<#5hbQfL|Qd1*8%&S99<}XgJ
zPtimDq9v02)-pc}zuftA5UAqz$WcX_VwppRhpH>cdul7l*g7v$C^rglg8HAw?JMIo
z0o(Q*&$)lfId2!o`5X{9J1hF<Pv)gqFqElX#q=W{^`1g6H9V`Q46$oRaHBAN0bBgw
zrUlDmDYfG^`wxpqS0ypaY-7DG13^~3ExUN8HJ&}I+VLnU#`NgRI*XeSv6qie<i3`K
z=)Qiq+ja+w`02N)57c?fjs!9Bk4Mn~>hQ^_Yo9HhFH7UXl~FgJzj`&`vHUhZ4_`;@
zqT97~2jj@gMf)!I#jcbSoZX1Idb;e$vBo{=75=t%`wy#^mnShRP(Qpa4es7jsv*!C
zFIZmfObPBz`K-<?2;4nMc<Hq`xch^hygS$lcW>pQV%nptPHR2BTZkF)sAu#^yw2??
zxbf=hFw8jw@J6#~ar9;&{B0DHS#1pG((FuBh|nt1E4fE!7Z9i@5lnxEH3WhUeR4C=
zKN+TA9yWf7Y`Xc9VN}OX5`>|gm7SFj1Z63Gq>oY3(=AC|B2(XAh2eA(a)0u4r+<HC
zh;w61r1Ry{)QXA%P@IbGZCAq91h548*_8VrtFnuvTSIw+<eRkKSyI-^oh{x>(Gzn0
zx%$`^(pIQ6iI)Q@=J0(MesKu&!X}zf8HjGpTW|l0U3l|rO5HmJonhPKYV3m)ehtI+
zl?Qf7y>{Q#n;4-pX1#9^>fHrm*j39w5VPV}Q&K-I!=4!go`d?t<bmm>qwXDwqT{Re
zQ<O+Leun)9c*KMoZHJR#DK%lv=fQnB6o+2Q1H-=@SHQljIO0wl%WG+ZF&!I=_6?42
zOU<zxly^Rr<i7IRvGLKgng}S9J*qv5Ivs{{b{X=)twC`!P;OW$t5$;T!r0}-vRz6!
zx~qMAI2mX&hhnnNW7a0S^7FS^&#6Q}VkEV(smEi$EYd<gk0iq;D8qCqNHNJ|M(s`K
zAy6~5$W@JlVEJ7NiX5h0fBv2YJsK|?Am`!<i5tSnBBcM62vyk3RNsZhD8BJ+Fcb-f
zVE0xAU2r8=M!E{~1zM3}s$OFa<NY9FHKn)JnM1=Ms5-f@Tyug3k|!kF{XCh$jjxw6
z@3tkI_7j#nxB1Lk)SVbZ4pz^QL!`B@lE{15RP4em*~q4i*d%F(m`Pjt>nWq@Zlsn-
z&^(v${0VO?E<viGpkO`KU1(kEOU18dq;mN176n0o3IZHa&pe;PF5BHX#}1UY(<S_}
zGz9wePMG0cn&Jp~?}I_XkcD%Z*I9eYA*8<KsQ~Cf`KSK$LaRy_axH0d%=H9)<~AR&
z2z+kyGP9A4akHIE;!}V?qwd9(@$W2_*{8=xN5)5691$hX7er1FC2OiI4b5Sxo~7Y<
z=dILCpXgUWxwtb-Ni6rF*_$Ngvs+co!XQ{v6(Oz*DoBmH2Z7g^zM#0An&tx$Yk7Fk
z)s)qfTkxse@pZ)%><};B>xJ(caG!6M(QeP~c1y_zEg^Pq`(A&v9>>;GlQHx3Q<W$R
z^-@zlVj$^$r6$!_5&+aJt$#;e5Ii=68@+F_7AfXVU(*>pCNv9jV!R+^mb5vb+>+19
zS<=Xr-Py<FHo^kB5p2b7WnHE;%!iP43vfXKr80Ltz`kTNlDt7SeOsbgPUI8`;_iVX
zyCj*TAgFU^tH`bcpC-VW^HMUDg<>-)J2_%hLDvrIfzitbWbs|*1_llC=_I+pJ61yy
zYgteCU#JCkXgDe%U<IUSHFmZ&kD^DR3v`_Ye*vqK=<(_f0k7#gN@U6t%x9%uiI0|)
zNwqfyI+#6Shj0J3d&T<}Q#*lN@vBs%Sor{pj`ZA3TX&?oJa^h#kt9wbaaD|DRl>3L
zp!gczFKYlPamnA2Q3O&t<lgQJsi!m-hmm~V7fmO?IlmISo#pwtt7c}^6J7ZoKAcCE
zP2cT4Oi$jF`e2LU&YlHz090-CB#72<oim(a5V1Q?w_SLD$dlV@JcH}nSd{VRdP=MG
zLs0UAG*?w*Ju8(Lz=CwUDa|3fb~D_shk?a2gn>4IM|xMW%)>zz;YVcCi5GhBB`JRK
zQVFe{k2ibqlD*qqp=@xAjucZG(84$O7;88tdC7_vh;CH+6(2<pTT~v+Jpc<WudyFq
zKKTN}O+)6hUgD%ACw$0UwqI6)Ad@4mI9zXyH+3aXrv=YRn?SB2K!P}^!E~Kp9-_-Y
zr(^bE-O}Xi6*Xw~N_i^kZ5OP#!r}=_J<P?gG^X^|WBy6Csp(hT(sJixzH`RM=X#}e
zkm(Btw6D;SrT{!^^*cmBvuH-e<214di<3ghLwlcrAg^sUKq+{67dI`*2@nVfGVf$j
z<**q~%g$>QTdDgBonp_9(~^kyYyq(Ia2<9eG9|+vRc|J}35<Ft37?iA$!daz&P??M
zWFI?g@fPx)M_bOYmW`3cA+fH`(>-sF??AtDnXTqf6X2S@;CPc9LMp(SOwva7&cqZ%
z8_HI;cWxBxgKN?Emp8vA@1fRoQ>YDJ4of1Rc_j;hW+gN5b}-xEE8zG@Uh{*lneE#0
z!eCOlRd!eVS`3t2Tzm(~XCV;{8o84sV6{qjr1oqjrSXK2F+)hm#UWomx{wN?5%$hT
z(wN-AaLrCB>eB<kP}up*>pQ(Xc}NjCoabmt<XG|HT~AHG!EL;IN%P2`9~o&0vz*;o
z40Uzo`=}4Hf^rvI0WxE-a$7f(`O<<T^<sr7NiUK=FOs`(UD%FhJ%*_2Jvij)xf6JB
zymOKx?+KB6&NnJf+KLueX58X+8Q@jTCQ^%C<e=!3?G^yX?Phuv6w+>7MN4xSq!{6c
z8r)RAWCKm9ku7?4R9+QeDguZ0_R_O^!UFn?Uoer3h1~HJKM7F0A#~sTuIa|)9H)us
zQ#L)t0b4En>Sk_Z8JJ5ygJ}J;09)S@S+WTp3SE4FSi&iuA5q>;)1$ackU0#J(a7h>
z@(jrR(d&8E4=2gO!^1m4MxdQ@=OJ{n*t195QY5be=W}QIA5i|88Q^4GZjv`KlOW8L
z9m<cWtmg_Rgr7=Wy#Ry~xU=6y0iY;**5IK0S~UnhKd^a*e0Y1ye-KD^R)B?-yhp)Y
zd>3Ay0DTpM5A7j8xD%i+S(Qy2IM3X*oI_^qW`sXvKQlmInwvD`0DXb^i39hRDA7#!
z<lH*?zUz6s#Y-AI@G<#Y{am!g(D2sq2+jo#rCqG%ArLWhC4Sa$83+_V1CWG0B~c^@
zN<bu9i#b%*Q;~(1x%Bd`V(7C$x_HI~4joofOHXi~_(93tN)RZ122?wXBeqDZ#q!|;
z5Mv+x8(|D&^z6k+&kyqkXP<!}uUypBNpFo8RrF6j4Pg6pz5f*^0NY>&*CD9KTLcJE
zXVZYGotHQ(fcrC^+tm~S+=r_n>{{c27@w1X^GI%!Ul0Z7ff)$M0=VC;ZCkSr_W@Mr
z&1tUOg~XIREEDeDNwTUZXXToE5edZj5E#HCU;z5AKp|iT<Uo-Oe<|`$sz^IaN<2j7
zuT185fkxylGIJIC;W>$k?D+2EMNEH4BO`LKhA!KvmVU8h8+XoDD8gpC^Ue;&QsXfU
zHB{_VLp*Fs$75;mX@t24mJw^pL`rdqO?>V0ui{X8guu}0Q^Wji@-4Pv{TQtbouwDE
zWMs!a@dxVXk1hl9W6y!s*_quEwPUoW$Yys|&A9Ol)w{=*7t9E7&YB-E?yq07Nf%k=
zMF<9a7t4c$l<t>=wD@|6aD0^R@Kehq8=7H$0nVgk&Y@J9;u5jU!`jhwc-#PZPvylJ
za~-+q+DEJG+zwr2mv){*^+b1J{z^L*v|^9FhNCAxPodG;`+8%jsYRzfPr1z}=OdP8
z>p+YgNvvQ{i(#%d-J`=&jlWfbb&cAMG$jnCh$1X2gAZuVtURyKcJ9hr&8Er3`L<>@
zihVqQ!>&x_JC3*K@|!f|fS%DOD_yBelDuWexnrws+twmg1Bd%VU{3fFr*K35or8!Q
z7X1}LlUW@)_W0(eN|TOsZG49vr`=-ZBuHqtHD=DMy(m~{*Q_ntCQ|undFk1a`P(-K
zrYoxw_iZ6T@ybw%GjAf%spJ<oq?{u=hVh?^YOIZ&i*ov8{U%}}S>o|ivgG0Y6fLQ;
zX-6xhAf)v>t6m(z2xVoUmdzIvu%PGo1!6o2-#guF>=Qo@5_wLsE4mY<*Qmu%WGf(z
zQMdLl0GY!i$n5P*8sjFS*$9nf&Me1aClH=fuuqFKEB&imS3T-&V&UePp+KB6uJx%(
zS0vzjjx`SN-!_wdt=oN3I~$xnc?AvnRI6qyQ|Xnim}KcwQuzyup_^tzP@tQ4@+L>z
zl?G=ZoXN7AyR7Gi>hJHcW$Hbl?1ADjew(D&MG=7OrN0oL5?TtaM+wuoID*oRBL%rQ
z2_WFa&s<DC|HU$T5lMN?^xKQCbMHA*(o6LvU7qe$DBW_%fqdXlsDa7|viN{l4sxb^
z&mK?~Gf^v3)1S|%i;P$)PzVE+Qd{4g)yqs+k^O6&Vtv$8E4kjhV&ObU*rafSuy4Xl
zYFp}v&>l(tgVuL2DRPnqMj+7OWH>2?b8SrRxifZe-X6o2Z4%YEgJi5RxZUvN0l?!O
z&@_H6^<{GEu1pn6w-89p=|lvbKhK_Z=M|u3t<OY$nEA`($YHP5d*KSZVanHJGg%pT
z3DFiD%k(HR)xt_)v3rr%o?$90KfzB4PD%8v`JQDQE^ui#SM}Z+wt~_Byap<Vn=eN;
zqWNlcy?XcWOHijpJ8?4Zv8GOZP!Oh4)f+Ov99et}Of7Z(VBBp$Es%#jt=sv$hpoXx
zINq$jhaT}h`cT=axG$Nqak&eQXD8_x`M|r~%jh#>x^HMe=M3x|b@riX(4Nwwrkc8N
zEJ(dRfalP0@3!cpfm-Uk7Ly)t%CieJQq*||#%^NTRc%q7TgL2XMOG6grEho#&_2Kh
zBp9=l17D+WE0?yHWSdwY!gw%qOMhP<A}O+sUZV;qj<n>BB2jT~=?}S(53mE-OvA6D
zJys?rHCM14T1GtMQPiN-uX8q&rG$<YB}WVEVCh617TxZaW};dK%~>%~^<G%>TSz(0
zrhgl>v_#SA-N&;<*>?hzZ2FSwK!5%gSSG7UW{J=ZNrNgFqo@bHECN(GKTYOOiN&eU
zAWzixh7<%FolqeAmVCoc+IKFhUDWDLM4FjoK|g_<y0u8n#_}LoJXrBfQEt)1>yLSU
z7j^R-p5}Ai!9mbC4E5yNjkFA%!Vjmbmi823d;sW}E;5e;5n^7S0oxYrL3`>aCe;b3
ze&L6ZkT>Y=DqPuk<FY$W-XC-!_I*6I5Z_DFxCedwDe_ce)76>&wTVc{b5eckT#X58
zsu({bKR?@*r4p_Oedx;U=d*cB263)KQIjkKSe8Dl{I+qJ$g19bmZcC5@wFh6N?CF;
zQjEU_K0?Gl(9mLbGgWrsAmUKhDV2t+Zz5D?4Xo7(!H%Kp9aCoIdw?suyn5_-ECfq)
zJal$C88%27ri0Hk$&KkR0IuxFp2+!Vz?H?^4SFz4h;w@eNl0m~9BL{_qS0k(ia7tV
z^nuCg>5~Hm)?Im%^cvXL=U4BtG+l?)gkHVJ0HSAxR&|yAU`Z=pn0+b%fhMX9BZlmK
zV;diLT#O{q9Wtmsw?Ghg>mm!SxcGLG6PtN2()f#$Vx%4%_LY2y-F{Q?Sr`Zs!xD`2
zrGTZeypYS<M~Zp5?<u(hgs|jD&i2xfUtuXux+-lp%P0jw-b$#5)B?BHIv7>S2k2FG
zce_SFAPursi_%m9`tuKa;{Ztw4Gp_%i<6G~Pgq7q(JefYwY>Ng)D1TJWPUQ2_;<H1
zkwtq!R<`3gz<syMcGEOTdMZi;-WlNCOtQ)gstw!8+S4?L)3x)5;@rlbP8NB*y}tZN
zl{pk>Hj&>Dq-|{G5Yj=4PPg&2N#OAM-Su7PQ?C#&Nq4LA4o#>$xa2dwGIlS(r#`se
zz4vR1CxPT!9tcxPH`P!^x@B=>+5sj^q&@X<1Yp8axT31ri&xI%exOnJApHcKx~b~G
zA|1cv19d#LDlgNs8RSQ#p+VfX#4PVoPmzT4H(B0QQQ!+JGYt-sk&+<JaEU+ILDJ39
z-rMkOkm7kGpmNkNbUUY#le{2XO)3Ud8p!=x*=*+Og`B}Yj(AP$-15`&O;VGXnSKGz
zvFef<d2*ZClryp|$?~3aKF=`fox<R94BQa5(K(MGeA2;Y%%MoW9T*Xh_s+^IAni&$
zs(XBj+kI4F613ERq93RUu<KN>-T`JcVXBz)7TDz57e>b9sb@VoIg_b53Hj~wKBrml
zVhDKBP0Y6b>VN=BotNH8y~z5RnD;5J(cSivz6%nVn$3p_S%Kte>yD9n(E+W>N?c(r
z7L&r~73`H^oMi3H#Yy5f#n;KNb8^MHa<&s61f6?|z38ahcUW9Rs<fC`bAnYtmso8t
z4=Nb)c_4RukH3=9udigPs=SG2ucD`r;-h9>8;BQ(60^b9tUc+EN2n99Tf_%w$fw2p
z7(9yy$liq<lBpx5$?<|r?K(oKKzyzN7dsya$4o1P?Ch={#kZyo+v~(Vmun%nkJN!j
z8B%~i_JQPMJ53ZRX%t0IZJl^j`ccCAd`53*OJ2oV{Lj^07`Kva0(8N4|8oJ40HfPH
zvNzHTvJgSSsuIcJ8B!Mkf$)K1)jnpv&18I_z!2rdr+t~gfn4UQ>Z1vj238!-bcQVu
zSaG6XmT5A~A|PyPHz>dCz7+MA0pNq8?W~m-D8ERs>odv|$}h>9!aGQ}fHZtBP1J4~
zkP-sH@oWNA@}@IMJRld0;wFI@f^3uzglpu6fIj5kWR&-e0I|<BLd#j010gZjkDc~E
zOHZ=OqCjoYtc+~m&4E4w#B?N??+M7Vt3Y+|BQWpx*X7HE?-Crfa<&a4*>=D^@-Xuq
z2|nZrJNwAsDk$XWZt*{-7Y7mJ(<Oye0S3p&vuZa@)j5c+@s=6~VtwvX7IUDKI6Z(-
zbvK%zV*p0Onc5#FU{jBrN2vfYsVEzrw*UqMN?zHU0gP_G=WlzMpr!=tUSaaRz~ruq
z8(w4tDe0}VmBrfui~^;WfLzoNMFt7=0)Yn5IddrBk?XeK9eqZiEt1V8=>0s8kunqp
z3lVz(EGb{kGc%}z1pe6RRB5R-eDU)M5LwcLn%H&#KtK)fZJ?g9?I>-(GC^fhT_v_O
zJmR39;aT-qI2sgEf`YyFfkFyUu#YPc8G-@=!eqo<pnq{@eiB5~zQb=X6RLC<+O8kl
zL81<<1y5DK1mu#s+m%4y<xEh~I}iMiqQpIsG_Y{-YM=*P3H>G3iUfkneDi$znXh^R
zm66<*vlRd!%5Y#4Kg|OyUcqxfWJ^0C;(!)A4D|0QZcK{d<5x~fAy~`9XPea-NnZkM
zscN}lY6ysjm-El*sTNFtW!=9H5sSWl)LsKn9(Xlyff5E+@|jyw1kbnKaa*NCF$Ab=
z6KhzXDJjN4;N%u#X7M$=f`<TCJjV|4+zwy@=%2)^4#>;+!8x^i>((NDdD}~2GDF&b
zyzUGNe`EB)H#|uIRBbtPsJxkMy7I3@{nw)Y(W3rqA^)|I|3+8DU*7o-<()mZKnnpM
zXx$ihdJ-@<)_`l_OfHzI*l!KWq4z~yTherkJZN}fLx7;M0W40T9!g>tx$sD{4Ac?q
zGtLGD1y4^?G3wsw-qOj{rMbz$2wf(|w?vwa$)(5Zvb}oRmMz?eM#QO5yS>Adj}p5W
zEG5JJJP!hQa;KG<-VAts0cp!}skQelF_uq2(KM;ICiOMB>GXw3>St!E=lV&a=}L3W
zrw6AkMJ}FN4?!p=j&s1sj{)zmM{<SH9JEpJaO5U?KZRYeqd5l(trs4Z(7rxQ%7EA%
zO^4t1+XeQv_u$i<hFFpQ$=qRlht3QjKJ(Go&)JhEu$8EMw}odQ8UHv-x5pzGbV4~5
zp$o5NUjvE9R&Bt4cp|~;8BQruA2|7HbpnYrDt%#4sk$nr#ctD~?aYO%&lt=Qn6?!I
zjR0LUQ$;vz0ORVEas3|3BiN7Q8AaXNg-s!5SuSE&i~;`T1jChLn4TN_<NP+AIku0k
zO=NX+-goYP|Drp~Lap*xLl-pPpfcDxt{4M0aBE<-t3-_VSkMoz+{-{D#tegfqNDG0
za_!2k-oGpd4Cm98!uZ;Z10KWuvub6Sc&u%pR`Z3Aj~Ni^F)ZV?peYKST&~!Wp<8rZ
z=HVz?0(p{29VLya4<uu2+F|KfL6BmB<QpHqByT2v3?lT=?NKCn$uUq-!&Yq;-xT3!
zI?+38(96|GStjdEgE4do6yWU!gXto+pqs#Xs&LT>YB}{WJ7Yz>6ZstWSRK4LKx}Cs
zY*JNPCWOfmj#^5(HkufbM_u3VI0-~E8GaVaQ8olP#2`9kEY1@xw7tX@^|ZNhxWs2$
zt?f#MBqB=^;d2wN>itoC$v`!bBQ-O6zvL#?;HewbVk35l;rq_v@R-55ce(aYPTBT(
ze=KmdkATO@<bWReF}lW1oHt@+#$)&t+E%9s6Rs?VejX0pZ@u}oUa4<x<<b__Z7>GJ
zdr}kqV^a7C{>?o)qk@W~G^W=9&#{Y-)(|w3JOYg*6Cjk_O-j~6(euc`w+=!=B^CgC
z^%;701&;Qs@WM@tTB~|fmz7@Lv9dVj?A&Qv8DOHby)dn{U|4b<2^I6lbB$^U|Lzce
zkMn0uCFd(Kn9|kW(rfWjxB!0wsp#JyIDE@>2~diUs$gsftw%6g`2K(EJg}F)eNIT<
z!#49FuJaB?IGV0tNaBGg3DwFuYjZ8|8mPl_5`fqRvA^lrqoir#5acD#hC8)@vkD*~
z9R>D(Qp(s9Eb)byZ7E<^nqRkVW{H}_s>Eujae2X37+{x*W@w_f&GpSgXBR7D#oXPb
zUsPnnX0r{VJ5on<gL*ik_B3h$hDu@(e?C`o38J_C9O^c0G@X}9Y(%43*3hk@F?Lk>
z-FR51*fVr$q%&hZrOq6)a-65H`ynAg@M5K#d{8pxrtMy;LOyNhY5L&97@=7y4;R^P
z8u>uz+hwU)jfKiSd0t8I9xJ7XN6T74e$^VSU&eVGKktlGe_U75OMTVMhx7O745I14
zOBVe1A3uWMH<GWLvS$Arypll*jKSOJgiKbg9t?q18nX}Uq@5tbKUG5sT`A}{Rh321
zu^yTr6ZpiREBNpishK*e?47krl0Nf5{RMeiZ)HpB-i81+mL`s-v2lKRNpa9<cTkQ>
z-|QZki4S;f!Y~5{j?Vaue=SA8^euAac(QbyI&DUOJlGP+ya;X2_<YM>8tl;r<fCKX
zum$GBTxGdpG@DHDb`N9e2GA5&M~U7$9po3dhuf)f#2>y%Fc9B#n7#UZ#wJn0Wyr7N
zHQ2#pFS^)i-^CAGRdO+w23ugDGMNwC)Q<L9M|}|~^4B75O2sU96m`4XAJXa`M{8A}
z$7Uh~ai6n`9APW(8#~)l)Vctg<q4HwKZ^7|F2{8jy*Mx%D$1RT<llc>Tg+iZ*}0?-
zxw_v9Ir<Vu0rm<R&r%0%L(W+&g>8loe=TfeROxji5}x;EtxA1brBH$;we>9l-0aG=
zAI{r4zffdE*G|qTWZgNUb8SL!n7i?F>Y5Z*G*fsH!#7s^4wl*kBWuEW#~L`jFt$bM
zF4d^z@rH=b%2u``*=pk70rWC+JznI5(ay0HjdduibZs~SOIv1RH>s#$5nrorzApQL
z9n^o@f~y8;ntC2#bERBxBk|fzFz3j&)aj{+e*3LBi6zk9%DGs>nURB?qh7A5cT+;O
z=axPM8*&i6h1ocFoRfU-8q!6Vsrzk)(`0C-I&GxioHvRdyEwy@x_a#zvW~w|^zG?S
z;6-UZE^Fx3NN(g(ZEaApjgG@~kHliFF1BR}Q!3SRdKaz<j<h~8p5r=v){b$>^&kV{
zNYIg)RyKgKRdL4Bg>HsM<l+zb@Fs8ba(cRy+8Mf<@p&S-$(tOVHv_jTjcLQ|mywF5
zo2kBqYrp8igN}ita>ueC71UvavH)9*d^c6p)!#n@PhF#s!n_WLo6pbX+Vo!knCED*
zIMi9>8l0i(pTRQ&e_dLA4`!SNxA1XP<t%FQ^zUE6cl8P_P8G~G%(`Fehs%Kd`nlH*
zUj?{WmycYKcL}{(l?~0nIbFgr<;`TjL44}{cma@yS7vxhu!&d$tM+HGilJIzK>or2
zC7>7sP$VXgHVaS#;O%#3HUTf(>UrV|O*c|(ZZEhb&g><g5+jK#9cg2_GdzQ#F6+Pc
zIvh1+nPXT0HCcUt!ru5)vKNZX;kLj`d$ecA^j*tt$O}n{H)-EAI&`lwbx6|Gw@h&-
zF6}XBkmf?x9<d%Ni?CblxEXVNZt~RrbPWoF;V$RbxS-dVoVyCSnhP=|3Zzn-K{bKw
zro`cT&|ik<2(JT{WJ!M>+QJCkr`yFW+t8d)=hovGnTjl*ACcZG90@@&-U`^XpLxAM
zx7qUo1ubbJ`K!Dm^YQ90G&1$u6FcMJorm|%Zof6X<+L>`#?^QYg?70zaB;FpS=fDf
zK7h}k+iwSTP$2b)kU*dCaCxT2eXiNi0vig)NN%l$iT(R}YXa0cgvFkyQ{ByRZH7^7
z=aBM9vjH!9u(QKuGjb@VEk9}<-#UIy!E-q#oICR)pf)T=&V|1PkMMTZ$cg+Gizjy_
zXal=M;5IIH$!XCfi$7>nOh6h*ufma<4-*p;Cu6W!d2fJ0pa^pdbP(scv7$~sM#9>p
z(^IQl(eHCunz?&1pa7$)jg4XfTZ2bn2jSiK=sdcnizOR<I603NL_RlkB27bynQVRI
zO(P4Yv9pJFHz^KuI$WUqQNQn5N$~@CYX<##IIT^{lm~5b>bxoHv~jew>0;B+d1_Z<
z>4IR;_lxoD)II(D13xQhZ3c3sZNC|x(Yvh~x<|+?m{Eie6GbNyLpQ_ExyltGT8qcQ
z`iGbk%9-y#C%bzs^?qu#Ja3ag7poQU4wg#Lh2L>{t`z6Z$+-+%kg)Zp#7U#tbCO`*
zF|__?V!*VcLvJ$sfLNtuGplGA=<JYt-*$-5SJ&QsaEn(t1<<ee#}n>gSFtlTT(<YM
zRIih`1@I9??ob9MwG5pJYl?*w-L;y+*&5Dt-0BUn%Q(G)qUd5A<4K2Pi*QW5deM|F
z1@Dy8<uy*K<+<|3f(i8bY8d2{sLMxm@R2fsgK=#~jYq5=EN5RGv*?AgGNDVxS`roR
z>okhaom*_OLAOpX`TYt`VxE3^3k`NQqCrTrM5@Jo2Q~q%6Q*9dkRh&K#-6rpaGOy?
z^*C^c=_k&#?*Q&FSoO?Nz?9!fp}PH^-III5JcHMMz4Ilg;SdM;Ezq>Zvy-v(98EFw
zkRg4{!37Rg22u-u(1#*>Op*??vEIDrTf7}`oxbI2ktf&tP$Uh)c9K<qo|!9h={TNY
zOvX$bm4T}QgV4BF2Mdak`bqfR@po6IE3eqys+9n|t;B7SR3K^m76^O53yK`(+X{;J
z#Sx(INmH9(ua2jy#%O5p^yytjGPYZwP;|)ug-tTd;Ck5PK|r4#yb{&A7x04TY+9^9
zbBm?qq3ev`t&m^3*B_`0ZzrV(gxD43D8@?AP-RffdweUPPq#`BJqI-i^$f^tBcS94
zA5<~YR4IU(%wV;pBe58?z?>o_z8g?tAn?D%16a&R=8BR8>@AA(d0}9-VONbV8URX;
z_l;aO=<a?=5k+ptOkgp+jC*;=ui#ls2_rj31;ApmSLQGR7L##zR4M46GAtymf^7u^
z;tf`Nab|8nAVzRxwh;-$jvJ{vNG<>Z@l3S@PYECp^{(&T=C{m$NO<(TBp?v4-;)ah
z1Y!jlhqf)TcdE;mYJa#vX+)nP>jN@^=qR@6A0~SRXt}1O!%G7PJz;h&hUuX19r>lD
zp-#9tfAkQjcsMqJhBXR6xqn%(`^bsa7<;AD3zrt-;Tk=)+pk7RZvXOZ+~)e9WSMD_
zl{^&_P+QJ0M*u!MCCH~L8Mf_cSbr-}NUL`g8qmpx;K}cv``X7WIj<PV5szqD>)8r>
zu#a0^Kws0JP&wMB?t6pfK@1>0t=+4S2SKp1{gopEfNN%eos}vE_R&i6HB|PxM4FBE
z$X~&~?aplV9(~bD*HmYA(b~iyC)dSc6Hzkromb-%)ZfH>j^1HtMNZBJ_<qo0M+^2@
z_}?kj;%SW+sg`pg1yu^t<a1`h;-4N(xldi2TtVYdB3lk_C!rv-MlB727r{;2*K%d&
z_%XRv;aBm_61FYmw+<DrfZ$Vr^Xx}IFPbJ9V3P4khIhe+imJ*xQPu~iLvWao$qejR
zMrTFPev`fgY%;?ySr5ja!BgCwR7?GW?k3jAV8XM%T?&k1X<`H&SVITddajdA%SgQ2
z60zL3r)UJbh{R>*PfdfanocOT7n=S+d~M$`%8L!aaE)YYyte>W_Qu1omxoDvqv${m
zHWjDxhM)6HwG_|3|6}jH<Ej4p|8Y*II<$^0DP)I4ga{c~*&!M#WoBm;j=jnVDI+o?
zLP;`mBqJe|A|n}*y|;7D@9{!i@9X+p@89?Oe1CuZKHu-H{^}2$=XuV@xDU)mbL#FJ
z<<sQk0<e)@@TeSs$~y~G-ap8Ge|MLCBGxQ%nCJ$L97LWf*TNoPEl&7UVkX_cjQ9eI
zxR;LjIt7=s)T*mlyldaFDd}gq965=x>)+sFt8jeCFl)0gIi7dvR#U*98o9&7MR^kL
zuF25Tx6DbnBNEZY3SpxCNtWX>s|7NSplm}be{xv&>4~bSoD<)~OumNhXBgevG_8c2
zQ(A9wSzhlhaq15K*+b~=apF!Xx9G*6s6}w<iDcaP{;xvRsOeRm1@;kg)I5e?K%n^b
ztwm>bN_Rue?fQvfWRq<+S8siCGLaNiJo50(gT1JyR8x7|dk7OQrTP8$E1!{MoX?j@
zJGx&~^xh(+Kf_a3BX+19WK430cZsB!zO^D56*iMfamp#U{b4LIOWSc%+w1qJi7e0;
z779eW?qjWR)7)~9D#aBdmof#kc?4Ox2v130bQVAz&l@KH8|Ytdlojc6aIbU~th~}5
z{m)8XZT22<k=oEk$dq!__p2~MPyI0RTe=0PfOWj2kpurTxl31|gh8{#bR`42O&LFE
zSk}UEYbJ~1wz$$#hg#B*Eop$X<NlH^z+X9j!C(Iy2*~=O5tf*r@wCK4l%yVjPZ^+3
z67IG6(apoPvLeEnIs*Zk+h7jHyAT=_g_!BZn02JSx&DiRvse5ps$ffTZEKiQhmMqb
zJ-77IP!jGNVcwWjxC%R0{HXqjW|<$loeZ8CFJ(U-=oe7~;+F~f_`5=K#jkBVGu7L;
zMKS!)-My@Rh1oWkjF_MHvg~}8j9VO5`xboutvIS@QZUVlTncD%ca>e{>oD0zhRJm;
z11N6=n4e&>y}8hw(Gtj88pxEHrlz{I1%B`EmPdq-c3(m(Yd#MgHpO83GRVc>Mt00N
zq!R}$<P^r?n~z(Zs+xh85R8BdJ;f>dD0rj4;m@TMwF6BJh)xdF)mN7A5)_v8MWqs}
z)D*mS!Ar0!NFk^XP9u!q(MiD5Kl&M>o3W0k*Sc<}<6Dse(?!o&GaUn0xte8t{k@f_
z#}rhB5E&Id-b+;vEg574(2;5N`fmWIL!j}9i~#NdHQy9Ijo9@!Pwv?pm0hUY$QvBZ
zSbGjQfc#kkf(9d+FpaH%0c}k*Rp18{Y9x%{B=8EiAiTog#0S>9P^dU48;}hhzcclG
z(h{(c3jg;m<kQvuzmypDpGJKdFv^p8S`uM!4mQ%cn^aFv!v+Kj!?k#_@)u9>FUOE`
zF2eVsIL@6l0xE=T<Ok$G)0lU&i12kBZuv5rXT743x5>n5<?sr({Agy4X@I_L*3Q2{
z`2vJWiN&LJzoc_c|Bau`Y|vLHU;GP%5(HdtGKkSh6XtY_JXW1u5DC);DEmzuaG!cJ
zLFz$(aEKHraMFrEBf)0vob78-$J{^`&-QTu{Ov0O9LK~6CEjM~0^?-ckP??S08x(~
zP4NMV%%x0bEB%iU$_;;xX@F!{uoIGDGxsC7PwEqJDLe|sblvD?q`KIeiNnaUV!zLO
z8F^K>qq2xo>OqiJIjQ>tB=1IO0KyDx+)gTLR(2h@tJKApSJsD!zq&g@oIO|x=#Q@0
zqh?)*9x0S=$zA4tYP$f?>P9V6sOZMcGO^gxREZt`C#_Ni&?-G_L&e!nmNm~UE-L3M
zD+I%3w4~PoZYVGP{nj`bZv4Hl3Nru&nTgn$>wl-i$W|PJXbm`ji&zvd5o4gdw9OYE
zS4r~Q=1VFft*(o2A~e2<Y6jymCPstY^Y)+$VlP-WCAT<vq?SlnEuFU4Jy?bB&||WP
zQdz=MHt$M*z|{8#&(S&~dDqi&wviV@#CP60C}%$mXaCcnRtTjnl&p5d>L5g>UC~<~
zN3o-~!RcefguFdXtvszna@HWf^okQ`g!s$YI6BayHG0$8BmJJ_mo3tFPE6oqjw_UZ
z4H|Ai>9M51tjXEn#uR(FEFjeD1A<t!fUfuC?L$2$xSmSpIQH#_gk<;rx<1GC5HG~b
zU<*d}QY=|Ks+!Du8LhKMWlTqvC_$Asu#bkgpoyE|#`Tr2{Sb69Fkb4Z2JlCCk_)E-
zX>r;*ZN)%8K?axDDJ^<tig&(EE6$J7TLlV|D$~Nn0Kj?|)SUK}7El4v=h3CxHY?*7
zxd7q<xjGqo8&=ul6K&7UVSscF+f2Uz&8l3X-grtPTRW)q;9Mj#&5}Hvmknv9ML;}s
zO4gc`umkx|Loh<mN=Rb&%=I_!FJGM)t!cVts>q0&?yLS0=)R}o4Vynj+85(qJHy?m
zgK($beU3c?QMR^;4^=Ki*&qEHOe53Q@75zGF4X=N9dNgPF|DF<rWlwCv{hw>bL7it
zLry0~wKnOYd!;Fn{O$<rFD$@`ZtKKj*V~&<tidt*)Xj+7kvY|{14ma4k|QNOwos!l
zZoz(;Dsq~^kq`~OAKP!N;sTxer@K(9o)?BPWtI)8+0YqKHp=)>KXweBihakUuEAY#
z4epBZk<AC(_1-@S4-bGtrL|uaVs6plf|vAgn*cgW8~9#NRFVqWj=;5&Cj1AD|A$ub
ze>|<COr{)Cv64v~Y1MKT!~)`x_SWaYHis)^(nUE3o~c3eEsf_SvjF6C0@+GqMi8|;
zec#b=dxN@}u~^51I*O2l7_kpDD|}@52ih$|Q`NKIQx$Q*sflE&`gjPUmnRNYPXYAP
znv?swYa?79TTZ;gb_7V*sA_V!n;;Q-yc3NOEFbaswKBu6BwR)FM?eJ1L&+A)?IqZF
z-|G<B28rbfzq&A18B)ZEn(&qqinCLJ{><l|>b$Vfljw_4AY)O{@jYt<huugo?3E}~
zI^sST-ru)T={V67C4?S?d;XC)>yad{t+=!Ao_%Igir2r#ZleNE1czu)x*j|cdOw2B
z0X`_p@WQQP?e#dTefGp&c`wtgqGaAwX#O&b=MnvwVa1&%_fZLB75d?(>qk+S17}9r
zZzq}@0C`iKTa*7L4y9ka%vP&^o7Nf`ASb*K(DRJZhdUe@MI*cvrcUEOPOX!YE;lV+
z-RWHnmnF|`Oau3&H!SoH*9&V}GLQlO?nyv#2fq3jfOA>uw_UW^n56}G%^K_@!;`yY
zFQLhI*v9b>h|Aril5ai*18fn834Z0}CkXH&YPKyWWiNrugv!ak3Dq~J>7e3&I!%`j
z!+RdG1vUF?ZS4Q!wb{TLo~)>h=h`6=7ICo(`+^DvC<4i|=wa60+fe9Jcqfa+o<)LS
z?B4{zo71HHA5YT*H7|AVJ|sxmSQ{(m|8#9Op4C&>{HcsOxiI!L1|hUHGQdzcFQGe>
zmw=qc4m$*m)`vWS*6(lfgpDmM@MjDE*}|K7+@CG{=NA6wf=PuDaS34aU7DUVG)VE!
zR3hh|NkK3#hS{1nNSX38ydNXfSTCrNDtiZ|JqjZ$Kf|3h?6>jSp2njiq|o}v!*>uK
zz6vSa5?A#e+>*S@($wWee?j**P-(+k(X;1~JEY6+L*Vz4@TN%`QDuRMgfcWAOz%S~
zo&CC|VI!3mIUb+DdL$Bvq{?<XkDh!q8Qz?>)DrI5I-X9%<CX$(cDU6dTqpmYi(3X%
z1CKcrvORZ(uAK9WgF2h3Si@mR!3=JN#%>UP&2Jo&IC+T!iad9}Gn)FyPATD4sB+U@
z5f(Z@mZJ?P+UV0pRy>m&`j;&34EzZWgM9}JpaszJ`J&0-#>>a_P+bGdr~(x#4)K6k
zR_xmJJNEEb$aow{vofTDgvCa&o-qWNGbnMr^JU{}_>9J(WFhj4Nup0wHNaIP^<$Nx
zCOdFXwDlY;A3}HH!pXky&Hlnv9MA>$X<#N9k(o3y&|kxo7D-)@x?|)pr{%obhJe4F
z1$png2j9~qDS-Dyq0i-yAP8dp!rxSG)@?9HIeTRval!XRw4;uDLl><#FK0^TsZ4=f
z$+npO{`s%ZR|XPq17un;(v2UUlbFxkE?E#AoVgZcwNcb>3=#Tpc_%s=mR0Kzzr{7S
zBTX#5d+BA?diQiQluvDi>cVIKQ6UQS6;zqD?jEc%l%78B6^3dXl_(iG@O;yO=W8yt
z+5DI$UgkizLfb)$o0sAmM}CZq`=>r`ndRV4JPuc*7fXpsqB)yQ{EjBa<fxOeJZ%hO
zXUzvGj2HB5#NFOddb|duNAdmZe~lae?<(Z{PJn?APx(znhsQjV9P^IdOYjF2(*A`!
z1$~9%Dk?ne<ZE}SxO4?hd##*f+`ENU_ER`84bTYF!0UZ9h!l7U(txl4?PjX09mBzh
zX$4BP)_s}mdMJlo9ZfxPd_=Rfa=-wBokJ&MMPI;NcF=L*>49lLug5;<_ACGM_>=$r
zq1FHYPOI0h6WHjElt9ylzgCeD92s<p3DOxRy0Cmj$QDutSQ#-lAi?n8EOax7{u|K)
zMb09d?&B`dDO!XEkP~S+W9vM(>OmiiXvh}Mh*#1Br!6?r_Y$jYfe(|Gl9xw-=~iz1
z$aQr&EF&}tFH1?D8sYYmnX}^Oe2cUR_Di|u??6C6j+)ZTX{&Gccz(|X{2-@7pO<VD
z+I7FJ&M_Z)Ae&Lp_}Q^m+yh{U@FstY=cwqgEUQ0Ms3}j>Si;|Y!N<>s|1EB$g@_wL
z4(d5nP8hcpG`3*lGfMH6-G}^5dG3^GxN7RY1pd4Z{pDj$ZE>O-iJZPm6a)GcfZZ6$
zL)lC*Rm7!li{(S*B*J8T-9v>@?0=CtLcl<+6hV4y%|PB768VpFiS>f|;o{$1uD-ta
zl=d@NtyE-uf1Sr>P*9=u*$D72w*EU&h<oQ<K`8B%KPlWyKPWQr5))U&sO#H4suD(c
zV(-wRQQp@;bK%PWo92Rc-7+69!pqyuES|r1hjK(SS^@ou2eP?LJ3oOC$mTe=zma_e
zH!3fBqjFuAX@N*1{Y!`7Q1K>-s|XN~KVD_ZXj4=D1thzq3{CqDc+c_8Rm?091tldZ
zc(10%7_*Ydh|PJ=26kr2)Qw=z0gFtVPnGKNRrnsyk5`%AgHYi~*@v=?P~pbS_#D<F
zArLC?T;C}yM}}jhGBS^AP13rI$>xP9kGB}358r^}3}dA*=$XXD7+;v#c*y_VZj_K8
z(S*<VLJ8kFM5l^37J4E%yPp|CUHR#uyrZ@oO{$0AxcD%4fHii6a-Z)V=%AkRqmSd7
z=Z4R)gjupwJ?ujV!g3UJ0r{t)LXh#p;J(zx#yWm33X86R=bf=B?CuIk-w>G8K18fU
z!Dkdg6Tc8t1y#Ac!a1_#uS3eNmi>OTA%3HS^SG#v5|s+5g*%lstn2_`rb_nDP$3|n
z5eEWTagnz#`2)H~&Yz9{6Fj{Z%bz(lH<U*{eBnTQPeYPlQ(%(j34JPjP2|xuBJvqe
zp-+WiawDOp3R4{q#fgtkW{%Hp^r@PMt)Kf;@IX&3HDBl*2IM>x%#$s2aPS#9Ao`Y?
zF>vr~GL$u7s_Q}j$->Cfscs|O`X8{Im+Dvo_pmq*H6^(S;@6&=UzXWymOym7E=U;?
zCMqhfHh=$p$Tao=f=Al-j|j#ARt?~!#vt3gE@daW|6K<bdkT8{4_N)!L%cX~%{f@T
zn-`A6jA$P4IQS8k&O$p<$`Td;D!Rwertte`0ya*ohNtL1OSm-u3<nHSn{{^y=t$rE
z4AAd&Ezk?)?q8AS%qNG%iSF*tbRe=>GcyU0%0Z1pso^is%0J*SrwtZFlK_SMP%Iy~
z8_^-Vfd@s=vtrU~Hu{&B0^Wgu#OuCScIj2%MOE5UYqgB4b;J`_MkhcrVlp>psiUoY
z&~vSy#l@}4>cj2QYPrv6aRMW<4b~8~SdS{r2}40)?{Vx_i0PIhZ~om~VNLwmBUgvZ
zCyiw1IX4C`y$@+_7WZ6Ra&Y{fTRJfkHrwb6h^xb5f@`mkju5Hbu2-%NGu^*ZWIkgB
z?~hZh2dFSjcyB*ohXA(0dS%%1U6aRO6hUtEuL_NWrP1xhXSD}LYnF<?-5eDt0`0Zj
z;Xd3y^@K#_x&-K-yj-!;-g3nz2@apJyl^IvAV0TxVOX1?w3kKkH%+$Y!SK(Ci&(L3
zeKkHvLuhrAcyOUyxKfOv(!G58dtUyOOnI#RVz-MRNs{(mSx@a&+FFL(M?YoaQ}7wK
zc78Rr2%fS_oWeeETQJGRN~U8ZPn1}d?F($<WOl<=cvwef%$zU{Ai$Tk<L?IYGu&>z
z5=1%IG5Mmb&?bA)cPL=Vl7hsB$A7Fe{`@`f(NvK=Wn&OgAVE&Z@0^N1uF2BU4_{rB
zPKlo_x>W+(!r=V1mLxtAAwaO%#b?>MCzx1OKY2zp`sC%>36Xh6Tg1*0Smk+9RupCq
z?iNeAzY#ThvC3ZV(+AzK8*q4xJufP{E6RZsyk|iQZvJgf$^-C|!UsPC_oUf4I=1b*
z{IgyYMa&g;&%hnB%tV#!4%c+~DFyRzxTYT$58m0#=p+-mSo2xog5T<G|B4sY0Zl1?
zJEY-P<ia%D03LCg(|U|VLt0`i4R}(Pf*?mh*eaxa1MX2AU8fF7F?Sjp_9lT<1~aj?
z#{m(ZNK%^4Bdz33d^JmQDu|;awnGys$(Xdv^pq|S_Cu)5^a!K?H-0M9J3-D>vSzp+
zRRCg6BY*e3MON5F&}DYh0+E%IZv_(i`r+)oT$3F)gqC3s(u&RYCxYeyDmYvcz|3vU
zL2c6}gr>62)5~0^NQU$UOh@1-{v5Pe1{WdE(D}zJTYU!<;6^xjjV-eVu1gTBJx>Ey
zGevA8hYDQH-v`?6bgR&U_7=3|<EfO|f!RG~DahtHqUl3f)eL~J))Jp8L7=rpK0*n}
zUgCrzs^Z@iQU8y`JDfWmg?N_E4mFkDH}-UU=ItL&ocpBN4Zfh=(01(x^2J$Kr(5;C
z?6=~g?BV6&k<m5vlZA?ZtZKw`<Yua??7;C1AkeV0-lOu%fTSw_LTbb}l}I1;z_j{G
zSq^h(cn*(xqAsk2?#F93m^%=@)Y_XwpWeLNg<q?j!DfO)K{BN?y|o|6Xe#ieU)I4D
z_(LPwr5iXr-3YcFECSaX)*w{ejWh<y!9R2&H`ld4R4fJuP4;7(#;P|L5fmDn$0krA
z{;>b}jd%OS?H;Xm1AV7ty4R&Ze{t7c#HF>`zE?FE6o6dt;cYXdupv*vd|NkR5wwB~
zrwj8u8VO6aG7~dFZ3zrTABB^o1l&a=uFxL=a`j#yeaFLhh>yDCWw5D0{6-CpX3akh
zW#%hLnR&@~BvZv}rSz^RiC&fHOE56@D74b30{MY}n(6-9`|(>`x}6MM5^N8gFLSjo
zcI&Nuc--m9>LPUROHKu`wBZ$_jIAszvLq*<k!$};w@A`qK$#&kY4!a*KAZX&feC+x
zi$7}?O*#t9G#MsM!cTk&opyW;B0@GGFLdEkHEHZ0Hg3gMmVU3SzFeud>Q9aN%<jw!
zQ3EY!&=wRPxuCcG&As?b>#WEbOlJ<-?5qmiiWBuGEz)R8^@5jdsrxlQ+rxf?fwodh
zeEe(Swx(UMV)dlmRt>8j%<^5QDGapclGIy_KZ%LU_4h+n=DbaU-z$0FDpGt>HCzeR
zu|g=62Z)ozd3gb*NC&_$BLAXElh2zO740VsAW_g|{aguH&9Cn&Kkq>NV-YE(Hm~*<
z7N0`08T+z1*8<l-`~;`xi}$JQso@o2Un#Pq<O}%E?&|(Z#VRjS&$ng&4yW^rxUm<!
z^g0-sPd=yfS+)k~WUf65JoDuADtOhOVLrEw{c*b=Ypun}upiX4VszH&2k(9<+^K@C
zk*g6Fr7PUJyHznp)fZ!L-*s?GH^Qnu`j|CS)*-^ss)@6(nB!vi(6_I*Oq+6I=Owh5
zjK^aQM`the6f8=Nj(v5XNZ!U8;YBu-ibli|f}w;_1!4&sEPRG>#ZAqEsJ}=DSc7!H
zDBncSN&CJk3P&Jm{TR|)a^aYp1pOku6&IPEPo-{{!FwSz_#s5Gk@EiAm9LHp7;<-7
zxnL94{9~Y>;V&x-2qa!mp^MYlMCg{_7%995F?KrU8amXf%49eWzq&K2&@RuuyX?XS
zNWj9*Zx-(X+ijh=R(fQtfM@I|H^^+^E%#+6_ru{dy&hF%&Hm#+nDt~%ep62VuHCE8
z&uM&>JTf-RbJ2ZT(GeguM_Y69YfH@Z+t=b&P5gdg0alvY7%wR7{O-61I&o;UI148t
zWuOd=11^v<*ieUlWiGg>D3I_MGQT;H`S<B}iK55wE9W?h@udO@YyBYh{tRA_WJ!*(
z9*u{`KMS<?px%d9%1i**@`C(Z<Jz#oJjKq_U)LWH`CSjXOI=)M^S7QU8=cmc0zws;
zbjmhXR(MIH0hp!Ey(#$JEpx|D))6hvD*~l7PC)QdS6+S60(-ON9V3~y9@O7JSR1g2
zJc%Hz%_<7lWgO4!J&ujv*8b?7vy1#P{5A%1X$8;&NEy&#*g5}L!+|;x-kLb_L%L4@
zeAcR>QAr0~B|3nyz1gf``HWY3W6hJuxcwJIx!wZntM-QTojV}&Q~g`EWg3z-WaP2{
zh!Ymo9^_NmSksiWEr$D0m9VB*E=+F_AkY-*k`FVEXg(a^kOI*Jku7I3&Oj8N6_wz}
z2LgzEprq)#SrbKf`fp)tmL}Jr9Je|h@CmSw!()tlHN94Do4wl!84Ms#0BD!$3Zyx2
zz#3n(OldHP+!P^D+5Y?(+K=jc+CKol@)rQ`dmI42AemskE%S6%7@4#Vw*-X&2&?OZ
z_UN`v)+pxXj_q=fJWvU=9c>SGJ_c0dr>{c7a6vFMMeN-uE>=N6HI1+rv*4(-D#Ye-
zY*srXH*v-)8wms8(>Vi6E@jF%MMh15U_#4Itymq<>`H@4&-EfJ&jA(3om?9WM0K5E
zx1a1PEYOQQp}iVV(a0z;xe8@eL1a1Cb<%?%p6f#@tvZlrWI>*yviX*AZssXbK1WVs
zlxRWRLv^>)8!g-j2X`-`fwK3JaQbnG&tTHegPxh8x3VAO>5T<C*nXH9<GnxuhtAkU
zI6;F9ciOD>ohtyYVL8o{DhjRI8Zy-5>A6C}JMzed6Cl)%OA_Lfy~I!ME)m06tF}3O
zwy()m+dvCKocHRs4-R^;zx3)ppU-bKc8rYFx`INSxV{37(hUr(8{l=3Xn#?m6r6nY
zA!x)Xr;l+6B#@QU9>(^DZsIzH-U~DD^nQs9>zwiP+hB>%w<L5NG`1OP!&{DHkQ;x{
zmb747+9YPY^6|dDsKC_Su;Z-tZm=QTmW3tJ8L)?SGlfoVD!x!=O>i8>(6UyjB$M5U
z$q67MW}bS&wI!Vx7kw{{nr7*POZlhn3-<jry9zG9-8Kv4<5=!Q*DJ*q-r>|+%#PoK
zhfDRViV<|UdC#*}?o-^nv7)buGoq|%zNa<6EWgSCI^k8*CO4SL&*3y>2sgSo?gT*R
zq)CQU=0+kcmY(wW=ys?V=q3@z%w(*}iSv2!P%qg^t4xKOrTTu;T>53hPH(8i|2X4t
zCu)<mAeVA9m;&Vw=Z6QKcr6>WtDi(<ePy-Ke|P^S>44Az{)ZVOOYhCe)KQ@w!Ct0{
z7|t;7iW{iWW!II4JAP#73@C8v)(L3<_i<gwH24Dt7l!sAOas<6=BW=%gItEGZyGV~
zUQ87=^;D7fbC)yir9AE14zXRz@bMCI$H~&k%CeH@(rgWpQ;u3cnXlR(TxZ!P_vi$2
zL_S5|`3Q?Wd{+1qY?>Zd(>u*d71DWqojt^t#h~qHAi~Q`;hvVq^-lZ*xqEaX?@>9{
z7_#y^obOy!Hm?^BiO938S`XlQsr((uHEvfThzbf(oT3K)@}34@?^q+0-XGg77avzC
z-Hq70n|uPqvsqaq$%e!L7S^h;c@$_G-yXrdQ1*(FyZt0m_Yi7{ola#iRu1@3a-l*U
znDZdYe!b&`#pRAA<#UP=lgw}^na{-1pzPrSVU{^nzq$X|>Z264c&EU2rmb%3tAvV8
zFG}>lf%&#q6>0YY)A`;fR*?ygBNIrHJ%MgPHb{~&{E{RaUza4SP(h+HNT_{Bcpxg{
z1B}->z`Ynj!9W#)Qck2`5C93;p;XSzu?rvt1FQ;+okKQ24CHP^{sCs*3K#6we_+is
z0c(DS=jPi@VOx=PXz^KCkQxxEREIJV*Kc9l5xCVy{zcgK(Vvg}g%bZiY+{?AhfA+b
z$<M;6h`WFBX5DolU(yWq2C^J`tnqM!xCqRjhU(i4jgY^z(M|kpNgbT|Q9lSV`w`pM
z^D$t*sDuE9%cUkuXk53qPeZNj*kjG4V;~K9UbHp5h0s4<)MIn_LP_h>#SW{yScpsn
z!*7A}dn33fT3s&(ROC@0;(rT~SRC(ctA04@1eBoytG2_yrCWRew6hP-ujg#b^0oY`
zlw~Nyf_8xVb+K}R#%@&WtmS(#C;|!m@DjYXD?~Pgx{4h7d#*A(dE`{@AO{|>Ol1=u
z(e!;kATH(|<8c)~ho3B8EfJjQX84KF-e(vV7j{g7A!0n}pWdj=nV*TL;}v-}`?an4
z{_-)K)tP-eZ3w`H&M~iOuc?MkrGM_-%f>Gar@=GfFlZJ?gEDoAM8>=N4<`!_!leMl
z1y?XH+&ypiR<<99i!IwJ)ll0^fJPLJ#KPSE5DTY(T3V{1MYi&tm29Ar(P})>W0{}4
zm~TA7BIDVWAn9UL-My381Gww%iLhYf<$K1%<x?&$7tg=G>9nk|?biKD&|$2mbJ1UN
zk!v^gv6fwGq;la7#09=>zQB@uCIIwg`&?Xf+g&G1MsxKVDJ362octg;dHyrwbpL{h
zqj~}?%LC&6{eippk5sNfFQRDV1Fcw(AmO8+Q*C>xQ9zu~%jp@U6H`0qcHxy>^6Dyt
z!7+t1lZ^J$XVn8<IJnd;xg;$)HeRdM_Yh$a9Q2pn4FTHrYhT{2KVff<X%%<X9LHuN
zUzid^)2{&ONNA4#`p!11GvsJ$togi08E&XDMR07KVHTW#gb<ll^A1UYv2MnN+-;J9
z-6M6!#5EGcg#hntt+384f4FO5#|@XqH6I>ImOhObs}GaG5zD?p-W+26cui8qoi`8|
z^|%6)wI$oq@t5$m@v*%<C;G%>#-#R~n2UH88boAv?grl={-H}nNzXeqir2ax9*WUR
zdTUTVa}RzV*9{dxr*n#kdWh6)!_oby`tI<rPx~i!+Pgex54d}6{L57T3w7?t!{B;z
zeE*uHC3U;$XWFML=DYP9D7??ZRe$(nPL%I@thfg+kx;{g&GdsAQ1v_50P=TARAc-r
zG@uKdP6qMx)0NB~%vneqjPH~RHVCLMauyN%%SpCKq4rWi<u|tPJ%!)nC|?%$$`rjx
zswb@ATJ*K#n{pUSBp>0sKc<-Jzba)|vosvlpecG9?I9gNx*jy?xma2csR?ejsAgpL
z!l+GHa;el>``Xj&>$6vXF0*<@)y&MzJ{!9bRVPhzRXcZjVtIJy(-j_0_CX(68(2Xx
z`!DfP8?kP6!fq2A%$Za0Y+Uo9veAbpkI#mF6xho=6qqU+^A;ufCJT(U{*v*XytW+I
zANLFzQp2T7`c8hF*x}xmW9NdtW37MoTH8&Yh32E;^xcZjGF1a!nvBSlb%xCsy`3rg
zI5IQ>da*%^MorJBiV_{BJ0!)&>TMHW;YMXHfql4L=jme53eD-eaCFMQPF-y8weaPH
zE$ohRti0azO|~lJLWX*qPyLhU{BPtgU4(aP5HQnD5L-Kq8r+&|H6Ev=#-ov`#+fPp
zgbYuTZ_Rj8^L4?MFw^Q3K|<{@zVn3T#{H{B$!53O@r!#iN(xevG=Dy%^EAoo$$16R
z%5jZ}t>3IZD`iO_*A9d|5*7ttx;8&|(0T8y{G)^LxreB4YZbufe!W}pNXcs@m6;W*
ziJa=9vrHv4ZwPUuhS;Mu(oJs&MYnd#g_!AsA}<&phj^O2!QXyE=zL)6-(#MCo&H2Y
zC63;|dz<CY50tmI2U*j<l4R{FkPHC4#nHm1oOZyxN<e{r@ig{+RB7qkZ-y;6^H=+D
zfQy+0RRfpK6JG_gR`#ea#%mB~`Nv*rIhGmCw=m~Cpg|P_$?ANXAvZ8nk%%pXS;J%(
z=8PPyE~gxoDS+`)G0yY^3V=N5c*#n6>w8??w`XC;IFyw3k#<;;+^{yc*cW$F6csiD
z%0k7lw{mO0?f!vs*`6ZXq-T3v7I2>@n}!qjwDg2L!S9MDOo9e?bJ^TSweI`lM5~s!
zFUE!BJ2}7N_jo+R>pQ(#x}Lc3L#D0L_^sKCFAwRQch|mgDA?0SY<(<UI6~e@v?rDj
z7j$Euc@&$STbdSEzb=2Z<ssdK1l_T1t8uq>@RXj)mJY!MUfu>)q+Wvc&&+<zfoAmQ
z)3!!BFUi>zBfgz&z<3)`OnGW$J5)Ucucmi^rJ#qso4E_wyI+-VPn<ui@RY>t=UQ^x
z?ChM~xJ294iDk@-vDD>Ep`++Q=+F(pR&ra9OqZ@HTx@#AgjRrvoE2<I_)e4IXz68_
zXIhhHP^<(Fw9!I~k&EEYH}#)$&faKKqCOd$hJm-{44UV*94ll-v1A8zgEot6Y&Buf
zJe`3MFdBLa15gWcC~U#*oqr5m)`WOSgW`|OT0uT2l6g9;5T3b0-cw~(zZ{%Spb%Bs
zKOx{h*(v<bi#o3pirb)fX6-q-=$W^wxk^Gz?43!HgOkp?#mwGG-40`sY)V-gN|d21
zIy2ptIN2qo+lYUsWU}1k;r_%umV12lYN(WT!@`LZKbEgd%xZ@w$bX0*0H^xQD9}Cc
zSzAsbxeZN2nm656fW~-ZQSK868U0`tFY^|1PS{&KRB<BQkU&M{3-M4vvQMR)p$*`K
zteB($8h~X4%L?y8Q^RdWaamZ;elt&~wpJ#?M#y_b`7jFvDI9=wUz0|iN*fo~%GCzf
zM{4mq;XE$LtD`ywjKDw8@U~9X-c1j;KOg*Os{d@RKga3M1@b@Z%KZ7*62H)4H3;h9
zgI&drreNH0@cnn--I_vIZLq?7%OC(i=%{E;HfWL=e`tC@H?tXOyc-hJ_wjOt$QGf0
zue)qc8ODu@f|NQ12xuolK$8h|s;l?Gk?!kC1Ks}egxmbHG3z2l-{0C&3_asQ`%y!<
z1Ry5rlOT){anc&wnq)MrBE<&vIxLrN7N=HxI2dbQo?Ym)jfeJEEwh9}6|<CUb2}dC
zAAV{kG*XO^I<xc2JGvi!XCh-beE#QdN1Tg`J~KGnN)ea(2j|<2#p1<mk0CXPuLWk|
z61Ns|zCvp?ZgkoI22g-!A%}e$l#O42^i{vBt|c5X>gaw*mqeU<+}KvWAnFJcLMPGj
zz-97V_tTanHEV6L2v_U!>tqtV4Zj3lPWcLnqAl5>wt1{NNQ@gGzEQ`lK+PZ5ivCBV
zpu_ztz5(y><NXZ7+Do=e@s!S^83-)rdQW+G0+@+fskY<5spYv_uRlXcz+3iksgL_d
znJ^2J3-v@0mx#N~AQ%VUwa%Tgh;8p6U|G(7yII$BU<6!6cC^iA*RePPI&!@l62+|<
zXO`%eA=!{ifC5b%zzSj!BJAa|yt0`PH}GIA6*^W6ZE(R_E7D*b573W?<Cvh-p(G}j
zS3=P`SYKj6L-@~97&4aiUQFvCduNWF@j_`S?REBwZ<j9{FZ6&=m&R<nN%$`5(c~W1
zsUpMY{oP0T#$1aua37NAyH;{jx*iaF2qCj=&MxbX)25c1NhTH~y>;lXk~Wd=J1S<^
zE`lmtb})*$^Kmnfkh|SkM}s1V2nH?Nhb@GPqtUP;hXx@y!khIFY`8-V5mSoT%tj?o
znn(Eb$Soy63bx7SAmwgdw9Pe~hTZ)1yKQ)p`tG)ze3v8bBtoOD=O_2Uqe;UPA$Bf;
zuf|i?=GRL12E_49oV^to_<HrN&CtL_=Y3DW*4OIDH!!SNX{2<y9~3_dyHX4qvm-C_
z`t$_7JKPNgEe<xF-0W@yemc7abr1VJO)FT-&k(x&JU$N<aZnCUrG>=r_pGHRgNKI=
zI(sB#yY8y-Lg$d?QeN`YcxlpdQ@pLm=($0JA)M@-ot`|ua!=$}XOptX6mQu3vN$EO
z^PpC|U}uWvv8?qx#9TkknQr#vqbo?lNgv*92HhM}kg&G`@k^dPkl1Xtj|!JFd(cx!
zhL@9eU7pNn2hZdg-=e3L6R~s?%e#q=>|GCcFGw&f{Fune?>tl-cwu$V_(iJ|c<`tN
z$jO6eO=WhS%Ef^urQ6+C&z&z0yoq1xyFJ*PEMLEi8gF>HZB%Bd6PLLC^M(KYX_2Hq
zulweSMUj`oIpO)DU<Y+?V$X%6DWrz&q~1>A1;*Q7Mh&8H3HTbs@K)YBXW<%DY?@v&
zh7^(bZxbJ~<@R14y1XOPdF?#R51S^J<7SQg!COP9#Hd1lCllbV9{|63^-aUU9Uz4n
zz3um5g)Z@~|3;TM^{x;ZDjSe&At=<Je&l-b;Qz9I<VIus_qk02Ee&0oYvqxfRUXyj
z5ru55cgVQ6UiQI;@c<+!nt8-0nTYhXk3z%vsO&XWC+Ors6ZjP{nx3QXVuT*77tstP
znJRx_0ZbM1FNkAN<49MpyymL-Lo(un4`Fwwq0x@Cn%6faE2!9nAYEu>z!qn4y?5u_
zJonKzSgqt`8KGxgiDqNghHH^WqIIi00qJj>L9xIT=p`etMWG>V2c3s&(9*ebWV6z9
zsnm`Y-N6m-mq%!w-Eq+Sf4H9=_$#>eR`a@K6nGxcB3<Z+IPlC>k6u>Y^g7@fmi-a{
z9+C;PeiU-zDIhJQ?U1=6U_}@D+fC3sZX~<M`x(+nq#;ZR1tz4_ducP9eB<0Ji+Q05
z1*TP|s9rGUHaRYN3aq$^>#b&l)bkruaEad=DzCBX@y7(10|aZSf4J6dPCbWYbUWg}
z!0q2qVVDbTx70($aXVsGtN_Vz2nIk0s<DkQfJPNnxk?I9E7@)eFFf*m9s%V4z@<+p
z;}6_@R(Y>Y!4cC2D#vEWY`VmI<k(HiJqaaW3$5-;fDUvq;H#AG<n(K8l*W#isYYYp
zA*C_;27Vo0@-^)&yHG!Mg6KgG3tE6+hV+?DpMre&6gXf$!L*xJBidjStEC9+K0A(n
z>G>gvRNr(%s?hur3LCJwF?w=%B*@E6_cmDUVnj}PE&A4=IUlA$L0Bi@^f7=Ih*2{J
z%7Y_=bPE4JUXMGRQx7NIYu8)SGQ@tF2BZZ8GA>sWUHgK6WcWK9L&N6nAoNv^!BZS2
z;V=*+;X3u`8BWq^<V;`(q0xSkH2&GZczi;`ZkHD#q7n!&5=p+@EYjBx;MVMCS4Q*V
z!O}h+C=K;vUkhpzPTcx}$YM3lyT1-UaKaLC)1kAUZ~F#Vvk*y%mFbSbd#?-nJ|z)f
zECcY@)TZmzvx7?eW|1pebj30B>1*m*tGpq$K@mRHGY75Y$WR9nd<GDrG0=wbqfF)C
zAJGhMPLtpxA5BFtYhOekFr%K*ER7i8L&A+1V%HR?U5U#>jYx$<^w8L7%sHE3;v$G!
z8_v$>;ktQNyXPrG$L=qKrivlar{@^@y6zjB?m2M2iu={RQKwk7y)S5d43S%DvqO|(
zN=z<nc|+{>{E7z`7{}>8MMvP7+3d>%h+uJNNWJyz0oy%JeO1B!qs!haCS#7uh`P2T
z_zFS;py@{7*FqU+ixmJMZx-qI+*!P5a8U@%2+hT623?73%RgMld(P8b0|46v-TpAi
ziJybHKdOfkKdZLnWTxK?ra@tqHDDt-q@8ZZlCQNyJfO>vBk1ukvE62uEs#s#K%Zgr
zo`=505Fg1lnKThrK<X*)Vt7XES;fuTYZ!hCoy;31dE|<YGbLXid|!Yk9$c`pXOiS{
zZk&Ix%U=DNDV~c!+I`^@AlIs{#?yf~97(z0%6E@X$N0wTJ=rEFbn-*VZUy>#e8u6x
zuC5V)b;p)+0zG{zdQ9uWTma3~-+i1Q5%|S%v^1g{3D~073cL5y63lex9A8YA*3|B^
zEqm4_{;a7zVyPi?Uc<wE!caZPwECvrTl~5=A6#cSFF0bnKvECvQn=uNbETTFf*C73
znB>17%!;!p;xVm-Fv`xKm-b~Q>CDBG5d`jaX#+TS^rh;|q>&wjs&q&TkkVpo`ej{j
z9Noh1ZL4_va-(fr69jPG7pNvCwibCr;}daWZ?$Nu_ghU)<-6e8#}m5hZRDLm#(Y;z
zCn$MB=rloX@7N8dYlEO?*}b4AS|;9<qaSRlxa*$U9jsRcKSY-epl`Sj9Hg13o_`d{
z#H;$VUx!=uE{_BzLkDOcI=z@uOVk8;CphcQhH&|-sg?>tdx=m=#h<OXCu0FWR@9U<
zWh{SA%!4?aB-XR?rKkbH$jguGtI3bf-?sVrA;go$q~Rf*O`~T)rM07;RSR-9y3O@l
zjT)<Vkz<frGBz}Vf(dAUO!P%Qt(kbZJ%7oo<-<FY3Gc`=-gSt}vqs9*GCxGx5CIwJ
zd3JbwwM8w#;xz^2yXcPf;Bm`uI_V$XGWEYz?n~;zxIFgt_~7qREXg<aQgz~T8&STr
z&8UgN>gOxaW#7Bnu%jq6`j+_1TNOq4>U*~`7jFxeo9_l`_%7Dzcsl3TL|;5%$gTC#
z?s1@*TzOL-BuXnN1m}4e;wt5)=)IjVaUCtsYfgjjnI5~T1x%cXV$kDLFy>RAgNmI|
z3p*B*x%}(ZVA3Ye+Np1?e`iDf<K@*6TbdtnC<4CJRDl$`hxoRLP<n*^X<Ob2k~l6D
z0jmXeoE@*Xk-3&+EktVzAZUW5{Q0+UKj?PSYaKI12IF%ulaQdehE-ODLj||z7e+W#
z4<6l1mnZ0fiEs$WVJW<q)4B&w!aa&puMPn~n@%`eCGzG)0ntv`EM6S7KN)%j)?bST
zdlstrTKnOJ#Q|o*d4m=dsiXp5f&-k^D~<p@`r3<iKl(T0qJJ<H{~pj#&5N|G-6tHA
zj>ZEpw83YcUX*ghm*zOY$-bvW09LRN%z|H}nR*m!;pYFLey8mL&=Ze1D*IK4S5}#d
zqI(63x~@pC{A8a6=D0Jd&DLl`H0}i$a(T;gK<smuZ0|SlD{6W1TNw`^g-Qsd@Ru^4
z9N=z~f6_f(;|5u(K~TPSxbJOkBsE<{!xu-tLB65em(a`xfeyDng0KUDzEn=p(R%-t
z?7vth|H8Ha(?PJa?N#AUC@|>HBJ_X@MhhCZLCg3@Mm4webnpb;jSyX-uJ%4?D&y2L
z+=n0zxxE#IriWJG8Q4p$#wsg0-Rtx(kYtJkPVc%T)9H$pNCv1WtlPM`=)Y>Kl_A>C
z#^aac2cb_W!guq^$DGWkCBY2ve4O&y!&0XutnCZ&f^Uj`H1)i}-Lrm&Vt_u!x64}(
zBxLkB=#!s-0`q6(?$aq<hC&*uadiENn>TASmi({-6Lr*?NElDuUEy8~V5u-?nJK+t
zHL247E3C6or2<-zHrEG0`|-dF^%Hp+ngv%rgj}`3$jXYq3Z(pCdsPVoxlA4{s7c@z
zB>SidWF^iw?>OGWeg9*t><Z{<sUg5A6l!5F9SP(`&2}G<de!%)W5N!JuJ*JKj&J$z
z^{}{5wc#vcNvmB$cS@sDSR~h}Z;HSo)yFiP_KK=(@QN+Bgk`i`ezGTVCHtZrH5MX6
z3amHw2^0*T+>bybqLBM&_3TwQc0foEneu+rjr=Tfj33SS6y5|nr3^rwrklOLvjQ=+
z2e1Qf0^Ick!VUm9;$F3XWd|IAneg9w$*l$AaC5h~Jz*<W7q3t^z^7jGYM^d}G`vym
zv=1G$SLi}cz1y)F!%uA^N4WUk(`12tAw<4*(kYrlmT)hvsbhmTr*eQ3P==9n0Bn5=
zgxPy7)SCf(3}SE}#8IKbM$P&*9^Q+%e>iAwz7xM3w9kNp_95EWz3W<`B798i#^n4k
zToVwZgx-yO)Ne7$dAKA0avZ4;G0NuuFCS@@HI%9p9#?-~FrML}>t$!r_1HJggYM*x
zRvolY1QjJZ4(t+77JQ663&Un7SIBq(MEUqTVcyWw^a|(M_Kyn2Zvd>f5$u}kJ9;{5
zR1HC1S!`t9N!afMFP;As0cSF@{0qeNQD!qlb_2hX1|Tjp0`si_RCGgo&b->p20*J`
zPHYgOW>H89Y!~r8z!NI~Nkpg<?kYe$O~5H;X!}qJAcz`}xYr(uUnX+%M@#U<)6N81
z!HFDY5S(Tu^FBmzM}qfEEbB>mR)9kWdDS+X!)+iU$K^%V*`u=st1Rm^tBpd8&Z^-4
zy8=dM(X!?zI=QM4yA@G7Fdy#DZLx#vAb0r^sZo>~q!>@mepC~Tg^+z;XIH*p+xhlV
zm%L)v>6BvdY;6EjSrcIPS-iCA?%3}FI)BcjqRi=Dv6I(RO~4~(5F&h2BubSZfGAb@
zr6O%(ND60NAJ$7&1(nS0A1MUDW>shyroSu5<&-68Z^s6~>G_?j{T5(2?j3Q{*+sd1
zoA2xR%JTERZ-_;NMMT1Qt-FWtP{O`Xp{-&GoC6wx?$m(TFc6C3`=QX>?TY8^O)(xl
zybA&}F^#cqT7vy2i#1n{#*ni<cLK@KPdKp-I+@2LP=RpQuTfD%^lC$D%;UZ@pdwu6
zXZMXL?FCo4=s;NqIGPeVTz+sLx$lJl3QdK{8X`Jt9Ck0_j3P{WzO4}DgEHW2y00DM
zsblrs>AkkyA{mC$NGbTi;;*XS#Lpm)mYg7fi-O^S5sHo5-!h8b4x<3=cz9(FC;}S1
zvi1_fT&ME?N22-<^gC9ki3kyCERAQwOQFj}xRq+-HO1L1O^+v~tChsYo{>5k&z6T+
z0)Dkqd43W>k~loKPFh*B(2veh{t`fj4xz?K@Y3!A_e8A-C?8^y(w8IefqF9vRTj<-
zEP)ZYPv<$wfHp9dE~|~P5cY1qxlnYm#ChDPsQMEkBU$5TeW*R~(qvb0LFeufq&(M@
zlJET$a6#KGJBQA<!+*>)UI8Vce~g*vC@{u^U&+RIgc{E^P>K<ObyL4*IdNw{_ZAEN
zD(b6JXjUx&@8&4ELJDeeGzdY3V_bKJa>)`D*{`B7&2y>$mdW8QG=Dvw8bJv5Ih~VT
zR!6V8bVjddU7&$z-O&mfh~SCS%~-lM`qrTT>)TflE^3bp&=|VR?X23ZACBQkKb2&R
zJY|arwne!z(mx>3I}k^ws1{ibM?Df<lR&FlQ`dpzffhpaqYrU_)K(IZ{aq$m2kQ?2
zNMc5WEoB%%fQ*^zpU&ex1;Oe)xM{VDz5HbOpyI)Ik;^y`emD5<e-}hoyLO-WLx%W6
zhWJ-9#LGm{*Fe1iBbnJoQQdM2_@_cc`>j<ZOFb8RHXb6rGnoHn#0Ls+dj+VP^_$q1
zKjxTcRn~1qVHp)!2h<%}{eY4X04FY>D(48@NS<5^#t<|GIW(wIPe4=fiI#|*O(Mwp
zT)d)3VVOM?;clUy`JAi{wz#x+gqTXuNm<z8$$D;k-E?unH&{bTAc`oNXTP}@(z2cV
zgHR~<u*chsI3JBm(L@S1hUjNMEQ9ySiNdc;C0CMSyX+%v2%fYr^Qqik$yVU0qy?Br
za7^I$LjWp2L=|#G502N90UK#U>v?A6_Xq0}(Qq~u(Q@B7lDCsTg&0Wx$F%`<LS3^r
z&j`HZBVWRQUW2$C#zKi%g0Ny9!ivpbjyaTY9zI+f`DG>bcW<!fLBNnyZlKgnCLW><
zji`p8q>qE`5hZ*FN=5d8K_J2ma_ZlE^z!EJy8EX7hjv8pqgg8ig+YqPj|x*9gozJM
zMO548#S-_jBLwa6Oaz_yUwAZ|pC3sFmx-6GHj2$QQgI8I_0j_0iL%nnLY|<F{<|0N
z*WicetCZoja6o?f-ect@>;uRkPoJs<fuBq~z<T9?iI9d^$3i7fb=^7^yjxC#b!-Ur
z=DPD3MS^WBCYl2~!(}Ke{Urb%-=$PYH#3Ovg?<kksmcDP5I*$U`0mwnH?MHOEiD0y
zUiV&?!yR)PLP4mtTtY!$0g*&96pwYlGFKVm(0}2XnQv?xS^*V$cxhFsF>X=(ds(dH
zAHhqj9Vu<4i~9@d>0jC-vgb|&4yYAexp@Lq@v)f+vhU)r{@|sSMsq<<5d~Jk<Nz;%
zSWXMtURmHO$^qqQYQ!p-1Ip+$U=^H#e(~8+xm<)VB!=TQq)42|&WpJdUdW~u2`?Wc
zL|HP>R-WFZdi@JY?a|Xj`I&S>q1TCw6y%sQ8gOEs&(Kn^prU}dRR<QyUSN^D*^O=m
zi)3opc@&66GBuEyg25tL8`Uu)!D0NDM+NqtT1_oHDk|`(K=|Ft@|RllIwL9qtkd6r
z@(aqK*<82>7c~*u%OP%L;oL&}_ITF;UG3_Pou|PXS`F5^6}H?6SVL1lUHD(vj+<NW
zceDk&hqK?r8g_w~j4Eh%kAOy$?5_&^KZ#6zqS#!x-%lDWT#l4tWncxUmzW42-^K;*
zxyV{?MhjkOn8be$DmQnJVoN0KcG*W9$nJ@peg?rFggOXWWL|04-#&_)3zyMG!wyIO
zJ+g56i3fY-FA2k&x_AE;8fZKsYdsHF%?h{%Ls-uPTfs~A3Sfzav@-ZqH+N5pxeB=V
zvT8*lyQgmH>^|59-@_r-iC=-p;&<m|-Ku>CiZ-B*-*V&E!hISIz6*!;2XblfY2KY;
zI}!`M6G$5<psxpO?GM?SvIhkjg0zf=tsu)P1dvNco=<d~o4ZH*1qZkm!-6Bb=c;?o
zE(k5Alpr-%Cunc^AA0O7jON{;<v$y0>;9Hm-0so}s`6C865N4DS}@yD*mp|sU4)HA
za?oG{jrdN#P?RTFfbaAWoWDWvo$i2C)*5`LcR_lw>kyR*k9YFTm+B!%E8!T(WQek?
zw%0b`h(ovl4Q}EqEa_toR*;<>UKK|w*kuV;)`R|D(6x~-k+ZH<A{0Iq{Q3i4gc&>2
zdoST~emT!sdK@n2<4)`&mr<T4O1Y|`O>l=$O2Er3`N|x@&r0Gy?JP(BtobP$Y9K|_
zAh!;)BzLX+BRaVB=r~6kd{?q{#ZqEG+^G)Cq(`85H_{rK*$MYX=NE%>&My;jbE)9g
zsq>1<zci}v%Q;(7(u^SKBW>jRpH+2;ME)!m`Ljn^YUKb1`oFH_oYf6@nFvv+6|ql{
zSh)uEiA9GIDDoC81J6EA9=^lw*}-_*+*k&9>8^6KVPsjO$rvP()5JAE+$~w#NkT#w
z=kS6x@+M5e%|dnu3E27omqbJ5r#y|`=wLp;nL*c^AT#UBvi2zbhOa}iA(daSFT8s6
z6n1w%r92sk4uM)Z=;UR<>B-PC*$GmI6-sCR0w(#*I;{Yde>)U$vkSqRFF(VO3ZXfZ
zd2=CuC@qKM9z34P=tv7L05)@7Ho+pgtxB~2_77>DDBW(|Ids;2%!K7A_}%gBy|Pef
zp?_8BgAdlrixzc$Kv~;IoCEFzYP}X3n)$~{R>BX#!XYkP;OHo<`<%IY#yoHz=gk$<
zMnPFG(fU*0zMiE3XrEQA(1_kZH--dMaezGjC1xl&)lB!9Uw~bC_;va<HG+z+pQ|Ne
zRB$HrK{`C}A8FYRU>JP`vwRT8kL=HBhAle&V19w<E^+&7zY;&Y7pD5O-Q{5&9JD(V
z4#89(y2fsP8KxSDsM}GX{-xMVPyPWaWj`xk{;+uN4Hilol-f&-UE)w4d{t5TDV6BA
zL%~%K=0oqDLIe=)*n3e_iK<W@Odo69wAyOPd9AV&)el8&#-=+|H=(<E!bq(ldL=58
zQs^_NgMH3moK}T#b3Bnd-2r8-ak^%G;zkL{+AZ!nD;P#a$<a!069aau$l?5{xl9@O
zkc)J12h#~trP;x)^h(z6aU@XccyAS`Y-kyYSlLqhRv^HtnxiIu2jGB(f1y5_PDDPW
z5GDtKdsD-3gP&ldoME`Pw!XM0vr+Oom&mmbqX6V%tbh0$(ClRi-N7$)Vnh=@!~i6b
z&-kB4^Cm!95csZHQ1Q}x|Lyw6jo~(S#8<6*+xSm6FeV3r9#(2$)#)r5_z+!d7_M~)
zRh|M27i=ukKtZzgBDwXC4Y{Y5n8$V7P})#2SLijd>xWyjAGJd>e1!%+L=Rl8^w?-l
zQbN>)%r>l(+P&vu@gf_;Em+_Z!rXzr^JS@{r+z}qV9s1XNO#>U^UOXNZam_Z32G!T
z+ZIq~Ei{llx4bb&FaB>_(mPZ;p8diC{8`>VC-%>YJ;8TfpBd>M{opeeLS%T&Jwf*N
zR<YsqW8BK)K^NSjOJncbz(z19ixap>?MsICRP|ci@`N098;H|SQb8Rd4{|3P;7wa9
zs?0z*&w^Cbv5bfp&K=}!8O?V4^b!881b)6%g-8y7AGIYQK+L6y)8X;(Avj_D)DHY5
zh=Pc<=kcE1Yv3Gr1R7aS#7-WBOvwirL|8E2gi<~Wr6NPL@I1HjPPr`Ty*$xBj$(k`
z3k9{W7V8uZ$eZbygMxlpd0e9yA3y5Wb|f5XK#a(oLn+QN%FG^>F#+HP#Vle$Hmci)
zfmnPms*FX1oii932e<}6(ttn(?oB3Ogm%FF4~q1^GNQkVUtEkY4>9$()>vC>B9$#8
z9jR+fGK-EfW<;Qb#FidXEs27>$_r`|TOSo%6@~j+R7Z3#&wLvaE`a>t`<)3t;^0j~
z^a%h@DaZ$SN`rOq+zs^gw)Yb|Ore(fHHq*QxK>?yZ%VhKZ%}_H$UdI9y8jdz&d<It
z(+z^|S-Wfc@V?(Y{JPE=o-p$Rxeb)wAPgxSaKI!T5X208DSaO(<I8&r`*JBQ=s6Ey
z29V1C#cw(K43Kf&zxY&9jZg@Nfzc4Gs%n`veu1><3oU07J%EVl&v0y4LU5KXRCc#~
zrgJF2F@qz_w>^*{^Fzj)83wp4Jfse#5JqOwan`{;a6bb{to$WNx6_1;fNH-dJ8Ka6
z{Ba|~7h6J%8=y+u^cB@6xEL^}Su0lGpv`w`%ah?U?;2fAX-!f##5@s(za{(zV*r1P
zLx<i+M+5pOf?hQrA15-1@ZAwo3$;)`egdVYrhHo4kLuNMMttS&flN!-9!D-52SC*Y
z0d~$+2xrqnGHQ8?i5X^`Rvgli>9x!)-%}+ra}#J-8k=6tQ7&b^K=rrP-tUk7d`vD%
zFl(seiKBbj=;s20se{F9-x|Ss3@<vTuEijPX{P_t#Q`f?8n%_1=A+v@?bp)6V{-H6
zmeNM~PDsx+reYIj?G6`Gt_-s68Inp+d+Jl3{;u}vZ5!kVzhvaSbWd+H9$Au`OE<h5
zSCYRh7b1K1ou6(5*}M+cGa$W1Y`5@Q-;xT8zy;&sX_YpEo9;j3mDt3Gde2+Z%{9s&
z_~0gf-)O6c+THMT4Bf~NK2<liURKS+w@&;2R4X_r>U4S5pVm7+g5ojwQKqx5?Nm#(
zWxl#pJsl-&R8s!2KMEOavsk#C-G{fut%rWb2TE;@IOZTr(czNyAB->Wn7MZmm({<c
z<-Vz+<w)h=4qnt{HX4nSs8+R;OM7EZ^@zWly4}z1@#2O@dM!6H*ks!S{@)V<9kcYB
z#rC*uj#xlZ+UCNI^&dRuQTT)JHBqOQAqA>ct*!oz3_9paIj#gBbmo1ZsiXX%<@OQ1
z47Hjo=EEzh;hM-`<$I(k-$?8k(#d{gdthdB#OFfXyGnl2BR^=pVp(r+laL-Jr~rk8
ztgIdJf@v5(|I^}IDYOK)_L`k#^5|!MD;SnE*Ya`x-hm`!uz}@nv_6gpKBViP?2#Ji
z-57BZ?eZ(976If3JLW#e<jt+9?KcjB+K7%W!!cuJD$I^pJ4)(D7bz>7@<mo^P6ik=
z%M7QcBWsQfc8|v_4|;RC-QK<395L^V{b<TL<Od6fvjvQY=kFgc$9h=kr)3<zULJ7}
zOE26@%OU%k)-UO@#ayWGPQ1A1M<q36&5^;ftPE;nHkW%gB5-rWIs^S*6pN4_wEARl
zuKeSupp!e>%EugK^$YFpY>KS>S1Wk|AkT}DdHeC_zU_PeY|uX&^v?$U-@ZXr<{dWa
zDgvLxH`>(S<8C1A7)NO3=HBWuifVT<#u1zxC%PmGKu_q6e4a7h#(BKs8i*@jngHCK
zPe|xFqsa39gZJ%UaCk1Ud#Edabm5U4o=!JVXuAWqyY27W{UWtlZs13&!zw*<UkfGK
zOA51}Hl9ZAV(ZeI24?H`W=;0NGz^oH>`iuzau&ntoBraV#G^om5Ju=WES^irUxAAL
z6_^Eap_n*2tJ?yKJye{$BU-#`Q?*jp*c5vdzp8}W9?+X>2q|}a5%BvSOt%}nX@1~!
z`cFws=kX6AHsh9R1u53nqNWTpo{9x2)9*37J~dPk-!Lehk?Ldn$3{V7<ZM_uuGW{N
zcF3j8fB#~zrh8@C%1HJgeCMOkem|G^wtJU-Z>7JD#;rT0e0_y&7mtD{#4)gjKY}NY
z;%z*a-m*Bm=u0iMo7B5lE&*N+m{8S#%qx57QX96v-sM`m>o?C;Yk)^iK8TQ%Kcy@>
zti`*cL3y!)b^Ys9vns-^Kl_u<Lw|Ul`=PP9yWMV1y&-#;Q!(Cz;sbF?w!AAJqArvc
zq?{}5fP&Y#bD>}T%Zyuc%*%x3LLS+p)5LtdqHo$86IYGbRxR3bGM;O$ZM3hP$KzmH
zZ#C3KaW@`qk}^RWOcP;ufCuy!Kr3lW=>ARYYPF4#OM;bLJKp~opH1obF>vxb;J7em
zSOECb++h3K{Vq4usY?g%@fm#S(y{cDY6(<r5j%cYjz+mRP-c*qj2ABO2TI1n1*&;6
z!)tQ=zK%Ru$HU?AD^clfm~WQ4sn+6>IM(ryuDj!NjHzO0hh@Xz0YZqWV*foV9dsx=
z>uV}B$7eN?Mi6oT4*8~xseRPMhgd}Xu_&|^>Gg{qUc(i*p6`Dvomy$@=htOu4-$TK
zO|O227tOA^1l@^XUrvskQ%^h}K*2fvmSuSB{j^Cf=a2nrc|o~*Tg1Y@{SFq&I6j=;
zliqedvV6F}%H`AzD}!@!bk<hcLZuOld~tN42B(y%M8dr0PGKX?3+7URTwpN3LvM*G
zlDs>C!~+s2&Q?66YelBd1xel=x}fLkTQTkqw$8TzWk|R+wgs>Bu4p1Ta{hvtEBSWi
z!9bb59SYCOnPk$c_>9_iejLp^9Ctg_-;qys_mFqF+uXf|*wN%AridI{ci6XHuy3=c
z9RcGH!mH+`+jer<p8sAotdhyldDZo2a$rNUd|(4e<=j7dzExq03dA1l&M7WCc041N
zS#=xs9+<J7{DAOtCUf#hVmB5QLbiK8jy~&C&O2Lo;y&7Q$wc}y=g(4on3;IZz59=*
z+8%hg89+eDLxF5LO)H9(5BD#W9!>qHEvMHBdLpRA<4%_Txf5*-a9F=&E?)Y;rbxz*
z5r-p{PC8=ka^LS3y&q|EA(qbO_G5#KZr7%~+X-g+Wgxa$-;^~~6vT8BfTV*}0Cg!1
zwCmjN2(I>|Sh|-~eKL<Ldrqm!-BW2XK;7mQLbg>#W)YE*cja)1h?4uumn$wIUtK|P
zwWup%+_qTg#`ur8(g~ZFicKs=#`oO9^4$(w3O5z>trQG4yAXIfWDar;DSAF@qgW_0
znP_`(e4^HJlHbYYaagR`M8cIJ%`DsN`~u<kD`D>4o}3OTpS{{Pkt1=V|M;`>gn{Ow
z^Um1@hwn{lh1#~~C*S&#MaVV#*|VDDcm<cwBzZA1Oeo1J+eW{=ieP-S=*F{$PbySn
zrS#SsqV9X8-5gHBtO?fh)8Q`<OWzPI0o@IaY7i_vo=M#9wCE+hx+sWSt{+4^vDbmU
zfi9h=f(Vu4VxIkC4Tu+w<M#@0I*`^WlKDpJ)94636<O}aC)sEjxzrmj61P%-T)w5u
z)ARVH;o25k=1yGEB+huLlA+}3<XE`k`P3^UB7v`b=X_D8THd!;dpR!(!jv$l9}Cy0
zb9?vyw0GTaO=Vl#GGMz9%K)P^5plSnFpknol!yhp3@9}U0vZSbB4j8@ECZ;Kq9QO<
zu^=rJ5kgHA1VtnP1OkK*g;1mfkQ7Kr&fW2j^Ud?!`xo42^3(Y#`#J0Ewf9=@TI+p{
z@$mOYcE5<94hHl`19k~9^gVt?`J*TDF$Jlv8Hc_e-)B>|<3IQ@d3XN99*_L3M0Xr(
z^}?Y&ageuDt>d97+`h75z0Xzp$?NgyDCeqacTd8i&-}}kuvEFy%pNd6K);Q&t2H)|
z(BdnR=KZkVu)<WimiA=j!!o2p4f0^$^=i=c^nB@zflqMs_xs-oQVRn?kj@s9)ojGY
zhb~PMWB-U%({-r=+uw}D+j?kuT4{~Mm{YV@lhBqH`n+83a#XHe{yt9K?2g3D%}VHE
zFXUO`&XPGVh3d^xq}d|!V&9Gme0*a4Q95-%gVfBDpUu-e*G^0j<8-S9KU0_2KYFYs
zJg<lCcMFU{hS6S5a&B>XH9^@fwu>z%(`ZYrw5hC6AIk3owK&XK35js((*%n>z1j7R
zuu2B2n~Ft8t{Ml_xbPNOSdrkVBw!?xL92ZyW6OFQce}KflnIi~aC*<VYQe^myG;Ug
zJ@V@;qFO>9xlm0*kq+2Q^Mnf_UGt~72$MkE$k%3<9nn&aPK@&cE4o(GW&nFs4PP0|
zN~mRQ=dCIUBj8eM>s8&akShlLbSd|5Lg588-xezlf{!i$^eqpQSwA<g{fw)fQlLtI
zI*%DCbE~oj<aDD?Q#@T|%K|VYA<^d|iJ=LapdEGWe`2uKmG^+iJO6aWY-)#DMtA$&
zZwV6iHDxgN6fV<*e@CmZMB>#Wn{7nz{=j5&Vi@TBv0~=b5{A0yD_S=TZWtpBlgW9+
zpv9NZ&wLyH=zH!{oqxfbpMB)wOcIu16d`9Lrd)G1)}p99tbdt3{{X?U7%uVQC1oIZ
zMYA^ElO1?jsesLK{UYH&gtHR41bWJh^Oi5yXnMIU`um<aSKCtmUE)&{#L>;etKgIz
z*hKMuuQ5o<fuuYv)0J@iG~%Cv;~P#EVqaD}`4BVI#69^KWp>qxf$Aa4a)>0hF#Iu=
zifx96@y;wNcUM7_94o^CQ5)e#1H?gOqo<s?vOP}ITZBGv_#%9T8!&T^pRPoc0;i<U
zFbUI4RZqkC?jMB<>+#?y;AgvZKnhus(gDaG2{pcu&Yrh&mT#B=wA2fp*iRAw25B6G
zhJVkhpH;(~C#az4bHM0h;`bhEAk8(ZZ$3z(dfy^jYyFY%VB!~4r|qW*O4LDgi*%B#
z(<W8CE{RTH9egLf_tq1$h^<~1g7X-IBG{%{OGxv@dE<z{L}(=7k~NlzQO1wab7B@9
zLp(9aVVT+j;kcW#On8|}SwhbCHAk}|9?qyqEZ&+JinWU+p=?@XBgXy7?2T+UXyvbY
zNXNb3IZn7CY*KD-pg(;(=Awq54?0or@YQ-%UJ^&B#-t)kx)?HUg;Vw(HI^Tg5>}Kk
zs#l=?4=|K4%7y|y(44>Y?G)Fki2L5k+M8%$SFj~GviZU6UT*}ST;uZTz|4&a;yE7i
zT<M#V3QD~cXY~dFv*|*w5`giTU#b<7+H{|+_F5M=H@*I$XMabC{w99h2etn*PRNp1
zF)apaDw4L38S!F`-m--mQe(ITra;j)kcms6erxggW419#j0;~t(qo$U;H2On<Y}N%
z;d*0)Y5t7$1pLzATrlhIqV{$*U<sBIpR#Q>T?Jtq#JKm_fB21MH%z9wGLXRPeL)+?
z;=+5$rFKg-`t&lB2WL2C{{EI)baY`HHFP2!VOG3}xb)bUqL)Ynax>jr`9jU_kp>(A
zDvCTE$o7l3k0Z%MU8G9X1aea#hg#3t)<x?HfpcB?eV4{vu1%VFHIHwK47f=(NK=_)
zyIio31QeWYU^jDcto_yGELEwEb85yg;`UZQ>mt4MWrA&P*}dcKX7OA9fLk~kb7b5#
z>iF*}GIFcGbm*<Eq?M{FJrjj0Z@^!$;zt+x6BZ!T(G)IXcr0&3LrmX*Lt}Hf10@1k
z<A{V&GV3Cki8>tY*OUlb(nj_*UyEFvWbINK=oRqxPMB?q<#{1z068-7tfT+kv)u81
z3d~#c3wnoaVD?ncIG9ut0cgd<I?0iy&q=SKfT7|w?0JKj;)))Wb5W>YQwH<Aw}H+9
zB)IO@p*z5gH*HrxuO+l*Dt2-U<?4`^_Z<)O<cP~OMLR&L>zJCQvy@w2c;U$vy!=2?
zsFBRYLdSk0Y7<0;6Y^PgDY#oX9p}gJVA4v}mefG>Z2~pU0Q4elNLV6T!uw3`F${1Q
z>NE@O*qlj@%<D7giT54fyd`Qi`BnX=-MRdZM5I{B22xf8v{a@;iB^WW*5wW2pu4as
z=c9OSiFP7063}~r80JzX%_pO+gFtvb53?zMr2QjnUo<oLv#z5!?}||oEp3^&$3;bc
ze+CQo7*?Igcw=laVc}H%2%5SF{&mVDkEg6D@eYS#kt7g7R`j^G-Ogbg6k?D|LuzUS
zUx#2N)7*`Ae5VgZ<1^hT<J?%`8aGU2-tHBL%}t-I-v0W?KYm`Fl&1zQ7s_O<IR|1Y
zbxOUZ^$LiwEs+E5s#qOtuV^#tyJ=h(qPbba(T<b)>(jVhuV6%O;q{H;_!gr>Q6%9u
zp@=erJc*WvI6=iw;j~O>CKY+(%Fy$oG0!VXl|2g89?a|#T5{$Go8k9?G;hjpA#Y|_
zloH9$Cfl=iyB@bNjiovcq0q-1=>BMhk6VK9v;~tNI*UrR&#QHhxrPpi_H$UpLNe7+
z`tgm=Sh=z2X&j_=KD%wsj5u#L%5AyNmb`W)#E~gU;^yYgFAHhrj8M&yI%~eg6QbwN
zP&T|m(Z3Uiir*FAnxoFVMJjO{E6xWyH?uKy@#sjcCnE6eN}1p0bnnCE4FnjM(M?QF
zt!E9O)oXxoymBUyJi@E_p<l58JTPp=OwOV3g=ptH%XbUT5#g2;ldi66hd4u@FJ~5?
z2Wni~C>TP%l+bwV+FpyhASd*A)%S0X0~$K*j1Vd%sohM$@1NMDkFju5zx%Y`sNVPP
zYjIND&BIKV^V=L%Kz`AO^yv@=V-H-XVo#AJQdIn;K9OX0^ciGvaXh{e(3S-?g?$K5
zN~>IJo7PO`>t8V>zpR`5ih|8MC)D*J0Hj*Bk0P6X|AnhW(tonL!FNbs>AMgn3B9)p
z-8)70lj2`bujEZnMsg%so5g}+DFsaU^|bo84dY(0OP);C0m+;SqKK$>xweY~$waki
z`v6=N83{C{gsjm_+~8+Rt}vxuMkZ9F3@Oy=FYhW&$g|j@h@ZY>xQ_MU0*pF`)ze{b
zO1596h8wJ)&tsLVC8%QkcAU}kP%5$wd>lBe9NHIt=pAPTT}FN#3U#4?UO~$P&DcPn
zMMiy%93-{ENe`#P<$z}AFGn>_9^SCs^WJBJ9f`G`Vl|%BH@beLEwHbLb7<g@MrYBv
zy$R6PBemJp_+Rg`b3ewJ4gN5IWSedmGibqBiMDfPK%bW!jab6>mbh1Y$tP_G2v?=B
zQx@-bP^cCm@2U@iR~Rm}z>E3M{YHB%DOB(IyIP#yD03>^7(y|Xw7ZKx_RoP-2k-yM
zni-k|^)+tPu4$}=O2r$QQpds^Rs6G2=7jkbf2Tg}v8Qr4y3(V*u>31@JnZymf*Qg+
zN`x`N{l>#aeeTp7*0SVk-R#FW_r^XRtP1wF&y{&{NuzV3P5f0Nh)2-$(e6Q|uMfoR
zgHoJKE15_lzFOxK@o-t>+Wr)_I=kK>K;eNKXT#I8O*z$zpAzcac5uNL=s22y39!{T
zS^nsN(#OXeyXMKasNv_B4dL`jebG;g_VBa`GeZY=(MfWQD?c+0SvcHIcJjIG{DNFW
zpRyY)x#YapQ(ect-F!u-`u?qc^$SRT?W*IVbQM|Sk7_oIZCv{8oN)KySA)kdP<%p+
z)lwiFrIOun84#tmvTOzED#HDTWvw<JJ7sK}EBAbxZeIUBOkcL}+4RzaE-`qth_=*M
zwoN>mzx+?ohpI@gw)NX7*61W2Hf+0XU6CLDU<(k9&h8zM!^WImaUMEK4n?CJLoe2W
zpeMvZ8I!t?7vVCab`lH5Nj;SFX8`-;d}DHJyQQA(3vLg^q>u|T=c@7s(J7wTzm3*8
z53ugPAn6rB^kB`3JP_vk+TWU#<#(SVQ61;~Lp5qD3Z@d~JLPo>R`FnWpS-5<Xs+N-
z@TYpxr@sE;SfKL)E#f(&C<u4FH@6Y6pD@w;Lj@B~-jv@hv7^UC>(RvbAWLm)-(v{o
z9%_dARKwKsWSJ^@!s0ga%+1ciq4t5L*;S09hc2g^+z|J+VrjJPYib&fe00ybq-%GO
zv!QgGGC3L>Kbe=~8_iyUni;Gg9cm&q6LyrA$akGyu{|e$vBFZB?dl{)MBYt&Lqsb6
zy5XP({Di5ToU^y|0z#zo%2d4v714{dmGjs<zDNlVakJYcuB|06fo^zTfH`ecTx+;&
znPT&i1N(m&y`R1GL{6Yvb1+64<dqJ1IV!I{XRv+%RFu$i)NjY`!@#?6_eCqeZ-Wt2
zRoq^*d8k$kG}9CK3(cdAbB1dkVzO>u{S#sH|CBLdi5g$tAOFJRF=X)?uNWM+HZtJ<
zn}289?aBw;zk9rusI=W~_6JeiztO&=ycF54e%%JLu>B0>dP+OR^{(OyV{j)0(4Fn{
z_?q`Kz_Q$ivO@W?1%Fv~Xy+%(f-d<<lXrxZZ&7IuZ1#)bnZ;#!{Q!M-<^{tB3?!AT
zJvLbN^415#)5aAZFQ4u6oVek*2Jbj~@8?5n0BD&lmM@X{?<GDM^?y?RN~V%zy%JO@
zp6#G-EPm|ZA$O`Y;8flu;8gZba;GX7{N_~J-<;}d#OCFN4Tui26MO%zO8s4x`nzoU
zciB{4CI4S3n@)o|w3@H2%Xi7iiRY5Hg*-09Y^m$t0h$}G;OBslO2wU|DcD3wvO${G
zGp;y2>p{`og~Q2O*aJ5}cW_O}iKxBs;Z8#!9=-MsQX3iX=geAtocbiozmPsRSA3RX
zwu_8=y<oB#jI8ckwqiXH8wNcX|K;)enkC|;a9^@_!3FbW;CICS#DQYF^Vk0cRZ<S|

literal 0
HcmV?d00001

diff --git a/docs/features/disagg_encoder.md b/docs/features/disagg_encoder.md
new file mode 100644
index 000000000000..7d40af706982
--- /dev/null
+++ b/docs/features/disagg_encoder.md
@@ -0,0 +1,75 @@
+# Disaggregated Encoder
+
+A **disaggregated encoder** runs the vision-encoder stage of a multimodal LLM in a process that is separate from the pre-fill / decoder stage. Deploying these two stages in independent vLLM instances brings three practical benefits:
+
+1. **Independent, fine-grained scaling**  
+2. **Lower time-to-first-token (TTFT)**  
+3. **Cross-process reuse and caching of encoder outputs**
+
+Design doc: <https://docs.google.com/document/d/1aed8KtC6XkXtdoV87pWT0a8OJlZ-CpnuLLzmR8l9BAE>
+
+---
+
+## 1  Motivation
+
+### 1. Independent, fine-grained scaling
+
+* Vision encoders are lightweight, while language models are orders of magnitude larger.  
+* The language model can be parallelised without affecting the encoder fleet.  
+* Encoder nodes can be added or removed independently.
+
+### 2. Lower time-to-first-token (TTFT)
+
+* Language-only requests bypass the vision encoder entirely.  
+* Encoder output is injected only at required attention layers, shortening the pre-fill critical path.
+
+### 3. Cross-process reuse and caching
+
+* In-process encoders confine reuse to a single worker.  
+* A remote, shared cache lets any worker retrieve existing embeddings, eliminating redundant computation.
+
+---
+
+## 2  Usage Example
+
+The current reference pathway is **SharedStorageConnector**.  
+Below ready-to-run scripts shows the workflow:
+
+1 Encoder instance + 1 PD instance:
+`examples/online_serving/disaggregated_encoder/shared_storage_connector/disagg_encoder_example.sh`
+
+1 Encoder instance + 1 Prefill instance + 1 Decode instance:
+`examples/online_serving/disaggregated_encoder/shared_storage_connector/disagg_epd_example.sh`
+
+---
+
+## 3  Test Script
+
+Please refer to the directories `tests/v1/ec_connector`
+
+## 4  Development
+
+Disaggregated encoding is implemented by running two parts:
+
+* **Encoder instance** – a vLLM instance to performs vision encoding.  
+* **Prefill/Decode (PD) instance(s)** – runs language pre-fill and decode.
+    * PD can be in either a single normal instance with `disagg_encoder_example.sh` (E->PD) or in disaggregated instances with `disagg_epd_example.sh` (E->P->D)
+
+A connector transfers encoder-cache (EC) embeddings from the encoder instance to the PD instance.  
+All related code is under `vllm/distributed/ec_transfer`.
+
+### Key abstractions
+
+* **ECConnector** – interface for retrieving EC caches produced by the encoder.  
+    * *Scheduler role* – checks cache existence and schedules loads.  
+    * *Worker role* – loads the embeddings into memory.
+
+Here is a figure illustrating disaggregate encoder flow:
+
+![Disaggregated Encoder Flow](../assets/features/disagg_encoder/disagg_encoder_flow.png)
+
+For the PD disaggregation part, the Prefill instance receive cache exactly the same as the disaggregate encoder flow above. Prefill instance executes 1 step (prefill -> 1 token output) and then transfer KV cache to the Decode instance for the remaining execution. The KV transfer part purely happens after the execute of the PDinstance.
+
+`docs/features/disagg_prefill.md` shows the brief idea about the disaggregated prefill (v0)
+
+We create the example setup with the **NixlConnector** from `vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py` and referred to the `tests/v1/kv_connector/nixl_integration/toy_proxy_server.py` to facilitate the kv transfer between P and D;
diff --git a/examples/online_serving/disaggregated_encoder/README.md b/examples/online_serving/disaggregated_encoder/README.md
new file mode 100644
index 000000000000..5813a3cecf73
--- /dev/null
+++ b/examples/online_serving/disaggregated_encoder/README.md
@@ -0,0 +1,119 @@
+# Disaggregated Encoder
+
+These example scripts that demonstrate the disaggregated encoder (EPD) features of vLLM.
+
+For a detailed explanation of the EPD features, please refer to the [Disaggregated Encoder Feature Documentation](../../../docs/features/disagg_encoder.md).
+
+## Files
+
+- `disagg_epd_proxy.py` - Proxy script that demonstrates the XeYpZd setup (X encode instances, Y prefill instances, Z decode instances). Currently stable for the 1e1p1d configuration.
+
+- `disagg_1e1p1d_example.sh` - Sets up the 1e1p1d configuration, runs the VisionArena benchmark, and processes a single request with a local image.
+
+- `disagg_1e1pd_example.sh` - Sets up the 1e1pd configuration, runs the VisionArena benchmark, and processes a single request with a local image.
+
+### Custom Configuration
+
+```bash
+# Use specific GPUs
+GPU_E=0 GPU_PD=1 GPU_P=1 GPU_D=2 bash disagg_1e1p1d_example.sh
+
+# Use specific ports
+ENDPOINT_PORT=10001 bash disagg_1e1p1d_example.sh
+
+# Use specific model
+MODEL="Qwen/Qwen2.5-VL-3B-Instruct" bash disagg_1e1p1d_example.sh
+
+# Use specific storage path
+EC_SHARED_STORAGE_PATH="/tmp/my_ec_cache" bash disagg_1e1p1d_example.sh
+```
+
+## Encoder Instances
+
+Encoder engines should be launched with the following flags:
+
+- `--enforce-eager` **(required)** – The current EPD implementation is only compatible with encoder instances running in this mode.
+
+- `--no-enable-prefix-caching` **(required)** – Encoder instances do not consume KV cache; prefix caching is disabled to avoid conflicts with other features.
+
+- `--max-num-batched-tokens=<large value>` **(default: 2048)** – This flag controls the token scheduling budget per decoding step and is irrelevant to encoder-only instances. **Set it to a very high value (effectively unlimited) to bypass scheduler limitations.** The actual token budget is managed by the encoder cache manager.
+
+## Local media inputs
+
+To support local image inputs (from your ```MEDIA_PATH``` directory), add the following flag to the encoder instance:
+
+```bash
+--allowed-local-media-path $MEDIA_PATH
+```
+
+The vllm instances and `disagg_encoder_proxy` supports local URIs with ```{"url": "file://'"$MEDIA_PATH_FILENAME"'}``` as multimodal inputs. Each URI is passed unchanged from the `disagg_encoder_proxy` to the encoder instance so that the encoder can load the media locally.
+
+## EC connector and KV transfer
+
+The `ECSharedStorageConnector` is used to store the encoder cache on local disk and facilitate transfer. To enable the encoder disaggregation feature, add the following configuration:
+
+```bash
+# Add to encoder instance: 
+--ec-transfer-config '{
+    "ec_connector": "ECSharedStorageConnector",
+    "ec_role": "ec_producer",
+    "ec_connector_extra_config": {
+        "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+    }
+}' 
+
+# Add to prefill/prefill+decode instance: 
+--ec-transfer-config '{
+    "ec_connector": "ECSharedStorageConnector",
+    "ec_role": "ec_consumer",
+    "ec_connector_extra_config": {
+        "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+    }
+}' 
+```
+
+`$EC_SHARED_STORAGE_PATH` is the path where the EC connector temporarily stores the cache.
+
+If you enable prefill instance (`--prefill-servers-urls` not disabled), you will need --kv-transfer-config to facilitate the PD disaggregation. Currently, we use the `NixlConnector` for this purpose. Refer to `tests/v1/kv_connector/nixl_integration` for more example codes on PD disaggregation with Nixl.
+
+```bash
+# Add to prefill instance:    
+--kv-transfer-config '{
+    "kv_connector": "NixlConnector",
+    "kv_role": "kv_producer"
+}' 
+
+# Add to decode instance:
+--kv-transfer-config '{
+    "kv_connector": "NixlConnector",
+    "kv_role": "kv_consumer"
+}' 
+```
+
+## Proxy Instance Flags (`disagg_epd_proxy.py`)
+
+| Flag | Description |
+|------|-------------|
+| `--encode-servers-urls` | Comma-separated list of encoder endpoints. Every multimodal item extracted from the request is fanned out to one of these URLs in a round-robin fashion. |
+| `--prefill-servers-urls` | Comma-separated list of prefill endpoints. Set to `disable`, `none`, or `""` to skip the dedicated prefill phase and run E+PD (encoder + combined prefill/decode). |
+| `--decode-servers-urls` | Comma-separated list of decode endpoints. Non-stream and stream paths both round-robin over this list. |
+| `--host`, `--port` | Bind address for the proxy itself (defaults: `0.0.0.0:8000`). |
+
+Example usage:
+For E + PD setup:
+
+```bash
+$ python disagg_encoder_proxy.py \
+      --encode-servers-urls "http://e1:8001,http://e2:8002" \
+      --prefill-servers-urls "disable" \
+      --decode-servers-urls "http://pd1:8003,http://pd2:8004"
+```
+
+For E + P + D setup:
+
+```bash
+$ python disagg_encoder_proxy.py \
+      --encode-servers-urls "http://e1:8001,http://e2:8001" \
+      --prefill-servers-urls "http://p1:8003,http://p2:8004" \ 
+      --decode-servers-urls "http://d1:8005,http://d2:8006"
+```
diff --git a/examples/online_serving/disaggregated_encoder/disagg_1e1p1d_example.sh b/examples/online_serving/disaggregated_encoder/disagg_1e1p1d_example.sh
new file mode 100644
index 000000000000..57489df64f51
--- /dev/null
+++ b/examples/online_serving/disaggregated_encoder/disagg_1e1p1d_example.sh
@@ -0,0 +1,221 @@
+#!/bin/bash
+set -euo pipefail
+
+declare -a PIDS=()
+
+###############################################################################
+# Configuration -- override via env before running
+###############################################################################
+MODEL="${MODEL:-Qwen/Qwen2.5-VL-3B-Instruct}"
+LOG_PATH="${LOG_PATH:-./logs}"
+mkdir -p $LOG_PATH
+
+ENCODE_PORT="${ENCODE_PORT:-19534}"
+PREFILL_PORT="${PREFILL_PORT:-19535}"
+DECODE_PORT="${DECODE_PORT:-19536}"
+PROXY_PORT="${PROXY_PORT:-10001}"
+
+GPU_E="${GPU_E:-2}"
+GPU_P="${GPU_P:-2}"
+GPU_D="${GPU_D:-3}"
+
+EC_SHARED_STORAGE_PATH="${EC_SHARED_STORAGE_PATH:-/tmp/ec_cache}"
+TIMEOUT_SECONDS="${TIMEOUT_SECONDS:-12000}"   # wait_for_server timeout
+
+NUM_PROMPTS="${NUM_PROMPTS:-100}"    # number of prompts to send in benchmark
+
+export UCX_TLS=all
+export UCX_NET_DEVICES=all
+
+###############################################################################
+# Helpers
+###############################################################################
+# Find the git repository root directory
+GIT_ROOT=$(git rev-parse --show-toplevel)
+
+START_TIME=$(date +"%Y%m%d_%H%M%S")
+ENC_LOG=$LOG_PATH/encoder_${START_TIME}.log
+P_LOG=$LOG_PATH/p_${START_TIME}.log
+D_LOG=$LOG_PATH/d_${START_TIME}.log
+PROXY_LOG=$LOG_PATH/proxy_${START_TIME}.log
+
+wait_for_server() {
+    local port=$1
+    timeout "$TIMEOUT_SECONDS" bash -c "
+        until curl -s localhost:$port/v1/chat/completions > /dev/null; do
+            sleep 1
+        done" && return 0 || return 1
+}
+
+# Cleanup function
+cleanup() {
+    echo "Stopping everything…"
+    trap - INT TERM USR1   # prevent re-entrancy
+    
+    # Kill all tracked PIDs
+    for pid in "${PIDS[@]}"; do
+        if kill -0 "$pid" 2>/dev/null; then
+            echo "Killing process $pid"
+            kill "$pid" 2>/dev/null
+        fi
+    done
+    
+    # Wait a moment for graceful shutdown
+    sleep 2
+    
+    # Force kill any remaining processes
+    for pid in "${PIDS[@]}"; do
+        if kill -0 "$pid" 2>/dev/null; then
+            echo "Force killing process $pid"
+            kill -9 "$pid" 2>/dev/null
+        fi
+    done
+    
+    # Kill the entire process group as backup
+    kill -- -$$ 2>/dev/null
+    
+    echo "All processes stopped."
+    exit 0
+}
+
+trap cleanup INT
+trap cleanup USR1
+trap cleanup TERM
+
+# clear previous cache
+echo "remove previous ec cache folder"
+rm -rf $EC_SHARED_STORAGE_PATH
+
+echo "make ec cache folder"
+mkdir -p $EC_SHARED_STORAGE_PATH
+
+###############################################################################
+# Encoder worker
+###############################################################################
+CUDA_VISIBLE_DEVICES="$GPU_E" vllm serve "$MODEL" \
+    --gpu-memory-utilization 0.01 \
+    --port "$ENCODE_PORT" \
+    --enforce-eager \
+    --enable-request-id-headers \
+    --no-enable-prefix-caching \
+    --max-num-batched-tokens 114688 \
+    --max-num-seqs 128 \
+    --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+    --ec-transfer-config '{
+        "ec_connector": "ECSharedStorageConnector",
+        "ec_role": "ec_producer",
+        "ec_connector_extra_config": {
+            "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+        }
+    }' \
+    >"${ENC_LOG}" 2>&1 &
+
+PIDS+=($!)
+
+###############################################################################
+# Prefill worker
+###############################################################################
+CUDA_VISIBLE_DEVICES="$GPU_P" \
+UCX_NET_DEVICES=all \
+VLLM_NIXL_SIDE_CHANNEL_PORT=5559 \
+vllm serve "$MODEL" \
+    --gpu-memory-utilization 0.7 \
+    --port "$PREFILL_PORT" \
+    --enforce-eager \
+    --enable-request-id-headers \
+    --max-num-seqs 128 \
+    --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+    --ec-transfer-config '{
+        "ec_connector": "ECSharedStorageConnector",
+        "ec_role": "ec_consumer",
+        "ec_connector_extra_config": {
+            "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+        }
+    }' \
+    --kv-transfer-config '{
+        "kv_connector": "NixlConnector",
+        "kv_role": "kv_producer"
+    }' \
+    >"${P_LOG}" 2>&1 &
+
+PIDS+=($!)
+
+###############################################################################
+# Decode worker
+###############################################################################
+CUDA_VISIBLE_DEVICES="$GPU_D" \
+UCX_NET_DEVICES=all \
+VLLM_NIXL_SIDE_CHANNEL_PORT=6000 \
+vllm serve "$MODEL" \
+    --gpu-memory-utilization 0.7 \
+    --port "$DECODE_PORT" \
+    --enforce-eager \
+    --enable-request-id-headers \
+    --max-num-seqs 128 \
+    --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+    --kv-transfer-config '{
+        "kv_connector": "NixlConnector",
+        "kv_role": "kv_consumer"
+    }' \
+    >"${D_LOG}" 2>&1 &
+
+PIDS+=($!)
+
+# Wait for workers
+wait_for_server $ENCODE_PORT
+wait_for_server $PREFILL_PORT
+wait_for_server $DECODE_PORT
+
+###############################################################################
+# Proxy
+###############################################################################
+python disagg_epd_proxy.py \
+    --host "0.0.0.0" \
+    --port "$PROXY_PORT" \
+    --encode-servers-urls "http://localhost:$ENCODE_PORT" \
+    --prefill-servers-urls "http://localhost:$PREFILL_PORT" \
+    --decode-servers-urls "http://localhost:$DECODE_PORT" \
+    >"${PROXY_LOG}" 2>&1 &
+
+PIDS+=($!)
+
+wait_for_server $PROXY_PORT
+echo "All services are up!"
+
+###############################################################################
+# Benchmark
+###############################################################################
+echo "Running benchmark (stream)..."
+vllm bench serve \
+  --model               $MODEL \
+  --backend             openai-chat \
+  --endpoint            /v1/chat/completions \
+  --dataset-name        hf \
+  --dataset-path        lmarena-ai/VisionArena-Chat \
+  --seed                0 \
+  --num-prompts         $NUM_PROMPTS \
+  --port                $PROXY_PORT
+
+PIDS+=($!)
+
+###############################################################################
+# Single request with local image
+###############################################################################
+echo "Running single request with local image (non-stream)..."
+curl http://127.0.0.1:${PROXY_PORT}/v1/chat/completions \
+    -H "Content-Type: application/json" \
+    -d '{
+    "model": "'${MODEL}'",
+    "messages": [
+    {"role": "system", "content": "You are a helpful assistant."},
+    {"role": "user", "content": [
+        {"type": "image_url", "image_url": {"url": "file://'"${GIT_ROOT}"'/tests/v1/ec_connector/integration/hato.jpg"}},
+        {"type": "text", "text": "What is in this image?"}
+    ]}
+    ]
+    }'
+
+
+# cleanup
+echo "cleanup..."
+cleanup
\ No newline at end of file
diff --git a/examples/online_serving/disaggregated_encoder/disagg_1e1pd_example.sh b/examples/online_serving/disaggregated_encoder/disagg_1e1pd_example.sh
new file mode 100644
index 000000000000..6073e0580b11
--- /dev/null
+++ b/examples/online_serving/disaggregated_encoder/disagg_1e1pd_example.sh
@@ -0,0 +1,186 @@
+#!/bin/bash
+set -euo pipefail
+
+declare -a PIDS=()
+
+###############################################################################
+# Configuration -- override via env before running
+###############################################################################
+MODEL="${MODEL:-Qwen/Qwen2.5-VL-3B-Instruct}"
+LOG_PATH="${LOG_PATH:-./logs}"
+mkdir -p $LOG_PATH
+
+ENCODE_PORT="${ENCODE_PORT:-19534}"
+PREFILL_DECODE_PORT="${PREFILL_DECODE_PORT:-19535}"
+PROXY_PORT="${PROXY_PORT:-10001}"
+
+GPU_E="${GPU_E:-0}"
+GPU_PD="${GPU_PD:-1}"
+
+EC_SHARED_STORAGE_PATH="${EC_SHARED_STORAGE_PATH:-/tmp/ec_cache}"
+TIMEOUT_SECONDS="${TIMEOUT_SECONDS:-12000}"   # wait_for_server timeout
+
+NUM_PROMPTS="${NUM_PROMPTS:-100}"    # number of prompts to send in benchmark
+
+###############################################################################
+# Helpers
+###############################################################################
+# Find the git repository root directory
+GIT_ROOT=$(git rev-parse --show-toplevel)
+
+START_TIME=$(date +"%Y%m%d_%H%M%S")
+ENC_LOG=$LOG_PATH/encoder_${START_TIME}.log
+PD_LOG=$LOG_PATH/pd_${START_TIME}.log
+PROXY_LOG=$LOG_PATH/proxy_${START_TIME}.log
+
+wait_for_server() {
+    local port=$1
+    timeout "$TIMEOUT_SECONDS" bash -c "
+        until curl -s localhost:$port/v1/chat/completions > /dev/null; do
+            sleep 1
+        done" && return 0 || return 1
+}
+
+# Cleanup function
+cleanup() {
+    echo "Stopping everything…"
+    trap - INT TERM USR1   # prevent re-entrancy
+    
+    # Kill all tracked PIDs
+    for pid in "${PIDS[@]}"; do
+        if kill -0 "$pid" 2>/dev/null; then
+            echo "Killing process $pid"
+            kill "$pid" 2>/dev/null
+        fi
+    done
+    
+    # Wait a moment for graceful shutdown
+    sleep 2
+    
+    # Force kill any remaining processes
+    for pid in "${PIDS[@]}"; do
+        if kill -0 "$pid" 2>/dev/null; then
+            echo "Force killing process $pid"
+            kill -9 "$pid" 2>/dev/null
+        fi
+    done
+    
+    # Kill the entire process group as backup
+    kill -- -$$ 2>/dev/null
+    
+    echo "All processes stopped."
+    exit 0
+}
+
+trap cleanup INT
+trap cleanup USR1
+trap cleanup TERM
+
+# clear previous cache
+echo "remove previous ec cache folder"
+rm -rf $EC_SHARED_STORAGE_PATH
+
+echo "make ec cache folder"
+mkdir -p $EC_SHARED_STORAGE_PATH
+
+###############################################################################
+# Encoder worker
+###############################################################################
+CUDA_VISIBLE_DEVICES="$GPU_E" vllm serve "$MODEL" \
+    --gpu-memory-utilization 0.01 \
+    --port "$ENCODE_PORT" \
+    --enforce-eager \
+    --enable-request-id-headers \
+    --no-enable-prefix-caching \
+    --max-num-batched-tokens 114688 \
+    --max-num-seqs 128 \
+    --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+    --ec-transfer-config '{
+        "ec_connector": "ECSharedStorageConnector",
+        "ec_role": "ec_producer",
+        "ec_connector_extra_config": {
+            "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+        }
+    }' \
+    >"${ENC_LOG}" 2>&1 &
+
+PIDS+=($!)
+
+###############################################################################
+# Prefill+Decode worker
+###############################################################################
+CUDA_VISIBLE_DEVICES="$GPU_PD" vllm serve "$MODEL" \
+    --gpu-memory-utilization 0.7 \
+    --port "$PREFILL_DECODE_PORT" \
+    --enforce-eager \
+    --enable-request-id-headers \
+    --max-num-seqs 128 \
+    --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+    --ec-transfer-config '{
+        "ec_connector": "ECSharedStorageConnector",
+        "ec_role": "ec_consumer",
+        "ec_connector_extra_config": {
+            "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+        }
+    }' \
+    >"${PD_LOG}" 2>&1 &
+
+PIDS+=($!)
+
+# Wait for workers
+wait_for_server $ENCODE_PORT
+wait_for_server $PREFILL_DECODE_PORT
+
+###############################################################################
+# Proxy
+###############################################################################
+python disagg_epd_proxy.py \
+    --host "0.0.0.0" \
+    --port "$PROXY_PORT" \
+    --encode-servers-urls "http://localhost:$ENCODE_PORT" \
+    --prefill-servers-urls "disable" \
+    --decode-servers-urls "http://localhost:$PREFILL_DECODE_PORT" \
+    >"${PROXY_LOG}" 2>&1 &
+
+PIDS+=($!)
+
+wait_for_server $PROXY_PORT
+echo "All services are up!"
+
+###############################################################################
+# Benchmark
+###############################################################################
+echo "Running benchmark (stream)..."
+vllm bench serve \
+  --model               $MODEL \
+  --backend             openai-chat \
+  --endpoint            /v1/chat/completions \
+  --dataset-name        hf \
+  --dataset-path        lmarena-ai/VisionArena-Chat \
+  --seed                0 \
+  --num-prompts         $NUM_PROMPTS \
+  --port                $PROXY_PORT
+
+PIDS+=($!)
+
+###############################################################################
+# Single request with local image
+###############################################################################
+echo "Running single request with local image (non-stream)..."
+curl http://127.0.0.1:${PROXY_PORT}/v1/chat/completions \
+    -H "Content-Type: application/json" \
+    -d '{
+    "model": "'${MODEL}'",
+    "messages": [
+    {"role": "system", "content": "You are a helpful assistant."},
+    {"role": "user", "content": [
+        {"type": "image_url", "image_url": {"url": "file://'"${GIT_ROOT}"'/tests/v1/ec_connector/integration/hato.jpg"}},
+        {"type": "text", "text": "What is in this image?"}
+    ]}
+    ]
+    }'
+
+
+# cleanup
+echo "cleanup..."
+cleanup
\ No newline at end of file
diff --git a/examples/online_serving/disaggregated_encoder/disagg_epd_proxy.py b/examples/online_serving/disaggregated_encoder/disagg_epd_proxy.py
new file mode 100644
index 000000000000..b5f99683c2bf
--- /dev/null
+++ b/examples/online_serving/disaggregated_encoder/disagg_epd_proxy.py
@@ -0,0 +1,606 @@
+#!/usr/bin/env python3
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""
+disagg_encoder_proxy.py
+
+Proxy that routes OpenAI-compatible “/v1/chat/completions” requests to two
+clusters:
+  • encode  (multimodal feature extraction)
+  • decode  (language-model inference)
+
+For MM input we:
+    1. Extract *every* image/audio item.
+    2. Fire N concurrent requests to the encoder cluster
+       (one request per item, with **all text removed**).
+    3. Wait for all of them to succeed.
+    4. Forward the *original* request to a decode server.
+"""
+
+from __future__ import annotations
+
+import argparse
+import asyncio
+import logging
+import os
+import random
+import uuid
+from collections.abc import AsyncIterator
+
+import aiohttp
+import uvicorn
+from fastapi import FastAPI, HTTPException, Request
+from fastapi.responses import JSONResponse, StreamingResponse
+
+###############################################################################
+# FastAPI app & global state
+###############################################################################
+
+logging.basicConfig(
+    level=logging.DEBUG, format="%(asctime)s %(levelname)s: %(message)s"
+)
+logger = logging.getLogger("proxy")
+
+app = FastAPI()
+encode_session: aiohttp.ClientSession | None = None
+prefill_session: aiohttp.ClientSession | None = None
+decode_session: aiohttp.ClientSession | None = None
+
+###############################################################################
+# Utils
+###############################################################################
+
+
+MM_TYPES = {"image_url", "audio_url", "input_audio"}
+
+
+def extract_mm_items(request_data: dict) -> list[dict]:
+    """
+    Return *all* image/audio items that appear anywhere in `messages`.
+
+    Each returned dict looks like:
+        { "type": "image_url", "image_url": {...} }
+    """
+    items: list[dict] = []
+    for msg in request_data.get("messages", []):
+        content = msg.get("content")
+        if not isinstance(content, list):
+            continue
+
+        for item in content:
+            if item.get("type") in MM_TYPES:
+                items.append(item)
+    return items
+
+
+async def fanout_encoder_primer(
+    orig_request: dict,
+    e_urls: list[str],
+    req_id: str,
+) -> None:
+    """
+    1. Build one request *per MM item* with all text removed.
+    2. Send them concurrently to the encode cluster.
+    3. Raise if any of them fails.
+    """
+    logger.info("[%s] Processing multimodal items...", req_id)
+
+    mm_items = extract_mm_items(orig_request)
+    if not mm_items:
+        logger.info("[%s] No multimodal items, skipping encoder", req_id)
+        return  # nothing to do
+
+    logger.info("[%s] got %d multimodal items...", req_id, len(mm_items))
+
+    tasks = []
+
+    # Round-robin over encode servers to distribute load a bit
+    url_cycle = (e_urls[i % len(e_urls)] for i in range(len(mm_items)))
+
+    for idx, (item, target_url) in enumerate(zip(mm_items, url_cycle)):
+        # Derive a *child* request id:  <parent>:<index>:<random-short>
+        child_req_id = f"{req_id}:{idx}:{uuid.uuid4().hex[:6]}"
+        headers = {"x-request-id": child_req_id}
+
+        encoder_req = {
+            # You *may* need to keep additional fields
+            "model": orig_request.get("model"),
+            "messages": [
+                {"role": "user", "content": [item]},
+            ],
+            # Only need 1 token so the server actually runs the encoder path
+            "max_tokens": 1,
+            "stream": False,
+        }
+        tasks.append(
+            encode_session.post(
+                f"{target_url}/v1/chat/completions",
+                json=encoder_req,
+                headers=headers,
+            )
+        )
+
+    results = await asyncio.gather(*tasks, return_exceptions=True)
+
+    # Fail fast if any sub-request failed
+    for idx, r in enumerate(results):
+        if isinstance(r, Exception):
+            logger.error(
+                "[%s] Encoder request #%d raised exception: %s",
+                req_id,
+                idx,
+                r,
+                exc_info=r,
+            )
+            raise HTTPException(
+                status_code=502, detail=f"Encoder request failed: {str(r)}"
+            )
+        if r.status != 200:
+            try:
+                detail = await r.text()
+            except Exception:
+                detail = "<unable to read body>"
+            logger.error(
+                "[%s] Encoder request #%d returned status %s: %s",
+                req_id,
+                idx,
+                r.status,
+                detail,
+            )
+            raise HTTPException(
+                status_code=r.status,
+                detail=f"Encoder request failed: {detail}",
+            )
+
+    logger.info(
+        "[%s] All %d encoder requests completed successfully", req_id, len(mm_items)
+    )
+
+
+async def maybe_prefill(
+    req_data: dict,
+    p_url: str,
+    req_id: str,
+) -> dict:
+    """
+    - Do prefill-only task if p_url exist;
+    - Return modified request data with kv transfer params (for nixl connector)
+    - Else, skip and return the original request data for decode
+    """
+    if p_url:
+        logger.info("[%s] Processing through prefill: %s", req_id, p_url)
+
+        prefill_response = await process_prefill_stage(req_data, p_url, req_id)
+        # for nixl connector to facilitate kv transfer...
+        prefill_response_json = await prefill_response.json()
+        kv_transfer_params = prefill_response_json.get("kv_transfer_params", {})
+        if kv_transfer_params:
+            req_data["kv_transfer_params"] = kv_transfer_params
+
+        return req_data
+    else:
+        return req_data
+
+
+async def process_prefill_stage(
+    req_data: dict,
+    p_url: str,
+    req_id: str,
+) -> dict:
+    """Process request through Prefill stage and return kv_transfer_params"""
+    logger.info("[%s] Sending prefill request to: %s", req_id, p_url)
+
+    prefill_request = req_data.copy()
+    prefill_request["kv_transfer_params"] = {
+        "do_remote_decode": True,
+        "do_remote_prefill": False,
+        "remote_engine_id": None,
+        "remote_block_ids": None,
+        "remote_host": None,
+        "remote_port": None,
+    }
+    prefill_request["stream"] = False
+    prefill_request["max_tokens"] = 1
+    if "max_completion_tokens" in prefill_request:
+        prefill_request["max_completion_tokens"] = 1
+    if "stream_options" in prefill_request:
+        del prefill_request["stream_options"]
+
+    headers = {"x-request-id": req_id}
+    try:
+        prefill_response = await prefill_session.post(
+            f"{p_url}/v1/chat/completions", json=prefill_request, headers=headers
+        )
+        prefill_response.raise_for_status()
+
+        if prefill_response.status != 200:
+            error_text = await prefill_response.text()
+            logger.error(
+                "[%s] Prefill request failed with status %d: %s",
+                req_id,
+                prefill_response.status,
+                error_text,
+            )
+            raise HTTPException(
+                status_code=prefill_response.status,
+                detail={"error": "Prefill request failed", "message": error_text},
+            )
+        logger.info("[%s] Prefill request completed successfully", req_id)
+
+        return prefill_response
+
+    except Exception as e:
+        logger.error("Prefill processing failed: %s", str(e))
+        raise HTTPException(
+            status_code=500,
+            detail={"error": "Prefill processing error", "message": str(e)},
+        ) from e
+
+
+###############################################################################
+# Middleware for request/response logging
+###############################################################################
+
+
+@app.middleware("http")
+async def log_requests(request: Request, call_next):
+    """Middleware to log all incoming requests and responses"""
+    req_id = request.headers.get("x-request-id", str(uuid.uuid4()))
+
+    # Log incoming request
+    logger.info(
+        ">>> [%s] %s %s from %s",
+        req_id,
+        request.method,
+        request.url.path,
+        request.client.host if request.client else "unknown",
+    )
+
+    try:
+        # Process request
+        response = await call_next(request)
+
+        # Log response
+        logger.info(
+            "<<< [%s] %s %s completed with status %d",
+            req_id,
+            request.method,
+            request.url.path,
+            response.status_code,
+        )
+
+        return response
+    except Exception as e:
+        # Log errors
+        logger.exception(
+            "!!! [%s] %s %s failed with error: %s",
+            req_id,
+            request.method,
+            request.url.path,
+            str(e),
+        )
+        raise
+
+
+###############################################################################
+# FastAPI lifecycle
+###############################################################################
+
+
+@app.on_event("startup")
+async def on_startup() -> None:
+    global encode_session, prefill_session, decode_session
+    timeout = aiohttp.ClientTimeout(total=100_000)
+    connector = aiohttp.TCPConnector(limit=0, force_close=False)
+    encode_session = aiohttp.ClientSession(timeout=timeout, connector=connector)
+    if app.state.p_urls:
+        # only setup if prefill instance(s) exist
+        prefill_session = aiohttp.ClientSession(timeout=timeout, connector=connector)
+    decode_session = aiohttp.ClientSession(timeout=timeout, connector=connector)
+
+
+@app.on_event("shutdown")
+async def on_shutdown() -> None:
+    global encode_session, prefill_session, decode_session
+    if encode_session:
+        await encode_session.close()
+    if prefill_session:
+        await prefill_session.close()
+    if decode_session:
+        await decode_session.close()
+
+
+###############################################################################
+# Core forwarding
+###############################################################################
+
+
+async def forward_non_stream(
+    req_data: dict, req_id: str, e_urls: list[str], p_url: str, d_url: str
+) -> dict:
+    try:
+        # Step 1: Process through Encoder instance (if has MM input)
+        await fanout_encoder_primer(req_data, e_urls, req_id)
+
+        # Step 2: Process through Prefill instance
+        req_data = await maybe_prefill(req_data, p_url, req_id)
+
+        # Step 3: Process through Decode instance
+        logger.info("[%s] Forwarding to decode: %s", req_id, d_url)
+        headers = {"x-request-id": req_id}
+
+        # Non-streaming response
+        async with decode_session.post(
+            f"{d_url}/v1/chat/completions", json=req_data, headers=headers
+        ) as resp:
+            resp.raise_for_status()
+            return await resp.json()
+
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.exception("[%s] Error in forward_non_stream: %s", req_id, str(e))
+        raise HTTPException(status_code=500, detail=f"Proxy error: {str(e)}") from e
+
+
+async def forward_stream(
+    req_data: dict, req_id: str, e_urls: list[str], p_url: str, d_url: str
+) -> AsyncIterator[str]:
+    try:
+        # Step 1: Process through Encoder instance (if has MM input)
+        await fanout_encoder_primer(req_data, e_urls, req_id)
+
+        # Step 2: Process through Prefill instance
+        req_data = await maybe_prefill(req_data, p_url, req_id)
+
+        # Step 3: Process through Decode instance
+        logger.info("[%s] Starting streaming from decode: %s", req_id, d_url)
+        headers = {"x-request-id": req_id}
+
+        # Streaming response
+        async with decode_session.post(
+            f"{d_url}/v1/chat/completions",
+            json=req_data,
+            headers=headers,
+        ) as resp:
+            resp.raise_for_status()
+            async for chunk in resp.content.iter_chunked(1024):
+                if chunk:
+                    yield chunk.decode("utf-8", errors="ignore")
+
+        logger.info("[%s] Streaming completed", req_id)
+
+    except HTTPException:
+        logger.exception("[%s] HTTPException in forward_stream", req_id)
+        raise
+    except Exception as e:
+        logger.exception("[%s] Error in forward_stream: %s", req_id, str(e))
+        raise HTTPException(
+            status_code=500, detail=f"Proxy streaming error: {str(e)}"
+        ) from e
+
+
+###############################################################################
+# Public routes
+###############################################################################
+
+
+@app.post("/v1/chat/completions")
+async def chat_completions(request: Request):
+    try:
+        req_data = await request.json()
+        req_id = request.headers.get("x-request-id", str(uuid.uuid4()))
+
+        e_urls = app.state.e_urls  # we want the full list for fan-out
+        p_url = random.choice(app.state.p_urls) if app.state.p_urls else None
+        d_url = random.choice(app.state.d_urls)
+
+        is_streaming = req_data.get("stream", False)
+
+        if is_streaming:
+            return StreamingResponse(
+                forward_stream(req_data, req_id, e_urls, p_url, d_url),
+                media_type="text/event-stream",
+            )
+        result = await forward_non_stream(req_data, req_id, e_urls, p_url, d_url)
+        return JSONResponse(content=result)
+
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.exception("Error in chat_completions endpoint: %s", str(e))
+        raise HTTPException(
+            status_code=500, detail=f"Request processing error: {str(e)}"
+        ) from e
+
+
+@app.get("/v1/models")
+async def list_models():
+    async with decode_session.get(f"{app.state.d_urls[0]}/v1/models") as resp:
+        resp.raise_for_status()
+        return await resp.json()
+
+
+@app.get("/health")
+async def health_check():
+    async def healthy(urls):
+        if not urls:
+            return "empty"
+        for u in urls:
+            try:
+                async with encode_session.get(f"{u}/health") as resp:
+                    resp.raise_for_status()
+            except Exception:
+                return "unhealthy"
+        return "healthy"
+
+    e_status, p_status, d_status = await asyncio.gather(
+        healthy(app.state.e_urls), healthy(app.state.p_urls), healthy(app.state.d_urls)
+    )
+
+    overall_healthy = all(
+        status != "unhealthy" for status in (e_status, p_status, d_status)
+    )
+
+    status_code = 200 if overall_healthy else 503
+
+    return JSONResponse(
+        {
+            "proxy": "healthy",
+            "encode_cluster": e_status,
+            "prefill_cluster": p_status,
+            "decode_cluster": d_status,
+        },
+        status_code=status_code,
+    )
+
+
+###############################################################################
+# Simple profiler fan-out (unchanged except for sessions)
+###############################################################################
+
+
+async def _post_if_available(
+    session: aiohttp.ClientSession,
+    url: str,
+    payload: dict,
+    headers: dict,
+) -> dict | None:
+    """
+    POST `payload` to `url`.
+
+    Returns
+    -------
+    • The decoded JSON body on success (2xx)
+    • None if the endpoint does not exist (404)
+    • Raises for anything else.
+    """
+    try:
+        resp = await session.post(url, json=payload, headers=headers)
+        if resp.status == 404:  # profiling disabled on that server
+            logger.warning("Profiling endpoint missing on %s", url)
+            return None
+        resp.raise_for_status()
+        return await resp.json(content_type=None)
+    except aiohttp.ClientResponseError as exc:
+        # Pass 404 through the branch above, re-raise everything else
+        if exc.status == 404:
+            logger.warning("Profiling endpoint missing on %s", url)
+            return None
+        raise
+    except Exception:
+        # Network errors etc.: propagate
+        raise
+
+
+async def _profile_cmd(cmd: str, payload: dict, e_url: str, p_url: str, d_url: str):
+    """
+    Fire & forget to both clusters, tolerate 404.
+    """
+    headers = {"Authorization": f"Bearer {os.getenv('OPENAI_API_KEY', '')}"}
+
+    encode_task = _post_if_available(
+        encode_session, f"{e_url}/{cmd}_profile", payload, headers
+    )
+    prefill_task = (
+        _post_if_available(prefill_session, f"{p_url}/{cmd}_profile", payload, headers)
+        if p_url is not None
+        else asyncio.sleep(0)
+    )
+    decode_task = _post_if_available(
+        decode_session, f"{d_url}/{cmd}_profile", payload, headers
+    )
+
+    encode_res, prefill_res, decode_res = await asyncio.gather(
+        encode_task, prefill_task, decode_task
+    )
+
+    # If *all* clusters said “I don’t have that route”, surface an error
+    if encode_res is prefill_res is decode_res is None:
+        raise HTTPException(
+            status_code=503,
+            detail="Profiling endpoints are disabled on all clusters",
+        )
+
+    return {
+        "encode": encode_res,  # may be None
+        "prefill": prefill_res,  # may be None
+        "decode": decode_res,  # may be None
+    }
+
+
+@app.post("/start_profile")
+async def start_profile(request: Request):
+    body = await request.json()
+    # TODO: handle multi urls properly
+    e_url = random.choice(app.state.e_urls)
+    p_url = random.choice(app.state.p_urls) if app.state.p_urls else None
+    d_url = random.choice(app.state.d_urls)
+    return await _profile_cmd("start", body, e_url, p_url, d_url)
+
+
+@app.post("/stop_profile")
+async def stop_profile(request: Request):
+    body = await request.json()
+    # TODO: handle multi urls properly
+    e_url = random.choice(app.state.e_urls)
+    p_url = random.choice(app.state.p_urls) if app.state.p_urls else None
+    d_url = random.choice(app.state.d_urls)
+    return await _profile_cmd("stop", body, e_url, p_url, d_url)
+
+
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--host", default="0.0.0.0")
+    parser.add_argument("--port", type=int, default=8000)
+    parser.add_argument(
+        "--encode-servers-urls",
+        required=True,
+        help='Comma-separated encode URLs ("http://e1:8001,http://e2:8001")',
+    )
+    parser.add_argument(
+        "--prefill-servers-urls",
+        required=True,
+        help=(
+            'Comma-separated prefill URLs ("http://p1:8003,http://p2:8004") ',
+            'to enable E->P->D, set "disable" or "none" to enable E->PD',
+        ),
+    )
+    parser.add_argument(
+        "--decode-servers-urls",
+        required=True,
+        help='Comma-separated decode URLs ("http://d1:8005,http://d2:8006")',
+    )
+
+    args = parser.parse_args()
+    app.state.e_urls = [
+        u.strip() for u in args.encode_servers_urls.split(",") if u.strip()
+    ]
+    app.state.d_urls = [
+        u.strip() for u in args.decode_servers_urls.split(",") if u.strip()
+    ]
+    # handle prefill instances
+    if args.prefill_servers_urls.lower() in ("disable", "none", ""):
+        app.state.p_urls = []
+        logger.info(
+            "Disaggregated prefill phase explicitly disabled by user. Running E + PD..."
+        )
+    else:
+        app.state.p_urls = [
+            u.strip() for u in args.prefill_servers_urls.split(",") if u.strip()
+        ]
+        logger.info("Disaggregated prefill phase is enabled. Running E + P + D...")
+
+    logger.info("Proxy listening on %s:%s", args.host, args.port)
+    logger.info("Encode servers: %s", app.state.e_urls)
+    logger.info("Prefill instances %s", app.state.p_urls)
+    logger.info("Decode servers: %s", app.state.d_urls)
+
+    uvicorn.run(
+        app,
+        host=args.host,
+        port=args.port,
+        log_level="info",
+        loop="uvloop",
+        access_log=True,
+    )
diff --git a/tests/v1/core/test_scheduler.py b/tests/v1/core/test_scheduler.py
index 749cf7dc8397..d5b829e79b8f 100644
--- a/tests/v1/core/test_scheduler.py
+++ b/tests/v1/core/test_scheduler.py
@@ -8,6 +8,7 @@
 
 from vllm.config import (
     CacheConfig,
+    ECTransferConfig,
     KVTransferConfig,
     ModelConfig,
     SchedulerConfig,
@@ -20,6 +21,9 @@
     PlaceholderRange,
 )
 from vllm.sampling_params import SamplingParams, StructuredOutputsParams
+from vllm.utils.hashing import sha256
+from vllm.v1.core.encoder_cache_manager import EncoderCacheManager
+from vllm.v1.core.kv_cache_utils import get_request_block_hasher, init_none_hash
 from vllm.v1.core.sched.output import CachedRequestData, SchedulerOutput
 from vllm.v1.core.sched.scheduler import Scheduler
 from vllm.v1.kv_cache_interface import (
@@ -872,7 +876,10 @@ def _step_until_done(
         for _, num_scheduled_tokens in output.num_scheduled_tokens.items():
             # We should be in the decode phase now.
             assert num_scheduled_tokens == 1
-        assert len(output.kv_connector_metadata.requests) == 0
+        if scheduler.connector is not None:
+            assert len(output.kv_connector_metadata.requests) == 0
+        if scheduler.ec_connector is not None:
+            assert len(output.ec_connector_metadata.mm_datas) == 0
         ecos = scheduler.update_from_output(output, model_runner_output)[0]
         all_done = True
         for eco in ecos.outputs:
@@ -1066,7 +1073,10 @@ def test_external_prefix_cache_metrics():
     assert external_stats.preempted_requests == 0
 
 
-def test_kv_connector_unable_to_allocate():
+@pytest.mark.parametrize(
+    "use_ec_connector, ec_role", [(False, None), (True, "ec_consumer")]
+)
+def test_kv_connector_unable_to_allocate(use_ec_connector, ec_role):
     """
     Test whether scheduler with KVConnector is able to handle
     unable to allocate (run out of blocks in allocate_slots().
@@ -1080,6 +1090,9 @@ def test_kv_connector_unable_to_allocate():
         use_kv_connector=True,
         block_size=BLOCK_SIZE,
         num_blocks=NUM_BLOCKS,
+        # encoder connector should not affect test results
+        use_ec_connector=use_ec_connector,
+        ec_role=ec_role,
     )
     NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE * 2
     scheduler.connector.get_num_new_matched_tokens = Mock(name="method")
@@ -1148,7 +1161,10 @@ def test_kv_connector_unable_to_allocate():
     assert len(scheduler.waiting) == 0
 
 
-def test_kv_connector_handles_preemption():
+@pytest.mark.parametrize(
+    "use_ec_connector, ec_role", [(False, None), (True, "ec_consumer")]
+)
+def test_kv_connector_handles_preemption(use_ec_connector, ec_role):
     """
     Test whether scheduler with KVConnector is able to handle
     unable to allocate (run out of blocks in allocate_slots().
@@ -1163,6 +1179,9 @@ def test_kv_connector_handles_preemption():
         use_kv_connector=True,
         block_size=BLOCK_SIZE,
         num_blocks=NUM_BLOCKS,
+        # encoder connector should not affect test results
+        use_ec_connector=use_ec_connector,
+        ec_role=ec_role,
     )
 
     NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE
@@ -1379,6 +1398,8 @@ def create_scheduler_with_priority(
     block_size: int = 16,
     max_model_len: int | None = None,
     num_speculative_tokens: int | None = None,
+    use_ec_connector: bool = False,
+    ec_role: str | None = None,
 ) -> Scheduler:
     """Create scheduler with priority policy enabled.
 
@@ -1439,12 +1460,23 @@ def create_scheduler_with_priority(
             model="ngram", num_speculative_tokens=num_speculative_tokens
         )
 
+    ec_transfer_config = (
+        ECTransferConfig(
+            ec_connector="ECSharedStorageConnector",
+            ec_role=ec_role,
+            ec_connector_extra_config={"shared_storage_path": "/tmp/ec_test"},
+        )
+        if use_ec_connector
+        else None
+    )
+
     vllm_config = VllmConfig(
         scheduler_config=scheduler_config,
         model_config=model_config,
         cache_config=cache_config,
         kv_transfer_config=kv_transfer_config,
         speculative_config=speculative_config,
+        ec_transfer_config=ec_transfer_config,
     )
     kv_cache_config = KVCacheConfig(
         num_blocks=num_blocks,  # A large number of blocks to hold all requests
@@ -1465,16 +1497,23 @@ def create_scheduler_with_priority(
     )
 
 
+_none_hash_initialized = False
+
+
 def create_requests_with_priority(
     num_requests: int,
     priorities: list[int],
     arrival_times: list[float] | None = None,
     num_tokens: int = 10,
+    mm_hashes_list: list[list[str]] | None = None,
     mm_positions: list[list[PlaceholderRange]] | None = None,
     max_tokens: int = 16,
     stop_token_ids: list[int] | None = None,
     prompt_logprobs: int | None = None,
     starting_idx: int = 0,
+    same_prompt: bool = False,
+    block_size: int = 16,
+    req_ids: list[str] | None = None,
 ):
     """Create requests with specified priorities and arrival times."""
     assert len(priorities) == num_requests
@@ -1483,6 +1522,12 @@ def create_requests_with_priority(
     else:
         arrival_times = [float(i) for i in range(num_requests)]
 
+    global _none_hash_initialized
+    if not _none_hash_initialized:
+        init_none_hash(sha256)
+        _none_hash_initialized = True
+
+    block_hasher = get_request_block_hasher(block_size, sha256)
     sampling_params = SamplingParams(
         ignore_eos=False,
         max_tokens=max_tokens,
@@ -1490,29 +1535,70 @@ def create_requests_with_priority(
         prompt_logprobs=prompt_logprobs,
     )
     requests = []
+
+    if mm_hashes_list is not None:
+        # NOTE: allow manual input; some mm items can have the same identifier
+        # no. of mm_hashes and mm_positions for each request should be identical
+        assert mm_positions is not None, (
+            "mm_positions must be provided when mm_hashes_list is provided"
+        )
+        assert len(mm_hashes_list) == len(mm_positions) == num_requests
+        assert [len(h) for h in mm_hashes_list] == [len(p) for p in mm_positions]
+
+        # Since same identifier would imply they are identical encoder output
+        # Verify mm items with identical identifier are having mm_position.length
+        seen_hashes: dict[str, int] = {}
+
+    if req_ids:
+        assert len(req_ids) == num_requests
+    else:
+        req_ids = [f"{i + starting_idx}" for i in range(num_requests)]
+
     for i in range(num_requests):
         mm_features = []
-        if mm_positions is not None:
-            mm_position = mm_positions[i]
-            for j, position in enumerate(mm_position):
+
+        for j, position in enumerate(
+            mm_positions[i] if mm_positions is not None else []
+        ):
+            if mm_hashes_list is not None:
+                identifier = mm_hashes_list[i][j]
+
+                # Verify if position length is identical
+                position_length = position.length
+                if identifier in seen_hashes:
+                    assert seen_hashes[identifier] == position_length, (
+                        f"mm_hash '{identifier}' has inconsistent position lengths: "
+                        f"previously {seen_hashes[identifier]}, now {position_length} "
+                        f"at request {i}, position {j}"
+                    )
+                else:
+                    seen_hashes[identifier] = position_length
+            else:
+                # Unique dummy hash for each mm item
                 identifier = f"hash{i}_{j}"
-                mm_feature = MultiModalFeatureSpec(
-                    data=MultiModalKwargsItem.dummy("dummy_m"),
-                    mm_position=position,
-                    identifier=identifier,
-                    modality="image",
-                )
-                mm_features.append(mm_feature)
+            mm_feature = MultiModalFeatureSpec(
+                data=MultiModalKwargsItem.dummy("dummy_m"),
+                mm_position=position,
+                identifier=identifier,
+                modality="image",
+            )
+            mm_features.append(mm_feature)
 
+        prompt_token_ids = (
+            [starting_idx] * num_tokens
+            if same_prompt
+            else [i + starting_idx] * num_tokens
+        )
         request = Request(
-            request_id=f"{i + starting_idx}",
-            prompt_token_ids=[i + starting_idx] * num_tokens,
+            request_id=req_ids[i],
+            prompt_token_ids=prompt_token_ids,
             sampling_params=sampling_params,
             pooling_params=None,
             mm_features=mm_features if mm_features else None,
             eos_token_id=EOS_TOKEN_ID,
             arrival_time=arrival_times[i],
             priority=priorities[i],
+            block_hasher=block_hasher,
         )
         requests.append(request)
     return requests
@@ -1999,7 +2085,12 @@ def test_schedule_skip_tokenizer_init_structured_output_request():
     assert len(scheduler.waiting) == 1
 
 
-def test_priority_scheduling_preemption_and_resumption_when_out_of_kv():
+@pytest.mark.parametrize(
+    "use_ec_connector, ec_role", [(False, None), (True, "ec_consumer")]
+)
+def test_priority_scheduling_preemption_and_resumption_when_out_of_kv(
+    use_ec_connector, ec_role
+):
     """Test that priority scheduling preempts lower priority requests
     when out of KV cache space."""
     # Create scheduler with very limited memory to force preemption
@@ -2009,6 +2100,9 @@ def test_priority_scheduling_preemption_and_resumption_when_out_of_kv():
         num_blocks=5,  # Can hold 64 tokens (first block is null)
         block_size=16,  # Standard block size
         use_kv_connector=True,
+        # encoder connector should not affect test results
+        use_ec_connector=use_ec_connector,
+        ec_role=ec_role,
     )
 
     # Create a request and schedule it
@@ -2168,3 +2262,976 @@ def _validate_chunked_prefill_settings_for_encoder_decoder(
         assert scheduler_config.disable_chunked_mm_input is not expect_enabled
     if is_encoder_decoder and not expect_enabled:
         assert scheduler_config.long_prefill_token_threshold == 0
+
+
+# ==============================================================================
+# EPD (Encoder-Prefill-Decode) Encoder-cache-specific tests start
+# NOTE: In E->P->D disagg case, both KV and EC Connector works in P instance
+# Unless specify, the existence of KV Connector should not affect any test results
+# ==============================================================================
+
+
+def _assert_right_encoder_cache_allocated(
+    scheduler: Scheduler,
+    hashes_to_check: list[str] | None = None,
+    requests: list[Request] | None = None,
+    expected_total_allocated: int | None = None,
+):
+    """Check whether encoder cache is allocated correctly."""
+    encoder_cache_manager = scheduler.encoder_cache_manager
+
+    # Verify encoder cache manager exists
+    assert encoder_cache_manager is not None, "Encoder cache manager should exist"
+
+    # Verify number of cache
+    if expected_total_allocated is not None:
+        assert len(encoder_cache_manager.cached) == expected_total_allocated
+        if expected_total_allocated == 0:
+            return
+
+    # Verify each request with MM data is in cache
+    cached_hashes = set(encoder_cache_manager.cached.keys())
+
+    if hashes_to_check:
+        missed_hashes = set(hashes_to_check) - cached_hashes
+        assert not missed_hashes, (
+            f"Miss hashes: {missed_hashes} "
+            f"Existing encoder cache: {encoder_cache_manager.cached}"
+        )
+
+    for req in requests if requests is not None else []:
+        if req.mm_features:
+            mm_hashes = [f.identifier for f in req.mm_features]
+            req_hashes = set(mm_hashes)  # unique hashes set
+            missed_hashes = req_hashes - cached_hashes
+            assert not missed_hashes, (
+                f"Miss hashes in cache for request {req.request_id}: {missed_hashes} "
+                f"Existing encoder cache: {encoder_cache_manager.cached}"
+            )
+
+
+def _assert_right_ec_connector_metadata(
+    output: SchedulerOutput,
+    mm_features_list: list[MultiModalFeatureSpec],
+):
+    """Verify that ECConnector metadata EXACTLY matches the input MM data"""
+    # Get the connector metadata
+    metadata = output.ec_connector_metadata
+
+    # Create lookup dictionaries for efficient access
+    metadata_dict = {mm_data.mm_hash: mm_data for mm_data in metadata.mm_datas}
+
+    # Check all required identifiers exist in metadata; and no extra
+    # In ECSharedStorageConnector format
+    # NOTE: even having same identifier, the mm_features can be different
+    # since their mm_position can be in different offsets, etc
+    identifiers_dict = {f.identifier for f in mm_features_list}
+    assert set(metadata_dict.keys()) == identifiers_dict
+
+    # Verify the info matches
+    for i, mm_feature in enumerate(mm_features_list):
+        identifier = mm_feature.identifier
+        assert metadata_dict[identifier].mm_hash == identifier
+        assert metadata_dict[identifier].num_token == mm_feature.mm_position.length
+
+
+def _assert_right_encoder_inputs(
+    output: SchedulerOutput,
+    check_exist: bool | None = True,
+    requests: list[Request] | None = None,
+    expected_encoder_inputs: list[list[int]] | None = None,
+    expected_total_reqs: int | None = None,
+):
+    """Verify that requests/mm_hashes should (not) in scheduled encoder input
+    If check_exist is False, this function returns True
+    if requests are NOT in encoder inputs"""
+
+    # Get the scheduled encoder inputs
+    # NOTE: scheduled_encoder_inputs is a dictionary with request id as key
+    scheduled_encoder_inputs = output.scheduled_encoder_inputs
+
+    # Check if scheduled_encoder_inputs is empty as expected
+    if expected_total_reqs is not None:
+        assert len(scheduled_encoder_inputs) == expected_total_reqs
+        if expected_total_reqs == 0:
+            return
+
+    # Number of expected enocder inputs should match number of requests
+    if expected_encoder_inputs:
+        assert check_exist and requests is not None  # only support expect input exist
+        assert len(requests) == len(expected_encoder_inputs)
+
+    # Check request (not) exist as expected
+    for i, request in enumerate(requests if requests is not None else []):
+        assert (request.request_id in scheduled_encoder_inputs) is check_exist, (
+            f"Request {request.id} presence mismatch: expected {check_exist}, "
+            f"got {request.id in scheduled_encoder_inputs}"
+        )
+        if expected_encoder_inputs:
+            scheduled_encoder_input = scheduled_encoder_inputs[request.request_id]
+            assert scheduled_encoder_input == expected_encoder_inputs[i]
+
+
+def test_scheduler_no_ec_connector_by_default():
+    """Test scheduler doesn't have EC connector by default."""
+    scheduler = create_scheduler()
+    assert scheduler.ec_connector is None
+
+
+@pytest.mark.parametrize("use_kv_connector", [False, True])
+def test_ec_connector_text_only_request(use_kv_connector):
+    """Test text-only requests don't allocate encoder cache."""
+    scheduler = create_scheduler(
+        model="llava-hf/llava-1.5-7b-hf",
+        use_kv_connector=use_kv_connector,
+        use_ec_connector=True,
+        ec_role="ec_consumer",
+    )
+
+    NUM_PROMPT_TOKENS = 100
+
+    # Create text-only request (no mm_positions)
+    requests = create_requests(
+        num_requests=1,
+        num_tokens=NUM_PROMPT_TOKENS,
+    )
+    assert not requests[0].mm_features  # No MM data
+
+    scheduler.add_request(requests[0])
+    output = scheduler.schedule()
+
+    # Should schedule
+    assert len(output.scheduled_new_reqs) == 1
+
+    # Scheduled tokens should equal prompt tokens exactly
+    scheduled = output.num_scheduled_tokens[requests[0].request_id]
+    assert scheduled == NUM_PROMPT_TOKENS, (
+        f"Text-only should schedule {NUM_PROMPT_TOKENS}, got {scheduled}"
+    )
+
+    # Encoder cache should be empty
+    _assert_right_encoder_cache_allocated(scheduler, expected_total_allocated=0)
+
+    # ECConnector should carry no metadata
+    _assert_right_ec_connector_metadata(output, mm_features_list=[])
+
+    # Scheduled encoder input should be empty; no mm to compute
+    _assert_right_encoder_inputs(output, expected_total_reqs=0)
+
+
+@pytest.mark.parametrize("use_kv_connector", [False, True])
+def test_ec_connector_cache_hit_external_load(use_kv_connector):
+    """Test ec_consumer loads from external cache when hit.
+    A normal basic operation for EPD disaggrgation"""
+    scheduler = create_scheduler(
+        model="llava-hf/llava-1.5-7b-hf",
+        enable_prefix_caching=True,
+        # kv connector should not effect test results
+        use_kv_connector=use_kv_connector,
+        use_ec_connector=True,
+        ec_role="ec_consumer",
+    )
+
+    # Create MM request
+    NUM_TOKENS = 200  # NOTE: includes mm tokens
+    NUM_ENCODER_TOKENS = 100
+    mm_hashes_list = [["hash_test1"]]
+    mm_positions = [[PlaceholderRange(offset=0, length=NUM_ENCODER_TOKENS)]]
+
+    request = create_requests(
+        num_requests=1,
+        num_tokens=NUM_TOKENS,
+        mm_hashes_list=mm_hashes_list,
+        mm_positions=mm_positions,
+    )[0]
+
+    # Mock cache hit - encoder cache exists externally
+    scheduler.ec_connector.has_caches = Mock(return_value=[True])
+    scheduler.ec_connector.update_state_after_alloc = Mock(
+        wraps=scheduler.ec_connector.update_state_after_alloc
+    )
+
+    scheduler.add_request(request)
+    output = scheduler.schedule()
+
+    # Should schedule prompt tokens
+    scheduled_tokens = output.num_scheduled_tokens[request.request_id]
+    assert scheduled_tokens == NUM_TOKENS
+
+    # Should called update_state_after_alloc for external load
+    scheduler.ec_connector.update_state_after_alloc.assert_called_with(request, 0)
+
+    # Encoder cache should contain mm items from request
+    _assert_right_encoder_cache_allocated(scheduler, requests=[request])
+
+    # ECConnector should carry metadata of request
+    _assert_right_ec_connector_metadata(output, mm_features_list=request.mm_features)
+
+    # Scheduled encoder input should be empty; no mm to compute
+    _assert_right_encoder_inputs(output, expected_total_reqs=0)
+
+
+@pytest.mark.parametrize("use_kv_connector", [False, True])
+def test_ec_connector_cache_miss_computes_locally(use_kv_connector):
+    """Test consumer can compute encoder locally when cache miss (fallback)."""
+    # encoder cache itself if it doesn't receive it from external storage
+
+    scheduler = create_scheduler(
+        model="llava-hf/llava-1.5-7b-hf",
+        enable_prefix_caching=True,
+        use_kv_connector=use_kv_connector,
+        use_ec_connector=True,
+        ec_role="ec_consumer",
+    )
+
+    # Verify consumer role
+    assert scheduler.ec_connector is not None
+    assert not scheduler.ec_connector.is_producer
+
+    # Create MM request
+    request_mm_missed = create_requests(
+        num_requests=1,
+        num_tokens=200,  # Total (including 100 MM)
+        mm_positions=[[PlaceholderRange(offset=0, length=100)]],  # 100 MM tokens
+    )[0]
+
+    # Mock cache miss - encoder cache doesn't exist externally
+    scheduler.ec_connector.has_caches = Mock(return_value=[False])
+
+    scheduler.add_request(request_mm_missed)
+    output = scheduler.schedule()
+
+    # SCHEDULER should decide to compute encoder locally (fallback)
+    assert len(output.scheduled_new_reqs) == 1
+
+    # Should schedule full prompt tokens
+    scheduled_tokens = output.num_scheduled_tokens[request_mm_missed.request_id]
+    assert scheduled_tokens == 200, (
+        f"Expected 200 tokens on cache miss, got {scheduled_tokens}"
+    )
+
+    # Encoder cache should contain mm items from request
+    _assert_right_encoder_cache_allocated(scheduler, requests=[request_mm_missed])
+
+    # ECConnector should carry no metadata (missed cache)
+    _assert_right_ec_connector_metadata(output, mm_features_list=[])
+
+    # Scheduled encoder input contain mm for request_mm_missed
+    _assert_right_encoder_inputs(
+        output,
+        requests=[request_mm_missed],
+        expected_encoder_inputs=[[0]],  # index 0 of the mm item
+        expected_total_reqs=1,
+    )
+
+    # Then MODEL_RUNNER will execute the encoder and cache the result
+
+
+@pytest.mark.parametrize("use_kv_connector", [False, True])
+def test_ec_connector_with_partial_cache_hit_multi_round(use_kv_connector):
+    """Test consumer with partial cache hit (local & connector) with 2 requests."""
+    scheduler = create_scheduler(
+        model="llava-hf/llava-1.5-7b-hf",
+        enable_prefix_caching=True,
+        use_kv_connector=use_kv_connector,
+        use_ec_connector=True,
+        ec_role="ec_consumer",
+    )
+
+    # Create MM request
+    NUM_TOKENS_1 = 300  # NOTE: includes mm tokens
+    NUM_ENCODER_TOKENS_1 = 50
+    mm_hashes_list_1 = [["hash1_A", "hash1_B", "hash1_A", "hash1_F"]]
+    mm_positions_1 = [
+        [
+            PlaceholderRange(offset=0, length=NUM_ENCODER_TOKENS_1),
+            PlaceholderRange(offset=100, length=NUM_ENCODER_TOKENS_1),
+            PlaceholderRange(offset=200, length=NUM_ENCODER_TOKENS_1),
+            PlaceholderRange(offset=250, length=NUM_ENCODER_TOKENS_1),
+        ]
+    ]
+
+    # Create request with 4 MM items, with 2 identical items
+    request1 = create_requests(
+        num_requests=1,
+        num_tokens=NUM_TOKENS_1,
+        mm_hashes_list=mm_hashes_list_1,
+        mm_positions=mm_positions_1,
+        max_tokens=1,  # For simplicity
+    )[0]
+
+    # Mock partial cache hit: 1st and 3rd missing, 2nd and 4th exist
+    scheduler.ec_connector.has_caches = Mock(return_value=[False, True, False, True])
+    scheduler.ec_connector.update_state_after_alloc = Mock(
+        wraps=scheduler.ec_connector.update_state_after_alloc
+    )
+
+    scheduler.add_request(request1)
+    output = scheduler.schedule()
+
+    # Should schedule all tokens
+    scheduled_tokens = output.num_scheduled_tokens[request1.request_id]
+    assert scheduled_tokens == NUM_TOKENS_1
+
+    # Encoder cache should contain all mm items from request
+    _assert_right_encoder_cache_allocated(scheduler, requests=[request1])
+
+    # Should have called update_state_after_alloc for external load
+    scheduler.ec_connector.update_state_after_alloc.assert_called()
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # ECConnector should carry metadata for 2nd and 4th mm item
+    _assert_right_ec_connector_metadata(
+        output, mm_features_list=[request1.mm_features[1], request1.mm_features[3]]
+    )
+
+    # Should schedule ONLY 1 encoder input (index 0), no repeat for identical items
+    _assert_right_encoder_inputs(
+        output,
+        requests=[request1],
+        expected_encoder_inputs=[[0]],  # index 0 of the mm item ONLY
+        expected_total_reqs=1,
+    )
+
+    # Simulate model execution 1 step
+    model_output = ModelRunnerOutput(
+        req_ids=[request1.request_id],
+        req_id_to_index={request1.request_id: 0},
+        sampled_token_ids=[[100]],
+        # spec_token_ids=None,
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=[],
+    )
+    scheduler.update_from_output(output, model_output)
+
+    # request1 is finished after outputing 1 token
+    # Finish request
+    scheduler.finish_requests(request1.request_id, RequestStatus.FINISHED_LENGTH_CAPPED)
+
+    # Create another request with 4 MM items
+    NUM_TOKENS_2 = 400
+    NUM_ENCODER_TOKENS_2 = 50
+    mm_hashes_list_2 = [["hash1_C", "hash1_D", "hash1_E", "hash1_A"]]
+    mm_positions_2 = [
+        [
+            PlaceholderRange(offset=0, length=NUM_ENCODER_TOKENS_2),
+            PlaceholderRange(offset=100, length=NUM_ENCODER_TOKENS_2),
+            PlaceholderRange(offset=200, length=NUM_ENCODER_TOKENS_2),
+            PlaceholderRange(offset=250, length=NUM_ENCODER_TOKENS_2),
+        ]
+    ]
+
+    request2 = create_requests(
+        num_requests=1,
+        num_tokens=NUM_TOKENS_2,
+        mm_hashes_list=mm_hashes_list_2,
+        mm_positions=mm_positions_2,
+        max_tokens=1,  # For simplicity
+    )[0]
+
+    # Mock partial cache hit: only hash1_A and hash1_C exist in connector
+    scheduler.ec_connector.has_caches = Mock(return_value=[True, False, False, True])
+
+    scheduler.add_request(request2)
+    output = scheduler.schedule()
+
+    # Check
+    # Should schedule all tokens
+    scheduled_tokens = output.num_scheduled_tokens[request2.request_id]
+    assert scheduled_tokens == 400
+
+    # Encoder cache should contain all mm items from request2
+    _assert_right_encoder_cache_allocated(scheduler, requests=[request2])
+
+    # Should call update_state_after_alloc for hash1_C, ONLY
+    # hash1_A should not be loaded from connector
+    # since it's computed in last request & exist in local cache
+    # Order of getting encoder cache should be: local cache -> connector-> compute
+    scheduler.ec_connector.update_state_after_alloc.assert_called_with(request2, 0)
+    scheduler.ec_connector.update_state_after_alloc.assert_called_once()
+
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # ECConnector should carry metadata for hash1_C only (index 0)
+    _assert_right_ec_connector_metadata(
+        output, mm_features_list=[request2.mm_features[0]]
+    )
+
+    # Should schedule 2 encoder input hash1_D and hash1_E (index 1, 2)
+    _assert_right_encoder_inputs(
+        output,
+        requests=[request2],
+        expected_encoder_inputs=[[1, 2]],
+        expected_total_reqs=1,
+    )
+
+
+@pytest.mark.parametrize("cache_exist", ["local", "connector_only", "no_where"])
+@pytest.mark.parametrize("use_kv_connector", [False, True])
+def test_ec_connector_schedule_multiple_requests(cache_exist, use_kv_connector):
+    scheduler = create_scheduler(
+        model="llava-hf/llava-1.5-7b-hf",
+        max_num_seqs=10,  # allow multiple requests
+        max_num_batched_tokens=2048,
+        enable_prefix_caching=True,
+        use_kv_connector=use_kv_connector,
+        use_ec_connector=True,
+        ec_role="ec_consumer",
+    )
+    mm_hashes_list = [[f"hash_{i}"] for i in range(10)]
+    mm_positions = [[PlaceholderRange(offset=i, length=100)] for i in range(10)]
+    requests = create_requests(
+        num_requests=10,
+        num_tokens=200,
+        mm_hashes_list=mm_hashes_list,
+        mm_positions=mm_positions,
+    )
+    for request in requests:
+        scheduler.add_request(request)
+
+    # Set up to test different encoder cache exsistence scenario after preemption
+    # Order of getting encoder cache should be: local cache -> connector-> compute
+    scheduler.ec_connector.update_state_after_alloc = Mock(
+        wraps=scheduler.ec_connector.update_state_after_alloc
+    )
+
+    if cache_exist == "local":
+        # Allocate cache to cache manager manually to mimick
+        for req in requests:
+            scheduler.encoder_cache_manager.allocate(req, 0)
+    else:
+        # Make sure local encoder cache empty
+        scheduler.encoder_cache_manager.cached = {}
+
+    if cache_exist == "connector_only":
+        # Cache exist in ec_connector
+        scheduler.ec_connector.has_caches = Mock(return_value=[True])
+    elif cache_exist == "no_where":
+        scheduler.ec_connector.has_caches = Mock(return_value=[False])
+
+    output = scheduler.schedule()
+    assert len(output.scheduled_new_reqs) == len(requests)
+    assert output.scheduled_cached_reqs.num_reqs == 0
+    assert len(output.finished_req_ids) == 0
+    for req_id, num_tokens in output.num_scheduled_tokens.items():
+        assert num_tokens == len(requests[int(req_id)].prompt_token_ids)
+
+    ## Encoder-cache-specific checks:
+    # mm_hashes of requests exist in cache after scheduling for all scenario
+    _assert_right_encoder_cache_allocated(scheduler, requests=requests)
+
+    # Should only call update_state_after_alloc when loaded externally
+    if cache_exist == "connector_only":
+        scheduler.ec_connector.update_state_after_alloc.assert_called_with(
+            requests[-1], 0
+        )
+
+        # Concat mm_features for the 10 requests together
+        mm_features_list = [feature for req in requests for feature in req.mm_features]
+
+        # Check metadata should contain mm data for all 10 requests
+        _assert_right_ec_connector_metadata(output, mm_features_list=mm_features_list)
+    else:
+        scheduler.ec_connector.update_state_after_alloc.assert_not_called()
+        # ECConnector should carry no metadata
+        _assert_right_ec_connector_metadata(output, mm_features_list=[])
+
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # Should only schedule encoder input when cache is not found anywhere
+    if cache_exist == "no_where":
+        _assert_right_encoder_inputs(
+            output,
+            requests=requests,
+            expected_encoder_inputs=[[0] for _ in range(10)],
+            expected_total_reqs=10,
+        )
+    else:
+        _assert_right_encoder_inputs(output, expected_total_reqs=0)
+
+
+@pytest.mark.parametrize("use_kv_connector", [False, True])
+def test_ec_connector_unable_to_allocate(use_kv_connector):
+    """
+    Test whether scheduler with ECConnector is able to handle
+    unable to allocate (run out of blocks).
+    """
+
+    # Setup Scheduler With Mock External Cache Hit.
+    BLOCK_SIZE = 4
+    NUM_BLOCKS = 10
+    scheduler = create_scheduler(
+        model="llava-hf/llava-1.5-7b-hf",
+        enable_prefix_caching=True,
+        use_kv_connector=use_kv_connector,
+        block_size=BLOCK_SIZE,
+        num_blocks=NUM_BLOCKS,
+        use_ec_connector=True,
+        ec_role="ec_consumer",
+    )
+
+    # Mock ec_connector load external cache behavior
+    scheduler.ec_connector.has_caches = Mock(return_value=[True])
+    scheduler.ec_connector.update_state_after_alloc = Mock(
+        wraps=scheduler.ec_connector.update_state_after_alloc
+    )
+
+    # Create two requests. The second request will not be able to
+    # allocate slots because it will not have enough blocks.
+    NUM_REQUESTS = 2
+    NUM_TOKENS = (NUM_BLOCKS // 2 + 1) * BLOCK_SIZE
+    MAX_TOKENS = 2
+    requests = create_requests(
+        num_requests=NUM_REQUESTS,
+        num_tokens=NUM_TOKENS,
+        mm_hashes_list=[["hash_1"], ["hash_2"]],
+        mm_positions=[
+            [PlaceholderRange(offset=1, length=10)] for _ in range(NUM_REQUESTS)
+        ],
+        max_tokens=MAX_TOKENS,
+        block_size=BLOCK_SIZE,
+    )
+    req_ids = []
+    req_to_index = {}
+    for i, request in enumerate(requests):
+        scheduler.add_request(request)
+        req_ids.append(request.request_id)
+        req_to_index[request.request_id] = i
+
+    # Setup MODEL_RUNNER_OUTPUT to be run in _step_until_done later
+    MODEL_RUNNER_OUTPUT = ModelRunnerOutput(
+        req_ids=req_ids,
+        req_id_to_index=req_to_index,
+        sampled_token_ids=[[1000]] * len(req_ids),
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=[],
+    )
+
+    # Just one request should be running.
+    output = scheduler.schedule()
+    scheduled_tokens = output.num_scheduled_tokens[scheduler.running[0].request_id]
+    assert scheduled_tokens == NUM_TOKENS
+    assert len(scheduler.running) == 1
+    assert len(scheduler.waiting) == 1
+
+    # Should have called update_state_after_alloc for external load
+    scheduler.ec_connector.update_state_after_alloc.assert_called_with(
+        scheduler.running[0], 0
+    )
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # All memory should be freed, with one request waiting.
+    _step_until_done(scheduler, output, MODEL_RUNNER_OUTPUT)
+    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() == NUM_BLOCKS - 1
+    assert len(scheduler.running) == 0
+    assert len(scheduler.waiting) == 1
+
+    # Just one request should be running.
+    output = scheduler.schedule()
+    scheduled_tokens = output.num_scheduled_tokens[scheduler.running[0].request_id]
+    assert scheduled_tokens == NUM_TOKENS
+    assert len(scheduler.running) == 1
+    assert len(scheduler.waiting) == 0
+
+    # update_state_after_alloc should be called for loading external cache
+    scheduler.ec_connector.update_state_after_alloc.assert_called_with(
+        scheduler.running[0], 0
+    )
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # All memory should be freed, with no requests waiting / running.
+    _step_until_done(scheduler, output, MODEL_RUNNER_OUTPUT)
+    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() == NUM_BLOCKS - 1
+    assert len(scheduler.running) == 0
+    assert len(scheduler.waiting) == 0
+
+
+@pytest.mark.parametrize("cache_exist", ["local", "connector_only", "no_where"])
+@pytest.mark.parametrize("use_kv_connector", [False, True])
+def test_priority_scheduling_ec_connector_preemption_and_resumption(
+    cache_exist, use_kv_connector
+):
+    """Test that priority scheduling preempts lower priority requests
+    when out of KV cache space."""
+    # Create scheduler with very limited memory to force preemption
+    scheduler = create_scheduler_with_priority(
+        model="llava-hf/llava-1.5-7b-hf",
+        enable_prefix_caching=True,
+        max_num_seqs=2,  # allow multiple requests
+        # kv connector should not effect test results
+        use_kv_connector=use_kv_connector,
+        num_blocks=15,  # can hold 244 tokens with 14 blocks (first block is null)
+        block_size=16,  # standard block size
+        use_ec_connector=True,
+        ec_role="ec_consumer",
+    )
+
+    # Mock cache hit: Both cache exist in connector (at E->PD initially)
+    scheduler.ec_connector.has_caches = Mock(return_value=[True])
+    scheduler.ec_connector.update_state_after_alloc = Mock(
+        wraps=scheduler.ec_connector.update_state_after_alloc
+    )
+
+    # Create a request and schedule it (and to be preempted)
+    request_low = create_requests_with_priority(
+        num_requests=1,
+        priorities=[1],
+        arrival_times=[0.0],
+        num_tokens=94,
+        mm_hashes_list=[["hash_low"]],
+        # NOTE: this test only preempt the last block.
+        # Setting mm_position at the last block can force to recompute encoding
+        mm_positions=[[PlaceholderRange(offset=82, length=10)]],
+        starting_idx=0,
+    )[0]
+    scheduler.add_request(request_low)
+    # 1st schedule
+    output = scheduler.schedule()
+
+    assert len(output.scheduled_new_reqs) == 1
+    scheduled_tokens = output.num_scheduled_tokens[request_low.request_id]
+    assert scheduled_tokens == 94
+    assert len(scheduler.waiting) == 0
+    assert len(scheduler.running) == 1
+
+    ## Encoder-cache-specific checks:
+    # Encoder cache should contain mm items from request
+    _assert_right_encoder_cache_allocated(scheduler, requests=[request_low])
+
+    # Verify update_state_after_alloc called (external load)
+    scheduler.ec_connector.update_state_after_alloc.assert_called_with(request_low, 0)
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # ECConnector should carry metadata of request
+    _assert_right_ec_connector_metadata(
+        output, mm_features_list=request_low.mm_features
+    )
+
+    # Scheduled encoder input should be empty; no mm to compute
+    _assert_right_encoder_inputs(output, expected_total_reqs=0)
+
+    # Simulate model execution - 1st decode
+    model_output = ModelRunnerOutput(
+        req_ids=[request_low.request_id],
+        req_id_to_index={request_low.request_id: 0},
+        sampled_token_ids=[[100]],
+        # spec_token_ids=None,
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=[],
+    )
+    scheduler.update_from_output(output, model_output)
+
+    # Create a high priority request and schedule it
+    request_high = create_requests_with_priority(
+        num_requests=1,
+        priorities=[0],
+        arrival_times=[1.0],
+        num_tokens=128,
+        mm_hashes_list=[["hash_high"]],
+        mm_positions=[[PlaceholderRange(offset=1, length=10)]],
+        max_tokens=2,
+        starting_idx=1,
+    )[0]
+    scheduler.add_request(request_high)
+    # 2nd schedule
+    output = scheduler.schedule()
+
+    # KV cache should be full at this point
+    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() == 0
+    assert len(output.scheduled_new_reqs) == 1
+    assert output.scheduled_cached_reqs.num_reqs == 1
+    assert len(scheduler.waiting) == 0
+    assert len(scheduler.running) == 2
+
+    ## Encoder-cache-specific checks:
+    # Encoder cache should contain mm items from request
+    _assert_right_encoder_cache_allocated(scheduler, requests=[request_high])
+
+    # Verify update_state_after_alloc called (external load)
+    scheduler.ec_connector.update_state_after_alloc.assert_called_with(request_high, 0)
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # ECConnector should carry metadata of request
+    _assert_right_ec_connector_metadata(
+        output, mm_features_list=request_high.mm_features
+    )
+
+    # Scheduled encoder input should be empty; no mm to compute
+    _assert_right_encoder_inputs(output, expected_total_reqs=0)
+
+    # Simulate model execution - 2nd decode
+    requests = [request_low, request_high]
+    model_output = ModelRunnerOutput(
+        req_ids=[req.request_id for req in requests],
+        req_id_to_index={req.request_id: i for i, req in enumerate(requests)},
+        sampled_token_ids=[[100] for _ in requests],
+        # spec_token_ids=None,
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=[],
+    )
+    scheduler.update_from_output(output, model_output)
+
+    # 3rd schedule - - this should trigger preemption
+    # req_low needs 96 tokens = 6 blocks
+    # req_high needs 129 tokens = 9 blocks
+    # so doesn't fit in 14 blocks.
+    output = scheduler.schedule()
+
+    # Should have preempted req_low
+    assert len(output.scheduled_new_reqs) == 0
+    assert output.scheduled_cached_reqs.num_reqs == 1
+    assert output.scheduled_cached_reqs.req_ids[0] == request_high.request_id
+    assert scheduler.requests[request_low.request_id].status == RequestStatus.PREEMPTED
+    assert len(scheduler.waiting) == 1
+    assert len(scheduler.running) == 1
+
+    ## Encoder-cache-specific checks:
+    # request_high is in decode phase now
+    # ECConnector should carry no metadata
+    _assert_right_ec_connector_metadata(output, mm_features_list=[])
+
+    # Scheduled encoder input should be empty; no mm to compute
+    _assert_right_encoder_inputs(output, expected_total_reqs=0)
+
+    # Simulate model execution - 3rd decode, after req_low was preempted
+    requests = [request_low, request_high]
+    model_output = ModelRunnerOutput(
+        req_ids=[req.request_id for req in requests],
+        req_id_to_index={req.request_id: i for i, req in enumerate(requests)},
+        sampled_token_ids=[[100], [100, 200]],
+        # spec_token_ids=None,
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=[],
+    )
+    # Finish the requests to make room for the preempted requests to resume
+    # req_high is finished after outputing 2 tokens
+    scheduler.update_from_output(output, model_output)
+    scheduler.finish_requests(
+        request_high.request_id, RequestStatus.FINISHED_LENGTH_CAPPED
+    )
+
+    # Set up to test different encoder cache exsistence scenario after preemption
+    # Order of getting encoder cache should be: local cache -> connector-> compute
+    # By default, the cache should still exist in local in this test case
+    if cache_exist != "local":
+        # Make local encoder cache empty
+        scheduler.encoder_cache_manager.cached = {}
+
+    if cache_exist == "connector_only":
+        # Cache exist in ec_connector
+        scheduler.ec_connector.has_caches = Mock(return_value=[True])
+    elif cache_exist == "no_where":
+        scheduler.ec_connector.has_caches = Mock(return_value=[False])
+
+    # 4th Schedule - this should trigger req_low resumption from waiting
+    output = scheduler.schedule()
+    scheduled_cached_reqs = output.scheduled_cached_reqs
+    resumed_from_preemption = scheduled_cached_reqs.resumed_from_preemption
+
+    assert len(output.scheduled_new_reqs) == 0
+    assert scheduled_cached_reqs.num_reqs == 1
+    assert len(scheduler.waiting) == 0
+    assert len(scheduler.running) == 1
+
+    # Preempted request resumed in scheduled_cached_reqs
+    assert len(resumed_from_preemption) == 1
+    assert len(scheduled_cached_reqs.resumed_req_token_ids) == 1
+    assert resumed_from_preemption[0]
+    assert scheduled_cached_reqs.req_ids[0] == request_low.request_id
+    assert scheduled_cached_reqs.resumed_req_token_ids[0] is not None
+    ## Resumed tokens include 94 prompt tokens and 2 decoded tokens
+    assert len(scheduled_cached_reqs.resumed_req_token_ids[0]) == 96
+    assert scheduled_cached_reqs.resumed_req_token_ids[0][95] == 100
+    assert scheduler.running[0].request_id == request_low.request_id
+    assert request_high.request_id in output.finished_req_ids
+
+    ## Encoder-cache-specific checks:
+    # mm_hash of request_low exists in cache after scheduling for all scenario
+    _assert_right_encoder_cache_allocated(scheduler, requests=[request_low])
+
+    # Should only call update_state_after_alloc when loaded externally
+    if cache_exist == "connector_only":
+        scheduler.ec_connector.update_state_after_alloc.assert_called_with(
+            request_low, 0
+        )
+        _assert_right_ec_connector_metadata(
+            output, mm_features_list=request_low.mm_features
+        )
+    else:
+        scheduler.ec_connector.update_state_after_alloc.assert_not_called()
+        # ECConnector should carry no metadata
+        _assert_right_ec_connector_metadata(output, mm_features_list=[])
+
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # Should only schedule encoder input when cache is not found anywhere
+    if cache_exist == "no_where":
+        _assert_right_encoder_inputs(
+            output,
+            requests=[request_low],
+            expected_encoder_inputs=[[0]],
+            expected_total_reqs=1,
+        )
+    else:
+        _assert_right_encoder_inputs(output, expected_total_reqs=0)
+
+
+@pytest.mark.parametrize("use_kv_connector", [False, True])
+def test_ec_connector_allocate_encoder_tokens_with_external_load(use_kv_connector):
+    """
+    Scenario:
+      - Encoder cache size: 32
+      - Request A: 1 feature (12 tokens) → NOT cached remotely.
+      - Request B: 3 features (3 x 10 tokens) → ALL cached remotely.
+
+    Steps:
+      1. Schedule Request A (locally uses 12 tokens).
+      2. Schedule Request B (remote cache) - only schedule 1st and 2nd
+      3. Free A's cache, then schedule B again (continuation) - schedule 3rd image
+    """
+    scheduler = create_scheduler(
+        model="llava-hf/llava-1.5-7b-hf",
+        max_num_batched_tokens=1024,
+        enable_prefix_caching=True,
+        use_kv_connector=use_kv_connector,
+        block_size=16,
+        num_blocks=11,  # Can hold 160 tokens (first block is null)
+        use_ec_connector=True,
+        ec_role="ec_consumer",
+    )
+
+    # Limit the number of availiable slots of EncoderCacheManager
+    scheduler.encoder_cache_manager = EncoderCacheManager(cache_size=32)
+
+    # Create MM request1
+    NUM_TOKENS_1 = 50  # NOTE: includes mm tokens
+    NUM_ENCODER_TOKENS_1 = 12
+    mm_hashes_list_1 = [["hash1_1"]]
+    mm_positions_1 = [[PlaceholderRange(offset=0, length=NUM_ENCODER_TOKENS_1)]]
+
+    request1 = create_requests(
+        num_requests=1,
+        num_tokens=NUM_TOKENS_1,
+        mm_hashes_list=mm_hashes_list_1,
+        mm_positions=mm_positions_1,
+        max_tokens=1,  # For simplicity
+        req_ids=["req1"],
+    )[0]
+
+    # Create MM request1 with 3 MM items
+    NUM_TOKENS_2 = 40
+    NUM_ENCODER_TOKENS_2 = 10
+    mm_hashes_list_2 = [["hash2_1", "hash2_2", "hash2_3"]]
+    mm_positions_2 = [
+        [
+            PlaceholderRange(offset=0, length=NUM_ENCODER_TOKENS_2),
+            PlaceholderRange(offset=12, length=NUM_ENCODER_TOKENS_2),
+            PlaceholderRange(offset=24, length=NUM_ENCODER_TOKENS_2),
+        ]
+    ]
+
+    request2 = create_requests(
+        num_requests=1,
+        num_tokens=NUM_TOKENS_2,
+        mm_hashes_list=mm_hashes_list_2,
+        mm_positions=mm_positions_2,
+        max_tokens=10,
+        req_ids=["req2"],
+    )[0]
+
+    # Mock cache hit: MM of request1 NOT cached remotely, request2 cached remotely
+    scheduler.ec_connector.has_caches = Mock(
+        side_effect=lambda req: [True, True, True] if req == request2 else [False]
+    )
+    scheduler.ec_connector.update_state_after_alloc = Mock(
+        wraps=scheduler.ec_connector.update_state_after_alloc
+    )
+
+    scheduler.add_request(request1)
+    scheduler.add_request(request2)
+    output = scheduler.schedule()
+
+    # Now, since encoder cache manager can only store 32 tokens
+    # It should allocated mm item hash1_1, hash2_1 and hash2_2
+    scheduled_tokens = output.num_scheduled_tokens[request1.request_id]
+    assert scheduled_tokens == NUM_TOKENS_1
+    assert scheduler.get_num_unfinished_requests() == 2
+
+    # Encoder cache should contain mm item from request1
+    _assert_right_encoder_cache_allocated(
+        scheduler, hashes_to_check=["hash1_1", "hash2_1", "hash2_2"]
+    )
+
+    # request2's 2nd mm item is the last call of update_state_after_alloc
+    scheduler.ec_connector.update_state_after_alloc.assert_called_with(request2, 1)
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # ECConnector should carry metadata of hash2_1 and hash2_2 ONLY
+    _assert_right_ec_connector_metadata(
+        output, mm_features_list=[request2.mm_features[0], request2.mm_features[1]]
+    )
+
+    # Should schedule ONLY 1 encoder input
+    _assert_right_encoder_inputs(
+        output,
+        requests=[request1],
+        expected_encoder_inputs=[[0]],  # index 0 of the mm item of request1
+        expected_total_reqs=1,
+    )
+
+    # Simulate model execution 1 step
+    model_output = ModelRunnerOutput(
+        req_ids=[request1.request_id, request2.request_id],
+        req_id_to_index={request1.request_id: 0, request2.request_id: 1},
+        sampled_token_ids=[[100], [121]],
+        # spec_token_ids=None,
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=[],
+    )
+    scheduler.update_from_output(output, model_output)
+
+    # request1 is finished after outputing 1 token
+    # Finish request
+    scheduler.finish_requests(request1.request_id, RequestStatus.FINISHED_LENGTH_CAPPED)
+    assert scheduler.get_num_unfinished_requests() == 1
+
+    # Schedule again; Now request1's encoder cache should be freed
+    # -> hash2_3 can be scheduled and allocated
+    output = scheduler.schedule()
+
+    # Check
+    # Should schedule all tokens
+    scheduled_tokens = output.num_scheduled_tokens[request2.request_id]
+    print(f"Hero: scheduled_tokens for req2: {scheduled_tokens}")
+    print(f"hero: num_scheduled_tokens 2: {output.num_scheduled_tokens}")
+
+    # Encoder cache should contain all mm items from request2
+    _assert_right_encoder_cache_allocated(scheduler, requests=[request2])
+
+    # request2's 3rd mm item is the ONLY call of update_state_after_alloc
+    scheduler.ec_connector.update_state_after_alloc.assert_called_with(request2, 2)
+    scheduler.ec_connector.update_state_after_alloc.assert_called_once()
+
+    scheduler.ec_connector.update_state_after_alloc.reset_mock()
+
+    # ECConnector should carry metadata for hash2_3 ONLY
+    _assert_right_ec_connector_metadata(
+        output, mm_features_list=[request2.mm_features[2]]
+    )
+
+    # Should schedule no encoder input
+    _assert_right_encoder_inputs(
+        output,
+        expected_total_reqs=0,
+    )
+
+
+# ==============================================================================
+# EPD (Encoder-Prefill-Decode) Encoder-cache-specific tests end
+# ==============================================================================
diff --git a/tests/v1/core/utils.py b/tests/v1/core/utils.py
index 6e739d6b0e77..3692e633322e 100644
--- a/tests/v1/core/utils.py
+++ b/tests/v1/core/utils.py
@@ -5,6 +5,7 @@
 
 from vllm.config import (
     CacheConfig,
+    ECTransferConfig,
     KVTransferConfig,
     ModelConfig,
     SchedulerConfig,
@@ -46,6 +47,8 @@ def create_scheduler(
     num_speculative_tokens: int | None = None,
     skip_tokenizer_init: bool = False,
     async_scheduling: bool = False,
+    use_ec_connector: bool = False,
+    ec_role: str | None = None,
 ) -> Scheduler | AsyncScheduler:
     """Create scheduler under test.
 
@@ -107,12 +110,23 @@ def create_scheduler(
             model="ngram", num_speculative_tokens=num_speculative_tokens
         )
 
+    ec_transfer_config = (
+        ECTransferConfig(
+            ec_connector="ECSharedStorageConnector",
+            ec_role=ec_role,
+            ec_connector_extra_config={"shared_storage_path": "/tmp/ec_test"},
+        )
+        if use_ec_connector
+        else None
+    )
+
     vllm_config = VllmConfig(
         scheduler_config=scheduler_config,
         model_config=model_config,
         cache_config=cache_config,
         kv_transfer_config=kv_transfer_config,
         speculative_config=speculative_config,
+        ec_transfer_config=ec_transfer_config,
     )
     kv_cache_config = KVCacheConfig(
         num_blocks=num_blocks,  # A large number of blocks to hold all requests
@@ -140,12 +154,14 @@ def create_scheduler(
 def create_requests(
     num_requests: int,
     num_tokens: int = 10,
+    mm_hashes_list: list[list[str]] | None = None,
     mm_positions: list[list[PlaceholderRange]] | None = None,
     max_tokens: int = 16,
     stop_token_ids: list[int] | None = None,
     prompt_logprobs: int | None = None,
     same_prompt: bool = False,
     block_size: int = 16,
+    req_ids: list[str] | None = None,
 ) -> list[Request]:
     global _none_hash_initialized
     if not _none_hash_initialized:
@@ -160,25 +176,58 @@ def create_requests(
         prompt_logprobs=prompt_logprobs,
     )
     requests = []
+
+    if mm_hashes_list is not None:
+        # NOTE: allow manual input; some mm items can have the same identifier
+        # no. of mm_hashes and mm_positions for each request should be identical
+        assert mm_positions is not None, (
+            "mm_positions must be provided when mm_hashes_list is provided"
+        )
+        assert len(mm_hashes_list) == len(mm_positions) == num_requests
+        assert [len(h) for h in mm_hashes_list] == [len(p) for p in mm_positions]
+
+        # Since same identifier would imply they are identical encoder output
+        # Verify mm items with identical identifier are having mm_position.length
+        seen_hashes: dict[str, int] = {}
+
+    if req_ids:
+        assert len(req_ids) == num_requests
+    else:
+        req_ids = [f"{i}" for i in range(num_requests)]
+
     for i in range(num_requests):
         mm_features = []
-        if mm_positions is not None:
-            mm_position = mm_positions[i]
-            for j, position in enumerate(mm_position):
-                # Dummy hash for each mm item should be unique
-                # since encoder cache tracks entries by hash
+
+        for j, position in enumerate(
+            mm_positions[i] if mm_positions is not None else []
+        ):
+            if mm_hashes_list is not None:
+                identifier = mm_hashes_list[i][j]
+
+                # Verify if position length is identical
+                position_length = position.length
+                if identifier in seen_hashes:
+                    assert seen_hashes[identifier] == position_length, (
+                        f"mm_hash '{identifier}' has inconsistent position lengths: "
+                        f"previously {seen_hashes[identifier]}, now {position_length} "
+                        f"at request {i}, position {j}"
+                    )
+                else:
+                    seen_hashes[identifier] = position_length
+            else:
+                # Unique dummy hash for each mm item
                 identifier = f"hash{i}_{j}"
-                mm_feature = MultiModalFeatureSpec(
-                    data=MultiModalKwargsItem.dummy("dummy_m"),
-                    mm_position=position,
-                    identifier=identifier,
-                    modality="image",
-                )
-                mm_features.append(mm_feature)
+            mm_feature = MultiModalFeatureSpec(
+                data=MultiModalKwargsItem.dummy("dummy_m"),
+                mm_position=position,
+                identifier=identifier,
+                modality="image",
+            )
+            mm_features.append(mm_feature)
 
         prompt_token_ids = [0] * num_tokens if same_prompt else [i] * num_tokens
         request = Request(
-            request_id=f"{i}",
+            request_id=req_ids[i],
             prompt_token_ids=prompt_token_ids,
             sampling_params=sampling_params,
             pooling_params=None,
diff --git a/tests/v1/ec_connector/integration/README.md b/tests/v1/ec_connector/integration/README.md
new file mode 100644
index 000000000000..30426e055ade
--- /dev/null
+++ b/tests/v1/ec_connector/integration/README.md
@@ -0,0 +1,171 @@
+# EPD Correctness Test
+
+This test verifies that EPD (Encoder-Prefill-Decode) disaggregation produces identical outputs to a baseline single instance.
+
+## What It Tests
+
+- **Baseline**: Single vLLM instance serving a multimodal model
+- **EPD (1E+1PD)**: 1 Encoder + 1 Prefill-Decode instance
+- **Baseline (1P+1D)**: 1 Prefill + 1 Decode instance
+- **EPD (1E+1P+1D)**: 1 Encoder + 1 Prefill + 1 Decode instance
+
+The test ensures that disaggregated encoding produces **identical** outputs to the baseline.
+
+Note that currently PD disaggregation set up may give slightly different results from a single instance. Therefore, we need the result from 1P+1D as the baseline for 1E+1P+1D
+
+Please refer to [Disaggregated Encoder Feature](../../../docs/features/disagg_encoder.md) for the detailed explanation for the EPD features.
+
+## Files
+
+- `run_epd_correctness_test.sh` - Main test script (starts all instances and runs tests)
+- `test_epd_correctness.py` - Python test script (compares outputs)
+
+## Usage
+
+### Multimodal Prompts (Default)
+
+```bash
+cd vllm
+./tests/v1/ec_connector/integration/run_epd_correctness_test.sh
+```
+
+This runs the test with actual multimodal (image) prompts.
+
+### Text-Only Prompts
+
+```bash
+cd vllm
+USE_MM_PROMPTS=0 ./tests/v1/ec_connector/integration/run_epd_correctness_test.sh
+```
+
+This runs a quick test with text-only prompts to verify the setup works.
+
+### Custom Configuration
+
+```bash
+# Use specific GPUs
+GPU_E=0 GPU_PD=1 GPU_P=1 GPU_D=2 bash ./tests/v1/ec_connector/integration/run_epd_correctness_test.sh
+
+# Use specific ports
+ENDPOINT_PORT=10001 bash ./tests/v1/ec_connector/integration/run_epd_correctness_test.sh
+
+# Use specific model
+MODEL="Qwen/Qwen2.5-VL-3B-Instruct" bash ./tests/v1/ec_connector/integration/run_epd_correctness_test.sh
+
+# Use specific storage path
+EC_SHARED_STORAGE_PATH="/tmp/my_ec_cache" bash ./tests/v1/ec_connector/integration/run_epd_correctness_test.sh
+```
+
+## How It Works
+
+### Step 1: Baseline
+
+1. Start single vLLM instance on GPU
+2. Run test prompts (multimodal or text-only)
+3. Save outputs to `.vllm_epd_baseline.txt`
+4. Shutdown instance
+
+### Step 2: EPD (1E + 1PD)
+
+1. Clear encoder cache storage
+2. Start instances and proxy
+3. Run same test prompts
+4. Assert outputs match baseline exactly
+5. Shutdown instances
+
+### Step 3: EPD (1E + 1P + 1D)
+
+1. Clear encoder cache storage
+2. Start instances and proxy
+3. Run same test prompts
+4. Assert outputs match baseline exactly
+5. Shutdown instances
+
+## Test Scenarios
+
+### Multimodal Prompts (--use_mm_prompts)
+
+Tests encoder cache transfer:
+
+- Single image query
+- Multiple images in one request
+- Mixed image and text
+- Image with detailed questions
+
+### Text-Only Prompts (default)
+
+Quick sanity check:
+
+- Simple text queries
+- Text-only explanations
+- Verifies proxy routing works
+
+## Expected Behavior
+
+### ✅ Test Passes When
+
+- All disagg outputs match baseline outputs exactly
+- No errors during instance startup
+- Encoder cache is properly saved and loaded
+- Proxy correctly routes requests
+
+### ❌ Test Fails When
+
+- Outputs differ between baseline and disagg
+- Server startup fails
+- Encoder cache not found (should fallback to local execution)
+- Proxy routing errors
+
+## Notes
+
+- The test uses deterministic generation (`temperature=0.0`, `seed=42`)
+- Encoder cache should enable exact output reproduction
+- Test cleans up all instances and cache files after completion
+- Safe to run multiple times (idempotent)
+- We setup the PD disagg part with NixlConnector. Please read details about EPD in `examples/online_serving/disaggregated_encoder/README.md`
+
+## Requirements
+
+- Multiple GPUs (3 for 1E+1P+1D, 2 for 1E+1PD, 1 for baseline)
+    - 1E+1P+1D is runnable with 2 GPU by assign E and P on the same GPU now.
+- Multimodal model (e.g., Qwen2.5-VL-3B-Instruct)
+- Internet access (for accessing vllm test images)
+
+## Debugging
+
+### Check Logs
+
+Logs and baseline output are saved in `/tmp/` by default.
+Can be customized by changing the environment variables.
+
+### Check Encoder Cache
+
+```bash
+# Verify cache files are created
+ls -la $EC_SHARED_STORAGE_PATH/
+
+# Should see directories with mm_hash names
+# Each containing encoder_cache.safetensors
+```
+
+### Manual Testing
+
+Run individual components:
+
+```bash
+# Baseline only
+python test_epd_correctness.py \
+    --service_url http://localhost:8000 \
+    --model_name Qwen/Qwen2.5-VL-3B-Instruct \
+    --mode baseline \
+    --baseline_file test_output.txt \
+    --use_mm_prompts
+
+# Disagg only (requires baseline output file!)
+python test_epd_correctness.py \
+    --service_url http://localhost:8000 \
+    --model_name Qwen/Qwen2.5-VL-3B-Instruct \
+    --mode disagg \
+    --baseline_file test_output.txt \
+    --use_mm_prompts
+```
diff --git a/tests/v1/ec_connector/integration/hato.jpg b/tests/v1/ec_connector/integration/hato.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..9c7e390e7d7f68824cfa198d8ceb57f9174a1137
GIT binary patch
literal 841034
zcmb4qWl&q+7j19}?hu^d?ogz-OL2E8l;BnhrML!3NT9`vI}}p9KPZG^p}1Rdmr~kd
zh4%6P@aBDf>&~1nXU<-G?#$Wep0(HgxAbolK%u9ls|CQq0syccAHcs=fI0vV2NxF?
z2k&vf!^6WTAR#1p1UV2$L_$eUMMX(YNl8t|OixY2L`zA@z`?-8!otSJMorHN=41sk
zv$C=NF9_D-QUZJeGD1Q!RvJng*8gw(>jO{{5&}qwaj-Z6*pyf}lvw}109YRL#KU?7
z;Qs;_3mXRyA3#7z^f;|U0l>ofAFy%p{x<^1u>jaOxRe}tRO0xmCe)lRfw2TM5-=_`
z)6y1N$$qfwG@bfZ(8UjKDYH02dN;U6nRGl#<}nfo3xM-Kp8rSm$OFKAd>xOI;*<dF
z{|B5$3IG;1B@PFbIIb$S2_C0}3r*l7MJzro4BR4Fdhu@sK!Wp_2_+6C;3?pD>Jm;9
zfdD%p=a;N9RPo!5M53zDe&R10m7;Cev_3kHI$f%!U;KRp^{huw2P5g*<S{M`6BHNi
z<Ag~8R@A3w2H^yIqSFB#>)~$@q;3caYdncGm1g3*E&u^Byr*y7$wE8S!iMy`KBL7m
zM>3R?EAr<r3nb02-3_0omra7DEpisYLs7KLpz<_t9^#cJ&lP^P|HY?#Hf?t0=2zx!
z`PbwhfUn!dRjf#c>rf)kIQ~w1-q!T!0-)5PHWO~yy0nv6fF&daYX!>w;VMm#Sw{r^
zz+@|4l;%>xtIR;&32h}J!BKoWB0)TI_a6wx?jaJaneyFKq<z<#E$8jTZq@*uZEY-l
z^0eki#$Jso?EpQ?0)%u$II;D>D&{O<V~UTvm-rw?Ej{wTrj0!Z-AMX$jv6RkL84}@
z3h6~FRVPJV8&&|MJSW~<3NpIz1xtpIgOL}@Vcx83cT1a==bP1NwEhorp~jC@)Mc3w
zPB^-Xc*YhV?!cKRh7EoFz-Cd8{k!ii=gP!C|8pADlNV?RSE7gcn3_N7TW0F>02Q7z
zu)eppk^cDGw(&{F3X!b(r83DT*z;{vGbLK*?T!z;%0okhF@VVSP`5L{QH!DT>5}&w
z4XTz5m+rE8oBt@LEGyAP17HEn%?^7~)4KzU3d1i0##rRz(<=t*3qCr#W%acyY|9dv
z)Bl0ixJYujP5wK&;c~-b7kt%Kn#pOHn5&#;0TK6D;1f2p56KYr$$N7vRm-S;>R30w
zN$;bH`FW<-GZ83EfDE-Ao_`vM!F~ZS?gV5?6))YNXo3vjz5BOTPaH^^05OKMwTDZ?
zu~~HsharY987!k5Ve-2k_O=ES%&gSBvqfy|>B7HggeiZ7(3Msb#JhMfkEPKw7d$VX
zQ`-!npho}hteGJTsNb8(IP3T$!e_Ks-X_V7OTOV-EwGTAtM54IXyP?E6J20mpYkhd
zXth&hm{E!=zgxVG=G-SJ{+GyUdZRLGr0kP6x5XeK&#q0dph1LGwy=^|+iX>u3~Eus
z_|%WMG5UyA>-TgzS5QTeo@_gj8IF6jVwu;G44V&aA}O^!RsdQ?TNMcKqIXOv(tfU3
zZL1Lyq|B3^IdUUd6$T23rU=luOU8k`w30H1rZ{Z!)r_?pogNlmw}0mqRGPc&mMaAC
z9=0WW`z@qD&|213-;IOY2QU?C`P%Wn4X7;)exlB}-RnYzhezZccN&i<fXgMtC%{JU
zPvI2!Q$3%_zv>36=3Yh2A^s41Rg2J}x;|71WkW?ODn;ahOSi`|oEb>N^59PYD@&Ru
z25`zVLDg#S*xg9W4>~ih&fWnn_R8A3=9Gp0W$9|u`a0a7El{(YNpt`R)!6MzCUteq
zmNx>qpPzk9ar^K~aIjeSR^kZ<vB<G!mNzJ_UOd(P3LX@bc=`3@Kww8FZ6;2e`0bB-
zzXCSna*G*Tm#`@&W8hScR0lqeA11z{5&~fzddO{AiI0a2on2U!^11DVLS7zWPZE>`
zXC){u3MnoN{nQ2bZtHUEa*48FjM>nc+7R8z)S|g$UR0CIwTJDCvi>n8aD{G`;QLF~
zCxcUglQ4hW4E&9Cid%=))vN?OoDNvfhngBYNzFxQwP1xKk``-1)Yh@6B<j20eqm*n
zdKa#&pmu57FZNe3sttD0@E>o>_97@pcV(SwtB=N+<OZCYqsM})q_bOrSROG-7TT(Y
zUE>k#f$b-PjnM+fru3>+vogx7>yxLwY0=RnK&TOIl0W47N@r&E$8Y`Pp{MVn256nk
zkAJ>uYHSST{g^`h4`BS<#!QUi<V9H4USKyu@o4e|S=`OAW#np|8v~wFPRjst_sP>|
zCo~f{&nk*`gH9a0IFDc5rAy?e48Pfbb>wK^Q|$_Rb*7aM=hYSL0|@2T&xO)nC&kgX
zC4)xxo)9zjs7*FR7X4UuJi0S@7VC-i)1xwr$8nwgXA{&-$`(`FwV8fvUZgtxAxb1{
z^@EFtlrJ-%U~ReBrxiKNB<6r$MlVe5l%F0qf~Q{mO~q^46<*xhudOj_fu*c+X*NVA
zYTs-y&pl{@GkjB7=L-%eKFmoS=YF{&Vj>TKd02m2NR@l4J%gBMLVC!tx3g<|6dkXF
zdy(Jk-gd6s2Gy3Fyy&XMA87}L*-X?g{MPHV-!SdV#NNMr%8}~L`D5sz*kyhW(J;qN
zva(I?p<=(3^b|EaS-N0haKud5)x}M2G7CrXg5-zBGQ~%weTjHKO5EiYED2z`GDfXv
zLs05rxw`^PL%P91MVcD)&RN-cj+>Rg0rY$1+ylLSZx7CZVV?TZnn@HWbE*goBx^mA
zgwKAF65}<zN_xjxTex=N7ZZ8ShE&pFN6=(74_TP2)0X+fE{oPqx{KCDHc`3PRe0)M
zZGe%$)0qkh;2R`pq*Ggq4ftu}yfUf;Ad(O~!XO~Qywk5;j;plUeUjiYjHR4gG$D^?
zJwWJnTFQSOvqVr~E9!w8|CxBftIwafyRHw!n>j^6gf}#5M<jxZ)M0y8;oj)yM_ZQt
zWo|CAc*@_S`zV75h2JSfo08cn7D;}kIUTAQN>V!aeJ7*emXV81O>X(St+t-pofzxT
z0jBK4K|yc&aP7!5MKO+PEd4#|CyVwEuDW`TUvHG1GZ$7VRzu&_G&R)Z%@vpFI_*tx
zoAKuHH;J3aGwXts$T+ywi}$xCdUD(8O#8_W=spNl&I{VHF6g(f_n8r|3>Wl1|8#7{
zV*sy9V|45AoHVbEvmqPCCO~6lDfHB(F(rTd9t@jafUh_Be>;h-jg+*LqL`mG(;}G!
z)b*Iv9EH8z#@o=evt$wbwBcc;2=N|-K^@MZt;%K1bBdkqeHW#;PEekhDG77GfL@U%
zBm>{qA)F|VIzcRUDXP+7{VX|sT7_Z=L9|KzDU*igMBsKmN8*>|f$P&I{*akXU{i_|
zM?C4nR0NeQXXX=A&5ys$h<&>h1?dOeR*v~0c?B-b1cNS#jL-x8!w&1J|5_anF9}pc
zyuSyiZBml^j+$g+-SO_Zm0GWn9joEI+>=hQk)JqCj9o%U@%XV3u^Mf{N+qzLgSr>c
zTa4||qi4P-HErcJVaSNvId<xob-kTWF<r2n-$u#oinoTcyb0DR0cMVU3IPR3ENmOO
zC+G$KbKf*Ce~$+2SLr=!?~ihpMaDp7HNvFyZKt2sqxb>nu+<Byc0qSvkq(S0>8DzC
zp`c=Gq1><S*cVYX#j|e^k#FUQ%CL2}B(h%#o~u2(#*M5ME#Px7@OLiKCCPUu&0Yr?
zN)~*>$e2C3=hv`Pvys*!kE>>sHG5LR45%+-yXO>JSl4V}V!fuPX-J*mL?6KvsY6~%
z{yg*Q7S~^Dn#!J~Eb20Qg^O+eb;Bn+*KomTa24zA86BSun@f;MP^Mq(yJ`VHJi>M1
ziKihqv4NijWTc!JG*yH|p1p{5P1?Z{-{~$|_1z=e&IU{H`S~OCW4ZnT1SGz05Plih
z+S2<zBk^`<iMKP}r}`s>4v{hqIW9AoZ`A7bv#$&Bu^~UQ&A6&R*ZK=w#pe0nnzuFt
z7n7n|yF+-rIx(nMqR=>$f_6-ez;ZY<ZEcgY5AnnTT{6tQF?ZR1|DNw_w3=+NFAT9r
zN4bo9MfVn`Ox{qu;D>vlkWvn_bpevfJ2olYOgw=%PpgoPfp9%tU8W!~6qv8e*LceA
zA#=(_aGVH@ZGWB9BTE@7zxrF>b4Sn`!sdN|m}Ue=XvWO0@wQ}$FxvL*J~c=>$8-8J
zHS+h_D~O?Q1}xNgWeg|bD98CX)m3+5@fH#nexBX_F!uwvy7$C=SG@6Kb7Sif4(JV`
z&ZY=Pf&mDD8zu@0k?IQ5?T-+T{YPcq&K?_$;lD&jW}3F7dE-_5scznq2*)2WZLUsl
zv5~tp|4|tJha)*rQkRr3ja&5!Y5V6c`8ccikFJVb<j-|CT(iGOaA8!!$V;O0?JKRX
zv2UNI(IORI*WkbTbiHM3_80arGx{+^)m*8fZaBL9x8=McR;NV}dHAg%D^wZh93w?#
zlU={{pvpWOm;hI~(tc*xWilO&swlqVmVmO{^XPbvbpl9<kR8j;(Z^nz`7{<u;{pk%
z6@@I<I+JBl<!c44x7IF;mknNo9YOW#jr}*;M-vY-;$=2cq?J}Lu!nn)>3*8oOfmiZ
z4BkkMr3XqW?Qax89>c`1KzHv$o(+{{XT<6%wZmy>)V|_T3K~sNE9GdC240uyKEN#g
z0h;dF*8*Zw_P`D*M8>)IVGh(pY(O3HQ`MjoY-rLI5o{pR^{{3K;9*?$!F4z?{Mjh$
ztq`^dT^JUlwhpkLLn4xA_;8MyN~CS&HM^TC&b7LCNNEH9vgO%FJE$A5Oe&Q$Vrdp>
zQfHBbEo(ztGj|8!3bW*Onu}SJ<sZ$U5PoAi(6Eh?mV9Cb->z(`4MBlEAvk0e!Rpgv
z`4U}mdwL^lM%X-r6<$inLSMh>*bq`7cZx<%XVNY+Ms{5lBB-oP+cb5nQ=&+L{;^^d
zGU=7t%<L0w5|H4!asrUFW?dpS-cRC#cP&>&`HD!cE!F9VG!BL_NN3l294bn6u{&{E
zHr>PMG$dw;NM1wRbEyE4kuJNXvylCkB$vu}n18nbSn!&LbJL#MJumPKgKuDUP2U}R
zMu#fuTU9LG$G<s!#~81t6%;*U1&hW+B;KN#KNb{L*8vt4;(bKGwwnRnYu2=b6~HB7
zPtaOr+oEq*7b;kV83|3G@0BPP-QwBAR~`k9G61obJ~fcj8?G4>`~j~<>uqIfQ4**d
zrgU5zi2n?$W&XKjcUm4<XhtH{dPQUh$`~D9m#-W^1-q~MEODr{D<LMsAUaQp45bPw
z2-X$nlRErPmc=aOuF&is+zh$8f|IBCSSWo?*Y>E7b$*OD<!?B1ua#l*=1I4Af2a!_
zpNQhD^9ZvLhD^}gK-C@Co#oAEJ_T+m*I6ko%RbvbBnwAxqPHu2$fK!y8i7m+5W{ms
zQk&LoGM1QJ=N7Ri%AOhxYmr}W(ZzLNa<QJ(5Q`7-8#0~FaaC(h%INH+-gYJhgqfYU
zb(#5Q(8#y`7(&EGk?_Pgohu<O#Hb&SRi`T@7HWGV5W+!8KK!rwuh#1kTrP(3axdRr
zvkID&@+>dxzFMZ$LVnxn{ym)q>kHyCtrsK9EPps%GjBThtpUuOu6}sgkOs~t_^e;J
zIKB3lF5Xf5M{-)v6X{KKs%2+*bwpO5%3c&NRFgzibPIpUdQQ||0c0ITUm0QF;}x*h
zcyBs&v%Z;yz2So^o70l^%c`O8u)MFG?W;zvSwa4Cde`!Ay>K5WE_Efdh!!RcQjk?f
zVpy7eEH2@R_CrS7nN`&YD8jl~RmC1!%jkD&(w5kXdC974_S~H=Iq>~?C*=r6y$}bv
z(A;e@@pvf<;7xyR$|~mo4{CWgfz#D7&CxNw2)Ym}_^~dXCVZ+H=gqT3r)T&NaGAYZ
z1<3u0T(jo(SL6lSA>$GN_lOfvfE5ss{U3<~pIxc$N^-6~>xTJqCEL6^o}tRmETqoR
zh%q;LO+n76#cyiY>u2+pLsJlc|I6C?Q0l^ZO=cSj8Ef-7DJS-Ii+PJyxj%7r4Rfr9
z{oRyJ#idsa^cU%{$u}--v@SyfvW7{;uaZd{IB2Vn4g%K0ZM<q~(^WpcL0Jw$>Px2G
z`vWGYou<6j92YfB`+oQ&x`Dp>axUvFB?KIOO^Hm8KAKT?^Sr^hw`CC&-m2?b|I7{!
z5g1T^Z^U{EFUcodjoLU_me5NjY~T6mK_n6=Z&Ws9;syq6h8eCX@~ev=w0$<%i0)Wa
zpwi_~?oSb>gee^f-*s$&e5D#3-|!G!iV0WE;l?EAFw}GgWh=<>))fDCPcD3TneX7~
zIz9#*+5#6VYF|3f7Y@=3Y#Z_uiqTvxe80@sk=3n&2j5;q(Mf1i3A<sul|EI5%Wsb=
zaIz+hvg9ZyDl+q2oyOLv$0^ghgO)k^{sHy^nwg&;e<Y@-XO7+D;F9k?+1cZ`6QUb}
zztoAi<K}#rjdX8F3=0f22$Z=jx;6;?RMi63x>Vf*%7QObBmR_nfOiuP4`2+qwd%~8
z$q6Il>k0Z;oJ)6)y2X`>O(gEVnB%SS>c*a+U3UJU+Lu)tGp6#?az##%XUCS2K`Y^I
z+l`5{0?wY%KLET0{OyRWru6In0%r3xAe*gJ--m{{f;aLX0MP;71U1R+1?==$y8u7`
z5zN#~%#&jI#)P<M9m7td5Ji0U7`nHSIrs-arNXYIOT%=Ds`!k5;;DeF@e;Bg;OCA0
zfA{`2n*RfE7wi8p#0~gDIuOSx(`@@iXf2f1Ip&0m|Cn2jpErMiM3{-85yJltU0)fQ
z(be6OPynn!{npq?>;pd!*}?#x+i=B&E<PD!V6wCqIDXrYXM@qqrX|C^HKrq&*0wV4
zEEKr)3U};x(mDJNr)F|yL7yg+Uj-Qn-$|ll;v@OX%4G&DwtkV*=}nVo*Hp5h{KyZR
zs;UD{8#q$GQ9eVl%1YsybBc(}H@;3Ee8ABJ^<u&_Oh|t<-o?EXC*LOmBS}H(oF2)<
z0di>PVBxzsSOx1zvaGhBcxD9Svv(tkoc61UIAzQqkoR$ym7+J9opOJ`Nv^y4q(c_o
zFEjLMpYbdjZbe8YY6~t`f)17XNJ^`tr_6es?J(HwYFhNwySKE!l;+Ig)byeW>LU6Y
zi8>p}rTg-&!mcjC^e;aHE7tyy8Te1nm~?CrnE?E;tm)+k0}>Q>@tBKWjKS;GDrO||
zE2ZGANm31#A4|r$3b$wfh`LA#2W$~pRfvx(PxTa17}1qK%7xlVq<Cj}aRi8{5YfaK
zs(>DH)9IBN9bY7=1KkkJkAC#8Ys7+{zUGgLX++Jp=`%22?LiIMgAvzpL%r+AOq!63
zwGIC($1ov@z%Gu8m8pze-wyiE3BsD@i|lUajbI<!RV<{14P$T<ap4YGjcqmuk9K6n
zsK)FJ{R&2=S?mB2D%9wkJ)FpXx>HTHR=`m`(;yqvR9@>j9mx+unYp-r;=uh91^o|^
znU#cevS5z828P^`jw`PT2s@_x7{*B^(-4kK%%U!Vdp^HF(s6?xPnY2bn2yqU=hXN$
z(ch-f&MT?%k(EI?(q`1-jdDEq1*sqB2~J4Jt9W+?!O6=##Y|Y#Gm}$^iq;P7LodD!
z$qx`NzPCKlFE3lAp7o9NH(Oo&=O?hsoMT)DXX2n1?MQT}okX4Wp{9@9LZ&oy1L&+-
z+$`d3lcnExe;<VtnesC9_O;Q=Xm1pjROQXOd<@F))nFMB5Xc+gf-rUQe);f+ufFd6
zAC98~tZTj%Oju6lA*Hd~&S`C0`80EzYUUj4!gAH<oKeWk`XXN-j><I%p(*t>1!@yI
z<Tyd3F@MzHW-X409_mKl*rZ5nNde@wXOFEEx6F3cYEXY=#51~3_4CI#wkmr-i+Y;`
zd!fIjb@G$)JSU2&za)lMIp+%P?Jc=#ferf|S%Ru|HiD^blgsX};&g$`FCC)69%E%0
zUZcmLBK|dtq&y0ajz4v2d7b0I!5;qAI_lWhLDl_0(xZF_d1%Hb*!MX`lBge-H7>|6
zK<dzmINfBhsDQP3(P-X`Mt5$5$5r!|tWkAt<(UYBQQ1tm-lClSjcub$B20{>OU=e5
z!`vvMONLxug(HFLO-Lv~^@%m*cy@P>aXAr*j1BLiMgIFu%>Du4%|!$^L@Xq7Lr)cy
z&%ERE+t!<uMyM+?aQWr6{xR*}boDBZ7dDdXjH1~&etTA!pF0@=sV}R>?$VY>4xSTv
z%#~8^j|rOC9i@{+)h*XofYagC+YuN+HDeH@ckVZxVr~ag&n@IbC)!sGt{(2VA#e<T
zSEhg@=N&2bhJ<vM=qXLhIrxMSZF84Sdi`mbe_l1T{U{~aF9%#ITGwvrNwlZ&dtIFg
z%`o(d_@6f#gq&xsU|*iU`;ZOmR*SCm=Myl1d93HPC65^f>LeiJd_u}B-!6SKyVEY&
z$q!Ug_ao|6LzRb+)nM%gbv!696;SI#w9&u*d&<VVHxc<<CgSOKSk7##d2?GsYz)?#
zpv=+SW^~fuk@l|t?0Icor9MzROLgKw>iu<f`3LxAW>aA%w%*`%hv#u^-~5u3kiQ)2
zj3-7%WF<sXvpZVQEsL|IBw^+?dSm_d_OW0uutJIV^`=BN)h>?dCs{)Cr?#R`zCC5}
zptUHC+3;P=@mleDUqj*~m^J$45?v<sLMi{eD6_o^UuLk83pHyN@+<2hTz0}@QRi^u
zR||Y?N!U#4CrGIg^Hcn<Lc*=S2dkYqG(*-v`!M5la@sspInPj2=kh=d<V<Gy$x^!U
zlWKr}Y~q2Ehl!BL3Mia<J$!FWD4@NTd7?mZ$GV(*GWwgY4b!o_y}h~!eXVwt#j$)g
zORrFY)hslL^8omemwlg#v9*<@UEU6D{SJj|BJC$yCXpS-cP2DVK6b4_Je6T@w!&O}
z8`E_&B*nXUiFxNc*lln)c<wJtBPV^Dkd$y$s{iB=iZM3YJqLKg<2hB+MU=|{0C~Ah
z>X2_{)h-lpG6Mc`p8eyOOENVc&2$X6njD(WWWxfOOla>Hs6Z!}R37y)sSDQX&@YsO
zv+OnEn(?2F^!LmgfhJ$`rz>A?9Q64D*LMCO<+gj;iAzQcXCrMa7Fbo7%U%e$wE)r+
zZKRU4pA)xstAj~76uQvRCtq$&bt3tU6{}Kg_##jznPzwmow+Nc(CqE+-N8DY-OixS
z)2y;`iB4<@)N(;7N2JOYg#eD-9dUcrbmo-0mYGk;hMwTcQILQg$s5;vz2V26OtYac
zBwqHsyN*|4m%W%-fq$6EP3&M16Btwys$OWM$MPw4RBL87+5PX~MH<~<g3`p0`B$<D
zBFm6pf!T80j4S}otLDpG(=>XRA+v<y-vZp%%&v-EWsji;j7Iw9`Q+C$&zwsRUa5Fg
zgi^GW*z+CKLDNa<w3YreiM$VA*<I(wr=eE-+S0N|04~T>yfg!op}hQaFcq$1m3?@i
zqJl6}2<~%Krpo&ihM6r$P0ILed%=ZSKB0`#bRBVsc<*W);hhNnK*E6&CUt0}0>u0V
z^S#8x|Dtf14Ubi5AY(G5Kt#<RP&k`#3`@*ZOivV<BEPS~Ru6c`^*yR&&vTipu)iR^
zhC31h$v<#HjM0NUJRXvU<lxaX*{J<p7oCwtH%zuK_Mr5)jOX}|Qps1dw&_?`Gw{ps
zBbym&=UouuLP#XC8b2oz@kvXeA_$LAZo+hf&0?5gOYCNkMgr_C5`e>Zr{}PqZT`iH
z+kSdZo$xx_#5+<_;S$ik)uBGFv*3xw^xsv;v_g1~<MT^rSpmEVVaG%jQ|ZROi=?Q?
zPQo2VZb44Bpi>WD=n^=PLfPtx!uGOuMj<Y`Kbq=?n2`AML~nxynMDrVz`_SOW1$>c
zCYuSh{<Ck$x}b!oiC)24_%b0dxJlPQ1_xo$5~8e^tiVf@D`L32wxzfFoIl>xm!4S5
zrc~yXIUBwxOKj@Nd>tDZd|67~wWYUD)At4G*^;MB4~XK=pF|;BnxR$ZAlz$r8#(Dk
zjF<))!8vj&Hpf3EUCSIh5ZXk#zD#xF7f?jQ-G!Q#bZ<33T_cjQCH5pOzpqP^v0iqZ
z21=1xm^}%o$C+cm(fexIn&;rt#&Iu!YWoLhT#s|KQzAse9QUhW9vnmo9ul}PU?Rf!
zfH>TC(WKMqu!y-KX?crhrpiaNaXk==Rb^X)$**wQ)$D4uJG8;l?`xT?9~Gqs#|~mf
z+?`^A%kX<ZbtM!|<8YcayF^5kP_~d*U@eS^H_eXGlg@RwGVlIxiGvEl#7nRL1{tV>
z*7@$CUv1yJzt$*{N4H62)M|Jtl26&{bY-T9zmd+L-v`Q0s8!ITQqkE~1uv7@h7AX<
z>y52EWX~TgnM%oPn{Zch?HL;R`;G9AN)(nIe)lITOLS3}`AqCdvIOOe*)ov3d}}J7
zB)13naem>~AV7%v5PIF<od0HqII56lNxOZ?_$3I^5?lUska(fsS3q6)KftSDR7b^F
z5P<cWC!<ADPNJ3QN#~Z`Jh{t_g+%<P$Ne_QpridmDAP@ALLw$5`)^QY#uEOL-W0w8
z**ptlYs`H$=5?3JEZa8Vt<Zl7aJ*T8&#DA}62S~~9jE0D4+Qc=IkcQr`UE_&(P~GA
zMF^-Yy|ofcYoPmU9J}#m3Y%`3<bcz7Vxf4=-V{<5*Xs_njKXRGE?w#CvSUc8`ToHk
zwc6x1jt2vM=rqFMI-LeGIM3zFV2XKNH7KkAfN~c`icoW~LVt&!sD46tmj2x$<i+ub
zQTuC-*zVWz6RUKgLw^-NWmm)#@?R6rj*U#bCG3$;oFw+9=@$0#9?1A3j7LhR$^ooU
zg+VVrY&w&6T0nI%8i-TM)(4u<9Kt2TzW^h+%EGtfc$+yK>mZ?b-D=z(VLdguQcG7`
z&TY0G`W!7Xd}qNXzgblTV$VguwO3Enb!B@NgOKtW7!K~l7+3(*-5HNm(6@loKOO7_
z*2ilS4sjE8j!$4&vZVRZ^##Z-tBxyzyt1-&;J~%F9jiGK!uxw|`Kvi;X~~AB#u9zF
zL+aHn1}cdk@JH<HhpjxycQ)BxoWmUIJi(EC10Uh0>s_DVfuw1x<b~DHY$lrM@@Oo3
zZt&)oXN(@hPNdy=(MS63)XdPXKfKAAeu)g)KpFIi_lLqQL#|W?#Ts{yer`pRm|Z|2
z64*eTZ~1^AYyJn=GIx6JBtvQ#&^clHDtD*bJ4c29fe`ycA%`b3TKQ$Ev(mp`4a(=~
z|Cg%m{T#BFYNHG74h;kZyo<UhG@R98NpmAPC~)9t<~bS~fSbLpS{VHY01|8Me1dLC
zX<f5obH}$3Y0074A@S3fL?~DWT^AjeoK)v-C7gmG7#TA(DkTmryytj6$K@=O6+SOh
zJ?p3Y_c*_|M9TG0fe}3TVIJH?;-gko9O3c$+s|LRTx*v`=9*R4{Mu6mnzJi-!&tI@
zBKbS+Ltx%r8;wh1_pI?8Kx7&rot!Vvm6;lroMBqg(31A7S$ga`-Pi2nFvlfJsUP7S
z!ovJN(9+FI*0elB{{R{;?F@VRG<eG#)W$mUfm<wi;xZ_f%vK-?s6nW~+nZ?>6g`r{
zZ;K{k&`84SLx&`7Yb~ujHKHCM_-nQ@6;Q|+#rZ@-K|5<%DFgHJxhIl~pwoqJfT4)_
z<#<C{obvX9Va8jHp*514(dAjfX(0n_^cqqUZ?FMQ$0mzLNc6c0@R~oHj(!v?=5+vA
z0nIH$de36s?D5^&Kh?A6aw)BFy;7fxhH?^hUg*))6m{|edC2-*{oNPs!tfSlIj_3T
zbGn8@&4b)mnFk8VOtL9Aw+KKEP*#&Ev9s}pkB4Gv3cq=A{6>YJUsA_(?jPAKbyM{f
zHn9pX^Nr$hOpu?)XpCTtjvUg#JNzo#Eoil1_fPQGv&2IM7xdQG`fivYHxeBA&CAXu
zW)}{Qo~cU=K$$|vN`O1px8z!N)MP^E*_^R+aH5r!?G)h}tvMOw9h|7Hk)&7Ge7-wX
zc8CIrJYyiUptT5>`-~|w4>ab=wy^LSzri`K=gqfaYXz+bGb)~cv_7E?t~|UfkpC)s
zYXc7wI6UM=tdDbhwVnxj&g`exzhL215n;SWwO7vq@pi8sOs$3R;famyCpf<>Nm3i=
zS0i7VCZRZ7?c5cAtM)Dwa)-S@Y3tb%4xc8&zBA`ssg0ZKH1`?{@Q!lzrp_6_gc5=~
z3u?amkgrQj$YWp)_`}`NX?#RJpZfUE{K(8!zB;b)CRGNBGLX2D#<Jw(&lo-JhBbVS
zroQq#w6TDuh+T>)tcR_#(yT@%v|}%B0a;WMB)QO`AJc0A^rM(ltjpX1b)YscB3_ng
z_rmwe!Oag3M#Khl?_y5aCS*8A1kg4AU?S={|0Itm7$KPYa9_ey{>eprryupQTRm`8
z?QqgP;xm!XkX~R*&#g|d3$j2$9YQ(|rx5l#S{NM6S`Y2)vPp3E6QQT@4@3t}MEt4X
zl?N(_Gkzw(sF4ST+ymjFA$fEdKd9Kw_$<q}d){KPe4U=OIV}y5I}VS*Q%bYI#}hy|
z;)Z{kh=tlXK_6fF*|fd;!`z?ornd)hX6;ORtW0x{Ta?Q7M{J`jy0HLAwKu?tP=-3n
zhJt7n0sT*bN<FeBS)PAV-q5=rLvobTjtXswF`^Itr6VE%L(pw6=oZsso$I^OU4bax
zC-$vjc?_R;3|(#7VR#O;o#@&yo{BUV5)yj)Y&h4NOp{%oMK*}4-nDOXK|XnzmBag<
z3Tzw^>m1n<UL{z2T@+8z;X#uGIjvWDS^*U}bb5o30JQy$eP^%-RM0<)TSrc>nb6al
z!^%SC0Gsw>5{-lym1&}+tP=I8dUuj)f54wcu5COm7glPpGW4k8{arCV@r&5|b6Zi3
zK=<O9i<Vl(2c+TFUf6NV{lS&hP~l4*?^Qp_b~15(khJwVP0O752Kevs>}B7T9)H1`
z8M<~qN{%YH`uKdMLPi{u93&t;wO#dHLi-mFa3e_1I!{MLs9J7is-|X+Sw%*m!tyR?
zY0GiJO#T{OQ!~rfeI>Z_sAFwLkn@g0Pln~@#p+&N?5}KvAUXOil?l`oZL~<TWP0f{
z_WrtwLOb<QEpd^=`C%K_d&>FG!}&Z_b`X~&Q8$iS<RczqIf!n4J^^93I#NbcO-tY>
zq0{-;&Mw2a#y#|+ljim<f9ouV(2I;V#WQwVsZ5`O#QciJmFb|Wum&c1C$p?exh?YL
z!VkdaMm3&nODFThcK|_w4BZ(V4>K#S;+Kw2dACB0Pt#B>@tU}EtQ84YM!q=Kv?<<Q
z+!7H9zI_b#Z+3U!52?Dk5>-u5SOBeq21ogtiooQv#t3gx^yGrx<)yt9t7fLrwg-<y
zK%XBehN`T7hQQAl9ocjWtnsLdOqH=m71(N;_P_=mq_X;(yXOw$HmUqW^QtR@-McPZ
z?<5BRSRvb^gAf}#DPLzHRL#7%Y%A<fy$*LLG4XOaDSP$@`N4W{j#z#rk>8GorU`D$
zR=s!47?I2;U5nm?phCQ{OCB2mO|tiRTAPxXMXxy{8BrpsJN$F}C97XB=?pevnD-qo
zzYL|`(3igVO5Q#~-=6){TgZGyOKa$R%O~U2PG0w_4ZN1~BebYt)?QcUPb0ObMEAJA
zvPGiu`{VRZ?j%No`my1UliZbX5iC^dJde0*$6aw2TZQlBw7WDZ%ik)jj%i7BZnBM;
zoxneU_%R4;GQm(9R56|=kfR$+I!0vqH3KHG3W-kL$<PeZd-GXSY7VQRi~g?eXp2;)
zo%RgUjw_(o0r$)2Z&wQ_lM(M2j8o3%rP~o`m!<lFESVXA0Fg8i60dP|wRF1hEG<j{
z_q)OxgB8{`SW0qXR?ok{TTLJn#zsS8pS<L(AEHVB!~pOPnGkr*-DjNruD|im-?ml_
zz|d-Pi=KiH{FC`x756sQGl!S0PQHn`#Yq`4--TNQY!B1jt}@4ZZcTGxG)M1loZV%*
zh|$O&08u{+t+FHAdnXJNaYxHQU|X+cF1>VEsFu%iTbcM01-5`~%?@<Wt)NjxhKf11
zZsF_13ix0z=mT+(vp2nMkM&zQg4fwJ0UZnE2Yh<ZmF?f3Hyo7)LyTx`Z|2#-KCSZQ
zZcMsZPQ)W)klAHde&+ocEE&r=IP;sW2>F1u#*cO6nujjPCFU~M66dkzdhZv^vvJWi
zLl#s)LG_Fm8Q|w2mpH!Vq@`N!TFUlCW)3^9Z<=sp#ujkxu;fQMcD<EPYaB=Eh4+CW
z*D8)DfXvdefN><Zk{tonca>-~k)VfWjW&%{aARUdrGLe|LOt0kcXIBJUu@8>`OwQg
z1Mo&m57JlE@i#YD`>dsPSZ5DXaUxWs02CbBcIcRuiL%sHjEudcZ@IZSxa1CeE(_!9
zhs;ESen)?F5Mx5*==qN_IQDCsvoVM$A?f00TU)c+TF}#eS5{?Ed~4d@OFueQH9vk$
z&k3Vg-r-qA!>mxGC~K}2A%KC20&URV7)elOi6bXXDk?hum-TQ$w6qz%`F8;DgUD3<
zpm3z^=4|oF(mw#mCD1uLU1sdS*R|EuilC@3e#E4(vmVb@Ip@gGwQxoZzLtqSC(%u>
z-F<TKE#(*!Fw`*<RlT_+s#QLJBFM#xFifmIw<;1HQGH_P{0!22%;H*1Sg5WlIO)Tl
zXVLiEfpLY5u2_%$Yq){_B*wb-=*aK7d*RG|8jAXR>%bX&r_$}2JF+zfKvy5P=<6CC
z=nFyUHVez7ztwt3vd~J(K3Nz={mh7Nvh8?co3~c{jYjg8p}fHhBP{&3_hWsUx6@%q
zz=T!N;s6-_<i;_*UK7;+Xh)pXuUa3R=r!FeIE#m6z2@(rS2x5<(#%DbAsfuwP8ogd
zJeDe5$`S`;NYPs%{(J7h4O66Zr?c)dYYk=NUiHDc3_2r4Zv@U(0-VXX*!WSJ%)VgU
zI$g0Kfuf{k0tF=Ev}ZswJ4husQMCbYa6O0FVXbVPzL3uyDvKGQ9D)Stal@@i5d05%
z*15Df^iBtR8V8`4-MM|hM4AlV7CtTtos)Y+-y$m}Y&aM#K>Yd(K%@x2&jy%^Dnc}I
z#Yd0nmmj`)yBdza?#TK+lgD1F^MNkVbvZ7RidlqqA1NfBeWVb@6)Mc93709YJzOzN
z@4uiI93Pt2q*{G=AtMV3#PR1m6v&&KFGzB|w(5Rt7`4OkEpu55VjJ+!dh!&;KwS!q
zE4GRY4&vvYN1Dlf7NNfyQ*62%s~t-5#R`BCg3`4|fo;R_zbv!h?=>3BCkuyV!8ZEF
zg0bU+$oWv9dLh%AKw4VRgkrr`RJP@qo<Mth-|}POUdHQiaC>bfz0jpKvzWVNUs)`;
zBAHspQQ`T8{YCziVK(eo)}KR0FHfm@FZhQS4Zje<dO~l7WjoQ0%GaH!f~vMPd&DuF
zEX6xVax9W-*kD@NkG%juF?Az@oBn!SgvKD=-~=^*^gE(TO{}<onXAm}`yakBd`PF_
zvO+Y4ce4r3ax}#`w47Bf&Me@idTH4qMLNxoe}E;!2zni&eGCkQ()yWc4*Mvp{L&!7
zew|_pk`N=k;Lq?(4i2e!n@HnMzbs^uEWvUh;Hlb*Cxw^6+>~ENmo+E4W!eB@e?3G-
z!?Sz&PWoA3vq@^=B`Tfit+@exJN4C#dV6Ujy<m|!Iib{GmEOanVoyt6XP>)EBlkAD
zb6MtCRuOl@ob@;rm!oQp-+E{0*$?F_EtOShMYtz-Vg+o%B2h6=x}s;3JznR5S3utO
z8tC`5Td^~3=XLVjW34`OYl@~Y&WjkFgTxITT$@QK0C5|aTiGML^>|p#m<iUUfGZnY
z0_5r&{Bl@QQl0m_C<!CA>{DiBth<rtR7oC7)-=r#Qvi)b!8!;V9~_@EoKX5D9Xo$h
z*M1R@<)ZP`TWOkP=P)tNK9f>76s^lnd;m~0+(G+{oFUfHqb4=kx`oSz)cu3!$tz9}
zehp(B;^x#i+bh}6>&m=ZMmhpLn;qRcV{3l+mIcu<ws)|{??yiaD@8-b`Djq|)HEjE
z5I_Ei>;SmuG%e-ZOXrvJrw`A&Ch@IEvC!F%Ddk!hMtK`jjeh`&#;^}>3}RaHk=ID`
zFpM|5>(;W?0nh#-Mjy0nnli>Q89LZ!s2EhJiFV6B*`ktdv3*HrbXm?G?|*>+A!`(~
zHx+6b#x6>+570c+#g<;~v*66)dynAS{}K%R09ecN6Q2peOEU;lY?@7Zo1+WsTQp<R
z`G^%$h^4bY9j_EhRQ-h#j5**VQ$xatwnyEZo!2_FA+v1u_&vR$xvo;qk@_0;!VxJ*
z^N&z&epsilFz!}v2Omv{mmS4RI`ug-$zDi-vH8q5Ot{XX%n9}D7`>skir4~ymDA>B
zTMH;v-HSf<26vM&#^11PiGe+hANS_=>hyc=eDBb(iYxmqSi*h>!a$v0{u~?dKHBiq
z<TuU=q<+Kq7RVq&z|U&<Uyb)?9n;Q8(Vz?fWA#nZd?WW2xj<w5O^0Rc`w}-kvC?_A
zl5~NtE=7=_Ui@hr()?D|hABzgcdeY!w?pOQ!&h8;_w0{&EaJn&0&e%lW%)*mHAmV%
z{P&#m#GL%+WtuY*mX#^O;@+S#KM2biC0v;sydLV8QE++UXm}25CroPK$ROYxv^D|M
ztM{6;8g1`ZxC!Ut_u1ZF#C+I+mIp_r)6l+-*<AyB5ML-QbF-;!yu<(~gEA{%rQ4%+
z;w4qR{cnKP46>(i*ya$nEnLRs3GKUe?cWF@4p7bN>rZvpJZZEonVf%3r5E*V^@6#0
zGw+4jzi3HM2pnj~4)*s;8kdQ%XSe2iFaT_7saTrVB{)IBk@cKmvI27X41f-I)>3mW
z7XZ>?ntmC--kt$1YvU67U;tMMl60K=2Y9yrupra)T%QA6+mo5H51R}GUz=QZK2Yz_
zhfyBlY(YEAIjXvkt#7nj8nKW4G^y}^4fyVg5TplHA+RGHa3hQSELl_et#uhNy|dnv
z+*L=9nFRQx*b?h`#zt~XHA1VC`dl$V<TxEZoP=2I^bZLCK7G$J0&GeDgp&7&4^NjL
z8}Ea&F%hpb9Uf*Kq!VM+dv=06{}k`JQ73ob2Ib1*Wu3;a`5}}RZ}j?A(T-oLi82~T
zRNIDoFt9v%YYsJS%ItSSnQ}wa0C2d@h3X_fEX6%s9z%Q0n{}R&y^50{87rqW%b~S$
z<IpP7((I5^5R)=2UZ?uQ#eKkU!rqYpQN`;2V5y_Z3$AjQ*rerRItfS<i&>&c*sNYz
zt7z#UO#25YlXQ)2y2@(2uY6ij#R|cjmS#R!?cVfXdvqr(vJN1*+^)Xeuv+3w#d%6X
zi}%Pa?3^JR=kMh+I_NQtwNYV;UBdYaxJ^xgpRvs6jCMjCOvnP8RYn%#5d<6()a%kS
zAREE4AbfK_Svdnrl7s>W+0a|TB9C!;c_2>9xEJrQveM^h9WG_sL`5quB0FMr=hQDt
z(kzBp-d#9{YPk#pwuJo}TElWn*sxDbNzIBNX*NS5(k@2hs(62ZgY~S6u?M^*8}s6M
z_mbr^vm~s*Yva^{mpfZ}@^szqCK@MX{Q-0rxl5+vZyAO|3s^MLhOP%=^_Z~C2>WG;
z!j=MpkRxTW)Yb~c=3hN-=~2NpLBbwVCRcyBgZLSMAaOJ&kKGWJ##s1yijNxf-85k#
z=>3iHs-KR%*vqqo&A?HVrEQX3_c?YTmp@U(S_$>%KSX4{3DwMC@G3Jxb!rjl0W{TY
z&;u7gOwBXWW4VB}3F$721|LefY<(jU33jpqHGA*fVZFmJcQdE6)evfe=#kFhk8}?U
zUSg3<JK@})=ViWa2T;d?B6KDWi?SnhUdngxO!A9}BB6nw{ir|>adrp2^q>Gsz?5W2
zeCE@Tlh}U%qRiK*X4YieTVmN!=OA))lFbN6^&#7WRzY)=<4HW1Vk-N)eLxT%($~Rq
zb?x2;$Ijj^>K`Cf*T(*55vC<|Fh@9-c793ukAMK?wBSDufoj;7J#}MUZuKUA_iJs%
zir{Lh0x7Drva;YcV7|i};#vLaCE+l5Yl!VjuLnA`)-=zuUDY&%^e+Y7jny1f*!L<X
zC61DTo{q>J8S}S9v7$Na_d4ixNmh1Jev{gxQd+4lt@5DIlqiAI-!seYV!{KrVHVOM
z*wW4eIq`!EZ~Kf$KKs`N)zNX;t}^c__yqppO>(_LImGV)1)1H1$RX9_g_SFj;l^&p
zku*Y~lz^R;!lCqU7_E*`{{D`Zw#F@>Kp7W4nM9$MJeGXPKfo?G7gztDC@S?CTG4J0
zW7yFiQ2o(&c$!P!*9TV!ETc?C8SJvG-{~h9-x#D&hMSVE%U<{%7z4=pQ=QY9&a*0K
zEhVv&{pqmKZujq44ECa8W4ZM=fDY-SosBn}ilsUcnpD^{c!|Ku5^QuA8ZpjP^JZo}
zTJAz^xxVZ`uj6{-?D0MY^J2Y6WQz0*U)wNj3Pn@vV&9<EjAadbh5WDVmOyv%6K5_7
zXg}X&e$2MQl>rx*e9tEy=D%zF<O~L31pfdLTBD;By$@6H4W$NXb~<x5g)#dBH7Ciw
zLZ7MMa3bl?%u(i@Ofw5uo_peMFuYS?3?UmhWZFvgMsFO8z4Lwa?M13j76G5m+wTZ7
zYZWX(&CT9~;3gretk}>m(MJrVSs48%RIDPo!=D8kAmZ+yH9mNhg_$xx<YD;~HXYy)
zGBU5)$vQwb9&J9|`fkv&uYqUFvM)j}L<%~i%3xVN^fr>O9FByxnbm@$X*`yV+~S6K
zU0*&+2G%m|mbL0an$Giyw>5LcE((dEG@FqPSoYM+)T1|siVf~+n+5KdIrp5&pf>Kf
zAaet;HmO7o9hL4O#`aN2an5Fg+gq9jMgwNv4h#tivXEcJL=s-%qGB1GPZ63RT{SWc
z!gI1c1$jjL4STsWw8{$fz%RSBH{)9&!tlHb*V%C{gOH~ueVCAZiMsqR3)aZ;BVR9_
z!Oey7w6s34vh$g?P+kjK8J{4wbNyBE)15$f`xhx=T&eGC$|3?ek8NM@Vg(6(*mXDb
z!^7a0l{A9@^kGj2-G0n3(X7QfP&kivshLZ!Hj5R$D7+Q+;2ukYz>R^kl1Q9(UfXlM
z{qz9peS~yf9jZ?Cby<JVEjg~+T?WX#4Pd`YsO$2Z0EzR0)!{i+Lrq_3(|=wrh<(OU
zu&KqgT)bz)dATtck%HbYZ;mW~*P2j0OHfgL&vveqy5ZZm>s*HEdPSAH0TzW*;(0QE
zF{I;e8Tq8siL$NFeM(-IM#u)BP?f8MUFt-Rr}%tz4t)Oi)y1+aYSl-%!N+lY6P9mG
z=68_`J{j4_83oxubc5u_KrGe4UQC_pw5|}`FHqjH)qd%+j=zEq&w5s8Dk#lds6g~E
zg_KTX(tKno7+srGCbltGT346S`UgE>T;TzDS3gjw0<Lsp<MG8bRl_A7mN~3t9-X?K
zcKgq!?6FInv(|zv5|si{la68Yq)%%x^mDHLQc+O&E6JfekKH!(b88T<ndu<c^^?Kp
zTcT?$pIB+zgr7No%(U|3|FldrbSKQFj$@aUs9!hC?0n{B>DoBy8)K2516=Xzc~Af4
zR%Z0lL?S<7AQ&laFur|dng7NAQ~Tw|{amZ@aBQ^?IooPL71JIRI_{~-<|XZef|A@I
z((@fd=9hXi_GKvE&PsYIQ<#)u*VUG_nb~*e(1zL#nc;Pv(0FP>AJN|q)<OMmBrY^o
z1{E~?J|`aBAq;$7<g8vTe6(QaVviECEVtu1kSjpUz{f<VnF2+&^7&R>ZG{St+z>$<
z>n?SIb>ASvl)to&$Z8|cZ^@MwP5b72QDl6dYf3Wha$6ltj-N;-juD);<p*;u;fw@!
zAi3SRLfozSgf0_m8HHJ`?5Z)Ws=<vRXHSwLxdFE8mib}_&Mp?%BkL~C^yO?E6H;l~
zEJ@F1r89bx(Jis>=q%>i4CFow92h%CuKagjr@Q)u##9xN?SyL1eDC9@*-%-L*!Wz|
zxE9vvH>KKaPo0aYAa;jDy+?&egGYozKo66bDHVwm%2UV>&7r9Md^Kx1P5dXO00CkF
zekW(_-dU;38CmS0cD#&<igErYjFm^qrTD{FRv9w|%yub+E96@EP?B)dd2{iz6+(w^
z+Be72^r)9>1<P;en7BH<ET|1O4KG?Prc#-8#^+gUwKm6MA)=yesr(ARLc72zQtMg*
zFWN_CY{{(Jqgj3%8|woJ_IEO_T6~(VCfZu$6N;{tVopE2;>@0VA+B|PAh>ZKp7WH+
zp5v38VqswZ?qrkK?^pCgxRNOSAFbtX$jdA@h$8asVFstbE4~pwNZVI0uVyDFP<`I>
z{C03)((Z0GO^1%eTlX4^u{<H_yfFKmTTAi1&lym*BX#VPJ-?4xe@n8EzeRVX66eYk
zobi70T1kd#uLtjU&`G@_xmR|^>h)ibv@+HkQkl5~IO<P52|?l8N=AOLE}O0+mFu~2
zQv6Sp(}uZBbd0vj*8D`u{B)q>Q=iScv300jx_Ufllka!Y6TL9`Nw84IetD+px6Qie
z#r8hXrNXX|xKIw3)Q1IGyWl4ObYX+vLXiQM{??=~!T$gr!;HaUjM`eR-eH~TfW&-H
zx`R%$1<mu&8w*<8@9eaPXtETZY^A8Yo@5VWFl)s-ff>uFjV&M_U`?d(P0iUQ&ur^w
zQ`JOYlWG&Qk2f>JjI8z_Jy9?FNnzuEN(5dw9#CD&A3U}}9MyMpi3aJOR2nKcwe$Mn
zbP?yj%2*=kc3V3lJvBG-50wUmVJwK5CEs`ZoVEVAHj)2hA5{VVO#k>FfL0mfWahJ=
zWagO0@`{Zd<c!G~qi-@=k<Hmule(X!p(~TUOu%+QF?Oj2uc-}+E^&Dc!_L)?&ZSj`
z89CZPAH7x&oVqT!c-C7%OPN~yb8xA(_yj+A-*YVV(DAiRIgNPNOw2}HO|3)EwMPs$
zm#$v6m3DPVbOuQ&s@H32N;F&!(D=K^xKe7#esKX6(f1%mx_o!>-+3DHQvEw}p(Dp#
zrfh`&t!kwI5>8OJggZP@Ky652ncmb#bneBPbH=oW9Q~-pvpcjFj06A1q}Kpm9;)Mw
z>k$FZnzn<ic+t{gjk`pq*yTTgkHj+D$qJ6NKG?n-3nRI`Xj-m0rfT(nx9W@D8r^a)
z{7_+H#1EN2$sfScf333PH|W-8=me&`Qa_gVi1%4{TdO0k%k3HlH~sgLE5np$J$bw)
zIX;Hg!$IAihAi++pFyOpgyH-Su{dr*m`O5)d0`=Tw)RCshWp%QHo<#@84uoPfzLk4
zMB{;2;F5PW^52P-mb+Qt_O-Tl!G+*0RRd%Kykd=jTZ2p-`Gtm$<oz6-LF7GO`l%3X
z;<KXAJR{j}y=?tV8d63KLaN$U46f(9Ta!MDf=youP@nxNEBBON$9RV(W1?pQJ%$LF
z8!KGd>^l;wYQIru$bV1RH(k5Z+6JlYhd;W5-)3S9nF0`IKsH%*_#J79sI6LLR>BPH
z>9TbSgS@@<(Eg%b{x6`QfnU#e_u_&iA}t-wn`V>Ps47zz6q`X|n5jAzFYz<#l@n(6
z{eDPD$Q3=md*=8ZH&q~_pegv5F2ur}N<-J=&Qg|dp|$whw4Ew~D96nKOJhbTC_T-v
zod0hMQ6?!1s%=T$THTZP5YZVfi=h~?Lky3c{~rLuKs>)vxY%eg%WPdW(zuKS7pOv-
z7dgj*0uD4~M9pj5c_^BA9!Kdp?w?53k}vgE)Z#EK0@0=<rd7Tf02TyU2{RlGjn(wc
z1Z08XS4$S-U<vt7;)GHw+6i|yPC0H-tfMx*+@&;!izKEpWn0=^!fR>G@~wX-=bs79
zqXeE)R*lH5Y(c!IoMZeeW>8}GO`3t$Hf|EQHU%V8J;ach9iO5it}jfGMo^BrTA{2i
z85%h%S5&kM1zyna{3)YmbHZzA#LXs0T=0*jfLI>rNP}CElvHy#40lT82`0iMU}H)6
zRr5%0ZNef)xxi%yH`Pfd*kho*J>)za^0j(lE@1jBZ3(=CAgzXwY{vWrWT@@&(`=Hu
z4eTo?s?&zN+%1)4&1(rh7DHH=ImX<kPiJJ6qK-nwl$+R*;Fn*rW1D3}bGVN(Fk;E2
z?Z1@5J`+oFh?G3Jm*p#V91AErrHlUngw!MKBsGb^uqel1Qak?uvX;t5HW?Ge!k7`o
zt#lkF)+ng>`jpXPPBcvuF5!iBN9|>Zu(GSBZ@3=n$*<ZKY~~}>pJupsS&HUvc~{la
zTv=39Ht$EYVmcVk;H{xy0{zhXY#WHWxfI|xj@e2Z`UQqpHP$4f;-3B0T~D$076Y<c
zX{<oH9T{x5knU~ps_Op$NydC5*z32H6<`~0%FHE0&+$=^@stdN362r4oD3|5B|o~6
zg5fY(5f~Olm=dMF-fpX&-+$d(Ra<TqRG+MbPy%4!Uxgw4Bz92K=jf+!$D1N#49v(C
z#V7%)p||yH0=T1Zw13J*f{v*GF#iCBQ8*iw)ll|0{BWse8=Y%m80gH2fCrEGMn`Y5
z3806M7e%y<yez;hpQS}h{^ut5Qa#?%nMOZ}bOOt`04)|#)q&}fN|u-np+{Ifhr*&3
z%2}*m-8F<~DboYJBSI#z%;2M_xEZnp4B;C?kz|q@C64O^1$(c`Gq4CM>nW50x!@^j
zNfHYv3AON_PUF01D^ZrsKAwGmDd#vSS_fPUe#nWA=AwmV2BVogpk3u3UN0d926CMW
z#x~^GD@`(&)F9g5WF;&nM}?`;X$d3Sglf%n5kW(NabT_ErxA`36tw#oE-#PSHnHuD
z9o&J08lzo-)=b!#e1(zMwLPK3az9<v0|5Z67O`CE9zZusVW3?~snbYuP&c{daU`6j
zXzyfbCk&z?jNapg8zZ^l8w6(_61EhHA!!y<-N0KaT6pdS!jQ%|wbGOWv!37pD&I<>
zE_UKRsVFH6-UYC<`fU}OJ*x=V{XUR}j4MGHYivq%Y-DW~1LZbJ8s7I)eVAjLYuJ?&
zj!lB+%YrTxFOuI<ib1iiJ5DWxJdQW8IORz9a#I<wyWVUQp;-f(OOu+zer`J>T4@+A
zTu<3X`l?}uK<9nz5Mc&zJ%&=TuDz|4?fad$Gy&mD7$>(2dN7f~c~UgBp*6&TYvD4)
z=IEG|$&3WYImF>}YzIGO&bI?7n1S~fx`FNhSY)ClIJJ=O0{j%hjL#Vhv23T`{?y)W
z{gyC=*uAV$2NFtf4L1k3l<mv_;V8ng>BBwE!eEiTf>9tm3$4+;5BVd6*IeaysM4BW
zf6@s0CI@0}02JNrZ)>ORaqVKDmBF{%wVH%<#?}JgRTHIg{$LbSIPxrlmD3&_Z=hH-
zf+c=QB$M)hsGc^CaH5}a{ckq#fSv6ZvA@+O!l>$sjGG}}D~Pgd-}Fs4D5NpOrd>D!
zm9Y|dx?yZ<M(hBHh9hxtg!rMgiZ+%IO^Cu)%(itkIdS0GTER>j(d{X;;fx>@Yaf6>
zKMHU99V4KH&L9S(poq7I{qBZj&)_g4>6s(4>#UPuNS>Mpo@^D2F>N0z3U;_S0<2>m
z&`N8fu|hS5*5Ns<y{&tvhK%JsqbC6iEf|e!4f|P0*4vckw0AZM?d2<FqXB`P)5C7=
z6T@%7vXQZpIJe51kwp?X<H%F7o<deL<0@9O30oaRMl$>!6s>K6NYQlXeQZ*dNa1gx
zNNhpuyB>b&mjfsaE^UC4_(~itV33^fvNelqi!R%7doC9?zwEgF$bf5r@`kAwz(pGY
zl7*@w*8@DFg^?KDw-`+zlgU!X;kU^0k<M?0RB_L-BaOz~qS+mpaxjLDOS`Z{x%Xwb
zx>i0lvNAo^OJQ{0Z{06&rgq1nK+V?%jQA;Y%Hih8tOIP{2?@eiTQ^ZiS^>#FMU34Y
zB#ay!`9ai9+}z<dre-j9RMqw2mjLjo6msOrK~*)4ZU-ImsdWuR+}QE*fUVRVORR9J
zrj}V>X58gdNa4wn!fNXt@_pQ(ODCu{X+J8$gG-WU?r<e(bnPXPG!q#?$b)8cOwlB9
z4t>heQE4HBT01MMSQ#G?0#To#xQfU*F?%cGqY;2eu?f;jV;<ZmR8-Btj079oQuB9h
zzjc&s$c}mBaX#l1Hs>Bok%kur-OjhdfUsQJ<xwG&TOn%+b<NQXipJ?!(c>Oe>~1(&
zve3pgjrQ3}8-5ao9tkQ&vm?dS+d5+bfutWlRH41ilgmx<bhhna64^x>7#oD<w<h*Z
zx6V?G8<nhXB5efVoF@T`6t=!c?2sM3ukx~Cp~LNeD~*qImln7Q8^@2YbOMm49#c*2
zZ<L_-vARcG1A>536K)N&l!T5gl(qo(Nq+W30$;*uKiNCFX}5KkW)PEWF1b0n?~5fL
zTq46mLAd!&__<w+9uf<ae&~Q->{nm1@2E+VJovIx9mq)Rdx=Uo&t%@j5SYVm<kDSY
zr2t<SO>h9-#HF(|K<n|sOZF;9Hpl)F7J-tON+Z3Eht($UH&1gxAvCoSc1B4}amCN}
zQjk1a$*vg9(Lyj;3%7iDLdlcm8z|e6n;|6U^rl1}go&3nDdr$=etr^0=Ub0}p7)S0
z5xtO?V|^=el_MC@_fYP3Z_0ZKwTjHi1;o+G{>p4x_8|=yAaJJ3e3Y!b5Z76AMmgnm
zhv`ZObdHXwi;<M8yRN{>UdjkXitE@UId61^#8~8nXu|hgO^=_HgC^^_<e}IsM-p(m
zX!2J&)+A@LO!)|;%#XcxwRYC|Rln*iC-npON-NuLLYE_xi!3$|DF6eys+&^UqZ)(U
zadoUbOSaheQnX=IQ`9({l8=UBP!*t{3R@J`y5j0kZjA~w1LZDLyQS`lhFq1-xGGF0
zIlvCf84);?!*wH^J`+QM<zz71n<U+gsR?b9UA1d68NGJo?X4;7U|7U^mu^xP1Hw;C
zd0NbKU7l0HO>AmG8o;s4K2(h<jb)R7@Ph%*%7DSV<q&>SI#w`buQ$oZid)Fd$*zcn
zGXUWQT^m|36!ltz7%`LZt0k(EcUU(cE6egcoDq)<XrwuI!6n=u?FvXIc;!yW3$o<b
z#>O5(^D*L_XUgcU*&&pcple(MNhpU%#<!4FF0EPsEg4<@Mp(xcwlZ4*tF3HO8w=TV
zHS$P67*z8KW{{g3T^UBg%$4yObIy4l^jnHZw_{xVxZOil0NQYvYg-$0WdxOmQ|;k;
zSRN-DvQljV%NT3$h^DG+cqK<K>A5*oHIlinHaJn9MUG#f7wy@hlD(z21S<Nvko$#3
z>EFpIKQ!RF@nz@yz~Nm4)B^Kn_fSPixz};RMowH&P`I45a=i>M9q5ik$yo$Zu-?kA
zRC_=npj}!yk8oAhl;na)`>W@55>SmZCtk@Vc^5Xi4mx{3z18h>O<^axsH&Zj-+;Wf
z(a}~tt_&U&Z>-zjg<U;coNOF}mP5%oK|!`rBH~R=z}P;?jIDFc%hf27{jR5qP&=mh
zXkzu6iDPh@{aRvd({Bow)@AK`pM-S`4v>stX!z;9i79a`De7uvH{3$ArQSd%B}GY2
z$l3`35ZPOOpo=bu<4;i`&Ao*JK)ESns4aIHO^7-F05?RonY(V~+Ybe;wg-_h@z<6P
zY=W!R1KeA?l-j1Xpo`&GG9c-1aJnIzBtKZPa*8FHf_#y638QGSwpD~pU;uYULrT|+
zoDS$_&g81eEfht*n6OaGF>fVaS3wL-K2~Q@edO5~?!4yJmyB$2pL3M0fXd&~gv~0B
zNu(ET?zME9JnoLchl?(Zel|>-iYpk=fYzY&<2{PS)xhaywZIo%wbYsu#6`|&^1QcM
zb7-m@*M6XIyD;FEH%!w7l9DLdkOC4JOC;J4d|3mkYVRX!LJv!;FO)gv>(Gt~akg`0
zYtgvVq<L+N{-7eNDjL9dzW7=AYud=}+*wrW`on-N4&`%yj^`>w;}?4^HGM`VgYE@n
z>vcCd)?x42K_s%&yxiO;GJ)lwhUI!VutO5rPH)g=nOyMy0C8H~H&tU=+}!*u3)v(t
zxK^4WmRSRL6rM+q8LJ){8tn8~H8~`=rl;Q{^5RYxbk>mhV{5jXpM|GxhFc%#&(VDD
zcNj{M*B06{l<oIetL-6>+-@ovblDp7X5=T+(@h(JEh<kOvM<y&li9A*{{Sr34lanE
zsx~*<WtnW!#M=^Zps1~p!*1fZW#P?BY^OMvRa&@Xu;kipR7mW}g0q4*NbB7b6*;y^
z!m5mM0ZQ4UlU9L^<PxbhO-<9Ct-X{cBBZ9IFL=e(;gWI$m>d+Yl<p&wb*t!#Xql<U
zcLtC_&vYDg+Z%g-We=$MWe<(Tt{uX@9M29_IWCCKJfhL{CrQiy07n=nvd{u8%K5vd
zzYsc$Pita@vD7!Pa9e#huX>)PfV)qoU_Jp~W#j%+7G?UU{{Z3UJTk}G>sJ6}L~0`r
z*bU0_sI}dHP;g`AYz;h!+n?QQx_*_+jjoZ-d-)~C<#%J8r@Ev~y3u+#T)1$#RAZ7m
z^q-<fJTzUz1yQT(l+<h??$3lAlI+GS@p>r#0McILZPs5l>hzzOt_P8PuW$TE)=r}X
z*vsv*@r^=BVXNH04tOh{Cy@wlLE_q^dOzW=oWl!Cqs}tDJ&{8UHy{fI<oyq=)V3zZ
zB4c<9eH7DA72hGT316KFDuK-$ZFXmR?yQ*I6cK`auPdpFVKF7d8?Rf}VTaQ<Ah}|z
zs2b@UK;?Yzoti3FCUip+lhKuYj%#hWlB??-Bbq=9RP842B!ndN3>UcpaO2FL?C5y3
zdET$<G;J2+!lIB!54$&Bi(jTPR~rlcl@)G~=G^W6%fAno4x1s9$7`fzfF{?%W8x05
z4J4~ssT{{2ZNA7^ni+6U3)06fT^!ESD(WeKy~3-ihy!tZtD1=$VmVcnZUtEdY_Be4
zf2r8`Ley0^X$)uXrKtmQ3R_)P*xrb)=Q{UC&_>4*xY(fqXyjc^*+3TIRv>E2`gc)N
zMY>s74}q0cs_KwAg_Q9h{-RJ5Pka)DlH~B6&QC#6qz^NTi6rFZ4}62!680uBgK|LF
zRR*I|NZ?o+>vnKfkLrD1NVYO&z}_twu~kt(T-&aaFu-%dZ$MN&qONJ(zM^Ny?=E%J
z5md_&{u}L;6SH;902C6Svc<Zdp({fTOT&CO3P{6^-1l6bZcuT%XydYbW;U?8+6A(C
z-oOu)Uim+W4X}u8GE2Zn>PIvaYoMX*Hi_sep@@R!msuSBUFExCX2II(khI3@c1~;T
zGE&Oe5JgOnke5BglsOkUN?+Ke+&H#;p%I3bn|vtT!g7cX^OVOtV%bk%WK3nb3RW?o
zd0fCxWK0kqY_kCfi*T?CIcb~$JS%3zS}q!yP{X&}KuODsHIy>2wEYq^=GR8d!F*V#
z40f@yqLLg|NC!QWobpY@fKglp#l)4G14FkP-7fq0QCyr|KGz6QhcZu<J0vHBKHT2f
zPXvL5v|?ABWT?-$+xxDy@}*-(7Q)S#SlTh+O?H5hj7nqgbd3tgfd$G~hEqcbaocpD
z7W2x;Vc=h|AvMg#dF3?BM{6kLn36#&GYaF`LnG`8X?bzSDTG+qlsK4ayNY`o^!uh0
zY$pd}k!0ba(qi^dmt}Oa4CO%SI}(ggXeEvpQpJ*jWS2%jTyO#|AZR)UH~#=Ao3smL
zp`i!8)Q@{wIYOudXLuYS<Z&j-X&f9<M;LRm652OJF~;W`sT~QnRfG}70$C#mfpm^i
zV6v~$_i@T92<?lhJpu_*GB-CCxlDm%i~)n>Cz_`>g&7V5B}DDVj3up_tej5y4oSz#
zI+gJN0Uxrir(tozv!$di7gSe3XrI@F3;=wnWSTz6meCHv<s<a-{Us$#T_6)PUHU=2
z)UX?VtSKE!>Gn{}cJh_VgH{^a%6M7su_$_-M9k9I;}-fV=ex;C>kup~kILSS#Dc0P
zxy8@HLAj#-QN->yCkupazyj&CFcVr&Wiul^?u~|)`L`-(((P{wQfyZx&<ij}!jZ24
zSlBL-J0JK_7K`{wzp>EwJacp`vNq==r%23Tp`>lkD$xjboBGGqYxL4X1&(a8T4ZN?
zaJBkq_6vALot`t;nu#VNvRaqwaPGCbhx=p|k<`!e4Z9%|x?L6T@nsnV;Yf11P=iEd
zVKL28-;~qG%EGij;8!=0N^`Sy&F6&nNv)DL++Qn?=}O=3k=@c1heVLu!Zs1P2MEfu
zqiyYE@e?3TI|u-fq>?}aal2T1ASIJN6?-|DlDm0By@b4dRP8wWr!~ItkD+KgNq}37
zt4Bv@)OuiOV8BOI7W!#IW%V35;RzG$;m_S2svmIxcU7#vs5`9Dk#kQa*b^$h+BxpJ
zkb67jbwIN`Ac18xpYEdIy@C>N_fM2u2Lpu2-4l!+RLpU={{Siw>kO$`Yh9&g0xFYn
z%B*+lR&^kF!mf~e{t-YYrQ*tC!SnE<fO|!PnBK^m$XE}mu4xDG!lnoKx4O2aKEazM
zY}74Z`+wb2OS^GbRae>bWl<qJjgdhh0Pg0<h74Uq+iwV#fwz<_1ajWVl!ns%)RK>?
zj*K5x%MAK2se#*n**36y3Vk=}wo@wyu-#CZOEZ1u<u!pmQSLp;YQt8=;>O6jE8EAE
zAPD*v<Rp+#Ry!c8xGKij;Q?GRbfL1b+}pZ+J<Na~DX$q)(c(dSUg$jzsL<){A)ygC
zJ8^{-3&z1<rKor<HtdQ6C^Zvjlq^8K)>Bs<(-4Z%X<YXMY$igzmU=A^aR+Wz!%d}Z
zY`v_2(WwJk4Xm#jwl-Mc**_sTk<>Y?9fg)}T&@fb7f0(gqBgrZ_$$x)i&MF94kb=<
z8Zn>^cTg{Lta<ra*&JN!lBB4V%JSk=UC=`u22l{jxaC5@lzlTrkZdUrju0_rGa3Ss
zjm7MhtvkG>C`}ecf;y6y)o|<+C~5bfqS0yewz0CtJ5QkvBEt&aCVC>oE@ML*ZVF?`
zN-Yj_g5)U7jZBf>DlYfAD<lTTz3t}TRKnnIWP}b$UG2BZDVS@BQ9O<mru~AA{sLnV
zoyQhS6j{n}Y=zjuk&!qYkhL1eHK1F{Qb-mF20m9FctN8KF1fPc>vEpp0O3X4;bdXp
zp8<E?$(J{`gt+eDnv6B&MCT3^q<}4QnC9*{9HV9<<d8UA))F{U#Tm7fq8D3)5rM=b
zxlMQi{366III>665H40?SQZ<_mtT%-iF;Vv`9sSifwLKO8wwOShW?a>M+}e>F_TDc
zZUT|?#EZC_r9%TrJFRW@`=Q=i>yqM#mLSeRK~%`r{{S!n6lBJ|(GD(ts5+X457HEM
z6)bK2*HzUuAflQL4XT{DoS@#~Qpob+ni@&6V5A@foGBxP$2U)oGjvNCVQ(oMgGh!t
zeB6~gBW^9qk*p-5pr<YX5SHxPL=i=IXMl``D*<4Lik#boeJw4$#cR+~uzGq&I>o@*
zSVv2CfyI>2!fpV{J&|o~?21KW04OP1+>(uBED{Fh=anN-9Ym5KZUymts|Z_x#n2Gn
zc<!xW7GNn`D5JB32iNAw;h4ZF?dOcC0PvBsp+t{quup41Klx6`DdE3#mQh4&8{J9=
z7w(m<HW*K9MaN{Vj*zYM$g*(r!d?Zili>>(a3wU_>#vjHA^RXQ5ZkaR14YG(cZ??i
zk>vr9-L36~%^o;T4d=361{MVk!0~j1;X3`26j7*Qy{~JbDt8lPVfeZdp!h{GCD9Qs
z4aI_txSVbux{$CI@^kW-V`w+ADv0BkXGBH+08l8QV$d$4hCT>tD{Y&50F~^nGByGQ
z)4O3Kamh|31czp*@0+A9u_=$4pnM?eYS_=_Op{_tX(D;$u;#$3`nuM~y6*aAR_Yq9
zukH&!U8p(a`|uAcsvl<#UnA(U)O9?#1D`62s<6HGx*BQUBdpR%@`=;*=_Wg#58XbF
zDdcP&kxe`7(62O|9Ge%m<ydKYXkY-g-({etr(;?O2sTNA(COiTa6ZW9!?bhsQf_M)
zNg)j_LtJg@Fb}FzY?YSWZ`h_!Ame}84rOTvbwfgp^1;BEpP*Z?(atx%=M?4voSXcp
zgphJ>NH_{j;E!mq`O0yktZddG3s?mcW6F{L04FP>Xuox=>4XP1CR_uMp3nuuNlMFD
zi!SYq1g)JhjU8c<GM?L7;M?Ifx3RIw`A&_FB>w=)Su{D<?cH~KDFk*LkKK0Gftwql
zVC0DT?vw{ySY1dqadxiX81KMB!(#}rNw)zvaNbEAB?mm;$}2$}Ep)xFgx$m>xwZ!d
zV6BckTl}QJ194q<aeOYeFo$7CLv6##>vshwAaIcJ$wXlY#g|_rkE&ix!TC)&;bBfB
zc}Q%NlZD;y%E-qPp2;~lPCVr&Cg`C=X~4MoOW5`+uindv#~DOpiONR{j4lrBkdu_A
zXAUpQYq;YHU29(blM9Wz6}^hsqW8*aAtvMI$qTMgLb^MFZc|-vAt^orY3CsjK7>EI
zYmc{q%5l1l#^;aSG9@AjO^~lPArmj@LcAO0G9vpP+gr8QIFK@J@VYkR949(HGKmQ-
zkpp9Jex*qtHt*daVBKSNEMNo9R%VMPh+pLMWj(#P?3oxB1P)ZVvEeDx20?86_D{*~
zk;fytR)KC3Go~WhaTYcUzIjP==PL{+&{-iqQj?3Omjm=djB&x{%ZbI3Sau7t4Zct?
zm(EG}UATBid9X>h>-(aGv+1gxTBe+n>B(-$PyJx%oo5G+s&7<l^z098EWg=#=B21q
z&hl9pXu9(}S>(#C#OApp)9L!YDQpR{xS`hDHMYDj4P|9xO~Cqst+cIXvNwPMKSkE@
z$#fXc?DxGsv9Gb*71cD2cX4&({Wq)BOj;Zb*Pv+=z0GPW*I|-gjXW;Goupw`)5(mY
zTOw;F&`>!_;t=9Q?c&Q=C|P9MfT^q5a!r)AB$k^wXLVyB2G1!Z+8!u5`lM|+cng`T
z#DDh!^L>7<sw<e}vzAtVrqrq4T4e^w6r?<qS7*D8P9y&SxDVZN)T92ee(S;+)-|Uk
z!}n7+tSYQM!}m?fK)9ad-AX(DprvM_!aq>`*N3;PssI-m`l4d%IeUZqt!y8y_Ips&
z8T~`|P8IC(7mc^9q&)7w!aj$ppCf=SHa<~OW~6%5b!|KpOmc#-dS<oi+uRnChOj&g
zt<5gL;9s%8gsyl21lg?6ZilI>a2Q@6<i9H)8a;tQu*s?b#q5KcZReF)Jw%1X+@WNv
zlwcb#jLH81$a%~5FB~*lO6CD_<p<^?Zy8l?k@6h4ltn!|-fmRi<nrcqiX*6{*h#H%
z!%)*tAs0l7M>JfhXJc60s>8?f@;*{ya*9QC^2+Q3V1kw+?{kSLirSc?CgoPmsz5Qg
zF1Yxa9;U>UpQ1t<%-Ib+NNvX85Otb}Eq2#kP*>N_*jO&Ce}#<Iv3^F2=_;Dz`mREn
zo@<U)V^4gtyCmgkXxLi8b>;b<9B@jL4?aPXKEst+Q({rFUw{x&M&}Y&6kJ9~5=PwM
zsLU=oB^T*B{3o&(oGzRx$@FPy5J3xDYviM%#e-UsI5wNOBDXP(z+R>%ph8y2%iab>
zkQI-(BIt^ltg7oJBqo}30#s7!?{{UJst$9>B%i9$R|0NHzEw2w`|!CODUO|h7?e+o
z2I{~?oRGM&fY@ZJMpQCvsq}~>CK#ShL9)2?T64GiBzzz@wTCIxm}~-u00=G_SM-y^
z3o=F3Gr<Pn*$pv}pVZ>3wg(F|Q|gR9*1z^kOH;V=vr#?4)*e;1njCF(QgP^<l1hyf
z6;Ej9>RGiJ14tJ7py6l?2b?G>UH~Y{bAHGtvQtqcugUI;h7wKqR4%Q2Z^JGTG3pgE
zTHeKcEl~de*?$`v!H_P9ZBS%p$108)+%orFHfq-J5A2gFzKJ#ws8qg35H5a*D4+%V
zoRCkr@Rjq1j&P;Ll#WD=A5RKayl)^|%G^>_QZgTC2Mfp|uGuBSmGus;1X-5Bd!7%F
zlz6hA$i3>y$Yh1>78mRngLShQD<1KT<$5Pk>u|C+lJSn@uNmtdb+XLuj<~-ecQ|~q
z{XssqQ|fMDxx%Y$Z=~!SA?j--nb#!S<qF}SE78S*qf$8Bm6oz<(w6OMC_y~4N$w>K
zETn|(H&j@o9*|s{FEpmKxNfqzbK`7$fU{KfMlpoStwvV@0V|It2~I=ClCa%Ep^lc#
zH@UG|zr*SV)K#;0mFF#$=3wU&Yp+!NFRr5#Mjq|1$13jvP@qOu&wA+{3Kqb}297)}
zEc#3$D{LRK52P!p-A>Cnzq-;-Jvoe$;Jo~wjKucNr8c@TRXR&OTr^wgn*AaW+q%IW
ztm+X$@>t+L>pfAfw79grbN>Lv;~}MTBGu@ljz4Xdc1RBVU|n6+SI02@N~W@<g6DGZ
zyq_cGo{;J^iKyXVwaPM9urt~fJT-%LgOL(eUA+GQb;$6_Ol6{54cQ<CbEp1ZIKz%g
z%9^phz@i&i^2-Mm(4#0V0@as#rlQ6$wSX$RC%&S8aqfVb?|tueE}2{@CEX-MfK%be
z8BKhzLS%HbdXGlv@yi=uw&&=*2T#)W$ClZ7MvK?_W}OGNDO~aVpeJfyih9*tZib3B
z(=g+4%a_$d@;(=fkBm0YG2_WMv(%@r)3k}VR!<ad`EbANv>G>7bo{Xb%}M}2?sb>U
zGu74B)H-^qhs`67OO4S~mo~{Cb-_RWN0B{6Q0vBDXVp=44vQh%9-~h8cx&#7W}yUv
z@wgG@>*jqnrfO#g#^Z&3A6Zt@#v5lF59(bQKlu(hFWpdIk1t2I>KcSBY25LD7g#Q%
zsS`?ETpB(~^XksB)n<K|@fbcbhGwT#RqmE&Jf9^${{U>Wx{3nBU6vg|D-30faB)4y
zWr?e#-!1-Dj&08ua;vL&jF&Gf@;T=+k$`tjHSjsMYTHuJJLAj4MY}IDhg$r+n_4ce
zX}XrAur?@K)BQx<H;bMyhwjCc9h!>pHkUY)@>YI%S?V~GgdI(FZ9%-VIFAE_Ev0$y
ze=Cd2amw$cUl;04S5Qc^ZmXWxIoEQq5fI#hqLL$<0=(~$Cr4Ks1#1~>fpuS~#TjXF
zuvQa9_VNnPYa(HPaRGMt?MhlBmeMG7!y5?<a3{c7TE<G^OO6WA)RDV6K1v3mtg*d{
z`kxvpMvogTpCdOkWOwBORqYlbT-KI`k!}?gW65y~u7p+rF(mjyNrT-I?DkPPmp8TW
zsG?KQF(Ur}M8`-ijH%rn$rk;SMKg~9Gm=KIaN=F=PajLEO*4SV;YL_R?{rkrkrTzq
z1HxliK?f*?Fz)W8EC5`Pn#}e>9`MjFWfYFT%9ZWC>^_P&H-p8JH?t60<tqT;D~4}z
z%6kohEtpe`CsTl20V#&&<fxqT(~K3O%xLu38vL9ODb?SUg{Jc|{sGF(im8At-rzo|
zh0k%xxm0p>M*je0^$!n}xMX%w@VYi0NWxb(#ZHDJF13P|Cb;CDQ(6I2ur}6N=*Jrb
z!fxv)xxqqSFMxtZ45njmbIP)b@v*le>V#A|nF&p7gxj)fbwH~v>Z+fR%LQ38<Z&g=
zDbYO0ea=sl(hcV5DE)^(j+bvYQ9fdEVi#06Io4{6X+4uDpo_Q@oF!|sZppiQr4|@O
z#H;~08>q$aWcGqht%R)tg$C+Yw&{&v9qgUBBw$3X1G!HQ0HL?oCc00Q5@S$kka@~*
zee4h|kPdR3Cj!<-iv@iaECilYWERcPg00rD`Xn<Ka#5`Ug?3NEVQy?w!M)0Bo&q!$
zG}sOl638!f+KGM;l0D8%7}&}r?vxCsNj1h479~D7+<RR;BoPTG$xdu;Cm|CRKiN*m
znjMgXnl+G9#bd?Qg*a#&Wi~bo*`W~}U|Q%YSdU`3;Xv+rQ%G&XhSxs`J%eMI2R6c$
zqyu{{hA%c!IgJ_amW36P0ohLrw+_f6ZNcuJ9Dru&TM1zsTZ{!EYXH6wY?i{{t}k&n
zx|43jQ6!SrvSpY%ByTw>vL6Z4p^-c@F|Ob%YB{%&*eWV`%bW<xxTb<aF^{UOZR`?8
zf|6QTqr2=+brp8216V{ci}|{ymNzh6?mxO6#1r2>R-B~O2$eC_HIhi{a1gI~H@(RS
zfgSQ}ppmU_e5ib76oJjpWadM=B(AvR<voG&U?z-c(mBkDqTH1&J7eAru%vAn0`4iU
z0wm2bJ1yx&J+EZiw?s#@1y(BB!EP*@EpF}<oTbsIim{&KY#|?m%9-*PV~eOH9NeHf
z(G-@qH%w$;l2p4z)4&(b6U25Gr$$4^Wu~D!SS(g<jz))Dm486%uvjK%PmG<3slL&<
zWHl#$5d5ufs0XA?u(EoH8;&lFPTY;wit<m{EzOgQnmZ)iJSQP+ZH`x1_)`Kbxy}IK
zBW6|%_M5I~?xcAa;3N)cIY3D!IB|>JC(3sA+mE_wEjY5lO`=$NR`ehnDvEnuT2sgx
z-=cIR-Gx=i8yQrS&F`|GP^z;_K~-?bWRz!w_C=!FnZ&pJqoIV732Glsk9TY<%6Ncf
z?2n;+ok$BCYbhs`+S$5m$ZiMhp^?|hDAFr+5(}<@VE3ZyoB=mM#%})rfUu>tAogF7
zlB(NJDfFOhO{u@8f4T!AmTUUID3}H~Lr;HH_(Vg1Gm9dC$%*h3(Ho3g3I^WyQ$(4q
z3WS^urz*N!I~P_{fwuWo(-FG~LQhR=3-E}>(uJoc*E}ivCZGfV0Pb8XT2Ih2s;*3e
z%GQ*71`?Q(WBfjQDv1xe%HE(_GO8v0Ns)%IUBj>lmRJNkIYhAGBQYG;+m#(3`-)kC
z*?g4^FZ-7sQ9<-*DTlE(uzM|Z>PzeyPpFK#JP)dCp;1FHvyas`$}(DWa(i7tBzsMY
z+>p&^hW0lWM$nUSlo%H_M^Ln0=t#&sT#MxeTnQIEs|JDx*#lf}bPQGz@Rkw$K)a3?
zM1A)`j*Hq0?6+k+!P{}+K|pT66@+nb$15N*m-4QXZWf0|ptD+SV5Fp?1>*r<Qd0=y
z1b<}u74|JVTN^KK$X!CYv9$ZFNV1l?X2!$WV|D#NH+9|iQj;A5bq=dw;2o8TuBdd<
z5>3?Fty`se7botkmWuYm=u)MMBJ5c*Hts6Ujy!OSVxVSII_Q{NwA;cV{?U~Q$*@ay
zJrlH>3nJ*@GCW;FM+=>7cURhNE&;YyqklnqWheo@+l6;d#<8}thLR8(Ey^jt4tynM
zOJigs>5j??909U)uICs~y5yegBo-r`d+?d@dnedml+)tLfQFJhrMU2rf{<XF<zO};
zc5P(CdlO=welU=@4nigv3Anl8I1}YCxwo+Fm97V}#w7rp**pLf8^V8pRxqw<Baoqc
z50xnv{$itc&=y8yWE`g3$vh_)d?e&p<zoy}M8j)w^hq3dH?k@y&JEKF&Vm8wkAzr_
ztsdZ;8(KMXSGBHbA=yi2qn{*Ew&VhVs;-0^G$|ye4kpI`0A(NKBXhSDHp4)Vl*#%)
zOB8P=_Erq1WPA&yE*8Uob*hbErZ)!MVF^_unA?)9<;eFq54x(Yl9{H@k)qyK0%c8H
zq~9e|R!i?H$5O1N0ERdd@Th7fYsny^{)R&&b?{I3Q8<p=raj>_J2tw>4m=E^BX0#V
z7T>lJ(8fC;*^?T^;Y!wD$|5+f0J1751+G9#W(R^Jdz5qy>;jSquV4Z?2zG&sl%Y|v
zkVJcgd=WXrj(aE4z+45!5%9zsI80hF83ZAt$qIKi!99bx8A~fh->PBKpisbkSvzmh
zJ8n|6e`FbnY1j*fF05hzXV1b0nWVTYINQbfO3T3xXt26?%2>fTvXiz#i)Tbp9^VQ^
z3}1_ODLWD~;W#)Css#|E>ZBcw(;8dAKXl@L4p3$|oZFOy`?#`KTFC|R{ua>a;%=8G
zy6a!zI@cY(=mbCsI4SKG8A;z4`zJR408oP&3OlAdIZh!l!31Nk&J%BbaFk$U_eerv
zS;vGN{{W}}igpKbf}8aZswhbhX4bakB;4N%iQ3Wax{2~Q4g#!tIVIRcPaFV<k>A5r
z@yj4~00Zcjs-gQxE;vEOu*PW<ZvgT#pq`<v!793Hz}DXO@T%*z5o4U9v6PpPkz-$}
z#~Vp$D?MMUob3enLDtsZ_bRdSx<^^JH%^jA7F^Aas?;Ws`&-In5Y*H<*5w(e>GH_%
z=Q6|SwHj8Q=GyUJ#u04ha<ZRG(H!Rj=Kla?si4uU(fX`0!akA>mIa^`aG9{O&XJ&x
zl&y*m%{8$!exvj$vxY|7Z35lNNmHmWUeCR|ASbI1IOf<{4aUY+N(^KTs-B`-8*WEb
zzj41mWCVbh5(0FC!HEOhK;+#^cZ-WIr)PU9T;Ak_bY~jS*o2qm9Ta4XZoknF5N_^3
z`=g+AZ5bowD=87Kh>V@ZbWO<Tl`OI`!p%RjYXRV8EuEO-q1MNXrtTrw3S1nd4GAo&
zM0<&E%0TG>7Ajx`u2St5;={_?4-j_;llqEqYpgGjrXx2bl!Ko6<!dzza0FakFCbt4
z0KmD|9|1bZGYz-O;04p{Ez0WxIanzTZMaH6zBwT{V<U@W<t6)`O2dsH@Q`o{U+$3K
zoU8;i3uKbGST!ln(KGoLGaP(zbkmE3px-G0$-R+AVsqIczx*eckLa=ZT<HzJNEi6!
zFoP^_^h>qY@Ddle9#?L77Qf2Ib}0p?Jf@r^aVL_vlWgT<ShghGCIR2<oCzl53%TyG
zyBbD0O>+;M{3qmgNJak1Kt@_`lDL6u45u3bkdU80M8KhhBq2E8DYo#i7~6b=$Bu23
z^MA5o<K+@^K(hD(-*h?T8=@!2-3sG#;W{A6;TXE-fA$j?MYzS1IpcTvOhNW2H#{j}
z{ahhT%^bUq%19^hZazv5%@kNiW93NueGqZWoA91x#x6-pbU=A<y@};LnZQs2Z{0`<
zzX=)97D;Y+!cO3>xCexU_`lI&mLrXhZURo+t~a%^Y??^}1ap;zVx9%~DTLg3T;fM?
zqj?)m?t((O4s)zdeyNxE35Dag?3ukfMBLAJG_uHj&bdBUf2K6I-DBl#S)`162kfUB
zGfylZvg=sBj~nKG&p&pX8(sd>RMhk>4i<=5EwtJjL%%{;bT$G#pR(T)3eO}5)6~sr
z7G~cIb)&>Kw-{A=cAD7jX5naPVhpfcnK9AZi!UXz#-28SJfcGsFj~ll70g&d&j||;
zg(cDzj0-Cbl}@7ob4tCCUnm-w?g>Gw8Z7g!prI}f7SCnpy3UmAy1??iuTrBA2Mak_
zp)yw+vy}Mp@@C1ABzWl3XWfn0_)q@;N~#<Kh3oYFGZ%JW>Je?}h-`m`7iajXqlNif
z(c;5Rst1A>I+CTG+z-)vG~F`|zfbm5x|W9wVEaJ(ApBH}ysPwikrgc96*Lo6wZhj|
zTBI$7<N$+&u)J_oegsu!Mb}Q&Rfzz*i&v*~`{i_PC3*KwhVNyXKV|6p81@V(WWbuD
z@yTevr(rG1e3bi#7gJJOXu2TS1@oVh{AMXdxfG0@l$8|k2LV;pMBr|;v*!RHWu-6d
zzAgSP6P-Z2o1&VPr*=ZRqYbd(LMb-qH%ieXO_~b!FnGV?q?AcXwizpc7O+(MkS=Mm
zumR*`5{9UW&KV1$eng<QiK{UB%ry^j+Ts-~R5LzLe&xHXrD?e!D(BO&uE1RweE8Kg
zRX;@s`g>y+AS&%b763pU)}F2~Ta`nov;b@sW#`2zu(+m2q(TWF_*z;>SR2`8XeKOu
zfm%&D#q0+8UMHIgW!eN%U6ailEqfqj4c)@Ed?n4w4q9s-7mV@bQYxBbY2a&($VGl#
zjcSSq2>Bw(wKdEFz>ED?&|u39IJUM%P;HP^mazuunp8ECzE}6M9E1GDa6ImL8)GF$
zRa6Gw7gY6iFLRF3VdWiA@CCV5^$ac~hLzg}q>NY1D~<^&zG*CZ%CV`ZlIIGtrkYK~
zEZ`6H4rV0s0-l~C;c%HtN<;2@t7>>y)?d0_DFMm!2<Gjz`yu9dH%3*Kj|#cd#?nc$
zq!o`IhL-N_l@yS>I7<5X<KoC^E8Qc!E7L(FG3_0ZRI_?zSAJl)Sd}9jEt8H?wAv>n
zWw6xtw2n{08d}L-em+p4@t@`aO%p-BLPn@X8XXXGh$UG-+cx|v@cp*<Qb$pXU;CpO
zNpxvO!=I2rC}(4Yp0Fd7$H+P5I+eYWaAV8e$0{ici2YVkK5KVQW5MLAHU*85KX57u
zt0#@7&NxQAus0_vw!Q3V<SJoq%Pk`{)Dz7m{YR5^gVsxTIFhzH{X;`dh*&*RS4$zf
z`fmo>A(gNl!?$#W<HBeGDdV#B`XD=Z!cgSPi`^r9-DZG^+Wtb~E;vjbjq<tX&E+i(
zdN_a%O19A}pGz=wZy?=Jx!L61O-mtUgOp_*3wu4+qPohpp^;d);9l#}wEbqft{`6U
z(0*6V-8rZjp3)paUaQjj#^$s+<o(x+<<3~y*@{=DZgmJ9BX>SmIF*{!A(k<A5*6EZ
zDBTzW!~3A>{{W2Z-r;zDPIWCE6lWbZSRA;Ygfzyj{E`CE8fFjGWZ5a$N3<?TPAkwU
zndqN0K2)!%n72HuC((d!WHj)#y_ZyH5hUn>85~W@u%vy>f~_qg_C(Q_HNcUAjV4Fr
zc4#PRMBTDca_OJ~cBpi!$k@;TE<P3YG*uO#2FGUo7f%Q{)K#&Qe$0hUDQu?AI4W9r
z$mMMR0QBUq8=Tzz6+Wk?K9$7V`z{=wEaSF-=Ri@|45Ar4Q4Eki>ZYPsgR~*N?{~Sy
zb36_}`BF5k)Y)%oP*m50-BZK}J=4rHNDkJYsuA&JdL3j<6Mla33tr0Jg0Y|rkh2p*
zELn3%3QBn-91~^f_|0MLgr#P}TKJmGxEw6TyR1aOcATb2>11v$P*Q1cnc>bDzwWP>
z%Ed0xNT)!QHL_GscC@WlnjY4NTlYZe^bu4404N1p#P+qe3&_oxIcU_$!6)?_1Z5~`
zzzVx|<BOuHq%A1BltCWLSm0?H8BLNFf>b}83~ovet5aYG&RkCmyE{~s6IF(QZDp6%
zqhrCjN7ZTt;{|7Rdbth5Z=5dQ8E|AW%`{Wi!oW%6DypzX(0`iTE0{F;s;85*<r40k
zl(dr5b@Ui~=s{8D%L|mP9(!EZxz08=x}~gPX)DmRT@FS9OGx=yJx+v1<Av$s$sD^x
z<p&kBH6d^*jU~s0V^d5o^W8=u486bn3hn(9Y)X24!sJ;T+IX5RVep0ZO9v?pRfj4r
zGLr>1OFS&GAXqB-qU4XNne`4N_)tkHa3c6rON!W4ph>RI5YBttQ8SjeF0ny5;Gb#2
zc<iAdakdIa<au2XF1m4H+jPn%26hT`R=!GXpoJR=PSJ^;>kJ{^cN{6U+;&J>06|bK
z42_pRD#uUL-7~{l+meEa*}}_N(oc)m0!9K4bn!{Of=}otOzB6|+t}lN0Pc;b=@}y!
zry|}$^`4T4N)*hJNe3JNrRrT*O{b@GV5Kj0uulrpc;L1O#mM>FThqTOHLYb?Yh`G9
z!mQ7zz2r1}4$C_7xRjiVIMBy)d#K3gDO}-n%iQBCi2y<|WZR+{8Fwk{fL$9l!I=36
z7*6-Ql2MJNI5r91j?uunS2PO(5nClYVj;~S6wQ}IotnsfJDaBnz7(x!?4P-<Ly@~9
z^t<r7z;;e_m&L52bBP!zt1}VC$CScN$W9=fT{)4Hz(=6j6^To*oLeY{LVJ}nBVbDB
zM&t(AU49e25<4p>+Q2Pj*+91!34TUvD;&drgyu0zC>Kl)u~kmdwm7oGl?&SEc2n-X
z?iV)K!p(#X!hTW;Vsm9;*zPX5%=Y0g$ZG**G9i#PsplRSZZ;@6Hfam8$)IP-Q@G@%
zYfk_nvm`npoD^J4Bq-sG<J)9hWHeZ+CqlMFV7^F9F^2ZaE7tbd45;KghhUkoSq|-?
zK>0~Ll_Z>6;X>hbsA0R0^AzSd-;PoieZq{pZwNFB4~Sh&w1MRVPbHmV>!UqUw~&$0
zsSJCq$xRQtlyXYaeX43WOpX{RDA><L)b4Xnv;%)A)>KtFwjR;&jG@!7VQkqPbp5Tl
z76Dg-NSmFqrLBCKaV0oGVROPFa>z*n-zZsXSUDw6l1wz&1y1JRUc-bV_kEP|)Ox<w
zu%(Wj#i7o}!e;C}0vnGicq%p#<t0l)0l$O;-U%cWn@nZ0;q~KfiMj%=vgaSN49Ex>
zO>1wPqivgw9QubJx>)9UHX$gCa-P;S1RO$38=UK1DYumwaA?O0BJAL)q`;7DO>3=@
ze+p+tz}%34VIv^fM^PiKmlaiJt1KXU8z9?jttOb@V;Kt<MC-^2Ia=KylELE39lkRQ
z)BrJ+l+;)*ZWgY!zr#21vpR^gi9MD~?qy4vd)y}Nu?lB`eiJ~k2Fi($k{ZA)k>4r(
z(_Mm#5q3o3-88oO;Y)0!Jlz4>7#n`cOKhIe;c*Dqc#nsXgh_pxY!LAb_9}NY?d38d
zG*?$VoAyyqW#Z~u#$2SKU=OjnbaTkk=`FYh%I3r}!B*)zKo>SwOe`(zh!qvm?%iuB
zq&r)m3dUvvab;Ir3rPh8236L(bDTRUDf0ZM)G(5rPRm;ff!S?J2F^PsR1aafQa~)g
z6DR#8W@J*%EhacbK-?&5NcC_O(Q$+#W=H_Ko(BHP297h7L^ik<PQ?<Twq{NWs+;wk
zD|x^SCd#U2`_@J!r{H4<f-#;H6ynY05!q`nFm2zFm1{}<*aFJ40#L0fhw#S<8wx_y
z{(`Ec{YK{M)}((7;Z?u&CPvWKHzUF-Hj>^yWIItz9^P@`E6}z@II~n#!qR*xrxpqd
zZ}&&l5sUg#Hn!?n<!c+21vTsfTCeugRiRU+15r}a>sbu>3(5IOI2-JnkDH*C4A|eY
zHh|jLLU%<`0uLg~Frvs3Ktb0LWN65-w+IUV00;oDBwW}oh@JQgi*9*R!yVoV40x9s
zQ+=Qne?tHuT~q0i*aEMqFwm!C&}=cZ9u)7Dtc>S`D3CC7fU31^Kt{(|$*zQJWLoy3
z*0tW@h3DGdpk<N4ruRi_x|a75yZfx%uP<?NJgk+Qp{^yy>zLn#%;gtL4byZII3pzR
zt!bKC+mw{h4){g}wWH+*6oBTv@P5g(>@Ic%%9>^Z>>~8qS3W>3bhH-2^x9H(n_Xz=
zDX;;;k58c?qYC0E16YG#8yt4=V7c}ngV{O24BS~p_h0#}fs-O}7B{g`INRYYg+$|@
z36L0slDHAwH*n_sB;0rd3sHxGoc_tpY0fgE0p3&ENapKNh1fi%J~rg?p69!;vW%PZ
ziH7=P##b-^Qsl0;HcVmQUxengj!03op6i3V0+hqf+wxRyxAi9xbj_CJtYHXe^(TW1
z1<rBhK`F(CP*TM_mkqv9@1Rg@`h*eSTlZ17Qr;}Xge)3E+;>QBtRbL|J9}~hG-pHU
zUik(0T^|fL9n^4*mJN^ZWK?_HY(<u!o#`8n5*S<s!-AQu4Q<KfWeq(;7}J}re?o~M
zExpgwpem{aVC6wsTGqDvhwi8=^#>cFu+@a>70)F5ilEdgB*;+JR?6#*z<mM&NnGw+
zN*#=}ERQ7RLgKm3%4Sbw=^3+$;W{?lrEFxQDXIARMY;gA?KT*)v80T<vPx=VNGFAB
zPY7th7gB6=sBAH9?2CpH<6<tQrhuChVf9BcGHtfO1U(T!P5|K@1wRCfDQW45%d(7X
z2m--14;A)D6k($P*-q9BamF&7$jy|2q?=mE(L^IzZrDwjdvC&@YKEn^7XJVUSm^?S
zEn<76zHpw{#jlc;jcxl{*+A4!Ms7wgm1MztVF^glxLF(kx}2HOjUq;jUdx^dI7;4a
zYp0u)D>^8EF~sKy-jlAT0N8Q!Wx(4uy3LG`*0RG1Qs213Li-D)u+iPWP7?M_zEiGv
z7+5EBi<GSw?Sz=W&@R9B@UX~!I|S?I$&EI`Q0%NQ;w}<x$2jbezQ-J<7n|HHglUf2
zJ7qEcFJ!xj&5~sH1rbor<q0XXk#YhWZ-9W5lJBA@5@g$&8*%~~SB8S5H?SZa{2*&&
zdv9jtS}618N+tuJx(iaQ4Q>!s6V7jwZ>pu$pHe}yiSNpDmCs_=YF8v)%A$J5yx3;_
z&`*x0X||j4u5_&#?;yJQ?6YFIFeoXeseW%|qtbL}nn8am$4$~&94%l5I9fUy7-MKV
zzp_@udjX=;DcA+_jSPY&@NN-KbaAuVz<$Un=W#e6a)Q~Zi8Vt*eT;Igs-5m9+HR$q
zNgiz1Tj-z=Ima(^iTO=PtZ}vu(C3@p%2q}><f3AOXtlnoX2u2w_*uy#t{7VZbSBqA
z%-a=dI{+6zPTW|f<U7WZ03P1qM&{g-Tu<E*9jtt&xPX61vUKd`$f=Eijkvwd{#AuE
zV*dc6{{WOU4mYscKFY=yyJ*eOY|ukq%>JFf0V@VPC3)}4b3E87wst{iP))43H=6{w
zzbV1J!QldwCpZ@SE*Ko!!gkzd#c;@2WH5kR<fJ3Dlbm~|_PJWkM_S)hq+aIs$Vl6?
zlh0+u_Uy1a9B`0wd=CjRZdVTLBOyjJf)iY9Z`mQZ7`p2?tT2G`7k9c)!cTR@hTm)~
zY8ZD8N<wXro?DCeNLmNcVOY!e#!>^4xxgF(kl^x&r(WjC3AZUo?|T%SENVL7o;X}h
zvBp<tkMO$77)#%>QIGJG3!LG?z@c~?TPY8V*(UA<*KQq_u%URs;VO>&pV=-*zxP<y
zDHrW@%={F*c?q`f*)Sv{h7w$HV!Pxd#ugQgIk@hldAHZHk=!WV!YPtqvfSqQLm$+M
zn1V16*Bkx<bVfr>#}_I$hdAIAV_E^=Wi{-@$V`rTFds?RyRJea2#x}kpl(w{&@2kg
z44CL)u(>4mPAumb@}`c#z0+iKK}c3Ip^e59hYArO2b?7m3tv2;MbyzX@O-4W9f?qS
z!8Ow1ZXtORCUdZu={tO(-61FZD4!>Ce{|dlyq>}xDv9!c_z>auxxNBxq-f*1Wf~<c
zgs*?c%4e*9q@g944BsjrU;g5#k|XjTc|lClFK!WWLf`35q+r`;I0R7G&*m0g5z^V`
zb_G2+Ex@vDP_PV)qNkoP++_>vZa7-O&_sJ1;ZGc(VFcTglvFIb=E{z&EIJu4!Yzj4
z_d-*&3nG}fUuU4Y9tu;!X-*uaFoa=4D{cxPj3}iB$e~Kwn888%OfE*$M&fxYDB<^V
zy6_Rr(CTPg&5>+@w&6aO5rlJL7F~y$`zq&!yG|7btxDH5-qo;{7LkQdsYKfxAkfig
zmuos!_Zv3(RdHzKI{Pj5%G~PvTXG{+43r0DihBAej?lE@8=7|8>bDwHdq5Uhsv3s1
z!tJqIItq~B0KOEak<*Gy&{JWdOyh(VERJv-qnIu}SC{1Y>nfwIIv{ggN|rc$so5S>
ztzZky!T6X$T$s-#=z!BS@)v$uG1wwPY>oh2uIYIA;<^&s1eP{5U<FxPS}u&Psu6=_
zpR1~tLuQOGn*4@bF_#tDXv0=PSn}d_g<Jr?KtR9d7dt%sBX&yuZW4MxA0=={3XmMD
zqPBQ(!lBh*mG@`?YvhQzxC*|qlLq!&`QYI0jTxBQY6%3lB=WR+ZrFg_R5LTvy@IW&
zsFjBo!sx~1ry8MTjWg>bXs{s%RaVk4R!Xl`njk>E)l0Rx%l*&A`;|G=ozPZ|ql=|^
z_u&%-2ynT#-DR}>U=S`<t95`IU~Z);CFp+3Iq9N^SdgnHV_f0~36g3|cj|Ec&~xfh
zxAdH-MlzhPhe;r&(lng;Q?`x^WB{n7)!aC60Yv>^oNu{Z@yxL<gmL6t)<FOVASw#R
z$8rUTQO#cII3$ESq;r(z<Vz#!hfqj%)`NcvI*O3NizwdW8{JpdO6-diR9girAg`)(
zt^vZUd)(vtl+_O+=V`hL?t7nozu9!-g%4_nwWOOK>E)c;l<Iakf$hRAl<p&prjz;r
z0BeQMZpta9m7|+0XHyW|@T=?C15ORmgssy;*<LG4U+#Yh>Rm;)vz`9{%Fosvk8mGV
z3{%;_-pkRCj~T~ewrjuCH#Z%VqnXdKS@`Q4g=s@Lc>rJRx$^kxD?=t;Qna{VvXV<T
z{{ShJm-O(4tddONu0*y3GG`B0kfm$vIaSST-20oOLr7*-_@L1ZWm%1+{>p<<)Ew)L
z+$#-D#D{;CkksbdTno4>yT!t!#GN2rTB`f5>yondj`tr5#<pPNl0J&2p}@F{ucGns
zD4dxjKo7=K$--d3;VtdO*J%x$ZSqop2?@8kPmehU>oX!|HtkH5VM@$5g%p7El&Eh&
zuK7|%NXp{e@pSf!c2y9tpsMto3e{-Z)7an`;y75A<Ahxl?_-<p&HJuQ{yNCEQZu93
zbS+%HpgGz4tN5zlAQmNgUr$#)?f2X*=8;fd-bWm-lk<FD60^25az=^(=^QU|tf8l9
zXu7YYnl>~NQdH{gj1bbeB9nA8vU>2=@nus`cOG(vsMKekOEg%0RFFd>#m_6Rj8ddc
zyX-*F22+?u;4G$fEBqBD9-mPxt!r9bZ`o4@JCzcZM7Pi(WRd_#UZ>L(kTy1xw)R;*
zm*~w#eUAXOtJAa&lc<4>-sctc{x^c-8>5^2h^IrHOA(9O(Zb4gK9FRI<*f_U==4I?
zfb6cR>DZ(hYUrPavMOMfZ=>eppjOXUv5`3ElC(N!;r#NnI&+iQ1?(*8Xqz}8qRRe{
zNP-rRX#1$*{6-k=TRFMSv&X3a01l1_iylZ;F6a=*kF=BU7q3T5&KfSGtB5u?Uc(Ea
zcz7VRhFreSn)>HOZkpQ`fKC8eh+$~#7WeU9Sf$qeCO>xDlCg{}2Fv4o$th)*6S6RL
zhrt6#y^$s+G<<~CNY?jHbMDdt^0KDAosd+D`l*9108!G+T<oQ*jGK^~M*%Oo=epQj
zONuzXOCw!Q*yFnGJ_j@eMPnW5k-{s=Ye><=W;J@JM|QPR$1~)T?s>AZ)>-Z)QU~n5
zY`qLJ=C(&IrdUZULr!jnhCg0>fKaA;y2Pt39Jka5h1KyWt7LgL=+Wr(QMH2Y3eIRF
zYYmzZ^fIxG!5B=`D_Yhca9nB<a<i^9mdx)_2-+WDEoJ5!^B(ElU~Ih;RFqEQ(BN*V
zXVHY@kkUx-7u0??6N<KZ-cCh&Jl3KT2qg_5#fBEsTF_*U=ViVYI=!xfa>6#1>dF*y
z+F+7LcPQQ(z;9&vNjEpL4xz_4x;02BY|<VYQ1VFaxG77IaH5bCbQ1d+14|>ENV;PQ
zBqzwi9FjKK-&FK4TviRf6Wl_9t^j3oq!#!H39*vrg%D^`Uik?L!oyIGAPWT>jne%B
z>kFem8ZJ*|bD~$ejzPFxz13R)zEKdk8vuiCbR9F%^v<}UqNn$=dE~d~Xs}g!_g!il
zlx~KajyibGH-4vn>Yqu{A6DQAARh}=P13+dHpU49n<>pr?T;7f9(z(JdyC#lamgpT
z4n~pPZ90!jj)}K<0Q@YR&1>F6bDmOTotjF3wu`5<TeeXihyAIhH#f?)i({e&_(s6X
z<qZU7$H`Vy%`DB5$W~1qJDdhEQ1vwan6XAWSMA0=h-Z*)TvV(S24W|+6C{i^6!(A)
zvW1>j?d24Q29w)x6eYy+QoZHG_)H9O@~V-#7Wd$;&)G=WPbGJ!`zA5b3!H>ZO>M7h
zC|WI>VL#Nc!BUg93Ma+VTwcg>@=rENy2PPC4rACpR8vaRggBAJV5c%W*qfomWawkY
z<A9N{oBsgHEs+jWoCgV%tDrUu>FpooC~dn1Bgkrqzcx#4g)#R4f>IJ(egbq&4z^UA
zT7HNc$Oy4diUR&PPc2~Wa-@m-PB=|;2Fc=}yG6(!RO3v>TL6@-n5P$ysy`)y*&BtL
zZG=3MI`$YUX<p)RqH8_Z?wK0SVeU#t$lmE(+zg8-U2m#uvkh@Bb^x+a4X<RP-U?ed
zn+z;542QWWXS+B=$r(57R68tI4d__Sl)>GChtqZLf3lJm9AKc(3E+ou$X1k&Y&P<R
zhT*vxMMT2ys-3ncvd%3@>~F9I($&u}%g7yq9vB^N3T;U(Z|br&_6pe)(gu=FPt^?K
z9{brvESsIp%6m5v;UL>5gftu35hTnF<REtzi~h<NzZ|N11qoX&;y@@F1;Qo39!1J&
zV84{3bPUi`jK*zbLn9X$PY{9*Q&FrN)a(M{@Nd~qBq5`O9Y75Tg=|;JVQ%Sx*+ZEI
z<t#7mQK~RVaSACt#FC%95pGj|QRfI=%|z5J_k;4ax=9->vb2B)0d=R+K_FtwG<A6W
zht?2dIKCENQX_d<dX^Cx<Sd@3PV$0BbfriLkO#_RjkDb}lYZ$gNZ_iZMp6~$38enZ
zh4Pwyh=`>_iNfU{doInpp+z~OKyl%5DWdkZlSbq9;c7Q9h@El>L|)+w05{<j2e$~K
zQ;;1)OTLLH+3vq%%9dbne#o6Z0`f4bm7LOa8%ZOY&~t@r1m?p0A>yU80kZ5cfn}<M
z<zfD&=JWJG)coB^6t)TqsV{#kCKgvpJ=jYJDU&}bV0M0~n5eXe^yM<E{k{{RBVf91
zN9i|8!iq|h{6TYtJu&u<R25DBBATB2M}?7|iOI5>0&n3!KR{AN{{Y!eD<+#P<yK1H
zaW_^n-)SR12nkQUDhVVlzzSP?dH7Mo+rpTP8>|bUU@a}xy&(P@RZaf@hyhmAmNAQE
z0KUbk{Uj=hzg|_nSs|w06*R6J&&q4qDUOeu_xht_7$5Mf<2H90M^l?Ljuhl!DhIcV
zA>sc3cb@2}&Ew>hG!49h{!xfasywtORsN4YQc{7mSd_I`jmp49G^5@?P3Jxn=CN^1
zBH6me8stqA?0G`J#gx>y4&hDcXrkOd+uJI;P=949k-%_*tdYmPkW6NVMt2)4Dkw>C
z!VZEW_uAJhOQ%v;aEn$1$><=k;{jN-hBRX-BZq5yA*$yQwCA<1qWd1~W}#W>w18GS
zUew71ZbfUA`))T~W9zC6uQ^3410txD%JOf87e7VW?4)E)cV$F{u_70BtgUER2tmaG
z7CA;jOD&rfsL7TwF}6rrPjQtCCjeUK>WijfmBR^G>5rwO^$pJpN2Jj)fLI~)_%^oo
z3gVmwfN~Hw`wWaWHsF1dK1($DOgC^Q_)$OG&C;5Vl1Cf@qAs~jbB1h~UJnMzfGey=
zDl^VPbDRl0qz)WeY74QOTzCms(wr`G)S~^**$^Dofyzf%JM5lVQ%pA*TV^73mf<Gi
z<Cc{nhQkR1ZFQ)^Hso-Wwbo4}-uX{yE*SwZ7{bC%UCMW(VSegX<2C_1)N4So1S}FQ
zt_{7D3m)U1%3|xA1;p7XD2<ftIXPAo(Lm8_e`G5i<DTkR+(*#_z{@z|h>S6zOv*@|
zY&BLkp}+x)u6<mMAE>6WOGi_}*5HIKL5Y{O?5o{g@G^v`)E#f-30TPlRZiy{G+XGa
zs@?rX4^gOFf&mJTQPgBNyY8@3VYQP&1Fw}qsa3QaHK6!IRaCv#_n+MY_uP_lu+%z9
z3yCJ*MG?7NPExaynvG`$+^M36xlW2QPYAeJafBN+2^1Lw1Z^}PLUklIu{?NIa5ne>
zBV(j8o*a8wm0?d#?n_jZ(E)5L2w^X=H?Tn~9WO*sLR<hM%Ep?UH?n+DHK161QB02M
zmWPZ+MmB+fRLu?_3C)YRx}C9$UduLzQL+ZL#0)7J8RUdR8WfEQT#CjN53?7tf}yzK
z9OjS^l~_F4EtFB9ZMJT2@R6-;@q2tHmivEE%4BV`kNhH?iCYe$+kO$v0Gxy!5CDwb
z8qP|Tj+|(bgRsTZtS$w!-6KG^bmcPX90x0i^JMFTag>f1A1e(*EC4B_cIV1<hhn>G
zz!(L){^>|LDZp@2fKA2L4GjP%THskZpj~zdzbIJaE!-|R<P-EyxINQJ?}R|c3-?Qa
zIJ)bD_egt=76I3?X@54tM>r1m2ug~kFlFD}6s$(lCYn*S+}T!5RMxzbctUCw?H4<&
zs4DCI#?HE=V`nZ*=^9sRfs8h{&DB+IskoevvZQqLJXxd*pDI{sWpT+Tx}_v}^T_1F
zOwW*>Kut7q)Oi@PHkN_qq0S=z07Y*}Mq6tis>GR3r|3fah|iUONu@S6+_uO3qT0a&
zcNY=#Ncyw14E!N>WQn7W2$}$3P|aFdaK;b18S_ZsaDJ#_ByqjK7vQbO>}3n+eD#$k
z_5=4&2hS%b3T8x4E+na=hQ}oq(mHYA`yq-f-sdWI!(s{M%23c6E!jJ0_`R^DDV?yy
zkkG+&;?{$UU2wJb^0<+EcS~i|XcnQp$yKv+m1$50Rc!Vrx7|`CrxGA9!f9c@8B@c7
zf-aQg-BBD9>`Hju_4=y_VI`pVP}84v!AG+#7ANY1VTl8y+6W-sBL;93vbEQ^IQdLq
zwawJqI<fREz$dcp*J()MYkZ_2j|g^Hb4a~~{)>;a{{VEE01JiOH)<w34mdodcfhhk
zer??$@>b{<VzlsXxa3_R{aFcGKFBZ%F?81)k!0g*Sa(Qo;cFYAq`R=?CEN;i{l7%g
z;bcwO&Mv*lDG7H6mBskZQVi#^-5H8+$W3?21ue6mvO+JL08up!wi2%Hkl6u5`Xp`1
zOSF&<QUGsjqJ<ZPg!x^PI9x2z##S)fWF^~tf|UFvJ62}wZGib)8QS)`ar&ge?p6&@
z!rvXzk)A$@-hPR<ANW|*Hpi61!MX09ZcWBhPEkx&G>$KTxp7E&MGD5g{gh7!pR$$S
zQyxu$2%>TUmf(;NDkcwi1raIm0*!#DL?lSY<CKM-GNl#+K078j@q|-nJi8<PzEk5T
z7Ad7Ug*YsfIo$A~na9d|jfW^&mt>5gK~G~`^UrkGNse-%F7I*^9P1-Pa|m>wP?%&k
z<b6=?lE*nvzIKb;;TDnulL~yc_kORUiSsu1-DO`TNEa7E%UA%gJRl{uSxHfD>ItgA
z?k)9IGSw0diiPty+RFoxV=Y<TaBQLc(C~y{k;e8VOX$hrVR;{;5k^7DQn|QPqgS!v
z$$!@42O#~?UPMKHJj+){xg>Pv_W-Ks^~kpXMZTdK7Ox4lh)%P>Px0mS9TW~6gj7-6
zvI;Fu6M#aRI_A5JDdo!+Qx-WO_{F{y?LxyQ<Wn*i8)tIpaO0HW!azHx1h!$oCb_BY
z2^<j=4rtU&XS;+{)(B%DX<ZndGFcU%%68Zz8TwUhRSh2qmQ^$Qmuiwc`9;`7jrdhM
zj9`L}byE%jLDb6ETm&rKS(MeOT<h2>Z^=7xxLY~k4<`yA$PWlm)Msd^PT`CFmV-}&
zXc$w+MA6tIV1zL6r<G{FCq(qEupN=n@KDfz5i#1!hFzVB+9zsoOlo-HWCM?N1otBW
z5pUTen{_O(<ft)pQPx2BlB=YEw)Sn-o$!K(mXsdL=KRmZIlfWs=vfh#m5&89F~Hu%
zXdgl{Y=oWw!NT+L_?bLwa}sqfikUat!mX~AtZCeCRm8x$;3~T6BH&G~y#D|z$ev%;
zD@KGU%IZ3lak$-4R%?)pv^MA9tDc~sJ00y<TH1LVBZZGEkvAPNoM?S*d*yMpfI+f9
zRmScK4Li?cWa!|PuC<MqLYA}zNV27gv9|?E=REsb@1hn4$kFZxm0?A-(g0S1ZR~GE
zFwxH|xhClLX%c#SoNTYO*dg0++x<c=cDH5%=&66yTT8PQQKvLJXe5=;=~)DW_X|NZ
zP2a%EU9Ao9mQB{!yxV0Ps9M3r)P92rBGwAVt<4w8u64=B3zjyXi!H5@$xjyqAgW-D
zo)w3r@-PaF)4RTY%dsi;!J?tmEs&cqD5TQ>&cL*^^zE>?Q<_$|aGRU^7j2nHs7N*q
zKeDibiMwoYui>C?HVM;GhO+}d2-_%(-AywCEoD(zMjv}{wKGx4AvOv>^rCX?DnZu7
zZjU_FG~1Ky!l{=|cy<MsqiQrvj`zx-nihJ877MB#Q(8ty%R@l&>k?L*L(_|FNXnj;
zjjnh$1z%9pwTu@Db9oJ;R>h~JXlDvJsDq8HjxTFZ%H}u|a<~+ojmC<zL$SZ51z6un
zyes;dV{CsbJF3*j=iyrvo0S0>U2dXK*9PDfh}EQ&$aiIKbq$hS4(m6m(OeT{^qv%y
zR>@>`V=5(e$S8fp-B{{WrI*644a)bR(^if-*sZ;|Tzn^igvZ~)rHF=(RFIzPEca4I
zG7)A8VaJr&ER}#+He4n4H=-g^u=xq3_X$C=r=bZuU?pqp@S-mAQUXEwD>Z1=X*4>5
z9Ndt-1462^1>M<sW}8qWc)4306Ho_e1$f?e3s!Vvk?1U`1)TO#K0_m{2{%D$yQdg8
zzY9S_rk7Z`qy^wg3M}cnAfToWa5l=&P|^cpLP~l@N684?qlOYtwH=#?zLY`0TwQJY
z4?tx^jhV~`HsN9-Ygr&JTkebM22kv4fyaQoU&P81$#Xe;n7%qagF@2T3@vD281Szm
zrDJ(m5B~sY5J3m<Xr!6{0I*TfekA&{2G&tJ0eo$_UrzHT=;2Y~wt8Dw*6;%7G!bhm
zog-Lgp%8p6acSdlR?WExj+$hCgKu;-Y>`sN>1KFq8ZJrfj_k0%iwvx&>G`3hd1-a;
zZd9{mlpy65W~F4+eSOokZE=%OkK4!xE6;k*@uN-=Nl&K&_Z$ayUOTO6brkO=QvQ6b
z?D2-mK)y=(uP5?(r~17XhBUTlbq#iHMz!@5IFjRjQo~U9j4Hi0iPAeF_gacQFo?&p
z-(}!VNi(J!1c}F&U06dSLq*Tg4_OF<2MP$~4drrYo%CKQ*<gQ(+wP9j>6#751y|F~
zEtG32!x}cO7T>Y%yDwlZV>=;r35TXYIaPm}o#jVTY8=jNyL@+vc1lv0qN7@V(Cd|(
zlY5Ee1%IeS;^VnhOxCnuFJA;>c5>yEnO^HgZsLrgu551?HVUs(l(nSUP`a*BCT<1S
zs~l=^IaK()o|O)*xu7tTpsA^rZe3uqdVZ)_J6#z4Mp;@mn_WsUP?piq^4ig&prwuS
z?s2(1t*(us{$d~Y><G6D%4oH!ojy|Y9`FtoyZ-<bHRA{6=%I>~0b=qlSHI(Vn4urz
zY~h?F-J0&J(CMfsWS*hSV?ZYEE9ZWqaF<b*Mt+N%S!}hPQ&QDjWUs86rRTABKV_S&
zq$RH0(PZ=TWtrPlWfY98(rqUQXFRy%VO!O}z~TTvm_QsO9<~$;0KRaeaSb>GqU38p
zP=;pqM?nR9cN^NuH#9ccMaV2I*$E?Va*d8g=Z-t1z4*digsu!eEVBnf5B{X23$Adm
z&ndUD<zy3&bCiVqT`41g5<LKj9h6?0_}eh`I4AZ&4sB#*B{6vf@QQToR=pmT(i7<L
z?V75(o+dPRc2(Z9*WEi!PUxs1maa>Fpxv$g%JS%_nAZE0bHj@OY>rH_lB8&)wn?t)
z^%|{PrId!WpKNX51=?Pm`hoyyH$k#8Bo-I3TaJq~&Y7OCw#UL;F@o$|l69f_cSp}G
zLBcBo-8WI_xnhrZrhjGZ-9PygPTMeBv3-#mwKW^!E(MM@{UBj<WmwYDIH@z|S7_4H
zyp5-o#)?*p?XvVfq>c#QL~Lm!=iy|lB-?y`%g*O)vrQBgEpvVqbgp?M3#*!wyzyii
zjy=aWDWgEyUSpBj+(1yi8**-~9T+5rs2>4yzR2>SfFpx*uo2NwfB|q*K@&r*Y^x7v
zrUovjDZ9}&%6XW`#egLJ5V<(804tZ%dZXIgsAQon85a7dQ+2VG6%Ppo{32$JtS0$T
zlWW)uCQNIwgn^WT?>0^V-8q34&Cw$x0^j9L?ExfK<flKfp4o=FL&xlx=M%|F?k-er
zc>AVE3uJPhR876?1=Ow=zk8=d&fyzK1ESq)@T4yKCkXBGqmj1ckE#PBzx%qCpaFC^
ze}jd_PX!0FIE0BU##GEMAqN|-QE{6y<rNkv^3V;*x{61J@Rmt2$wOR{j>a74mt8X?
z*)=_laVVq)a26aVi;>|?9Xp7<uB7xsc}(;R2N8qHmMV5T11pFZQ$*m>kuirhjh4^s
zoXS=QTe4S7){JFB>Y`17vU_6HgqYaO^JUGdV-4(v-drx?m~w0d%ABkeSV^e{vkfGw
z+PcXmcNPkGDIWZgq>_cr7cE&vO&dtAgc9UqK?5o$u*PzbNrTS_^b@6VC!8pc)pOm2
z8y%Dw#GvDlm|tVUa{waguLJ6`MisAdcPNHiZORNj&ahK9Tel??=oC7lOjs(p%iK}&
zI1$Pj?F6Qa2o18H$7AT0VUuimQ8b;&!`NJBj|x_gggkl0l+4csPuMIjjkk~ioUMM3
z7!3#EWi-~0RDD*<NFKp&2sU<jyJVV&`$r2Ms*+r6wt9g68MlRz)W^NZMbYTb8f7^r
zizb(m$WuL{=D|kcWmL#KV+^O8CYd|gbBB8<$n9jvi-_+~az&D{?f#VyoF_M%ClDYw
zTZE2tLE$x|+X);qbfY8@PVsw$Sj#VT4Jbx7;kZQ!By*b5>tR}Haj;m7s%ac=g>9r>
z*$LFB=WAuV$FmBqrNkTjt72~v2bE7=EJ+Ej#prBvd%0aPxIxFecPNt51^X<Kn**rk
z`AGq}7E4kSAieL|Fbj%jdq;G$-)Xo_q8`Cy`Ny!NVMQ%h`<7C`J)uWanJ%S-U<Hsz
zxjrJA@yGrXq8<m`H=$7X{(^9UmfNzAm;lS<m0dULII;-A6xPO6&OD*%hX{fJ2sN+}
zfA3{m(lq*F*utp4@fE!zfs6oBFpaHYEg<p&rIDWdtID!=kWJMz$J|CPofvF(+%k@X
zZL`7!mM%s_FfLGFqo*Tj0@zVgW<lXiDE9G$>Im-Zi!8Jj%W6j1x9*u)`ZA1yG3kpT
ztC?n;swOH$EWfOPaGFPQogg9ix@)pISUn6QBq`~cb9Dv@MAEq1{{Sf@JZzpuSY-ty
zMeen(k8#{K{>Z8tLid7Obg<aZL-aZWxLg~pT{RevG3`vz={5jM0<x)g#u5G1Wu!?v
zWo=`GZME%Xmey;78b#HXxmwnP?%`l{s_pL}6%NZ?0&2Bxl0#yvGEbD}oy3xz6h+3?
zPP8jxz{2MRZA(lGa)+d+BE*Gf01OLRsB7VCTWo&FIa+sFS&|$+R4t}5I9aKzRyKm4
zdxgT$(9<=x#uOS|9hx@_E101TX#W7pNeqr?3<AnVNN>txoASAXJmCR}#I8J)$H{YR
zl+Fia(mX7KV~D{>1-QyV_2G5ED1dQjJf2dupdQJk%a~6K0FYqdB?HZ}nh5S!7hK!}
z@P!0<<Mn+PZU+~_U>D^m3<Bg5Qz3dBa!zoV@nMj;(*P_5lrE6FlZ3%J*95L<@pOjP
z9#fmRU?5|NebTXnj&iy2%HeQ8NXR6=b&M_SRL#qNR0bIbWhI=}+UXiGAj(oe=Y<Pj
zVlbNLTI7@vt&+NM(T1VssV9cnMJ#{}m0wd-TYD5+FjM7{$2K2TUsC)MU-r5Js<vF_
z%C4%aQ-9(WhDb8Dqzn6%JoA!Cz0^|3;!VjVL`o?RE1mM0lDOqLjXlC)Y(}=_6%0eT
zx@=LBQLx10#|b3Dkg&&dV2g?{+}h<jo)d5YR#dbyINiXG=|&=_h0e$p3et|5+*uJv
zL~t!-YYh>NpqmtEq+$tAO~E%-5X2fdDrl+hEHI~RSr->Z(M19{ndK7J0l-Suj~P<6
zgOHK3v4DVM9h9tMR<|j@93{IdqITZH3C$MlxLVi=!-TDsQ5ybk3J$1zBVCY!slmbh
zkU?l2*aMQ88&2X)zJ)#H?cs9+llnQ|VYH3-`l8q@ZWI)4A*U#o1AY=oqo)}oM}*+f
zg1LZ!**F1ziz!*qv?YK@O}ixnHtrHQXUY}<2?y+>4gtp>x^WjNHtxPMiG<#6EEfXe
zZEGjD7qDD$!o#DP@;LIik`6_e1KYYxkg!GgvP&)lA9c<xXymLYgn3ZSGgvN7ly!A%
zh#MT)XSFRyo0L+rbDED~_1cVV1T^F<_MxjVlWVH&Lr^X*0awP!DqV02vW|~8H;~CH
zYuzKr0Gp@M(@Q&rh5m@`H${A;7ci|xouX~Ef&G*8a`N_6>6$Z%4toLmg`}a=W3aqp
z;aF1XrGR{MbV2mtZMU}{DO&}r865;+w=EV5Ih@FwX0#|O>e?@9fchY$osPkiaajdI
z$Imw7a?xZbse5pgGjYc29_32NMesPv4Wx8K2iXV@b_uuHPRKz#U+Sa{vx0q+IkT=9
zQX1I6wk`sFzDP;Ug5u6{rryq#3PO1oNsC**A4Krc^(i)saIo|@7X3Z&lIHwd>ZGvj
zE}HR+TLEMifog5H{{XzI%7<ivFs!P9+H$Ju2gX%kb7f*i=C>{cry1G149Ce)v>mrd
z8ScHV6_Mvn>^h!%IC}!IhIe*oA7xcc$6R15I9hgt*(2<xGo_TcX9E5cLx*dpOgj|A
zVnDT&+1DP9F6=@=N$ituJS1@LvL5Jt$sR1bb8(Op00eSwosMjX#{q<$k~rA#y5}D&
z3NCJPmpzJQ^V{}Il6b-m7;}Grs_Tn)To2OeJ9k86Aj!Rjl5v|QHsZqn09Dr{fAFz}
z@^UPb7P4^$_f02^tYHO@Vmu@#Jf{<!q$j@%Gg#Ask;38KBeBBn%TTSIp4mxr#f_H{
zb;Mf)_f7}1h3#(Zjjxs0%0pqBECZS_Kpp$87~o}b9mAIcbf!mM<gOgpBsRUuLVR$t
zMr?J@l;4BhcW)U<o-DNiosQ&>gom4@KLIxWR!9g!Z^CKv6N`sr!t7-*8xi-ltW+|a
zHz$<$I^3bBcoziT>5?NUQ4Ee3J<>#MZhI)Cc)h!*{a0TJ=!Dr~-1ovlGs+RKaj?Cv
zyK}B`e#p_z6N}uXyDw{Jo=}43);3Zw07)e<88e*FJ*5dy;oFq?WNSjLtf^oJm6I|Y
z`36wZ)C(IFB=sYN9JAkyEZFuLHCf6ATB765JE&xNak09LFu3D|tX9R6ceoo5l?~qa
zW0YJ}j(G2Md>VNrzSH|9u^TF*r+Fg<83hf%C0^6%qZe*|h}dXD4Yn=F&Dl*$r;7`K
zjsE~nJ_@*snV?(+FQ&vS2iZ^4Tj37vEG;>Ncu|-~g~vyuW?<<<!hCvZZZNb)5RgPT
zveiaxrH+8Ks|reIHrGbBA;pyOunS>e3r!uYjbOr#CaIV(jS9uGaN!_M9oC}`93*mZ
z{V5!Xpj8Bbs%oWsZbG`5w?WBH*K!t3k4d7C)Kpy9VJNDp3fR)O`a)02H^5EGUt;`m
zD+OHq5K?|_Yw%CqS^iC*(ieVBo)%M*_HT|L0<ueflAPMtTZbaeBYZCWn@T?<f$>Cv
zwZz*Bcxs&EVRWL6z7(<2hOF{Qg<^^bf<o(Dqv1CQIAaa6GCU+OLsNiEYLzgjH7*KE
zuKO%wu#kY11hy$!Ghp+KDvHJzU&6e6d$|fTO2d)@;PQMYpG<hoBQ_$j{VEE^fZx)!
zFQ$wS(yKKHqH9h9^RoUc9w<GOQ?t(X@=d^J_E^fgH%TEoSEXw3HbOvXS<1>F%i(-q
zmlm??Xs0b1nq4qC)-6_$=uC5OZdX2{I%zE7Z<KTzv|gCNE4#*&EA~WNU==zeSsj|&
zm0ukQhFsxZRBDcpS&jb6s;XHDF13n$jepe(%hi@N)58p7bGYn=tkxp{wU$)!nP2?I
z$_LYdV(;#`o5}V%NFr@amzP~c?M=@F0&IeuHMj&_2P}oS7b$N09W+@wq!J6Abm;0~
z2P%=$yo_CRZg=xtJY94a*`sY+9fmZYl<-LxCmq#IG{KEiKCEr9RrwoRCvAmIP}rNw
z9BOVZ+S~nAbn=(D+~IW`Me>Vb1XoEKYAM|CE>)0=b1!5*i$>jmxn6p4M;PM@u!~|h
zvZz2C{HRLDHa4Eh!m^=_xE5L6Rr5afBqo$3hfJo|Dq|NLv+%PIs4kMjD$`V^mCiRN
z>a~=PC)_dqQ(}hpHiIZ1fLv@<qiUMQexRuh;TFlTK-Jbfd}Ve20FLLn7e<0=_B7<-
z4<@q{Fdh39m8z+g___Msbrdg^;`j24@nV+6l*{^!N%FMqB!!vQE8N0vNc*iEbf86G
zepY9wX<BY?pQ@*g2=g;;il*vqbN>KW?o;KeW7tj=T$FDPJ3&L#37Xxe;Fayi5_Ly6
zCPAvXk8#^&P9Y`O3fJ=PdCw@CS}cpTc1I${sGOCRkWfAO0H3manp@i2mX)*8wDxTV
z$lAR%rX#hvT<^}QP!=mZx_Wm;cq%p=+RIa`>4Xwm)j;}k#~a_3=;F^Ap&WKKq*+5V
zu%7G-A!jDQE3KLIFv(&{Q1uUUbgT!JS|*t=clk;Ve5k<*?H56WnlpUxwB0h&W^Kx$
zpr$iBZLj9bY15iao0{gZt{*ETRB5u9(`@vfmt`yz?Jpqt%DbOar(oL|{gz6O2SXRQ
zk&G!}k=uw~K0Fv_J8sUl+FCUfQyHEKI9GJ-8-B|zrbz1nn=8s$9!Dip$is@XEM)It
z#f>i+T27s#61}z;%Fj?nWt0z<=)EOG8X9eMKOKg$3!VO@)|;bxj2B>6ntx6}9vt}E
ze#p88`f-dRXVvNG+j$ys;eA7#Asc6!;@NejQL+fYYd{0Su^cP~N8(1ENd1ncm+N%+
ze-iYG1{p2S(Ru#>{ils7aZ^@OINDts#YfaIwt8t8MeY?Goqb03{{Rjreag)BA6-;B
zCpHbS-;1Tq`5ZXoZP?2jk%;_Bp=1H>+8Vr&L|sr^bCtO2DRm86cS%({+}^_YRBWQ!
z`!%I}ca`SHK1V33J0lJ#pGA$V+Tz@JSI?+$j?8atC^TvpJb|@Z%|uxqLY#jelPcsl
z%A=zzUR>uA^;bOpo<>ofK{$@5({1nFSH~Z!Me?|1kArEKQsj<?u6Me?kQJ>FmP4Da
z)Aa4c9jg9=O|cld=bMPiEsddskS-CD!R$CzR8&9#W};-HE^i4Tr)F_T!)kF0oGLn&
zh6C-nTl)Pqq!Qpht2bRnz~k)&dfp_tIykbU5m`?p&u|Q|>=ksnM1<V8p7vYM$d^0X
z(wi=pZFk+FeFQRajkAVO*@valNRv5ozNOPZW?OY_9V`*Qfa`ZC&t3+%mbG(a&ZNhL
z8ZvsN2G$!k$G#SBc%H`*Zc5&2wJ<%V&L35b*DBzQoq#yr%df<j*tt^lMF;_$p!FBA
ztT%8U3bv<KnBF+Wf*v^?E4RwxbHesv#q>g&AgE^d5&=L}0>N$yxT=&jmyLl?)|ZzT
zIGdiy<dPjL*#nN_o)USoZOFz{u(szsp<yC)Zg*@bB!J%v;gL6LiR@rKu9dn6BC(JY
zgy%(zSsXSCo)Gg$+nZ%;30+V&lAtX=_(jSKvU{lZ`3aK?vK^$4qT(!mROE7_0FsS`
zGooNF0EKHw9kIpG5H#G|DA=1TtztrkM*R$tU?rxBzW3bxC?8hIUA8#vJd<@LHkxJk
z8=tBsIw4MX7G0yT38JgBJ@h|Kr4pP*3HetP8hqZUEd{ydR#WRyQrtsA`5nNy!m!hI
z?Lt|AnT(Dj*`qdHQF!Q#lScQZBdHPqOpmrLd#x2rHLi^A+y{WEx^t?u4LY5#oVdsb
z0jA`n*MAX>WNwR1(}MxV`4sYI@t~`=XsNR^)io}HtI=y39c-6!vbA$w<?gvw^=+uE
zne)!#_rH_E0-}R=>g>1|*;e#W)l>t4bM!+s&U3C+!>Afv?H5tLiL4j0bkMGVq4V7m
z*c~OXQv>0N*Lyd85i#n)jRBA}4<ubXYODhd3x;?qdU_#(^Mat0RD0Ym+$mtGd(P|d
zxo0VXqRd4MY_J(sI-Hz<r<QZD<yKDe@^SY=9k;V8D`sn)@>F6j<SRJooc!5L>LY90
zmDHpb(Ms{R04T-o4bk;f&IE-FQ2^_d>4wFpjJn3?jh1cH^ui{Kn<muB2pBg%2+|h7
zWo}UK3R#{@iiY+%y_Sm^4vm*Y#LEsYp^5AnQ;LR;P-d-&`+?yJJM2{RREuCBW_Tpr
z-sq)cBsJ4m<fe*@_E5=pU|Bv2a`FKfR#8Jz4X2Pei+5Hrvh5p=0veK&Xubj}R@uDa
z2PA|esC;b%a(f}#>+lk}q0T&~#L>YCF2&Hsu-sb+%3uM{_)TCIN?aN+Q^e0<;mi%}
z5Y-a23>+bhr0|+!e20u7D7Fm<W-c}gc!Aq;P|l3U$WfYt0T;4ff`aC7QN{^2JfX~`
z-SUd3Ci(r47%~cHKGsDtjE`}(l0i489qsf(Rn|V%xdk$56YRBt@kiKQGOnqc2mpOm
zEL9R(`CTl9!`xFg=-f`4MweWb3yAEI)+dykZ`n@9BazB2$8wfP?sN4_um{S`kD_Qz
z_)_e+I8nmjJ`~~N)<VT#(leYU5aGfiM+>N3&nQr0N1wXqTG=a{Y@@L$k{OXq1?|d&
zHsuuNVK-;OdjQrp%2r({VC5(l2|yjEn>=K#j*jcJcUYP?fbg~2B!kllS~~n^QY@>#
z+qWfTHBdv%*1D*)#fz+-u0VPDDOYEz-J+q#Ch9k3ImIJL#rrCv4Uv`-RE(x`yA*XJ
zBY6N>TSHG687&`F#3W}OM({sMh42>kS_=2a9qiz3;ZoF02`0&tCea0mO>%j0JoizY
z6^2CA`E`-a7it2X-sNQjZZK0KauJbkJS%NJEv+B&hJqvZM?y##OsIr{WObWs0IF-9
zd-0TH@3r|iRaH;Bk+CYq!ad&zw*#>UPHu7K9VNCVurj`<x@03M^#eFehqBaS+L#T4
z3Db{buA52v0({vA<pvd^nxfmUWh?+#6T*t8_1he&U^wFGQJW+q1G0Qy{shP87B)_a
zFbB+irs}eDcVSq{M$Q#<!{2fdMkS{<!kxt0>Kb<34hkqVSduaj_5d<Zslv9Q%LSEN
zz!IxkD{L3QLV`(CZJc&gvbXq$>aOa5EXN9-U^iqek&cCcyM<vCb^xI%051U9TE^Dx
zx}4s`_5(N|3v!=8Z6N)VtAGvRN2fT4lvdE}(Le!cLTVUlA_rZAJfW+}+HaLeii%0H
z<MmPT<vvsIDW|sy*igc9RPbDsG3Oj3Xd^CgQ;_JfprtQ!O|NyO(<t_UcK+(WNrYqJ
zX(<3`zxhHghLJlq#K3WTDqU*7V+(KlBK11P#~H}N!Sx=imjL_SX-dUWpbnta_ZI+c
z7FKBtj=3sYxt%M?Ch7n?Ae9Wx0GtGM6FtJ}2q7fhSW?HdU1q|Sg~ZSro(5B6<CQ!S
z?r`SGP}E5Td#o(1X=&Spv~-vs-C4s9z%gK`O`=LzfCCvs7W2YL?O*}IdxejZQb;KS
z$$~<UaK27c<p(7~2O`KIvR06JUB^7xHK!N}P0kUc2;xQ3V)-k!3uP|B<q#Y;i>X9+
zv2B8DSl;}pqaa``nV8nWd;5Y@7;XW%3B|x3!69%f86km(ISB~Gk~p~Vnp*BjTFf-J
z$@-?7ClO$xc25a`M;AC)1m>4tn<fC~9N|5zKSU_j5gV-0b9*Ta?Xbm=;k$WAZQzt!
zHImCvN9nLbnI7z6Baeao)NUt$5?;bcFXb`rvvPlR43BlKdm$=jU>@lfYzTE+zyp;}
zS5o18h1GRXi~EUG^>r<A#nu{!)Koj2$O$BKj!H=%xbtf$$sLL*1!&@L%IvNHl`L_S
z*&6`HGUXKvU}S{&qR$A(A-Na*k~S2ELlyr3l%t@B0ian=Pf551Yez`YZPrU;qzOk#
z>w-eLrGfYgXern&i>n$?7;FFqGDE1?+Dc~t0q(3KfPrEcL%7%;$f#O#oFLhFK#j53
zTG{TMw*9zMvOkp|W-Ju>oeBgEY4DsHRKySxfq<8hMFfTc$CU8VWR~xA;64_x(ZQ*9
zi*mTzwi1zmRv8R+m3>zr1z_QX6wMx{R!mtU7dP6LHgGLu_gD)Om4t5Q>F-26hf%lL
zY^ep$H%+G?G@D-u@$+yjr6zS_M1Tx;_)0tkqV`+|KPq-zp{Dn@e(8=Ufpqisx^76}
z5k``JQ<w_o0l7z+(Y3}2fr_&lyYZj$-Gb%qp^Za#?#7UeQWfG@hp8m&S&#eumV
z7ON*IBpW2HU?i1STc`$H0u@H5tevE8HyxI4w^fouVYrm>fz6Z2QPFd#>Yu1?{go9>
zOp_Zm#WEUNx~BqKS_;u<+6ZxLoYG37ibtQ5GnYjspQKAt@aF?>1g(yX)6uo9E^qc%
zI&PC3VWPl&mAp{0I{;74Q*u;uwAd{!nG-FvG<}igD4}j#E<TDHnPO-oak{IiovuHq
z{^@%SSv7q@Hw==%cvUjQWOdArKXmsvIR2uMpmyiF&qq!?O^`mBw!P0jQ=+6}U3*^W
zfXx2@<v0S7$nAy{h6um{!8kAk<;Lo5wsa^YG>k5?b_ff*W1Ap{NKAr|B_jA-+i-g#
z5e4p+))`7U_+5_SC{j3Bc1)1Fu(Elu9||`g@|hWd)R$WYR!qWQ&BC>*AYE2U<G;5m
zu{kpID`7Ul$?lbqJBK|ZWOx{82|Y*OpSTLCo_yl$I+hS!%CKVq7QY-Sx_8Nc)P9P=
zj&{rWOD0zu5>~gd35BBBzuj}mE&}P?0f3};L1<>&;db0z$<E-5Wi`&S#*mg4;U$fd
z7g+L}zXJaN-C$6=b8t<{>kj9Fn&+fx+;8C&Vb&+d%5|-art^{II^FJ=V}Y=`<M3Aj
zo-$L!cpHcbS-K)W2^?+z04ie}G7EvqK*+#8?Ar*~wnb}<8y~9Yewz}cA|Nfg#YH25
z!$;j?U5G&7@)B`!xa4w?-2FQ&YdH70?2_MmF8h7gTwj!E4CCBgARwjV7ftN70f-K8
zknwKm)&O6Ghdc$WRwpGO!f^*A{{V&7;^ko2+x%g3hy#@EwmB&aZZB@>j5B{ZNxWLw
zT=tFvK+oF9S&nnZYo-?wkP?w>rn=q{LOBV)AvNab2^>HQ8Dzf&Iz*>B7FQAt{)lOu
zmCq=7pNrj5Bbmy`o^Ism+q%{Wb0&O(r-DrX0O1l+b`;hE1_I}{!=KqYC$`y4e1hk)
zR>ZNSfx>I#9xhW{T5dvVEw`K{Y+!n+TrXuyTPyNLO1YlL{#9j6A;gO!m@KD!uW|4G
zS2eGHDE86a)@c67%323n)<x0-Wn>hk#2l*%dIRJ4R<zVXy_J<MD{Kh`D_|=rC<XKW
z6_q_8Z*F);#RFO}FsEx88d^X<C^ij(!w_j0$8`5JG-AqEy`W>lf=NDx%Og;P*zsh~
zxAskZox5_I>K`ZfPJpcY%#SIgSmivBkd?@KLkJ!dcBhrx1&km9>P7^>q-~aFCSsIu
zp<z<A;RXT8a+|uzLAnBu1vsWOr{c+lB6!M(fTnkJ!WI~hXkD}?E<7eM-Jv09vUU8M
zCb{5uSs>V(N05{-cL_aK-8a?+HwFtN*gPkO1UZ}z=|42V{KNN0fH?)Q1uSODyj914
z_X6Qv5dLt774|EUY{H%#JgSfN7)SGjj@2Lo^{r7}#o2Nk7Z;B!J5jIG#e0%%;Zs-j
ztWW}3O)Jm9M&K10K8@d~Jf{bR<rDrPRqi4>D-PExIQsUv$K4IS{3<6ATv|PKuN}%#
z=Gl3bCt5ky-UwE--BBC=0QV7-iW6qWXMj0WI<(*eloR##xPGyfRj6vMeZa{p=YKDn
zJQ|BH2SX~R1e=>GiuqbW0>yN$nrB>aQ$H%=F5_ap8;(nFvb@nlT~F%Ce#@eyV{>j5
zwM=ouJ;W-Cy4d3e&Rp@yIL?gHXj!C=CiYb|mF*7p*rBVdy+;;;f(<Wq&R3wN$}}RR
zO#0bheV`ANJL+GZ&bdyUmNx?`o~l`kt-wQpMM1`G!wxp`l(4x01fjS%x5_EC0JH)9
zk@)CNL!B5O{uH7yj!99OE^efXR)7gND=09jk~TbYl0aJ0xYaaT%}`WT0xU>JgBeMY
zNJw!d8>i0JJY7{uHsg$>ibpizJYdJWM&^@Mjwtd{%dNHKhQIr)d?rVaaVVz8W@PZK
z3Aiy`dNd8xBazw3O{uAmX}!2q4xGh-{!sGOy~fUVJSLRold<BcCb_~#*aX^Y10ln1
zS82daC>*as>3t27wWZA&&R2hh;=GTsB{Kn4q)J(4#Il;^ojo~mdk7tu(vRutVHfEi
zvcUD`g$RM+jUTf2UyB&WLdEht8fi-%lvNdbVg<$43b(2EQB^&zJ<7?|YVwP<gs86%
z<U&of&qA!~NTXqETnV;SQ)=YYCcfYSD+Vg0mP@(BpOvG~>NeXsx@X}>61CW`Ba@?A
z$_PYZ#>A>!N}Yk^Up^I}o$reV{{VCh(7o>5<s5CNwlj)rK(sn|dAT3iSdBO^_9{(0
z7XJV#R<x1tHzNvJv$Vm$f`XOci!_j}e<t$Gj>>2@v7+HVTDCI;f%jf~vPyE$>L!0u
z(u=_-A7zr&w8q9<ZI!sM)Z=Sik@Q%Opwxqlto$BA^*kq$vU5wbEnLwX$W_yjjj51G
z@=6X-bISTWcB;;45CL$XYX#O#CpQY>9Ezo8_krOI%iFTC(u;j&hY*r_Kt|i6G-lMu
z!?O2Yv7+?$*qgR4-WFT%>PiOebDrC;UefC*{T7B=>*jpyv2&)+LmU!DLs8NT8X6m8
z^i}a`#jf`Qj&QfSi=mJb(REJvH#^$Im|BX^CfX}#;Sq}fkBC@tg)9^@lf~796b~d_
zw)-h&d2Z`Qi$vNfXpx|=OzDYYWNo{G^O$LjWEQmDTIsrr>B!%>1=ZtzMmSgO3Bu1^
zimpFT1ykzsnObea&roZPcmbf_$wpLa4Kdx$0}G=+pB&iTGEv5?&TCKr;^XCJsw8xB
z631ITmB&!((EEURy2sS&4w6C`SH{l`<#LNUl2x+eD(ZvmY_<o&wV|amG&#Vy`8ibG
zIZFDe+jf$@LqpJ9*g+AKap8OZALA#UHzS)SSjEyY)pP-o5?h6ru91}UI~~`rYW+V`
zEi0PFZCM#QDp@2hl$(^9KMk4WtY|CAid!<YJwY8X#W{PsC^apAP^)2Vdtqtp(6tqP
z4r6Zn9C=mM9X$BieX1T-4>J<t-hl~1TSuPNGFQr8_c_G(DD5&J2;E`zSGBq`fZeqK
z`d2~;vBLAC<K&m4t~85%K3G@<%DbYPB1MQR&nmS81eV=mt@JHWIl}Hy%i_uk*<NV$
zT5{V01{AYR8yS)nH8pT_V#P;QRd8*U%9Ngo&PbC{tBS>ED(8s1aR|ECII!ElDw?u6
z3vdWtzlGxEyGJfr#)(aPT1bpEe4y%TT_wqRC+dKn?8BX8Go>Jrf9}1RU~PWP<M|Tk
zo~ip<Tpe|u)O7;VdB<Q?r0*|jXjL_IrQnh*JfjRzy_!>XqOxsDR{{d5t&q!o;1aEB
zplbm(<CRlX?2rZ*p@tFkbGbidRLr}Lf^O$F-qb|zw{N<G)ouO4>#-{K3mGe_9^Yd_
zeuydP<v!<<Z{1u+D7Y2_{HIH_GW&D#r#y`ninBE>KFgE9OACWWLL*dt$!l%)RnBYe
z^YvH9CsxeDq@KgtR9>rjz0k6?_r1soVixWbH)81%mu?3nD4qWRZz=a1ep0Y*-~<vi
zgE@qbQWjWTqMpkGfP;{dZFJ~9$fR(+f<|1QDaJE<uFGt*3JHV}Ygt%n<)z`THXcf>
zhE}xY5ZZuv3M~(2#)_{?rHp!x^<UUEHnyrNp|T2az<+YH5K7pcy~Jb6WnQTF`(tq*
zOeTz1ZJU?TqNJf~<`J==xUCd=8)A$}E14T@%Z-<s(rXp;?j|WqNj#!mtW`<wnt3EY
zC0bdMjYSe_`!%|Qp=^PWxuvb{4ho7YxT7|E#r_sXT~c=o3@8Ou?sds4&-i5DCQ)@q
zpv9?Cuv-41@xn=KA()Y1(eSYFRXw&P#_DmXy`TYeWF-l|V(8Y%RYw~z+q<%;)N4IU
zhO{(%D!<OnCU3MSHSIsBl2ONv`vW4C!sPOz-MH9tin9()fJnm@{jC=zbZG@_Wjs!E
zv)Nfg6`71Bq!A89{uI+X?XVbJ^KL@42T=C3Sd<ZYx!NodGRJujl@W!l7jwV5Xh9@v
zNJy$nPD&tEk}QNRX~PPQ?QjOfrlf1wT&@nwtPm3xf^1V9=lrOw=UmvQNNS=$<K)>m
zFr1twvfy6H-ljmZ3|2Ai_{xaJZ^D?kUnNH@pkNeMf|DaL+vu5Y;XSV0@2Zu%K<o-@
z8=xset(zgFIj}}lyc1z%6fil*AyO`lbTSCH9ED>~9?&d4QzK(oGyADTt!H$}*c-5>
z?yxvW`*|e_>C3HSgqzQDl1&(y!J|FYWb@fI&%KDUL2~S&ViE^9{Zn2XLVH6)a%{Rs
zGz$dDjwDtF?m0#>b_Qa@<y6Zdz0^i$_cu>&v@KYDT;Ps*Rj+v@g1OQXa-$@Yf<sdX
zg#4qao&oq(k!}SS2_SN(AX#K*_S=;e_ne{k+p<Q=<J!n2>`<o`v>|1Xl0tKfoGzkx
z?zORyf?Rh`Y=q|O1J8to;9n@v)nw8<-z78>PlX4mb7d@cKU5m7z|k`XbJ<OseG?em
z1WO~r3ubf<=9A?!VLpF#WY`)-k14N!jsi78rUW9z?UdKV>)jb(-g)qz#_l#22q$Av
zTj@WW8>com43MuW=y&9hiGG;fy_I-c66nm9xvlUNCE2hgTvyVzFmB~fC9jO68?p56
z_lqr7i05qqWvLoBg|E>Y?F1msza4C_p8k<pZCd1?J(jAh?TFZ43n{9|?Zp+@-8-!n
zMXnbX&xFz)eiOY%ct~V&p$4RLUn4lUQnIQ```+)OgL&?3n&<p1BeH2~gRsUEZzyAT
zo1fV|uHy;8*8Ws_HyI5K`lh*u<xC_W(vyF}))f|X4YPu@rQmXah1Vk-qoXCQxd^U>
zl4YehWrfiLZrmzSQ0AK>X{9b4qil<z)n>riR8CIoD{7YAhU%_Xf>kJ$*tBBh9^iI-
zA!!@#93xyV->M*GZA)xZA{gaORf24zkHTXXG{o%Z=%kokwz_R78$MIz2Wd)Tnx_xt
zNlb7uqO1L7Nllv!f`TwZzrtAAei9dU3TS>&u+bc?J2I<hzWm)=%mHEYs%kRpB7oT~
zG3|Szw+nqxbi<1xfVj=d48#v3)xXNMqc>na6+^+^GOg%A*f_vK%*kp^nV#yJYj0N-
zIAJygQ%`N>5F$!q1BLLdV{qGrPYw4BWm!eLXDV_)eT}X@(_}uL>rADq9@`RvrE`R~
z9#h3=$kbE2_+Z&ZU5M{>9V6UXYk)f^Rouo;Dv42%OEtF}5~Cz`?4LM0v&xJD;<bee
z*4@|zTIq1R2E{=`PF(Ar7KVnKYej{WrpiSI>G75{A1Jx%Jt)o32v<tjK?Aa*)^#G*
zpK#$xHc^rF2BrXTzsD;Hsnr0^Krz3WWjVM+YW41s<OeFARU(P8z}$IK!rjl|KAHmi
zVOmpB*aAitVOtqX4&lNn(H(}$Xrc{MmfTnYl!Xyo$lthQ>aFzX2_ot!X`JU=w+iZp
zpKC@Fp;<gJSPLl#AxZ|(WQ5zY)+qXM-4GdZVo<GhjxLqbAL>D%lT90Jataj3W5~Ma
zNKOt@0e6%VG249IaK-#5Byk<Em=-jf;3q`XjVa{ZU@U4B3u5bm7q#q}cOEjijCtn4
zV{MWFeoErj-;%gC!zC@+Iq$;O6eY2Q*IA<`>Gx^wn&ve3Hdz6Y6LXZ@o&}V}t+oPT
z_(qI1mc`V8*5kT`*Se2$yOd~9lOZO-M)FBfvvKaHEwJS)Rv%<GJ=7I4YzlcE)`N3p
zRj5@lr0pnBLF($9LHF5G*3=S6E+t7<RtT`Q`>LtrbDVR9hDS>%Cc@}<71`w{B{c%Z
zoAyf9lZ5t+qG5<0R=PD2#Sun97i%dYj9>&*Z3KV<oSlx4$YTH^>EkDX*-J@He%~s}
znv@3&Tp)%>Wh5k!t*KxF*Y1*@3vdy%@Q_FNOpx)7lEDzLutvoVfH=B+JT~PP#v5=f
zgrsys9gK<_4(O&wj^w3dZ~z}wJ6LVPgr;@J9V;5vo&a5CC~gJP>;oqjOJmUi9D)~H
zHno(t7hSXktkg$q8~9EQ_)oCyo2A>1FpY$WG-WNWeiOq+7XjOqyD<yf=Y$mh0PYVe
z!Tesq0Z<RCU_MqBT@g5ZrHO*~T;{kNl(DtfAJ{6K{=?vHnQ*3H&F-Uw7RPdKq>TG)
zc~FtpjCchmJSLah_DTsOgbRyoU%G3!y_2j@2}5i?d!+|MGCQt3^OWZdra8?Qz7qsj
zZRDsbCTkjdSwUA=$iepvcv<~NRc(!rA1J7@6Ud|3ZGNF*Kz0^>y1mXO#@{G9%J;|)
z)7>Q<6-86Hb&9frJpA56eFMqrPbIE-<SQLNM|^}Ggy)j4w2qzNxuoC9)zE1X#~Aj5
zgnBsK+cWxJjNk_5fPcc!QfZ-p67T*I-i%O>(ZU*{paEt!!Dj3PhtP*6Pws-LtYH>u
zLR8But~LuFlsDIvsH|aQ=bX9Lxw4Aa;F3yRmp3PsBUx;eu2gm7z%h*Oc~Z5Yeb;T`
z#_8A!ZdP_e6f^;A<tuD31`_`O!e}PgwtS?rlySALyZL!sZUL}KZh1ko9ra2rWP~0P
zcga|wqQoTN@rA%-rN3Yn7KAw|FY#pK`&+tcw?7LEb?!J!b&2D@Da3*WyCgR`vSh_z
zl{N)e$j}{o-B?u<{K~z~_gPjaHc<()ab*}Jb7ejYbI*j((R->RhEAC+F(di2@QiDX
zvgcR}l?^)uuWk{5H(<I}QUoB}_p+0Wl0JzDZsE5Hd=YQDn`dNt6LUfSZz>51F25>g
z8;&u;X3>7@BQg<t_W?I0+#&-<HUTFItR!1V?{w(cY;*NbBKTZzfB0C!fB+fETy1gX
zHzWT5!noY5WW~8@!1zdaU|lJ>@BNYsfK~$;XLlr|+jDa3c}~jV^vGC2fMUUQh3pp|
z<gRyf-4TwyNJt6h#dpf$EU+v?`gurv3t#0Z$K4?Y{{RV$#UH0DvI0(c3$cC{0oWty
zg}`FVi151p7685bq_xjB3%U4Re%M&Ye>H+b$<Jhk*1}_+7D~+IJGX23QMuUVHPU0@
zK=*;&6p2b`d!)xIC&){^swpHKs2v~!1ga>U&mkk^Bfs53_w$t-<QB<8OHdoYO+=+8
zPUrJ?A*GOWxd}Z<whj<;RFiSLKM9GuVegm+V1>+_ToU3HOQk0y;YkawJf&<1w-sP;
z;f2Pk;E|Lh4BT)L)b!+#Y?Xn!7{`~K@SHcB*`$SG9Tm=OiDebBZ?aHZDNJv1z#%*G
zjwa-CuSF5yi&;wAPyol#8v~I?4JE8dM@38k$SD5+O{_fs0A!W`t!A<oL;=l{+h+VH
z6L2nakd~9mCTw@Aa!QIx^Mab^H^{%w3J1M|D5!xkUp<Y29rK%?KUL3rc~HIJg!F41
z=^cCbN$MXC{nRDIl1l44!9^s7KS9VOaJV<Rhw}{blvFp!UUBFWZ9Z2JZOUk!ztp(Q
z-|9xpI>jqgE~#idgpH|djux{8w3{gyO_VUm3L%y#0iAQ%D82Z~cmmuf5Ed53f>W+n
zSR{F9<r)-gos`Eu-PCi`M#0UMMx(6K)3wF&v|HtEF2*gSovj%|$y(8TtZiph2_LeO
zCrVFy;X?~G%|!mELc`giGJi-kYpOL!BNvipH|kY&M^Vx@4S9M00JI?}x>4^t>SS||
z$yYR;KSKch0H2~ix3+3UL$&IOf7qmZzFfJrI@I`VEsbg+p{9=8B53;}TN41l0bo)_
zRw^B4U)MI@pt2#FEn~mjsekUYtzb?J$`}0x%=<Jmg6W=r{Uk(sBt!K%$L_ASCkAC^
zz*fbg(~ii7=`_QJqgvG<7Fxx!s$C`mF&j_WR#s>bynccEEl34(nQ)edQlrkRx?P6*
zSO<kv{+tYUSE)@*9objZ&;kw?<m1pLxuXRZj}r!4`>9)|FdPdl9bFk<z*TcN#_|oU
zyf4ZALo`2BMPRLi$EW`Q-Gw;Q<7oXiPHkjN{cmXdrpu~9Yct>UUpYT39bQRnvV-(7
z@U}hx04nP0hB2fAl$F|($Tn?)&1#y1jlg>4eq<z{5b+aMsB^{le|14SC6gB<U$QZ!
z^$*D?=qcj@#NBz*pY3KS>GbzG*C49~Q8latw(8<0!y9fu!Us~VEMXBaXSrUljgt=_
z+3cHAvZqmntOowje5~Dkk%E1|BlS7vk;ikDIj1ji-FIa>lzT&~25XC*i}H=94mL{_
zBZm#|;U7&(NwtbM$Z7`>k}hzO!(hL{vwS;Qz*V&@d!1&cO7v!^5?Y6LAbk*zl#`N;
zbqn2_VL>LI_M4Ea9BBiZ^fn?ah=^R-LeR*0HblWJXMmZshuaRMz{pZfHrA8<lyJNj
zi(N-FMdKxNN=nB|Ks9x31my_V$t&!}n;z)1NCWO}eyECQ!6Bix@VhZ2`Zbd1h44ty
zd0wH?nwz$@q!6(BUYzHU;@btb&?(yxZ@H_jVabiAoe{Hh48};VR$r_lVW*I~+;>_U
zN3pQw!q)P$-Bv`j?`&X`W$Q;PQU1rr+4A?|aA)V_3>eMqyw0SM@)x##Am~!MSIFj^
zp9{&gojK4vn^|@EnYn3_%h^*E?yt04nFdOs{VvVbu8~yO+#GmaIg@cE9?wJ4X@lC`
z#a%Z}gKxWqlhXBY00QUiv@}%{)B#{^^j|sTMp0)(WP@2r1Aj|ye3GRMV+HIKje+fE
z=UD?=R3dGP<6pa>>)F-SjD|B}FtU2Cxv|6tTke^z>kMcj;FX5dYn?o&u)6lVFADb2
zESYOaxv$rp`?aM}%{-I5mt71Wa-?CoUeqwg3rOa3avnxJA?Erb9eXBvFOc9Ls;#Bi
zCD0kU;3qZ-9gse%-iJ+l+$`U!x`Rb_+wB}F%gBs$1s2SKh3y%_lAM;v0m9H~dV67I
z+(!z9_H5o$$0C{pqT+43LZ!@=fH;hW>%Bix=f=&>C(W0MbhC+(w(`A)rI=k4PnGiD
zmX8@)I&jI=8#o`ipnsKTr_;7Wf0b2F8{8Ti(ysLArC<c!%a6kH+&flQaI)r;Oo+5#
zBUz`!II^#7^$d>8Y5S>ZDy1$SqpZDW<UFdVnvW32X~Nh6S65MN7x1pXHo+euP;0t?
z3?Lp?k>z-@doHAk_tzR?LtVlOvsj)+*hoUCs-5qU<k>!-(rDcCbK!YzGFq`LNrUD0
zypldj2)&G$G<PVP%CP2^#@~!8_#&D0A<k*F*Jq20a+21G&C%??hI&j=#~h`g+y(2@
zRFTIMKxn}5ytnYewkA_X!r_JK&()|YDg8<6qK&rh<@z2D81W;_R^_sJ>6+%)v?}*d
zzzyBB50y=*^;@dmVA1{L<J7hSiknW>Dn0cRzDwskCRtm5q7J==YOzxo%NSbY@Ur@)
zJv$>UC7}3MI<AMR$pQ4H+2YF?sp$I5MaD@U`!74pc_pp|ak#HwdYp9aVHjA>qMA6P
zb%M}TM^Mm2m$>q>T}Th6@IguA_|U6p>*w@&zfkIr{K;&1u~%IsEV6BLk9C#Sn14HO
z`<A<-V>=t3J{O(&9}zWCLVTOq=sH+)qZcaP8es8}{nb{Q9#|U8eO9kQqI=#qjlp>y
zALA!Hl==+wB#0o=Os)3DPs$5Z(H|QeT+1!=VmfI3krHj;V80PHy+S64Vhn|@!uuHE
z$Kzw@;g!vvXVh=>t4wkI3a^WNhbn5<31u#O_dJ`Mr&EH_><h!mCgj*vB50}opp_j=
zTZMv2<dLnriTPEvb+ZFzHs4hlIlUE0BtczD4Z@|Vq}nnrt(!ECKI6)UsjV$HIq<qL
zN=Sr^rDQJMVB4Ub3&qLG(bUtq*V;MdLl&Cno4@-m^rXeKiUyZ3@KhBO%Hms)wG(Nr
z4Z~F?p-#x$>kQplV@qshJLso$ZgII%I-G5|3C`RcY|Eu^sF9>xx9FBu`W`H<s&3n%
znrx1qoxuC9P;x@xa1Dy0`ZGeeJd2{4cDDk`3U+5Gqk(H8>_9q_T!#&@z(z{K?<yxp
z$w5knq9>7LJcl5u-prB8RzOcJO~@$_Mi2Dzj*2XBETb_wg5W4$JfPa(1ebjdv>NEg
z7`j-fA0hU&HiGgvZ_3(eG>|v~^542iONh!mjI(rSftICajQ6~@#d<t+`ead;ODkLO
zNGa5`+GLNsZwKVzbm8G8woY+z==0C?Hw*hoK-bW^m|Wp{hNmW-O%sG{GDv&1xBlzS
zx`p!3QF9q<2LTDnJwysFtfgRaJmE^ln_kyM)4<cnL^?Kxo)lcDTd*C@1O(wTS;@Ie
zFtPr~eXb_yf~=qO1;)xqi?`gAI~!~%+Us~pCNnJQ9@aN=vZr*-BE!0=^^NUhWh2^4
zcQ^sw=~Qe+beqW_0t$u9aQ$2>87gTS+XJ}#1zS~69e&MB()0wF=Dm#q=J-&_D@p8y
zl1rQ<jEm&mWf7{GJ6c|F6v6>)C8zK?MPLlsGt$r-ZO{yn?Y*!Na^RyX<pkkY%`J~0
zp%mCsv9H}?ZlX87Qy(LWh0?nGD@F{UOJBEwn)#gLZhpvM=^Rls@RHz4E-4GqEi^^$
zxw#16NHx9^M`)YbGI_6sDN5djdn1^%94POU*B>Q5HiMtpI?^>AaeODRc3p3UBS7Nl
z1ZZkf15~&iSg2(BVG|8|@5U^c;_l@o$R#_nD8TX;al(e?{{ZC>?&>EHJ10gXvHPbq
zT_wR!X+$IAX}Bn++TRFx&QzYIhH#O_z)Aq*l=#5Ml>;OR-l(z-Xi$N)a#T}WvW&}f
z!tLas6|xy@4baYcx+-Rr9Dwe^c$A7Hh}@!LclJU=4b;RNctTqh_8A=B-~v9BIzwQp
zsaQ*e){9Gs0dtEipoEb$P}!F#YRQ8eVTEH*_O+hh3qPpudx;>~W~>m8*gUlao7^Ws
zF(g=^oGx&k9oTv9r^br2OQt=}um=j#Nait+9&Kfs)2j?*T;*M}Q3foyeHG%>9PK+Q
zHAr02OPo)YO8h$t>r<&?$rt5PKQ1Q9ZKler2%<jquF)Je1(2i`c>e2Iq8qioQZuv0
z?6#`RN5ac$ZTGm9s+3+cg_+ewi>?q>dQDogmCYACsN6oPcMGVUe5)o#Xo|~#Dceob
zfG&$9yATT{ws=cxuI`nVNK0b@CAlfd2tC$8Xp)@S!2F||`VbLV9#Qdww&6Tk%Q81%
z$f{S_4I^w*p?A4C&co()*^~>#&TxrwyHpRs1LZm;(IqI)gmbJ|2ZR+h!;z=-f|`Zw
zudB8AQ83)tf~BlJ?k<O6&DJvLwxd4Kq?BNV4HxMiN}5aU&B9g{*-Kh1>!pC;F02E2
z%IF3VK}4kXDtdoB;|c;k5ftM5;cE!#Z?M|xu7B0axS6+M@~NsUAKf|?lTv|<BLK&g
zB_SBHG@M%)O2zgAApRx~b#X#JhAulQhyMV&t>{Vg$90%dC0FRM7_y|Dqj|rTcTz^o
zs!8(luu%F|-M}2Hh$A}z7*(`G-Z9F$iJ&lj6sGngE34b>JP#_e8;O<1qiv;BLN6~E
zRL9WBy`lX8C)GRnX9*~q>;}nef!I}85lK+tzQGYgPGoSfP{#q1Yg+kQjT29}7iyTp
zwAwBX(S>5>2-|UmVAvTPS>np0R;X-DBKQd;#)(_1R(fnXvc+pv#qTz9H(k^&Tme~$
z<T5(tDpoa(dyAcNpH9MFE-sQ5Z#K2UwW6fp**kOuiM05D0FaL^09Xrsl0gpE_)<BA
z#@511D!L+#+nlUvU~|YMC}}D4g>y?Cn`>DVg>Ht^!D}O!-MB~^08Zn-J&^$54fETD
z#2X7)Ck1uQ!p1tqM&LnD{{V!?IAX{cjl|~139SzDQ`~MaQZ~qdQZe$AJcR39a=0uJ
zwsrX`RyWB>&y^z^*aR%c3~|T8=U(_}AxhRd{j5`+U@d&CFe`yRQf;;gQ;;!)*D!L3
zwlc$<BqqkeJhTMEZz!M*F3tjDoO>s@j=+@}H+BLhB6Z8MNKI=-c~k6nHco2=&g&vA
zkvH0S?3*OPt;@2ys(4~)1<H=UQ;Ni2`=x9(VHNd^U_S6Z>pxjo#~XumHFak9n-mM)
zNcc<G)JZhgaVi2yNN!V@!c$Og!~*JA<0PlY2`4DXU^vDSxf+=SFpmhxVB-pS;TOPG
z6x7Wk#|OGb#!&-;na(x=Sy9m(Tnmzpq@`{HLbZaOfujLrJYok;LeK^8bW33kb^<my
zfNiZ{nqwF4ibW`nHs_8}l&rggjyR34f<iKqJG^%8i+UaiHW=_O4be=C2_a?%Q4C<_
z>z-0OvBrdrm<34DY^7^YC;O*{{S@0Qke~h(*$-jaNJoUy4lr!6XoP}$728eu7VM<3
zKTsDNfn|kbLtN36q}<?s=}9RF7ev%IaUf%r);7I>PXixC#ia3Ntkg#Fo8<v90!!ss
zy{6Z`LIzd>`xH|ImVw<Pc(F*yhU0|yL@nhyIKXi3oagox9E7l8O&GvE(f|WSKV+;u
zf|F-fG4=-?mkW$paqhb#z7m%eG?9Fi*Ss`x5LI=oj2pOJXo)6}OtUqBo2sotQe#>`
zc2#Dhs+$l9R5R8-XIZ4>RxtZHGkFPg8>s3;pKFy#^=hBBtv2$GqSM_{MZ>N1T1_`a
zjieofeN|N>&7M~#Q)wC>s6(D@i~<(7OVVS8z_?rC9Y?3cz%I~@^x<o7yaGF2X30Ls
z)4>d2S>TlUs$z&(5`Ks&W(M|lKBzgI3A?1QK_<eZVN+L!6JSs?Rg!PC5%PzX*TYTJ
zZDHh;+DAk%lD?tR3x)tZ`AFY8ZdWm&c25A`I0|k@TrnhY<A9WqQro)k_)~1?ilc@6
zq#T>2?SPnf4hjR0Bg*Ssa4eX20m@%@l%XAuIZ10K*!N05b%sYgXDJfj%0b;^F~uPk
z8OidMCuNLvyCm(x>)V6&NH6wA#inz){{V!C;c+71=P9lOIVphHEmnW>fX3uyRlM<(
z2<G=xiOrCdHMY&uLs@Zy`=q<J@)9-9y|INvaLInfg(zi*w&<4z+YQgk3Y3w-0Tdm3
zWg{&OjkVp7l#DLD-Q6w8HYFoE;xLR`DK0H!;y}qMrzZ;p=Ml7c@SAaeqFim|CB>{S
z@=-<=$ApF1&t=%`nr+G`Rw*|a#mZhy$;Xt^IK|fyVU7@H6p>_?u(Iq}-xuza<r4}|
z7PXUmoLwo%1b>Cx{4LO<P5dOu$qCs5izFAv2!#zJJ<@@j*>D8#kZ1l@H3;F#LU^)q
zzu6`;gvbpDZ_XDF=3Q_xbkaqx3c}qBoB2p>#q5y04F3Ry8IS{Ig>(BQ-C!`7=Yhh7
z^8v>y2_^~DNlPe0<?&*mns0;3f%6|cs2?rC%5?%V%1<Q6BK_1amgd(eX(j^qC`qcU
zaBzx9l&08pleXsM{SdQMG#~y|bhRefC^;%!e4C?mCD~&&Q1VcdRDuprZk5E@b0d3*
z!LdV?nTq+GZUzdD&w0P@ijI}XhMS`)=!xa13uSZ^&vlBkrJ^Rl-zv(Ig9F;E;H0;<
z$aXE2^ps#);abyEv<@;+a8p~rx*|3;mhLi@uu&9H<a<Z#r(|KgjIJ+e@x~N#Obc*8
zDNHQRv$2H(+-@Ckn)z{JR1cE{GDe}&INzM8pDuY(Izh$MGD~b+9}0>lC48iJQ9fgQ
zAMT-ammb`GN`=n3K2s=|nerPS@}hL4^U96Hkd%y!Ca<t75V(_jT&@S<b$}=KPud3<
z!p)43#(-~xsl%Haq}bp7$`&$IeSY4jjQ;>P_fkjH?8bk(@h|lWfxhP-y5XtRf<K8M
z`W5DJZ13cIoP9|d{$)Eg=--X`UKGt%q#OFOG<=mjTGc=}oya83$sXw*ryPdnQDl8B
zY$OXj72&j<Lr~jY<gF%+)ORfoap%exBr>LZ9VJ6t2GXn{e+vzu>SAEh9d)jun{z^V
zyB11|M&)rfQ3(JUL04BYCK6nmqG?!M^$lZ5y_FuVuR%=56Ck+xR9eoq`3s|f+@L9R
zTCGM<`hs?z0#xNLhNOr!PN%D@d5VdSKR2=#gGjEfm(;3}#2&|muBFgmrHmg<q=YV~
zQTb+;#@k!M&PoF%eFW(`RSh5o&1;IhhIk_uV_H6o%j^1<N@tL7Z-gs)*zk9)@=5wL
zibt=0alTi6aih3iPTsd=vgchd{<UGT^(}R|Kcgx=U{<sGlZ9(Psd+;>$*2DSaDB?2
zF0YH9Q!8?2r20KkwT$wlZBtKm<`8vsWY|bQb!9=+jFG@@zuj(T;(8lr1ahZi!C7rT
zQ4)dfSCq2uvMJcEG+8vKjub363Rb2>*zv+}<0+vyCIQ4<LomB|Q>f$^Q<BhADD^Ny
zU4@0}DwjojINfjcLG5?ZdG}PnUAp0X&*iXW$iGtcXw3e3&wa_dHVU@w=EYIUJvj)-
zPl{3He4qaSUneivgr&r?tf}17Wm6<?k@pQZQa-7G+UWf<NMs}0FY>()AMxp`NLQ0U
zP|?kcFrrycJ3s^#s-%J<z+Gm9TOgzd01~?&<M1!!$#a*ZBq?WeZRwNqWm&1w)opdz
zkA>*rwBfuDvZvM?8Eb=DFJvX*;exn~rzUw_T^y!Ezl*70rG_zg07|>m=*f_{D%s=O
z%XbTcNnXmU1e$1>fn^kR%@_msL)W#}J3<;3xEqqUCFrD9iwP=UCQk`qU@ioNJ6_Rm
zgyT{p&GM-k0&#NDZph=?z`6ra5w(Qg-Ia9utAN@Hs;#P?d>2?M#kS2HbUL<Z_t+bs
z39wCTAV3$nxl_krK2_XRQC^FRdbZlgrc^P*kh9Kt2MGmRfwGtQ{GN>Dk$p6*wg^t7
zsAO-s0IEjR7Ymbsp4x`rBn8us4jlow(XEeMb4JLT8}hC6D#@mtI!Q<#F0k~ow2_<r
z71a}-NZR5D)lVjA^0%=abdOups%e`LGR_ah)OwDgMq@3E0#*W=cSbWIzsW@kmpI<{
zE58?&CaS1t&>vJ$wyZqZ0KAK>G-%=uZ~=QQVKPKR+#7X*>e?9Ojlf;SdKi3+c;8}4
zay%lk0@<7`e4_N4CrI!BIq<G^jXW}9Lv5bOuAGIfm8HOPyQk#;0LN(Oai(AN&rgT#
zdzp`--BD@L)5HeQ6?TzP9C5bR;aEwiHr5Wm(R{y=mnKPU=!8^z7PvLBn=E#`_gTOn
z*=VZgd)sgd&FYMK1eToNl}{CMmde_#7#(Uiy~LZW<ng(r{Z`9X4HsE@u-(h*{7Kq4
zav&Cr<k=GoZ)A;S&lgr2eJh^vh1Zg5D`eufK8A_&I>20ftv->{kCw!+{>aXn(*b)<
z%dbY!=%ZsB?G|4>=YB!K)J~XUy|W!p)8+<l^#1^|7gKDpL|WEZ4r~{wnkb&zkf^o&
zKAEw&mb7Ea^YMAkQvHhjRJ3@mv}zvWU4Npcjt9C-gYs76U8jljIkAFsg$)LT=??Eq
zucE``sKDi%b~B_X3#Vs1uW;!a7Pb}(V$08ZcT6x$+qTQqI%I8YM+?mSl2crY;fqG1
zhKZ)a%S)$e(U`{Ivy|0F8)aNkYR$L>!E$~(CM%|NPA-c|ng;rIXj%P28KHUF)upGb
zWUUzqwQxlC7h3Du_#riMXE!Qmo$8u}Y)5D|3WBP#dEM@i-1b`zqM{DmMS`f)bb&0F
z+i<*pBgLDa6vpO}MGY-Pt^@*Bi$m$zs@?<dVy|g*s3B-C09kB$Mk*IL0QLj*U0x^S
zar0jx&yy=lMRt$SRJ$7IL>zumT9-sq2u{j&gKliSCWKN)2>v8?`k{3#Mv0)ZG9Lcc
zUr7ueJQo<Fk-0s#cnyAwtx)P>8XBph+<%m<pGkC1qgx|q)hec(czcOj-9JhddWYs@
zVEFi3tuB%{q84bvSa@)Y<t>YHlcZPZojplI6GU+VZuVDff;P6np-2+hbXiEjA~!=D
zhFTSUew!4rkmdpp!n6S+h1L%gd8bfx)PCnOJN=i9_2mJjsC;&|7t{6h?JPF~h4bg)
z+#$NGfN+*kidq{RceB8CXm49?GPa!=OB`@D@=DSERSu&->8pK!lXd7_6Vp#HG0$lO
z$y_<%DJ=_<OObh^2+125Ts)jD{(vc?V0-cKsOdCj#=scspM+G5r=^7cVx%w+E?nL`
zzsGIKfyK+B+h5mdX(`>c%m&!7xn3XE`h@zGW2G;3y8^YHO{&v5raDkuJGiV=vB^_0
zbGwzp<$3QcsXY~jCq)%B2YA78@>RVxGswei6~3LOv7+v6$~40qVMR{R%L<7^Xg9Yb
z`yi_{Vp>kqb*qchzW^vTDWPme#9>BGR#ib!fvKS}ID$xB9V09YoCnvEq}R0uHbNRg
zrforayNS1j-G`MNxgwJ-CW@2!PUn0KDX6HTAihg6qsde?Rk1?bi<9+K^;(p&lHKQT
z)pz2_D6WXOr|i>fb$V4Z3nQ3GC9oP6BDMas?s*3%0ZX{Z>$t9PjhVgA!dYdMp2kr~
zijtAixHYZiT8$@b0dWmgvDQr+uOGJG2&gI_Gw)F`+ur3vBAVTmjRRFsu)K!dz;^*w
z*3t$vkkA%}vsTloS+$RBj{~sbW%V6J)lMecT6-q(<vBgA8gzkNHuwq$&e4IAnNv0J
z4p4>S{qDQmzKQYs4USFOL`MmEz`f8k&d66(lSJ0}DH`?(GAQUfkf&`USTD619L;b7
z%167~ZMIQt$+D8VGS-_k1yL+yIFhtApj#zURgr%w@yKgrbkn*wg3@di#TKPj@EF$y
z4>nYcuskao8kVumXlVMX$|?FCN{x?C>94Jsrg^WQ<}1>)E|;a)-)`&tEN??o`qD<@
zVh1Mc+jI!&p{8r)o+bg#<7L^4$F*-ri^;Pos&s@#E#eYQu)M#nG*(i#YXAhEJFjQ!
zF0In3DcuYbKBh}pHarXcSDVdCQLRYoiiS28UkwKKP|G}VbrPxaJmIubHKNT;mIBe0
z=r!719V8@|hq~RCUb+~=h-mJ-`S}Z#BXBblM|WDv2ere1uBU>>-GSKyC~oUnRubeR
zbOhMRy~>l*JZJ8wvq7?D$8^mwSsu|~Pu)F@@szD=d#N{oFapT|vNyMALr4pc2$?;`
z<wp42Qz(sKjs#sKZa1~KQ$7>jIyf<u=};^pnd02#PWKWn8`(z`Kmcw43RCHUmye~=
zwQh_BG-TYMrH<UINnXGWzp@H!gO9qTV?(U~J*4mw3S#4t-4q<rfV<VO!dEBg7BV_^
zw>{L&Xbl!o?@AwZj?F`)HXkTy4b<clbs1si$>R`E#<u8&v;_#eGLX%iEYk@ih|U)>
zOnfLzmnlGdjs_M{4?!YSpQzbF8bDG+U3(&s87pGAIJ#t!JaUeNunxgPS0LJKoz)6g
zNr7ZMhTL+cnZ%U?h0iM_IwIb0;Yk~;yJk|{17!E~9?3mSTFEz(aF7e9wkMOq0yIew
zy_D@>zl9uZ+sQXlhX66koSCS5V`nK#0PLFA+bQMaYFjcPkP9K?V9r$25>L?z@_VL;
z>5gk`Y!rYC<v<)b;ZG2`Mo7#qlV~8@D&mr6fnr6zs-7swvX~MAPE;dSU6~@=?jYDI
z%IP9??1p@X->E?75}8SbL`{t(l*uDD!k!^~cTyOzhh}AKoc5e2wpqKl*%2gS_W>&-
zZV5rj1cJ^ZB`2mvQI;HGMJ23rWVU2Bp27KAjSbiVW?+wWm_I95p+jI39XLOcZ882I
z*=6-}?kiVO9ijjqm6O(3;^VY;OC7V(ocN-l&bzLoBowkW*UglB9ebRsq;ou?-=6EP
zoES%JCb^|*Ca1Hnl!e*hAqNY#yOb!e$U5tZ$0?v5;I7(5@NBX{SyLs1<YgZjC4&eU
zT5gYpr)a+@q)u`}9u3z+%2`1isG@bxg;lebLCqI!@S`mj<w+IGImeWaw}ixnry1cE
z<L&uFQ~sn=hqpZWOn{2|l1V%$8GG=EsvhMGT-gt1EU5*6`BO|R)0?QMg_@+C*`!{{
zSjiOCqR#u}EiW7<)|0!Q>1oNZ%2XDDAC6SC<XJ%AZGOr~FmRjEf+au0Im)T17k%=r
zWIn@jaDG)~K)e2lkgQr(-pIn-a)+hl6kUa`E`^J15<zJdr4AS`;Z{lh=PJ^REEgGB
zn#WZSW;`lsN4%@5k?bIqOF8!yh6$l?4j1KIGC{B#-DU*49mz#URPx`|!bb~sD~NS-
z!D%-I0ZW;{`A&P>=H!x@On;0obx5iYMvjfAVDZ^?TyA)<?w><#jR^k$LhZelY-Ebf
zGKiTkv@KNxEscO%gbfsJX%=tY8#L`?e1T;*A-Igx>cnx{{gxM~H9PJB%Fn1Z5Cg35
z?yy>&S(ZXU<fZIuNf1^{>0U`U3I>btxB}-RDCx_bG0JtI6KS;Mo-ni&)b<=%3qed+
z0<>?nw(gO!(i$QvNU6(@A5|o0ap71~$83<YR%Ss@O=}WAvN4Pe76SHC*{v1;rtP^*
z286LE7*1g9lvoaXU3WjS!kjO(-^%MB0DLa})2=auXe4A4%8kv*xl)&ROmVqD435^}
zAi8sgE|IN0uXTbsjk!`afTWG29uvs7eh@IBhnw=Gje`8)HKPMIQZx<<!Czy64IG6V
z-Ua~5Qd%=>uH4J45+^<06J366aHVs{DTTxAv4~uI-zkOmIa0{s*kwRX{3j8dWGU?O
zLTf?2%5jh}r?5w$B0@`Bdn&y~t6(;_?z+0UtOm|m-9o#0uyztT45Bu^x#h$I{na%@
zu5+$RbwtJF+UQqZWUYm0=Qy5M57N0hCK6Ku$41+WSr-gn3#s8Gj#Y#)d?`tckrXj!
zJR+iw;=mO=P!rn7`dU+Qgr!JnDQ*I`q@)JI$0}+%TV$&kp#WF{jRhhYpaHlDnB&h1
zMn{uyrj4V5nIXh%XSo(kvv(V!c8hWLP;D1C7xEFK3eQXC=(<AP;~b%5YeTq4QUSPO
zPHu~0LGfFgVGzOcqKe)B0CYei-IqL$=%c^>6~yM&y5^i4WpE?6{{Vp@L@2q=-?~!F
z@nV`!bB~15_XB&BQHR*wb%%Q>!-?eCAqO@jqAdzQ=Y+Q5H^@AtZLBUVRtWChui+@S
zjQP6Y8*HDd;zs}iutvxLVfY9q;r9s14TX;g30zwH--VWilF-My<0%?legcMB4YCSI
z-gl30_fB)sW;hoBC$Qq`2+2RF1oH4Zq-R7OB5RK4Dj8>MK_v-SSlEFZvZys3Oq<!?
z-DMWRlQN1dtF<;Yqz5Vr-9)<n>!4(sS=>M*lx~}&NmF9~0NAR=2cMV8Yypjysov0e
z<z8tzIRriNhZS?CXkM5WZN94h3NaHh08aJM$mHK;T@@gXz%UP>MvvjP_PSb$%tVGc
zp#ti;Tn^`euo7&ZYPq=EWH^#ni<_t&F>$`*_D*0V08c1dM@%rbILPiBf88{PyT3h@
zn?U-m#jY|^xt(ytklnW7a0C(O!cyQ(uDftOidQ14B9Ed`#jI09yk9BJB=f>XIzruc
zdtfE9;pJw=NK0SgAr|E=vGS71O-BGTn=bzVE4UY2c(sW6SR!WGH%gn&33KD_g$y-u
z1Uml!y5sa+pBY3bP5~(h$8wyw;b4tC{Z}6rN=>*(2i+7X$8&9|ujBkDxF$Sz36{l>
z6-}&spoy^;M%81&3t@Y(sS}$k5<~w0Z}&`T&5HpjlL0OGO3Fjc!lGvkp2yR;;>>N)
zWRf@-?7Ehe3mwAY66o3i2IP(s$(O_o%kIt!b<bp^9rzbbb4mS_o7vWcH_5_j0`?pf
zw#ULtWRyZ79f=oRVQyD<U39|Pz*%t#F?$|YIP$Q^Uf)lIgm)d%0sF250I`ML@SA(#
zasKJQz0nfKZUE(V?$O~e<#n(3Of8PR%I($|NO|Y~0EO28Akb{*5pFDzG`L)*83q1P
zpmL%@ep4L(00l((K<||c<rzgpl(Lh_Ap5ADHLiwqx9+2Jj&hwugtG)mIK{b8nX`bP
zbB~-TWS9&2PNGIxSv#a8-u$TDCvt!ILQPj-Eo3B>hd$wyZi%@zA0<OtJCq#tehrm$
z)ptLs4*8t>S?OGW88t~aH@QK{P+fZ@0nR4msiCDVC~|Dn3|#jf_D_zP?sh`8gHCgf
z6_qxaMXrT{(M?Z4^V=R(oi3Geaxku_^!suwRh2y>N9xDX2Fz2_XyU^H%EApPpp1cq
zWwDKJO^QwNf^vniNEt^PGkm9dEM<yWDkC31Aqg#1d;n~GqK(lslE%^fu7{Fr;EQ)q
zKBa)1e1t3Nn}2IlC>rz_`i72F25@*c9#C@BjO`XZ&D1`zI3Ooc7qHjNEslAzh|~fy
ze#lMkBb437*C^0Q-zX=X-9+g(Tm;{XF58iARx!gO>z!|e{k-D|Hs`Xz7(No`KMBBF
zIJ$9eFMNNMf{4RxIORA4Z<O%SU=ns6)@*cy01idU?Ee5q_e*T9x$uRIdsSYMvB%qD
zhB|2AxBD$ys3d#6#mDZR%{2Hwve3awnacc!W<&ikx8v+nAEz;+pRijAG~5zG5?wgh
z*$0Ua9POFNsTsIh_*WV|D+G->=Y=bD=WgfwD=jvG;p6I+;T>mYzop`18ryKT^iBbS
z%PFDL`fP8NqHLl#?{&>6@j9bEL3MRvHXN*;tzRVa`f-v`8m(KLOIk`z5`f7j_ly(W
zO1UzZL$pmFdxWwJlC`wd&53{kWa=7r#~8;5rw<AL0HI&@S5<;qLd)xP<>B0|e9gF3
zHSlg}2_>=O=<;29ic7m3EQMSXG48e3uWLGf@Zti;YFcAM$qg#F@$x5|B1R}SVr~gP
zW!q<387RO%qy*;D0!8e8%Krf4qnGFYjOg{7&C~Zz0p{N;Mktwn2ke<8D>w`YKOG0>
zC}N&*_4+HFCbFbR(VyKj^58nw3eQZZ0piUCE5L`2dN#c+JkM)yb-vSg7K^NBO~YW{
zYTD`I%@|VQ#J@g8tULufI4TH^0-3qG!ZJXVTIr!ZFb++2LUq9Gkd-i%)$#6WSni>v
zE^Dk7>Y=x3RC=8@=A0>H#-yp0i#&%@p^>tj5`GnAu}IKGiu9WOF|Kj;gcO=AWrpnw
z$<6rZl2(l1q<Lj)>Kfx<>vl!xb#pdA2qkMZZ5jqK#5HH>+Z8oQxEMSrc{qQ^$NGsZ
zEgDKXiibuyA9UkcBu3@M3k7=v1*{Mnm37*7ubE3WT%h2RE#Iy+p4*hi>MopPg^8A~
zLpLh(N~mw7E<*LP;CS)d7Byvz(U*cqRaLM7d?RZ0IHQc%gZETbI+Nv_+J1}2;VDYW
zIjE4-(_g}`ng=x83@hq5B&l`<%C?KAq>;BRJa}Cgyj+uisxqCJ33rY{7Dp037T;Rw
z*&>L&tv|BIRZ_k=2qS{8KOR`Wk_RHbL!X|=NnGGcw2~VOkb|g*lVA~zB8o+Kshil@
zPXmjMfJ^yTmt-8Gsi4^FTKQLPQJb_Zbn;31LY10Z-JPVLg=0p}E)}dXw!+~_Wuu-+
zvn@86Fm4-fq6E;-yj+|u#L+g&zG&JXz~xi?jZkA?8cv@3w&eZRs)J5>Xv(jla~ST*
z+6s|t17*uOyRnvo8K%U+c^nVGE2V{uZ}9JAk<D-}a-8W~Zc+K<#z1qjM`G%qQq#<h
zB#V`#gKUrY6qWHo9Cvh$MlM~k(>!ac=o<-j#fr?*Khu`O3(`8Wos}*jmayckhx%h9
zn#5l`FLTE7Bk|KEH0(P?mTH0;-NkIQ?LE6go-^{PG#I0V0!6$l+Koy$A-(b!pX5o(
zU#c1~Y@V(dnGqh*jI5@*<_5Sl3)w-e^(o$1!<AJPOqE%Cm9Y5JU$Yscv}bjg-uF7(
z1)8aVwf4`I=ykNsG2jFCS)EFZ2NDAJd`$JDo^fSPpH1pG4(ny0=>f&0wNmKt+E7Tf
z*7rkeTM)(Wm(KDel_O$>vd2%QWithWw56?Rb+5t(cY82!gMz|c*TvV*$$XaC+0r#}
z)`G+Cvd#59aC2PH>@KLSWHFLn7AL6n_}Jn%U01~MB`K-|q@sf9+Z(3$+a+jdeGtKh
z@#T4Ax{QZiqrYWirS%-rNG)-d?aRW*&R>!#p1q|&*(C&Uwz@<c8V#%$o%Bs%lm|%V
z=(KaU(iT0Jo90i1c(S<m^c7c7*vQHqwZK2xY^!xDi<6xART5S?uOMA`QB#Y!mz#8Y
z9-XR&Gy>uKt2wpE+YV#{?!1z1Qb>ivjs6t0b+t7v7rnk$b`Li$HL@)(&AncrD&{R?
zi5^wXl@+1{4i;-fjij~DH!ELBG*Q9;AX$2z9(Om%i6vwjlibLS&9JkSwe=0FA{m~{
z_Bd7@L0-`tfN(20qfhGU0lz6cpZW5}DUq5<9-Y(g)aqE#>pj5sC2Qz(y1!2QM&gI)
zYDPK+5COvU8cJ4%3xK|##qlGD8n<lXa&mey^csGl48hKl?eMj<JH$XaN+Dq3p*#z4
zx{^s!GL11;E?lugmoDs*{#G#sVEz#+=l=l3_5-QD-U|0kYPK3`XFf-O0PcBTJpLqV
zY^>BIa~ud4%1KQv1}k=9^t~<9*9SGXxn9-L+7yO`o7-jOeIqSHbq1K@-rd|Uc<GPM
zO-9kQGYh5=i^p_w&Hmu^`g191oZ|ZsI19`5he<75fuNk8doO9M(qAhHmBrXzdDPlx
z<?5W^%wNLr{{SW7{EbV}I<Vxe7)j_{?7ZDU`F63`94qRm$vGeol@v4%nfS<FJHVy-
z!03#r+W~|S!?mbN=j?6VR-^qhV=cm?)@hp=u@^oUZXd@^D%m`qL`=<9d)P>4?o}qG
zUnAODUE9jMucY46Nw8ThYG`4*8b<G`zxZ&AwsSnPY^JJ^I#Yb*bWAdPTYsQX{$iWe
zv!wu&*=Y1Lr7@yvs<>ll>`qGThCF`V61iDLQ>V)2n=squXLVR)hC<PTy%$yLO&$o#
zDIqgI`kjWaKGmyRRZ{6Oo&e!PEa4|mD4|N(RwR%(4BZt@*E{)1PokyuUI`Z@tpzTX
zC#DEtKV>P+N1(<gc39jS!D_6j5;)jM>v+1<Yc!HZ(he4SW^HZCrZ3xUEzw))I`>h_
zf%=g%NYE_XA)eCgk!8}wKvU$E3ANEOF!oW1j_wM>3kyyD6|SEdbGzAB#t2q4bCzMe
zDav{^7u2vcFkZnWNs2Ihp`)G7ZV%ZuW*G)txnmhkgGj8@Dg)d@MgpsS?~t!%q!u;`
zx~2;o4p&TKq8?TPK_p`eSezMSZWOG7-14}vGd9Y0%!{oXU#ipX>6aULD(a`Mb&8gH
zY<H$Oxye|Tyn|p7bdp$te(G*=YOKyFY|+zd6?GDNlT7En{mQ+9wxGn;x?<7wSy~qd
zH~<!ghMX4eb_Khjv04|EGHG1t2?6dm?n;c(dkN*<R5i8q)Pl{KgpR=7Rn&C`EW#HY
z@jKDc2_}TqVljs~-@2i5z;`%P*J@6vBss;`2o3in^15)sNo<}*o6taTH{m+K8<3!h
z!o!RwdY}NVuF26Oi+f!(r1e+<vVuyR<O?UH%#d7QUpV@y9QHI^o2ubEoNNeE#M1nd
zNJcNwoPCm)2RkVXh|5&*GB&hc*HKL7i-v^FSP(nh^MH9#v^yJ$l;zg4WP;bqRH$*{
zNSZV5J`^&{A8^*&=%IPBx@fuhS+h{PZ`nDqftw@_?4Hm`O3XC2*G^=2Hvr{4Gyrau
zuWL=Nia@Z4DNBGUW`T@v0_kC>!2qt3Mv_a7%B7@cR#gHVc|pG8zEy=o+HMCZS2Q^B
zd!<Y(K;l9;7g7n|!8TJenA?Pc9N3H^+F`VFUPweoyPnCBFau;<AaZbk206v8!X8%>
z$}(rf2kHd;ASZY(HVIYPsD<6^kOkMx)7UPb&`6(t$|HNCoY7#T4Y64mmX((oRuRHB
ziy&ck#80kv*mq56S7OZ8v+9Q@I8J+uopPfm?54(D58ZCbu8`Z66W?o#<ww5d4mN5g
zFTa%(gTi|nTrfCOh>7fq&^iQ)H#p^6QPZ`+Tp?P`xw0ZT$QwduBx!G;$FerE*FsA1
zdj&1a@_0$<-+^S6$$@Abl15TAWMLM{cRRA@!L$-hfI-HC$ci^KV3jN8VHOByvd15~
zZNNb=StO1pfRJ2v!gC8<@|@;eCUFT1+(7Jxk<Puz!X`#oTFM8<aFJ*>Nksnu;svnK
z-R!@@#nYXS3s<2@cC=k-9X>PJds8rMcv&r8rQz-XEmYQYUr@5TyngpB2eZC$O%$%2
z+}tLLgWx5Rw<M^GS4yUGIMFBO3GA9@J``kOA!^hL(I}qyvXPRLiy>{@J}=eE6kyOr
zvYWXiM&Tp5N<1Q&JP#YVRxulkl~o7oRxyHFvKnwn46AVLg@pUcmZi78R8;Nva;p=L
zeU?!Ek#L&v%920Q0*%Jxf~rK4miw}dBicOuP?W;%N7x2ul%eRXtim21QB}goSnqVe
zEa?r{JgFuZZ_0|3^p3$xE_@_?4P`B8v$(og2Nqpj`iaWweAuN6CV3r_!+YT)o83MU
zlzke>opRHgs_B1OD#lDkZ*^NxY~yR#r-~JmQywf4pFNOtha&u=NxMi17>o`~NUdmp
z+XuR-m;KBuY6})}nzUi{m}hPk1w(+4tJ<^tGD^?Xk9jK&h@Ngi3V1-a0vHRP5!9@+
zNBLO7pVRW2P5$uushrbp1`{bFbEW_T$}47Oj)41H*;+RKm<S389vCbxtPR-Q<KZlj
z(PXi`tZzScS*%yJtUllf36+(CHXPW6kJmLK;zsZ8q?M28A6u_7Jb>%nQhujhERQdJ
z%95Rh&KTiQDi-XPjsoWo3igVexA}hR9X_9oE104!00Nb<;*O2GK((-^iZbV7$}tfR
z!a9nb-ad&?&!TE-U<Lc5n#QrB>0zaqi-uV_(7$zwIOR2nN8FLZ>kDB>0B>}TcW{Y@
zGy;B8!&`i&9x?Y_er!+CV-GuR@|bKA5>9NC1I>`I(8pxlBqKgTc7BNs&8`sumILG^
zX%<~;-xx^jTQ*n}I1)<h+V%;T`MP^8-3Ads;_1Ylyd=08NaOn<*lb5TI7lzv%Z>AN
zgdZuW7IFPJDTJOAi6B^;rn$z}{gyyuNO3EgGh&?0*TvFF?aFR}*pGJ5O0TS`uppZz
z>J@>EAQAhl&ZAoA5;rAs`Wh&jx};o<%ATfBTsx*qF()}t-smJ79szN}c!zPd(nL{l
zdxr?Hc0$@?Wjqwd{9zdr2^dC00X>pA4x$eX7O+Os)0cKc($SlOLbau%00XxvMo1ct
zlHdhr1v^=8<xLDA0bq%aFLq6WWQRy>O!@>&aSM!n)1r>wD3-^IlxU(vO=eBXcxmBE
z7%_zAumheJav4B{!ob-Me^DM$&uxY<gms$YQt}Ic#)lVJBWT*|@=%O6H}B;iNJYic
zNtMKybZs}a)Xixh@S}@2Ax=Eo?x5M+mV^Y3$wl$lmCdpGkh`^(4IDu4*))QCCw9R8
z=>az52~m!<zEW6nyKyNu4*dMAVL;8v;V1V@Bo6$f2jHd!Q6N79>bMY1{{XUQZ-n4;
z%FM@0mXZ!o54H1@Y?y9PMZiA@pgxGD+ro{6UiP|@XA2x4C#(^_87iq9Qk@oZ)CMyq
z%C5Il4F=8%w^Xlw!^)=~y-UDrNx8z@5WnQo3$Cwpjv=Jw4+RxPTdr?ntn|$mXS_Yk
zC+xKvc9SDo17jBYCbW)e<#H)>uAi3$!#_o+q0*#@fZPFPJ1M1zacp-gDIGXz7qS;*
z)LRID@S9@c`>N{NsTv5}I8Br~*Dg0zm1V>hi~Vl0NUU)-LsL}XZeM@85!DWP&C?wj
z4>!tdLAqj*$3fJN1b{-ajNl&1s+z#7I5GiJk=KlsrzgVf_p)`dWQUtsA<&V<z3iQj
z79G-dTnXU-(bfYTr5Qg9u71mb7Pn*=Xybe3CH{eNBG?!3yPki_20ONL5+5aT{V6kb
zj4kk!DQ%RNBn5_4A^2PYwm3>Vq~p5ANL!u~T-`2vr2hab3~?vQOWZE){{WPq{n=v*
z>mCztap5hG$w)yQ1W>GRAlro;oMRo7gm<!u<k;JU=$itlY3xBzv7{75L+yanGiG==
zYNTxDpG4(^470Wk)0hwRg$t&Xv|Yd5b0nK}&+M65$y+SpbBBT5O7}Z&Z=eWB44ZFc
z_m`ZK6y$VcLI=2#cUU9<p6i-8#lq(kl&tGr2zMTMO$7G|NjA0D4m=<M3C)d%{G~tP
zBa%0pl)~1|b+2#mn`@gCrrFQkH0JqCXQPQ63#DiWwgyu{?_|5SoCS=<40X6GgAK9S
zcd7pX*hnRJAm`|f3Mq-eV);yS2yf9Nr63Etg$t%8<3GA&nKtNgb-dXy$j~`ZK2eel
z(DF-gP1EtRQp%7^<^#Hc(;J%<Go<F}yTAtJI*HFLt&+Y&bi(74*+C@jYi@*^w!?(=
zM4X!rbF4Y}`Y4|}8_5cyro8zozDmg-hTRJkyQr<k4iFU;;^*CUSWQHoh#yqeP}E3r
zZk5Qy($<#~Vuv!y^K1Ud`h6Z}fo7{JUY?lP^M8aaR%hdaM{{zGf{E@nwicS3r>D3D
zr}kD<x)h?`&Jbp^F;77u0Bly&R1W@}EiFEZ-~n*5COtW^T!Y7C8wHe<+I#O{(A0fB
z6Tr=au@SYT-?B%_)(ks^t()G+TMK~tr7_#NOm$;_sSQ1QjrN;-qLTnjjj-f=pyoF1
z!WLS$yCvk5ER_zo>nGtlh(hF$2H1of<Y+d!9rC>Q!i?PcDU@i`NhG4g458lQ<AG%R
z8(iZlyKlg<WCn<czb3_Y-u=|O4Y*0L-;Aa;5$z}8CNE_mX|_k&%Zmu{_e*A>y}RXb
z#lYt2+jH``0ys7(SZM9v3yHey<2hVM#!w4K0&D_(@o(86&6gh>tk~$`e(6f!7kx@r
z$Ey*SzZhMAgtoR*ZSt~Vqw5hHJOuW}(bxq2ruMcM5%9W?DfU4t7*MZ?uDHS~Mv^$?
zK<0S~7|2Meqb?R`C0Wr@usd;Y2pE__!a5M_Sd<4$y`%KwXw8&$)zP)K4*ivV-Xr~8
zkg`Tx@q3%DY^u)8G7F{u0H~<B;cN7YaK<+ZgF~hbv9i`tGR+H@qpU4}0G#U-fhrw}
zLnCg2sbH~I595RtP<CvX#U7yxTn+5Ab@Xg;Hw#f&8;!!ItBitfF1qni%bBw;Q>Hg|
z6im}^*<Q>ncu-v4_6w;T7fc1Zb8V2A{W-SFK~}7FhY1N6I6<M4DNdFPzfJzi!h=o?
zaQ32uvwL!jrjP@cl#LFVbE84Ap=oI@006^4Jil4W3G4-eyrYrMvgOG~ZZ_F(8N!*R
z3kk<4mM9fu!97L_a99J9S#ZK~!6JKZf~$lOaICH6K|3zejT+3wWFR{s2P*(#xzr*#
zvaFUTZ8%BAmQqG{Scn+iVSBGR)>`Q5$p*{RH7Lko3(oqEoSEHW!BfeFPfTgc^($Lf
z94x%D0ID@Uqo)9}CYQV8Dq5-!TMh*c{({4h+b=6Wi-!m7&UsB%iof+&zC!DLtcY&8
zGa0pwx5+4pba37nnI4Kuu3A7`f8^oH>74weK-%h>lXpmLd@BkDlHs`|bTC8Q5~hrX
z9nBml<;4kq1TNdzyy+TNKW+1M=yY^+?1Wz2FB{Tz*U^#AJ1fWa%i9*%*z)Ul!te3?
zoPIt(*&PWd?ALWWX+=AQ+AzF_T4O&p;L-?3YQ0HaT2ANeZ-A&Ksoe8-T;D6o^E~gK
zT3RVdDnlk^@DxIrxY-i}3(t_O;iDUFLgY`|19VghMgRc?MY1-&%>v<D)xyRw=H*k=
zJ8P|Pl%FlSMpAD<P&;Vsi2Tc2+$xsJ<BO=Kdx<{cnL+y=i+L-WNogo~XKA^*q;&gT
z%8m7IvA5k(VZMQ7yQ@S;E*~h$D)&kH2kx>$V)+HhveI<$4zVM;w6Lhg*o~T6V=LGS
zZAqD;;aTbIX^dcSqSSUZrvZ8SCX>)$n<*b%QxULzkX1FaOMUVa@Rqsvlz^a)Amj2=
z#oD$}AX=Z|i~?0vL|a{QKXs%O#m(UhSwzq-;d`!}c~W#UDk<N!m_KATr8~VcGkYsR
zNoHGa5VdqpEwe`}suPbbi_3~Ix`UnSmmUI23a2!T;_CBI(t!6k0e>p5@~va62ligP
zGD1<KpOb7kvu|#HbQNm@-PkGYSO827FLKfSc8XhQ7LEcX2FpiDH=_t7_T>W%OkfT+
zy^z|CYhqym+;~eX%IGOp%UQKTa85p|CTgr;E-nE1SgOrNV&YqMQ&*|gA7<hL>Bac|
zKzZoZbq>5-T-HDPtVMlG=aiQ^`B2R?l4Z^(>X<G<^>BF6#Exm?auf{VT4>;z8}h4L
zYlV5!(3xr)0KQc-Kh#L}dXGYvS)#|~dQ}GD5I+kw_<y0w_+x*jZbI~!v?&`+a?G!b
z^D)mRM@aNBRT(<Xq?KJGSY60Q^)n=;d#-I|K}%9(ly_X;6O2kS!IUkP!uBfCmX)x!
z=twF98V$Jeqn}fG!%ytFWy()LWxx81>G2(x4PLTuZu<{~K-r%uxhl^~uyDVXSj!|M
z*pHz0)6`VvM-y~@m8QBWn)ZMZx?33Lj0>yEdO-VaXbY#rSsqSAoGjgbA62=mV+!=z
zC+>(ZCh1$#IlGsl>AHk|m^-Y#>&MH>8s*u+C~=W@V!J44>tla#h-2E}f~=i{a^=gB
zFxQd+A!RzRQPv=c{zGU!Na1Tw2wI9ZN-_ctDoU8H{T>O_Q}q>7+-quPc<?Y57g>g&
zxPl1!ucfuE4xUKe{4sUnzld6Rq^dhbfx_nh02M*nW5XkEnMe3^$Bj%dg5iE_zKiL|
zZA#B=u)H_$yhr|}?gIx4=v^EzKsJHG^sOvvj!L|&mGs5USl+nO-0CSLh*|dRx5yg$
zR?H6JaJi=yk}faVdgHUeBhl*JH}M$aepUXNr5M26+b>0*MTyVc7(ZnM+Cz5O1rHnX
z@WZq$^3F$|>vPl5LgGt71G@7)Us-|m50*y~1^`~=t#ss5!r<t`vE6z0qxgL4nVwqR
ztUn6bG0nX)9GdL$&ZO!yBOM$b)qt;-S!6GBiOxwY-1XnX8CV|Zqb@&1=DkPJ)%5Ov
z@STp<vg6BwOKhZaBM$3sw(P0lkT%3}psv%asbnHZUfcX3Ei*5;JN8m|+CwQ=eDdPt
z-2>~5_!#+7z0S3Q70z}3=@cw;U(=G)`hds*J(lJw+IBz#OIR$tf|9aGMcaF+C)Fxk
z+Zh~wF1d4fla#c|MoA-E)jEwUi<;RQP4i`juBbA|Y<;RJr*p|9+?5Cg?is*co<1i9
zOi9Yg0l(EhVQ|h9;ELo}8>yWgjm^G_l9t3kq6@mfDFqqHBHk3DK*5Haf|Zjw&at{G
z&17-W7n@-?(+H2sv4Z8eYIEtICu5ZyjUe8NhfMZ6+7z)=OyV(hVIGp>k`WA}iV`kV
z)>y8I^7;Y|nnB=w6J1E-?jWD4v3!w6FpSco{L{l)!g8sNxjh-Sk(`#6Ud(b0^m7cB
zkQcM*og?eOBry|?EP~hiP(e)hh>gI)?0zKp@&e1~@*hYywURVgs|`w$Xs2@v2xvXj
zaMNxVHu^3(E<Kk{(bST@J~>1_uA%JP>N?&orHYE=TK@oWi4+!YRT6SSJ#3<wxVVx@
zLcH4?D{V!w#?k>Bl{1c3S{ULkRIFeYx`aC1TIs>$g-C&mBZESKNK3GmTjfU+Np<YB
zjHr_2i`^k%-TwfTOi}G^?7BkG6#05UO^`8#PRqCImLLvrmPfITDbk}^&X|sQP)ReK
zcu~naZ;LK$jd@Ok(C<;ib8n*KxQk^-#$z^4vur{}!VR+D_(&Vt$e_SZaFM}{!OCQT
zWD$S`?4H+vJOtO9@r1&2Yy=t&4|Ja@B1tLsZzqtN;s!!wsKc5_9IkutquqSnaRtaX
zV4^qjF>;n8l`CPtDptS&x-mdw;$S1eQy3aTiLTqgu~HW}@KJPOu8(gPP)WNY{{XU`
z;Mqn%xx!w?Oc!gri>4Mh@p6xBV2hE3&kP-t^k%@D3GkG&Xz}u<be6q>jqbWzvrs&M
z_e>n{rFbOdrVOGRq0R7A%mT_F8ZmV6;4PJb*yjsyppcQ_Nauo~eozR<8>C?OUdclo
zRMEwfiHRX@5lm>d6bx;xa)@Jq;H986#B)edw!noW-ae`@K{&Ej!$C2;40uur19G5i
zM>kF&p7=_g0Gsm;zA%{g6Ou|;m=7gL<}^2u7I$Ds74ERWP-Nd0Q_9@faGAEo>8K({
zgh(RTP==5ayY!-DgnuVDQ8*O;0HR~>YhLMEH4rpfOW(TEXe0||W}FV?d7(Ix2V~V~
z>A|LJ9B&W8&T8!&h*~J~3ZT}o;-<T!)c*jfK=$OQoZA&Fhul;|*j;oZmO}{mNZ>M@
zUGSLm+=S%V$0dn1$M;;rm4yq8@H;L)36b2V_DIU(C8rtry0U~4)muz`)>g1K?Fb?A
zbPZ73ebjKYZx-h0nwH?*4+uN{>ajfe_8P{Wyx1t8i<CnL@cyb9Z+t2uNfJ`nIURrD
zpeg?VQZ&2<SX&4hfGZEe9xGi>S`JXra+=JGS})U{!A&5$PXR$f2?He&D6>*9qLRD~
z$LgC*KGsjJ9{i?LkSv7^5dM4d!gLngGtZRA9AQ467Wl#_%pv30K|PgKNcVTTwvZj4
z3a+R16jK(5(&EDC-{tIZf~6+t!@A!HNKasskK!vT5&SXR3bt?6-s;MT`vNE|lCSh1
z@Th7pyyafi8^);T{aIKjiZOBuu%_S)SpW#!tSE-!0J6+#u!h24p6b&|)2{Grou$#2
zTO6%51uI$EXn>8B!Z?N%ZmT$nhQ(+qnPw4g%OkID40kDCW5$fWv#8n50IbDS#z`-9
zcB{C`N6M^oa<oub_#3^zE6qNT8xk<7DX}10O*QxnGbC8S3s?tW5wHMk0J<H6aI!y7
zitirWc~dD=9YsbY&4yLYB@0;Fke5%1paJlXmF$i?Zdd@5*_>emB#tNQrmK~=A*Bid
zaVL_PQKyUq+k7biHnQ!%Q{ihEU~hY+3>WT5N=fXHwEfB^6m15}uZv)W+gkooHuqRl
zo&h)gly)PMq&Ve9`)8Gm#u85$`X-MT<v7?3B*5Tuuq<;hZ)>N3EJ}<Kd?nlgKqK%4
zxJXaW38nu43A?h1hZAs^=X|6t!ALGnN+=BANjburJ)@EcP=WwMRMc%4AR=zd8E1)+
z_&t?9eSaV->itRkNDsoHs;rUDBsiq7q!Fmr7dgY9s;8DmIP#WPx%s+;-4ue|9g>s-
zl&u%Z2$-X}$}P|q#=_Haf~+Z+IU|IS#1AUYk^o3kZpKJ;EJeg)`zu;%ZY;W%28;kz
ztPpX|R-yj@p(&|=0{KSA5#w$bMIQhRqoIh4-5!QWjwnk&Bw<d-z7+AZAEc>6f0oE{
zDxyOZJ`oIWbg{FABOCC9q*@Rf)&!xal{gtm>D(MCHd#djO53!HWme6&U0ce-Y!nQv
z8NHTLG@=H=?-%;33J~(^@P}i2;^^utd}V1fK?g&D^-}J)l*SBzp3p6R$}JsnLT(2M
zV>fZaQ)GtL<e*^*`z0sp0%Nak>y3cq{48cGoooO?L2f}!F3-o+FMbiDP@n$*5=+|w
zakq5W9N=LTfH|h#bIRgEX(!<^^0lCnQJ`4qU1t9P_k;j=4magPsA^4R!(0^<n!)u*
zZOUa9LoQU2b6qeEA*Yp6=E*dcXf7or6?HW-fFeI|w0c|*4F%Cy{{Zx=tsZVnm(fby
z7J0xgVFTq`=~@QDF54{xZ?s@I5pRU9u7)P^F0+1#QPlL!r(nBqJ`}I43~iXfe=5Fh
zL^$$o^h3I%c0nmyD-2FSRW-Ab{G;rIbxe-QH!31t{&-6p2uRxK@5STSVmZ!n_Y^Hw
z0U!iv76?kq0g#r?jtHxoz~0IdMeT2*o>Bsb7vWVino*`tNPXO4S;c#H1y|Az1+1*2
z$jM12TN<KHJEiWp061I%LgHt#TN@nRaXGSH)>y+x32pFF@+`Xf;|mx<H~}GPzEAc}
z4j^P@CP5`BhS_#*yK!6`d9uSJfFLeBSuN6E<zpT8vP1Mr=V3L(_6r#?3Fn)xJba`e
z_i;_zaz)MTu*0%@fS2cm9^7P{Cm$KLmN2A?@|s)$Ag*w}7dqC>u9*nNx!6!h;cjrI
za2Y;1QAz-9teFVd6z1m%i~zd#PMX(IFt+Nc9JvXLLASX*j9?=2D2e(fNBV+lIlYHQ
z8MpNt{ZphZ4gUa?$Sq{Ew$0^AMe(hSC8T47m%aH)z&3$w{{V!iBm@1D9cW?WjIKQ6
z!dvz{f|^b*%Emgx9>pQO#n(9VoFsFHY$rmqi3C_#Ap;ml<KMDEaEd|>?P2}XNw){;
zkhl&m4`mFJVE+KhWPs$6DR>{Uib+MV6b_VIl>_7i{;pG~ob$|)JLb+fL&+#7xhfaR
zGn6~$Yenu=RA}awS0Z=3T}JF2pk=Mv4XuO(`jfw?1lCI1EoGUlxw;N&%qnV~N#x?l
zH`Pxk7#yYKBSo!6ZaF~BSWg5LIAqU0<W)5Uk{mFT;@3jhZh;JvNO|svrDTBLKeD)@
z(PVRl<2mvb-5!MJ5Ir)09GO8&6pk5aD$<Uf_XNlNmYRz|+8Rg!TEU}6(eEw#rF3pa
zc8;0Ek7v<bQNmkmw%G8kA)u#auOLsgGev}g!{KW}_6--d!)5KloJt#ewKem=%bVXG
z5S10p>`?3>kEpoCkkZr~+?ya|uC{W7p17O~gxpLQJxLcg2pOsk`58jVQtQ|PpmBT8
z)iR1QK@v<ak}RN-d+=_UVvzC=!cBm3n?d3<z0SfyJE!f*%2L~QO~`bJww^87EwA7A
zQgY+uCX;NO+@WTn!aKJXN$HG|Qwy9h6HA;z8#NM^SRO2!X4~}z5hs+}_rKXT#iC*w
z4o}Kst$Z7($teiR1{ZMdkmtEeVQy@YjI0qZ1{WT0a+cY_2|&uhNao)D669LRTWhC+
zEya)>A(=g_lW7;_NpayN#ruS#RgK$>Wi5|{;^A%*U;gEW==&A44j^Lb$4_^KZYm%H
z0X6k8l9E1LS;qW!QaXX;+iGCbUQM<Yp{Fd6;9ly+o{T(SXi~}NLN2V)@tKisobWKq
zDOpDLoV9D+M#hYQg{X!$gMbs_@}n<imI*G5^Xbms6cNFB1;=%5Q6x<STm&3)#$>@&
zoTA3X875k3Q3mb8&{GRFQ|Z<=S1{jbT#X%woN$-nG+j9<hL)k`Wzk>Cp_10{n#@&I
zL^7%Cp}zrNRS++gSvU?WrxQ8yqdz<cI76Caein<+Yl`7W)!3w{;CS7c_R|}1m-5H@
zO3=2EozuT6&j>bxpv>T<J~>3w(;e9#MRq9Kb7d@apl}cm77IfKtgh)9U=%Py8`&EZ
zKwP;|*@z}C5iH{fcvS2-T+F#B?w&a1M$=^R!p0mDjuS^I-&Kq`M<zm23gX-Ho-9^?
zsv!<SzK-LCZMAS`l|;}sW$U!f?I4Ag)w*oT^5DhlK7(DzQB6X}57H6S18ng+o}7Gc
zH)+BSZ9CHzEXZERU8OO=`$Ep@8Z37wXkH)Wyg6oCVyM~WHLy8^*`zAD*z4GnZ>rq&
z4G4v<A-Pzpw#m5mUm-Zl#+@0UH%8HtqkD${gxa4_1O63!l1d$GuG}6>pJc9?W4WMm
z3W`|>ZWJ(acMO#)_S?#Q(sNra7J#RcLT!5m&<65yQ)f4KDImCY&t=8KMU^tzkQ<9D
zns}Wfd#XA~n$Rw-sO#Hn1<jed&?{t>G@jC^YiS1S*sW_ECLEzFX&72gE~SD^J&(l3
zy{=(C+aV@)c~?55C7{?UNf`3$oG(f)(U?2hFMd=nW%K_42*VLjNXKvn72_&0bO*N1
z!oSdG3~(39rz`~g_eIcMuNLyFH_9{`wt6O+KKR9~rm2L=3a#nT=Z1lDw%T5o>abj1
z>&VIDWNy+g9w`_p^vPWzA-MV`w@-9r7XrOVXmJMIfP}5mAq_YIN#vX#7G(s_F0GyL
z0vgMGkg=E45J*~XprB(UJ3t{;(9)3W0rXv%l9IF}(*tEOw`(D)Vhm{uO6pP=ab-=a
zLf{W7$y3=U6Ctczk^oeu30(Wy-({k#jF%gX6eh;D_qG>)JhZ6;fl(w64aamV*!BWX
zZwm5P$7>P-2Cvc}*p3%gERts8QPtKK1CpyBDV_Ev_eN@LWy^^Qq*SsuTI<!r4O&E`
z$>pURZm9J*+S07*wIOY-RMk?MU3V_r5t4Sv&VdNJP!hY8tFVyPjII9w;l&#&D&x2Z
zBL!euNFOUt(Yndg>SH&sX}!{9+6-#;eUJEaq`=x3+~zj+TN?Oaika38;dp;S{vbr!
zRtL=1jB-|sQv5-I@a>7_N1n~f@^j_IkF<IiqoSkn3MRgC*7sQ&8hwWDJR`M@La$Jn
z(>xY8<mFa=V&2=HSI_x5l=Tv=CiEFmC%0%SI(8Qys)>Ne>;B5lh6e2g#>#jxC)qi=
zIyP-+PKI+ExHv?-)3vtTFX0dAmpcVhCOD@_h>QIrRgHuPn|;>TM%3byYgh-}d1#EY
zD$hx-mI*-KZS`J{iqsGrJ+n(Y$SpjrMFlMKf$kuDFFxpfL9&(yycO$OL!&UXf;e90
z3~Eufb7YltbuAf$1Gtn|<^+GJ+Q^5wfvS^OGfKk90R;E5>;4P%ApZce>Kf)h0EZ)E
zcIJa+oX{v{g`?DQaXwatJGGfq^|2EqvP+99-AhoGo+9X?-bZDM)Vi}?bgqgTXrdl@
zDs!5Lp_a|AvsVlh?t9$O0PegS@eZxE)uhK_1^8M`PyJ%J?yIVi*Zy7t$@L8}rD)&Z
z%2`TWZK@s#SxeJZ?$YbTjt6b-Y`wds`pZj}2-xb7*W0@AmOFf*t;sws*GBZzwQp<O
z(g$_LkI3>RlZ;iPWyc8q%=VgXUYc+{DH{9uMY3JvAya5NGbtfx4eiRkWMQKV)LL8Y
zg1G}s@Bucmsjk&2X|KGO5#TGjn1Nv{Ev#wNRn!fmYXWt?g`067Nm?}rdl_c-R@C}y
z9?Y~^38K)7U;@xZhJb_pK?LR5SvHYOSV4(~{{Rayt#n-lX6@AN&%)jkJJ}CBvD()J
zp?3B(v7^HJukg!FbPn50+xEiozP0>66t5nXA&1~$eQ&Q-Q9}uI<P+F0ChH<=Wg(Dl
zXPYLHjMY&G9xqJ!XH?K%O(UA&!R)CgqA|Y3nO@D+^mJ7FjYQE#2a}S#t6Hw7eOYV`
zyG94f@^ZBaQrXcPt(5XYTicX8u#<cc71b3R>ZAnRd?RMkUKni4rnwrvjC+^?wbP>7
z2qha|MEK_*H$DPNZ9ZuayM#Ve7KX(qU^1m^E_W1UbOJGQ5c9Y-#h|IYiM<1hLkw*=
zQ`1tk=E^7l4)+`UBIBuKcxVKnDYj}3rltX-7)D13Z|MMG2}LxLxubxtAdQV}-EJ2)
zSV`@H$ySQ`hLF;#s@(9>(0+>Ux$GR_RY@6;jtUT5QKE{!N=aTW;<o({H6=Wa6)iXN
zsA8mW0?kL#zw*VdBII$5tKjk!C9_IAk?#5qr>DnC-K}WH)Ro%Qf9eoB^7N&|{{S<F
z7n=0{09evfxH7huTMy<9TG_uAC@CpKI!=!zMAo+HFfP5N=V5WVGD{q<qZ`&;Fv@C4
zs;6jeh5TK4q%9@Hw0B#+uhzPksoi?UvKTLR#Tc;rthGfO=~?e>mz$f($C6gGj)-EC
zK(3e3jGSFpRq8b|ds^Vod?(k=2VhlmM3TD+V>>}{*vU)Xea<APeIj$&TE|4<F62F2
zdj{6?-71~B8;u|bFgLx|G!k$Vje$2)LA1KY!B+U9Y>BWJ45^`}vAGD?eJ<s{x_pm}
zHsc{eSzC04?5~;I0RVg;$$Q;<e(36fa!rtOTyU!e>?w(I(UOCxl-~yTQpiqjZijHf
zvO^I!ad#-XVnviqj^rDCRL!$EP6q5GI@~TD{Gr6QDa@!B$Vov7?QE#zHWwo)uB&Jm
zZP4=0=Np8^q0W9&OS^?1y7x#;hDse74=(wzTnBQIoT*sCQnqF{gsgV~InnJ=99;`A
zQyc)vNhIyDutR3vQe>P0nKsN$C%w5+i3t|AP|R-yN-Q#PwHSGOh)oVRxlJ!<1cH-s
zJT1|XOI|I=!fb~9?xAQSE1x0pWNgDp>@bj)fy#-`CCh`Y$|12{LE$4n8BO2tyLIto
z8Hp}A#g`it)`NU~l!3Qey_=(hMZ)74P8J;SkhpzNYzIXcC%T+5p+v`gr*0>NJ20*v
zDTd%BvF=l>Es%>cV9$Gk=16a3>6$nSHZa{}k(&#N`LZF79gxv6#>j>?->9XMF#D0+
zG~A4o*FM6-As~4_DN&AbH%%@)r(YgaPbS_IS&lLroTM(kZlZC%GPr!8%!z~AS8r{K
zj1PpZX}$u<2E=d$!ph@B8(uQ1wwvKwX<+WXl^;d0KiJZ>;6$i(b8>7Iz1$+W<b_45
zIs1-sr5dx+n{}e8@tc&>89zklK0tZOXQ=-GD)w_Y$Z3Vd;V{JOsf^CI!fT~Q#A%S2
zPt_}7BPmSB?z`7_g{&M|D_BQm&Tdp<VpGJICdo=gG))72!wTM%9jdO8<9Jsz*<k(F
zGjG^6P{M)__W<&VtZygf4*<LEf4Z!CIcK2eH{0-sp7%zzwr?m|?YE!0s_2hoaGN+~
z6kKg?$T+`Oa*6{T@Pjpi)c3vr0Cf~UsZCNapp1>nAeOXz4iOTOu;0QOgy3JgB3v~7
z$OR&oQ2lrB*+)(knt}KEOr*W|<sjiDpbV)gg}Lw9G2D1gh?^tmUdh~S$7d?4r}gDp
zJQBm%R#e}5WCzf+uI<?z53tzb14)uBO_hLX+OsEMH4d}UlusKxAu90fDX4f@V5*0I
z4Ck_?sWx|&aWk&N;@qlwfa3gjMFxnQlXY>V#!G?ibPXjtq<FBtR;Ng!4ca#Hvq7@g
zNn={UgK(|kkTf9RV1_a9f~&3!Hfw;&-2<}Ts-?Ru<MOil(}az2;35rSlLX`-wG()W
zJ`#m!#cFI0c~z3e71p5Nc_CNG%aetMusB<1j4P@K8;fwOSsC81G>T&90(e27-ixg|
z2g(6jT|S3vL32==91UO>!o6gSV?#n#gUCmb6EVnDwG%ncIVhUBT5n^N3$kv4L9?1k
zcPd7U3lFM^w+D-<E-VN(D?OPC<7112(tL2a$2Pz2n&WS($TU8~$l)Oe=$ajF*<Evc
z_(a2lZf@dj-6;TNHO{%RX(XJSEMuPGg$Xy$bm<NJD4mmpP@<lEq#cp~Zn%r!6vjih
z0d5mdJgyOUPZ8TBB?XM-aUUsNgJj(HMH<B0-zkr9YIB@g({iio>YB!!qV#LA^)+FQ
z;Zf>3fj9&xbqzyvND7jAg7Q*rj!jimUT<_R>zt^b`=xEkvMB<|n%ji-#dBn^Fp>%~
z7*8lRYHS`VbZtBVOAI91!z#*-lKCln8iAvy$ilLtr#Ag3;ZGeV&^w~yj>5|%G9;vm
z$K_hnLvRSf5}AVI3gQNW!Gz&LM-T${xkN_G45eTe;Y`Ngu}LOYC|KGygz((mIyMU_
zqiw>Ak<}OsYel&I)5CwVcxbnT=70(oRYrz}=Hw)>@}=9yh1)>l-V(Mt2Am6hm2`lf
z%F3qOPh<<M202-F33Nc#o!AKaHgSY2Pq+kqDFLUtX)z$!OnheJ%6A__!bW6po=wIv
zZdA^sCjm9a-SE2p+a|c%kW!da!fl0;Zq2){-Y$wpXL2}Pc*^2MzPzNr?1;7@1UWRD
z3zC~8t!7+ssx=K&k%AiQSu#ZBDi5lvWNmgw?x-~#QNrLp!1fBGQq~^gLvBzJvZk@%
zkl+;~1CK9}MDxuxM4MXk@~m`yFFWKeB^RV<p`osONhN7$sG8RPn<u(B+}wugbgW?Z
zw*D2|c8!<H5wC0l&9~J=>X~1Ay8%tu(Z^vk&gl)UkCZITHoKXCQ%vLlc`1%Aeq4pL
zc4P6-#~c2Tk*&4zRE=%0I8F`hQa0Jw3~D4}7)}D_{nCH{!AoxFGNXI)fvfI&*&J>3
zK-OaSHdx+@$vpB@V3jn0IC7X+E~<`a**zIIva^r$jG!pv$W{ToTLDf(z<A??w@m<!
z3Q!5}biJ2IQFYlS)=6W+;rk!~Y;%y3$FaKax?GME43XPUbA*}w(vEU+yZj{>Xck>#
zW!t^jTyj>RF)fRvBXIDX2Oy=ka+q5gZZf;K0XT!<b&`Z)?#WM_uI#YGO}?oe_D&|<
zlN<%Ha<CYevu$i96Z3TJTgq+hiV=-<zjYh_Q`}9ve#$8ix5w2wCc!4<$|eW6fYztX
zet2CC&8=lrbLDyw@z3NZM-;^1g!c&#i>E-@NxtBny&TJICJ3e5?tW6s9?)*`eiX5_
z<+d&gIj+HzbtxS<#<%q3l$fzf8~_+x;xB<^Gp5EJrs*A%WUl*NFt~Z)H)6Jq#j;Xj
z_w&k)&$oOiWSYXs)LSJfBu@8_i>RM2Folw1&QvdylgU(2WF?&hOFt(0L%v*_C|>Xd
z(9+afg;g3kWtGS!@*8rXmSzERcvbV(5qmg=TUA)&e{n|1?6s+^XuXQAsIFi<s>y03
zb?ko1HpL`@<diuBqG{_#13yGLk<uI469pCj0F;t>R#bXXeU96FA=tK4M@r|o8)aBh
zX_G%YR)UvF+TeXWtBPs@#t-3v^g)8m?G}$ABKE)0UQuZBGz)D6cPicraKUj97Dhtm
zGnhk)4Vml?mrRn`k%P^Zgfx$6{{VbhIkljF{JTawDBq|H8$)X)+ch$Fw`j!T!8S>Q
zaAiMa6q<{ML=6Mzg_luz2lzlH;>=h}RMB&D_b5s0ZgG36*{ca8@KDdIcO#OSKna!;
zRvYHQ3nfW&kWZEFB;46B2OIm7aYH3xZmW}S&;^ucXS<sP4%1}zG?CBjg;2^PjE}b#
zO4qp|Z*%riV1Z;xD2N{OZwU)=d|Tx_4{iBf%3B+W5pH~?vAU3preGf{HWd*I4bDPq
znUwtP$+~H{0c!(^9>7O98BHx7Q_b&km_jxyLkJ&mnrsb|oI*qOOd~^lA03wwpKX%l
zc3efW3cwKao>z8GwY(&53f2^k9InSBDL~|RN`4S1gabAOa2Ux>Z*+&xWVSL#5s#wo
z{{Rb*ZplwLI7?v@7XtX<Er*ni&U~)>qh>zbeHpd_V`z@+oU6}BCb}ROn<zyhwhKp2
z*zN6BQOF|*P|`c88q#|byxHN4km=}cRZGY_0lKHCZB&HZpWR-F2_L0K>To#=y9OA<
z4n|sfNqdr#nwiXf$;#1GLN@TLoXxLYsgq&aaIgyQAJVC4PDRz#IrfE^2}S~NNH|N`
zA&yW_dm=ee$lI)9p0fF}tC&lBfL4lFfz5$Xnr58Y8-9aGpbng3$-(mj!Lq#kt9%58
zmA(QuBXEgKB$t8;aF$Q$R^OFxfV=Xo@QRea!SThFpO|?5Qd5~#C-m7^8b<hBDI4J)
zayQ2iXzE^UEK!v2bGb^&W{v_PD1buS>^xHFo}TE2sACpWH-dnyk)=Eo!OD2$U=Hk*
zE@vrhJS<^X6o-Y}eGx`y9v2Q$r0$pmtg?HC6l_v<PKn6^)HdL%ZALqTg?TVl)o~Zy
zPEhBe)1+WJijc_H06AEC-7JTkSau86^(r=&o2<5>M8Hl3myPHCBjjA7bI&L3v(GAY
z<Fxx#HEjuDzYEc7>7#6C+Oj(C)->2J7JeMCt%Wqqtd0?1bBIH}rOv|zuA5x*>KolQ
zm)t=%QKsI-Zn`_(<8p2k(Z6rWM8{4a+qWuVNJDZksVpu_L&j|t@;&Yz&~Buno$Yws
z>!(z)tQW`C1nHZ5u4!XSM_eBxSw*O^tpJ>(pHgLKvAnE(C0klW`zyMAL4W`<QZE_F
z=?vvs7P6i12H{tKra8ot4c3C0&Zuy>!nvo@82G^=>%SL;Cag|I0<wqGVIV45-C{uH
zZ~BIsI9Ns7b?23>wNbZ|WV6G;)rQ547iAek0dvK_!itJJyXvj!;@I1Qla&R!G`%SU
z{YKx)^(`tEwh@tgFC@|H{{SrJ-PQ|lq;(uZFgF5Mv*P&}94bguoAzwp!Wn<^sdX}T
zk$kR?S#0gYhE!EDGC*wWmF0d%1}v`Di^1_SddoqO-sZ}(7Z$$EVEUfRMW|92IFc1z
zL~+5FS#jd=rwCd>l#?7Ac<%RIRO)cFwAo8hsxmM@?5Xt)Q*%haD~V#w%zxI39a_wB
zBeKcs8jq#BY2YipW~jJ0-C;GUcNbi*r0_6uu0&@fmVs*ZxxGRIvGq`mVD0xm>Zxjt
z-atc;M=R+e<72LlK5VkB)ZHm994h|+QN)vcrhrq~5pl)tx+4g|Xp?rxi6q|lDTjiO
zWgFd_B$kcAw*fcF5K}9U7q``QtUeU7#^#%CQJaNC0Ug4Ul%3+<RA=a>qZt+}OQRbe
zl@dMeZueUly7i3$o;aXsu-ryU^3Ijs*S5iWHkVN=AqP0+e2?W6=PHTUg_c@@01y>p
zLqqOLj;^XlJhz1$ZguWY((BHS7X`BJNd}oi1`1=UWH{bb4s4G$V;p{gO9c%>$lMD@
z$WIzwnaHrA_Yt^f%Dtt9n?WQ6QAbW<9_QIvLgqIf<Mk?X$xlSxu$g0y*f;thrDTEE
zXe!nRu(xYiE{cMI^SlDz*>qu+S-k<OC+NDGsOlI!LeX{ZeJfcRfu>r5apic`6$7bV
zb~8Rzk=ANxTXydH1@B?=76|^trH_&B;<}hN&2S|?C$?u_vhdwMt!mpK4*)mGTHPzJ
zpoxRkwbx!B$>E;cB|I`mtkSiis%I8~n=dMp@lKLAZEZV`&8!hHek0OK-OqCy@paI=
z{1SSRKaNY$ysT>+2wB>yNIi1m1=eF!{6(i^WK*=g#b#<c`nB&Rv4D~OOA3`IVfZA~
zo`YQ!OpLgOfIF4t-G5Xhn`B1dcuuM69Y(t0&vROP0;+4la|wP=%BD>J03?5*p^lg@
zNJ06%S&Wd_0=|go{W>Tq8DKAE^PYiQ6&9?=k^tPkgy@}CDvB7(Tn-mci^t;qPHeaG
zY}YgZEo7;YygXbK^hzNuag`I`Y2YcBc3SAoSPX%&T?am(A|I(Ptm$?gm@6q!JE`91
zOkVP+x7i6wv|c+>mRFm<V^j~+9V5LsuH)rmwXUaaI4x^-`~)VO)l<IhX^s*7MBJqL
zAe{=^HQI$9{{Z7uIAh6PVfcqxENqdK@@#12j#j3-U8Q6WlB%xe-fp~;@f)iknX*Ge
z3*6(&-N)>?JfAZhR~soDZS3*hu+$`;vR0S5)^W><&Cs#3RDTiRXS%c1gp*XsB$xLa
zs^+z<b}{u_(UMBg#{U4NpwpsgmU);5i``mkHM)PMSxEtr*8N0S1?RN2?1sP%$Fi}D
zReO!gUHhoyo>}Q>4w6AL>Hf6lM}c$ME2$!c0Bk;qkJO!OY#H;)s?@7zlKWj?R6Z#L
zcC%GY3rK6T-DiyAN0Y$j>N>W}_Y!VNLAogmz1Lk($4jwf%V_3=57oH*DPudcw;mNt
zFA@I$Ey^xBiDWit02J;Fl$$Q8ssvWCvM5%UHwNmmik?Xg$SU5JhQJqN3R73vts)yf
zQVCWXeHQl&7ayW@P&I@r-39P6KpX|sTjQXo$%W}XJ1s@Ohhg+r(DZ0?b06BvPtvSp
z#kgn-Xvk?}i<XysE<CvBC2>b~C_#34480#4AMRji@~pIelBO;MMhPDaXRAROJDx*Z
z^*~9jX}V-2zGh>=%Hqj9@KqzK7~tN4YI<6kl;!5lu<*R6@dlO{H!?PXZtHE-y?qPd
zb18^uw_?1bsCAcCJ=Z1fDxM@~DRN=XqZraMRWTP!w>P@8(e$}ya1FwB4J%(eT_<zO
z^d6Jbsods}=3C^2?R=}F&rofYQS{87j`tUzqRw?K2jru1BFE)>UZYW>P*M{$TO8m&
zOFOR`>)l=rLaeftyJH`^5u977yB<-bVx)7)HceyR4<!@nb9^oVjUZzG07ca5j%T5<
zzEjB|6&?V&NfQB1mCb8x+@#fucE-sd0Ni8hgO$YRfSmU@l*fFkMQGJT4j1~S5HEYF
zAIY*n6QPEO5x`7yigcDy5{ZSs$w_?KCnncjYY&u6NWpPq!f*{ADlNoeIj*s?+X*63
z7URN3I>#zzJTxiEuoA&f+yql#u*gG4QsIG*qLkDS+!U!lW*IvG=I6o{%>b!pl)EJI
zpe_lLu|&5iLrzEuRE)-OokU@wr^-h({gaEW!Mbat_NK5?2b0=)PKo2nj!Tn-#+wp{
zVGj;&+$f}V$+C%u86`;E50s3<Hs<NB1y5s~q}h;)W@G`j7z=|)Dsn8LbGs%$Op-qZ
zNC*K7a!wP$JaV%ME8H$_R6^$~tV&zh*c+ut-ia8{r)veiP@&{;YpEL{;_EcbO7I#K
z4wEDTl!EMBrUo0JY97XyWTh?Iq=mTo@|@_22-%33_W}YXrsDUqgVJy|Dec?>%vMN1
zy5V7j+a4DHdz`6^DLCTFCjvr{n+tN91=dC(+HRGN?xxve!fCj|WXyD994SjZo)l~#
z8!1GCY4};NQ*4gbc2&NUl}jW2_$t>%ecUpSqoWF^vqT5*@op6!rre%Zf+qg}3i#nt
z>cZCrB6~eVv{5`|MCOD<ozyM`Q3*6gMgGZ;9n{>Y-{ht_+99%CxJzuMunQPK+bICT
z;bYx)EoGTlqIy?tcq-<WKpBjxD7nJ5rQsBb&63qSb-O4j&$&rCHsM7D_o^<AIrdsK
z-Izhtixg9E&QP^37s92J8BW`|8UPIWK)`+6qiuGhKm@85Y579O$+9k_5DFGA)$~}_
zSkVKEoT8q6z7VulvMy3K8|5f$rqlr3R8;+~buOW8+$ib(sab+-NK(QLuawT-N|FoX
z`=X3W@$4$9sC$*WjhpjjQ&)ZDqaMsQknJEV0Pkg$bvekoJ~451n7Re2%kGGyZQ7%#
zjoYw_q-~=Iy1`o?ErSooWm~X5Zab@4T1fh&p`$O7<-O5C^iQNwfNyNAH5?6OV348H
z=>r%EwZfLJcEuU9vt^!)wneE`HaN%!AS{J;qFpxDp6X41Qm`OBW@DMs)LfihB6d9*
z{XSCm+^H*^eJgW*$ZaSeOd@Ls@c1d{PiAVYd+d859@~z{>YzPBqmDhqDU3l)PG2Cf
zT3s%fw$};`I*eQr75yYTS}|l>857h001cq2#F@EKv|wL^_gD)g>|`W{_`lsU`L&lj
z2f9X_j_87icgS2uQ<^{)ElN%B)GmfZUpY?=7Dz!P;>p%L-5WN}vv0=<kG||D7K~*^
z;pc^{L9Qfnn{sn<n&D&0ZTliJM26keZnqad3$Od6B&Gv6k;+^6NH4(&)<S`7?bZvN
z;zh2L?wIEQJ0fAkj#N_07~GJeo}e%)it6rhWH}m%tE-EBqQC{8udaE$judsZk9i{M
zvPYL3lsgR$mSXdhbqUH<BN_=up@udxPr@b`Gkal46hPYH7ZiEGO4t%Q2&@J$jfNuZ
z0Dj47sod@Yxzp&*;CA6H4@5L{MB57Lj*v7AA}J}F&@3{KiXUjd_)IkwvP1`Cgp6QE
z)Isi1h^$cd5osFG@%`1TO%@<x$Qo8!ORFXUWLpelY;#8nRy6iV(0hd|Mf2H0Qadrg
zd}ACbn%}Bx2MSO#fTZ5el!XoOES$#WbAD3p7v&2Yj@#um!=K$ayBWG=?|+P}9)YSd
z57h$ZlzmCU5b<t)>5!A?g^c%Ky0D~-+WA6^TIlLRHWPoF1*Om-qF~Ws<tgUHBTsa$
zBhD1djXj5Sj%e~QyW_fRxkik2ngz<^w%IAS&%%Ov#9)(aq9bIINY;*UfveObiKJg7
zc~!cWrE7+}m7J`rmPc4Po2n?;%{<B_rlYHpNDesgsV17DsrG0j9DFJ0wArd;yU8JH
zbbSqt0KPQoBymqGk)G1@XGr_W!Sc1*UXu)M1Z}wTttseYV{RiDPJ3fuAONu{ZH;U(
z#sJ>S`~=C}k8FXr@S&8C>O-6EHo8-*9t#!ib^XsJAi2fLa2Xg*0DK_X*&Jyc)_ee-
z1;v3#8{X+a9D<RQNPUHuSYX?f&^)EELt~*0g~CI}bmPU+TzA65A&#*Y$^xuj<BzFU
z4n9f(uz+vKSu-#vHq90vbkTpRkiE9!gw5dQ$M#fA<dxW6CC!QOjRacADmUDZZa#>y
zz)K>KWP;tSlIb|NbmovO;uOw<h#;gFA4KBvcmwuHy!?L417ca;E|Vg_rQYreX*VkX
zQccOqKu$&Ol;t%1aInJQ<DZ1M7fF<aa#2FIJUDQd2fkE$LB*5W&;lS7xN=iL7w77h
zz*~fu9l1ngBa?aUbmMI0AaNKL2nDeX`;2x>+Uwk1Kh+~7e`KDk_!a?RHpVy-KS@j@
zHp-FCdW_-3*!`9!n`Cb17Wh%fJ+|-Ushm9C$_bv(2(h|lu^R)JfJwJx$eezD$z~&U
ztW)7&Adn6FWmO#cSl3A4a!Qg391XMeNciqAw5LMfaOFK{=TZ!f#DRPL%ISH%vGq=9
z4Q<F6Ld`ovxe9F^5SGbsT6`t;jQ;@26Y~x1>-kKQrM^NO8!G0B-ury09{YGhzMweR
zIY9Y{?yDFa^Ul2!%PB&>Q_axx)POI0s`{G1FOsUFk;^=-mQu^KT#$sCw`UglDw?Xg
z*8$~MO<3n*=G~UMBeq@CY6M^1{nd3wql51L>a;d$hgpqr^JGjqWkbNUFCS2awr1#p
zTFD-4)Y#c1j=5KKIt4?;%r5<v-49O6ZT|pH;75>y1=*OTp^?rPVz#2vBz8+jD_cj?
zvNq0i4sI`XV-B3izf(B!P_!+X+8rI-?N_u~Ya485=!-s-e6^?UnCiwbkUMi^t%ivs
zqhkfbMU=&{Mn6Em%B!f<n%~k$9u<7rlZ%hMp|%<{CZ(;u07FlxIDVFk@U!2WbBXs7
znI!TaTtamK-4_ySF1_5=p=H!vz_P1z+(oW_sg{5L0A)IY6|nhhNdn{ShLWYuCc?@P
z(~kB@u;hb<M34m~&Pq3b@{};~@|@A`?pAUcMU882E}d)(a-Ie6V4MIQk~UT;h#O&)
zpm{0G94A=!vPR0Ni~w6d-8c^ZJSP!yxMQ{w*y$Z^GL!j@_zB-PNa36;GebsA#|b_Y
ztS&EmE;h}$DA)$L4pRuQPPbxknZ`f5$W}CrrWW}&Qk?OH9GN|=RSB{;3vv6V{Ps_=
z7YQw5wUZg1J1+UUb-UqnthJbLe}t!=Ft~xjP_V)S-7WFLUf4<f&|{<`UP|vdOKc3@
z$OKOXcYms0GM3oN1`@?4JSE`sWV=U#lyr~1-s>I{e^O&fc|^q+BPT27Uy(NSQ%MYt
zF>p#QCNK^XHa3BQbo;n))W0m3Xh$m)gV<Oo<d4cy=l3>I7uxw<-abjs(UJwKW)(#L
z0ITk<CpT$S^*D0$qkh7|C{9AUr#{fAX&sQSDP8Rdu>yj3!eBT~9H3$2DXs}_kgQ@i
z44b6eg#O96vdCe(LQSd5lOqYVS$5D0QOfS?QHJdn;c#f>JaD-a2pX4!;4#YUAYoa_
zQ!|31XtxSh{H0<s?c}GlCIs>NRsgBvgv9Tn#vHjdE)hl*Cw12zQeW(t1gz|(z7#Af
zQNi+^6J%0^EUhGA7Ucuck7j)p8iXXYtj?zh7sA+9w(Kh}t6)0ZtK^p$XyVDXW%U8<
zHnPR_0|5rY{npy5DP<&BfT`>B&{|0sy7^xx#`1H^szo759$BeDBb;$zbrlq3I>z=M
zR>xJ-n%md~Mrh9BZDr@b5^$9<{b-V&SYe1c_QD>sRs<GA%b%35r7mr+g(Vi3z1Q2y
zd11(vAjZ9v&TUOho1c4l0d$mdHMg?ZMW!{a%SG2sr?YPhmEvgVjHty&8-uJuHV3*p
zD>|Asu-^d)Vr}d=P<fmkB95449;oPTVZt=^Jb{I~$ik;|SU}W7Z^k<&kCP^<#z`a<
zsp|4ieog$UIZ1ql#Tp<sH@c0`hPwP9r?6>`p}oSnrftBzl|?_b-Iat>5$y#BA!QaG
zSOZDF(G4YIpm(vx=?sUtvKnoN<unzrMH(#!RH%{7X>stq3rB_1M%NtOd3R6A4015N
zz-H^ybS++vC>l4m{{SU>{s)DEOO)Qo<jExI7L^)!^hqIPHR@8`+kVSkHm^x5EF^F4
zsP#IUM>L(l{TFYM{ybw!iNVV3^PNJO`^g~N>Zz+piKH!tuPiPnV{_$aD(TwtU14?e
znes!I=yt)g5v)rg4#lpqdb6Z+$Ri8XH97`8rx{r7Q%<>YYdG>3rQl5oG|XU%;_m+F
zdWP5|^=3Mq#9Ios66s_BoOoYB3#&P$qG}pv%HRdohJ#2h0J*=}5z{(jWpi>qZnxBW
zT|7`+kZ`=uFV5iU1`x9w9+?|PMXaEyql;+)xmWtsu)yNhk#$1p_urcp9C;@_mg1LY
zdr+edB~whzrD*j@S^+LAKRep@VS64slUpGqh&WanT{)IO0ObNkN7ZV2I*?0Jz(*#*
zUnTL;K8?RcXog7I;=|c)#+2yb{T;k3ZiCU9X=C;d25h#K8YSuNuyNseQt+JR%11;S
zOGk@VQA_!f&@fLb%S+L>*vWFW8n%<@NJ(hAZk)?I0|9*Z<mW7JiYZpeA=2YxEY<<?
zl3F&i0A*Yf1ApNQR_2j~=3$hdWm!)ocI7rPpD39kG8}nCQR&h=+%T2Yzh(;`r#dFQ
zZ@^m39#{!(N8M6Gqsm)y+baz=f$`27NdbBuE1H^$K$=NeucwL$TWHuGQzz-!YR&yM
zebU-+F|d#p;)hR&FndD!i1-nlQ<=vs)%;H>rs!w5i?sgA(msg|W@GHVQW_}0{UJJ9
zW(J%ENcb2b(kJpw_RkX5dSS4%kk9P0b5Z&)HuAl*t746?y3M)x3(M+hp8Ap<9?^U+
zGtBX^r%^ADBlc3q1dkSLNmg2ZhdiVb!nJ)lqI%>LANE^)H$sj!3$P~fKN<f3X#*#b
z=^kj!4e_(|EdKyeLg*Mk!uGvSOk-j;Z)N4Zb4()+b*wJC{Er{?sELmz_IWm`B+*nE
z7~^nPuYL{d6%s<oWhWM1O{&<{2A(%BQT!>5v4*>F>{YxBQi^<;FDa(g9{Z-q3}WYy
zjak|%#xf!9?1_%Qd&5JO<=C-wi<QbMcW#dNQr!kRVD%8S;F~P&vq=$YE(=R5n${bi
zvZStz)H`7PDd5>DqszLFOKnWY(_tVS*etH4Of=}sk~eSFdwkk$G;xya60jY6pg&W9
z#RE)W_eq}u$rs16Nw~Xbl4@G(WNV{qfFBDTt<}Iov$@_@?zf<-AtVszm5l0cpOS^w
zloo-=UKUTq<%{PwbT1+;Qbq$)E|NpoEcJAoUtw~zn$+>e3s~EgLlrxxoVe#b*G@b@
zawDg7uW+<{d?Q+FfBJsP`$f_HMh6jKq}Cy(q=<m#Imdt!<Vr4s7T(G>Na6a4B~KIv
zbMO^==CkhNiKo;yw#;SzRQ@@>gUx#-sG@9aC!eyVs)&aZ!nCQZsgzhV?yH?kQ#-Or
z_*RN>U$ByzWoQF_auv3h6l8+qdn9I)F!vVWJ+VF`ayU%qYeHWwm-O>R8vu>I?<l6Y
zxLllav#``ZcF=6E^k#_zcalovmDxza1htoK@~m`vee<-I8(+G!qM?gmE{^B5)x{M!
zFKa{>ANGWCWREJ4TrFtU^mPbx7~=2%=PO@XU7~5UyXx!WVFQ5cmFH$!s%UmnQaBrO
z^1S~5t{bb&ORAsj{+5dc-<QhA2-Fdw3HvskXV)4l-stJ-?g#Yc$Lzf4Q?8#=arD^u
z;{O1<lBu-XPg0?+u;qFlgQLLML*|j7e6JJD^Ar`y9hh-SeKQ3;6<de28+j-ZLh&V}
zzT#J->#}LIv6jZ*=MjJwCV7CEypeKv3SK5>m0DCB__+HZWjoj~&!R~yYboy5Nwj<^
z{{S#t4nusPD`aCqC;P7W;!=OH%<?tSSE<(4PU0Uk$oi_*!sle<sp{rwb(&H@_E>`J
zlC0_-A)|8bf=tIZxlN~q&v$#HBx_uMPy@m$jg15p>RKm}Bu5nki!*e|sLOL}E10cp
zxC9+-L`(z%3HU>v$*49|x(2l5sAY||x{_JF#M;Bch0ZP(2H#a^y$wK9yKA<zD1(U^
zM9Us|x`om9R7N9l7{X!ag*T>r1fH5EL}23fU7zVv7KEJTYYQ62Uy_~~w*@?4945WM
zU?IrEKy}J>%4=P7U=b0=cKg1_=vFp1A1Xi%lf8}Pt|h!*C^QgxFjE7FxB|*qY<s9&
z_Jq+?VRyRRgvUMpQ(Yjvh0<;bnVA0oP~APg;e6dh&Ptv$VSA-?3u9c{@S!cvIYl_8
z23+!%!bclVDpufSZ~z>Y&9#!<u+Z>AM?1pnfSONxVKo4XM>#RAaW^V<un}^*1B7ma
zLqk9}Av|L?Omu)IIzhtQW=N6FOuB1sRIP}glzKBGB>mIkxpIG{boNJYgsp&)qZdpd
zUg^ZyG!QZ2O(2p+Y=~uu7eWGW-zsRFZnGDncLCu<Ta_px$*wl+g_~kEp4_f*99Sm4
zODLTClqrOk%_rqZ7!Pg`?K!wk^&MndG94(|Fo$!K<aN$Xlnx^N-7-wt9vyYX=Eljb
zXg$<`2J(nO-e2Pi-$DeqT~|1_aPY2lFx|l7!57hNU&zx!-{6cYJ!IIGe#?44WkIbm
z#l<95v(%K7Vo<&LDmNUdB#7?h6wgfOD#=mK^4OiM6moe)2=Vff@!cCG%E2$5ERee#
zDa;oso{0ztkk%gING;)TjDvtvw%d?ap_IjlUFz1DTyce43l8CMt?1if&ty<0?F^Z?
z?_~^MuL!z;LwG1w;r0blGm=O>q-^=J7NF;{B0JkBl?31i8>d9bpg!eb!Zw5q0B!(;
zdo8x>7#gnj@PlRUj;j3^vI(ZnKPiDlg$OntQIZRU6%pWN8vYUlrqn-IbrmX~QNiIs
zO~~w4Fk1#VQq!i}+Mf^?!YC}6-=$R6e!TLn-EFF-v-LR?DFjB&?yTtuEf)&1Aa`Y0
zQ``WwjESZV?w<vSutUslY)UswZ2+u5Q@_Z$!dn`G=_!l<0F<kG3MPYc)h?G419`eV
z`(tOqq*@e$q0ELm*ael>buFOS@T_&p=CO|VEDo_->OIzV)a2}BfprR(OCiZgrnH$y
z)eDy#=IYN!it-E#rCJ%9-6}uf52Bj5S~KvSr#8@p>fyPB0H3i8#Y0P_Hb!amPIgGb
zCZ3aYfRS~1M@-hV3nih5X(=`UQH=w#bHHe@QG;R<y^ql_0@*39aN{W&NjNx7bF-W*
zWFe6E31c@nOukcrzD5ecvQXRiPrx2jZNTuIy4|?)gEfxbV{ir1INaX}r`^I<w)sTX
za$}EsVLaFo?g!|a_TPsO{H%dwPqEKr!aLba7!PFE1*~EsEy8O-zm+f9G+^Thigw(t
zHVd5NYbM^^(*Q>v=E!P^8qji`Jk4n3QR-E|Tn8m=)neCHG-DRBpscFha1(0kOPo*-
zc|4RV$2vzBl5Ux7t|3bVd#sN}8ysYmT|5^ckfx=l@~mm;!bc-eG%y@{RgEPfHpS7D
zltSamxum3R#t=-RK(sVgJS%!ycDBGZOHTj<Z3P_^BqBc&C}GXKB3m7Y8B(${!g+0m
zR<Q6Zs)4yZ!XD_#!L*PC(1zsjvIC71(hI)%y0nSD-W7clefU<<b7ZoSY;hHg$3H4o
zGR1R1&vK<;Hp1tVI^z*q++2k4E!iVSe5nBLfmDRBvTo2ylGyN)*Y1>YrJ~mfmhKbJ
zHa}#?m5jlvyPF`uu*Y<5RskqO#%`V@=g`=%bbUDXT%j3kd?TSF)A>e1!pQ~rNO|EX
zzsJgJ$YxTV4V{c-GDo$h_w0tMtYl3$BI`e?YeB6crz<G7N_i6OxvsB{A^L^Zb5qrU
zBnK*ris`BxY+P^QHkyh_pO8;=Xv6H_%jB+*yQHa;4mMW0c932}k0`w>OK7#*Wu&2}
zr;6L`ES}Cr+?fWSK^!as&A-)HHbTbPyKE5v(hFc8vSigX%@zQD%59X48z6mDyqf@q
zbnbEGI%oQhxEn%d-qs5pxbUPQxj9Y^7UgxkuC=~WohmddS}&7yp{=>i%0M_u0S3uf
z)Gr4mFSh)oBIS0_fKnbv&lX8>*aXqaQReFmk>4qV9#h4JQeyYA7BV9u=o+>Y<yamM
zbQN8%a*ct3>><BI&5k$1m=R%<gwk7k-QPs$<b9LT#%*$nEyz&P?X|_xBo0!xJQl<_
zTu&HWKC7{Blnc;={{Zs3_7^LOv$NqLSO;F|at=~hE<Y(khcsV|mBd_F1kv;TlDCks
zShmf8Ty4NzV{Z$tdnQ0=?l6|(+%CU#w+6)#MDKfHAh6_&aGW#P@|t)+DUBeM)7?Cb
zT`=7QP(#}NlRRZP!snEn-DD#fb9<LvBiwruoo}DAYlXlGgt9VEB%60o%aMgMhBLy7
zLeX(!WayNDWWC5LNDP+1`dvphU2uq}YePwKRY>N_#yrV;TkUj>bi0AVl21;<+)ewG
zz#_N>$0?FIY?02E+1q}~zNPjyKXhx|7-ikN3ZAZ_J?6xVCQ(3HAEI61GD#TGl0S7_
zJ!@NV3a_ZIH@GRf1g6<-JyTk6KtRu^4Ez58x}~19xY!a;gfoQlaKrl{Vp(HTsJHsb
z`=BJNbibszEL0M`+l*)6*&j=$OOxr{D_|>I8{TeOPt_3x3!HMoRqZa5JDfK(02R$9
zl;LaI%UBsjq|-i}?rcDw*BmVs37A-zm`}(@)9K9?+*(zX6w$DIoYvdQ&V>i2mZi2k
zBNp%x(bd&hUtk~oE4^w+d2?Js7NWKi4Yph9!c7buYpRQOhcpj{pekx67qha0lTd}D
zFK9v3YD{(;D=dmeB%Wz<NhjjyNhF+}Ir&Oz9Qy#~SvAty_j^Bd$pMf(vpV?us0?ns
z&C!N!!oo%_4FqMv>D3!_3K~EJ3n#UN<xJ**%1{9*jFpjkWMbD&Y<a!#RKbGRAt_+G
z7COhGErS_duoKuP*}Z~kXyhEBVd5bI_6I3LTf$3=@oy>3@8J=n5gIdr@SM?O@{|l*
z*>FA-n=Kd%WTbm<gq;1-@!OQ8C`)IxlG^8m*&Wwk<za*%+W!EuLw;<YO_E>2HfkH2
z@R0aVH%-4dL|P+uK>B4d$BZcpZGpmTt_7}&Vlp#(+V%;AjFj`(8(A>;<uWG5xRla<
zzX|5V@_ti$U$S%{gFLP_xx#h0%HS?MAk2{49>65=Z}6Ym{u2E1g^rNW4eohdKbw^6
ze(4AxSpbP)<#8BGZf?7t=on1f<si7nl<%CbKmCP<p)to~>z|a-e&Y$-Ry7}YLm})D
zusi{hv#?f3K(mNOMJ$K8Ukl^;6M9H_BJfVYISH<*X}~J17aMLWSc|WLh3okL0JGX9
z#4x<MFoIV!*krDBfOuZUH59rEvKd-zRZUw>%C(+$+m%sQHs@RARV2dX&ZZ@<S9ESW
zLZ+kuxGTyKEEbd+6-X(U?45F)&@IAUzY285v7nXLP7MicEy5IQBR{1ylBPCIA**z2
zBVA=64Z2%3HJZqWDO8pVfD2iyjNNjQ!6;~2&0{{v$-$v0Xe(K)YjB>@lr$$>2m-_h
zDd6y$0&_yZ9u5~>b&}a&p)QcP4oc?)B=R+bE=t`Dm4q1pUFwBTKBEf`WCQM@{{U8k
z_>_L>ens{-#?1>P2H8`!_*vL>SZ+UvKXi0DghXM(_f>{O$;u3~bCfP{LmIX_hb3&A
zjuj&<lX212E!^KBQCHL6_*yNyf)=Wp;{kTUNaD#B%zaD*1B@zq=*5lJwz`?wuvyJo
zH!+0S49#)SkWDiS)DlMsad22_{b2guoGoZK<n~(LsE%282DI5>WzwZHleCYr_}@1(
zhD)s-I;|JFNn^ubJMMfdgIi4y0w#i1c9M!#0djxxi)%JmaJ=lFl$`$nSgH&oU6#zK
ze6HrfNh9pT<pWPVQH#Dtw0%%|ma|P82y2Va!md1#<NLDQkrt^?8sZ7zRyM7G`<;vB
z16x}9iF1pgi^p?y&yq2l(Yd1K`hzWI3;k4nxNx~6KPsp^yN=23Bw(qp9eOv(WrL?^
z?i5>topcG54oY~aU^W>~97znM9L=Dcu6)6x9IEG3ypC+5eL?P1Ja$)*Y_)H{B}e(E
zKLaO)T=};+fpt9zyRZIJC@8BD$p<ylatR0Er#DcqgxRt@kE$k-fz8N88V^yI4P6*+
zMB5{!)@sSK-sgSQtU8nBZeDHmS^Bzn)3lS0=qPHXYw${3m|~vTW3_14Nh?U^=sJgk
zfx-fsq0$abkq!j6Dh`{Xk-uWL7~F3m3bR>dBO@(n4sxDN*ZoKu=5H1NmwYc{#f~_n
z*_&+heyogdaRUo8OyJp8=czR5OJ3(Nfov=#K=kHt$RMwC43wit=g78fx^}s-5$;-9
zHDdUKTI|_*rkgaIzyz(&Owu}X(;>q1JiHN$<iiOxsS4^T>!iNYK~H{#J7fJgTkR%>
zo+b}yzshc{Ei@50lF)lEIeBeMj8NPgXO8RId5E~W_*r*1Y=jRhZPm5W$s?N`v)yIj
zq;&5j4odnT7bD?vAw4h_f?a`?w&*DXYa`q+92IRgi2Da^T0WMc5LU(<-W(27W%5;i
zqNQijABVdnr;Gu}3(-Xpk_<DDu-}F5gj29sc3!Czj1XenDPfeRu1xBTX&!&CXobMI
zvdc6y*2Z0KZoMm4B0yR!sK3)aK;vaRzm1QPD`AwBPdn8lF%kgEt&T}0eTcAIZDT_l
ziP}{}dRM0Z0MfkgH}UHfD;hGBkq(zb>Jf3u*=U+nb{A+=l&uh0_*Z&nvrQ9&UhoNC
ze}UpppX`csjR4Xk*@od))@h!bx3Rej_e-yic8#PEtc^T#H-NsH9wb*pr7K%Ax<;`j
z9D$E%$HL!e8lUEv4Xm>A=`1g}YSDD<FQNdl?!u<ECUQ<GJsOA{ND0!kkW*=f0wKc-
zphA;Tpk+fya8xq%)Fw^a2R;_iuoc1vp2=Jy`vFU(X^f|60ij#68#gG3<7;~-5Ssps
zqEzY;0~>)Imyv!WL<1jX>~-VVev8S!5*h4yLR|(Oo+GL>er$bLrT!T*?QiV7<5q2|
z!9G{3{u091#ThB^Y)tN%>C_aiEErZ0QWiKl6+;U{8URL^z!(TRup$_yF}BuDH7+9n
z1dfdM3KzylC29?cG`G2PzjA<*vJLxNASdBVQ4{0^qXAY_QZhT(jmhGP$*|#3PDTiE
zP(GeIlkT;ZYgl6>-Of@|Nju+XJVwujMH&;8_9mr6Lj-Pn!*^Q?#Xl9a{{YOw@eEsU
zfNZ^|QJM&&B#%+n?y)+Kl~JqK8D{~J57Gcx!{k)Oldg}NYx+`P((Q%B@~9u9Y7oxm
zHUsVMLi(nsrRiH4vjg4qRmY%PJ4}yY7wiI*{6#H9UUEKRt*F%L<JkAPjqot4p84i|
zi6s1+uX6lW=}KKINS08+yS5jO)5Oy6YT=#;W1SaMd_bYoUh}#4D#Dh5tRL;%+rrRk
zx@=C5bka3~-c*%ljuz~R+sc+{@Kl(swo*k(WFTz-D=JC`2L6B#mDJ#J(SnVM&mTqS
zN^)$RtY`XrU&C&zH61Ea*E?mK^jeB3nF}skx!)))YFVlyEdy&$V7g(F5sh}k6VB>~
zqg7#HWo4!6u7T~@7V<k4EZRYQxoz{xw$k)4#{%|*A69g!7accMU0pMMUu!!B>)jcn
zM>|^S9MC(g27{-V!1UXHvfJr36|lr3jp8%#GPxl>GSWKn#kFmlYPu~ZmYliF4j^(@
zk#+SuwFzYOTedO40eTD~2EuAJO4hZYT$vwbfa{*M>FQwkH1~?RxVuG~7iY%@`%Yi_
zK$c4A@_8vIr_{`CaldtU8>-s~4w696s;#H2_3EEfE85pQ+@A^c+Ql<iS{(UZ;Bccg
z33n2B=Ow!Z)oP!8jLE+x2LpHA&*e5rolz$DfY6|-tz-<dc}SqvqKevkY$B?mk+#4A
z^;Fe!I#Niw8hW`VeaXUDgPsq$bi)k$XFQ~@Ky$=zlVuo<;C`Zxk*#RCASfLmvAu$;
zR1RYp19EbRj(ZRqN%#m;?;r(frqVN)<oqO(3fQbN$T4seWu+yzB$BVGqlJ;-mp>?a
zw{8S&u=q%#??W_^n5c%=_(MC|Ri$nnWnUy@oA4Fk(5!=Vi+}(rVt~5j@ShZI-D_nX
z6B-6Ws*l)>&;#kiM+ixQX)4;PMuA`zWTSJw63P7q0}$sNB@8zxhR0)&onR93VX$&D
z^+;QbsmKJT7Tc1EtZZxm-AY|ylA{MUQnE1q_Dr^5SC<zj0Bw|KqR=jW>NmBa7ocy@
zGn<oj3x|GD61W8c&t;Puh`>&0w<+yt9P!z6fC$-y2jx6GeQcw#B{_`vS+QCi9DFA<
z*sj_DO(!`?Ruo8l;YQ<Zf}5WyNWK<PpokuOr#0b5_K<L+A>0e6NIEBUgR#1S(i8Bw
z1AM1?MCQn<KqA~vboMsp>PEslsT#mI3ppUOq87rO6NJ_@4p%&YFq5zk1O)Bv0S&m7
zBS9mCC=7FmC2(l9`=@L+y_3T-P%zQJxKCrOJFYDj%7RHY_rld?<7_F?f}?xy-2`d?
zDUPbY0c8d<h+#NL94~YboSsUSH-p_fR0j~P={NkQ04%t-;UH*7I{c<u=anE~vPQPt
zg{)c~9l+0J&vDzrR=9AH$HKv&XFb5>UT9C;;1xd2?+WupfQJKOp0spe?9#GFh;hZ0
z2C*cC=EZ0l!|7xm6&|X=bCdN_T4$!>nltZv?pFu9%9ZRJie}#dRS<9x$l#F7dmN>3
zQIV8rR*<G=T`Ofhf`!-@;VTcyG$>14;y7IAkdc{cM<8gV*(6UpuB_=^c9Z9YR}jjw
zrUt^?pqTQ4qDh^0<v|zwgW*dyJE-Bd{#BxJOg=XIFNFn2&HJLDw!z&&R5?^ggLVxN
zCBXjxgmXu?2v|Q~{38JyEo-gpHVIOFwn8vxgk@2)O^}h3xcNi{jT1%(lxb<o4^IZ*
zqn(zJm(WUWOj*QU>Iy;b0THR;*Y2RBCgS6iv|!6wxy_QqZIqx~U;CwC_X{RLWXCKv
z{_3i)_1RiTJ*O(BtmK=c>;zGMq)2hL4+vO|+>4F3BH6kU*islv-fRlG(c*ak<qt<i
zz1yr0*=T4f!vHqIUqda2QVom*gf6FCBZ%20eOQg3tBkCEyQ$okwbx0=XB`6T`iXms
zLAuV!;^*9wZl6&rrFkaljcNKOU)Tr0%ewuQ&W_)B$8}c=cvl)&0zqUwftuPDe+&*$
zGt-jGfTPnk?H5*3y}p>SPMrZ2F~l0{+Q_DE+k#R!d+%iX*jRZ=-Hw)ocH@gAU^n3{
z&G||)Zn2I77bys7J(nAimDaI9VM9Ep?YAia!tUID>mg3Cx7Bd%i>ClQuG@R(m6@2r
z;0`!VbFpD?oLOsU9oIFY_X}BuWcE)DJ=4Qeh$M?;V+{?*3Ni|uwb-``IU4Ty3nK%&
z2EjDry6HZu86AX8XGrkT&5$)UtzbUn%ITWWeakyvP)RmD)-pjgx{b}R_Egn1E|J`*
zq>;`iJ=9^OoF$=zb<NGwL}cMk$j>%KLk-Ue-53%oV&RaEr>61|F+wgeWnoQD2^dJ-
zhJop6iLlyAxS^x9uHUjEij)g`Rkb}h0|5#iD2|qutrxacg*`p8pA06~JfmWW3>0pQ
zsEmp$Sa?J-G1*BQ1~8@DZW1{aj0l>~vU8b?1vmg<G2;bKlPKV*tE_F@h1-92+^ZSK
zy8^*N8Uf)_EQF)6)GV`ym1h$%dsz!gFYt|u_DMEd97ndp>YmP00e;ENZx+53&XkD<
zJSSfq1m4$6ix8Bcw@oL{b;p5Z)5b<tG0ry1ZScG0Ct_AGJyu1B-3md@3M!)gz)%|k
z4b#M&#9$W(X$a_u5qt$+>6p`U?i3YTq)|hMXW=tf(28m$th2F=&8$9EHl?b^8%>@S
z7NxB{*9~{<v-8x{RKIIOvV?JolgUYFx3AR<uPtlNcq$57C)K|0zI!P&tu^idx;v7!
zx<;7b1>>@+q;O9on=5qf0i*-9TtT9;F}rR@!o7-}u*GsLP}4oF%bWoEp~yt6u5<;M
zYe=$T-p&P-wKb88hMS*+GaO#+#NO*!)sGP-`5lhQ%?E-Ln%m__)(hJBO4-#IBy$68
zn}pz6Ka~FI;iJYE7{Kk4kaUQ<;8-OXx_yAY6F?W^3o+5$uEnyJz<hizw`2!GV%A;o
zP8WCL>Db{58iv~ag6wy~Qh6!6f%rhjcU{LRrNZAUw*`hrI@ZSsDx8yKW3qv&1e~T8
zL<a2^@|X`E6v8I#xhClZ5#J=?G<rDOR!d0nYw(ENPh`q?SOy95rG0_I4VA{mCERYh
z=bK%3___s|+48uX5SQu~Tj5|KG4bVb&Pl>j(eY%KN@Ir?=dxZqBqqZBmkW&LFxEQu
zNKNp&mB11*a<Cf}AU5D~m7}^wjGvTfTN5|#xZd{f^-FAp*!|ElV^77?NwvSiel6PR
zw*$J=9z!m3gwjp$pKwn%Q8@nqO2BeC#>u4eS6=6W5<3}Akd2KwA3fAFfo${HOih73
zyCLUr1G;#ka*!*{j#RNYxtHvRd&qIc%8{<K1_=5mIWiqC>;9mibitgs6txX&hjcTb
zVHtD3bm^RuY;9FtnfjJ*QPdh7L4H;BT_rhYUf@2eg0hZ`xR71`R^_lJ%DJnYO`CJ{
zQL*w!a!6LNY4AAmLa?OK;V!n~e#<rjo{paGxoJNt;+BLy$8DA7ouWbf%yQ7s=~Qgx
zm&bH~a^8&99-Wb9-{D!(>Eiis_F8ypG}brV-=&kDXk+~%)>+ZHKcbzKdsr=IpQ4$p
zF?^qZh^U^J57gybRap(r*Sg*jTNR*}PV<5P0Q#t<d$!{?@7+~PP#$a_C6CRN9;J=9
zIG?J1CJve8pKu>rp(+3%{P(&Y^8ijw)Dp-@xFs}T2eD>rEKPwx$Qip03DP_EP&kg{
zj|DqP2VoJg+Z=sYdM@+(C|dFd>p!wXDDL|q{)`nA2N^|07{BVu3JC@d@=<X}!hc@~
zFr>+x)PQFgy5R8a-s#M+Jf&>tiXH$qvgZS2p`yeo1VzH&_EWO;pmX6M9u5@d6Y!e&
zTr+$oOh*zBF=CttYh6p}8}b(z``;WO*i=Y^bC2?spj#<;D}lcuD=QRs+vF}b7|KF>
zt_J7@i`{cY{>zQ{<ou-UvI86}4lIz{!tQwq4+x_PfKndD>1}%^ligumoJa1WdBu<J
zr8lySf=MMZ5=>z@%3&AfJdEId%4umm?o*RvNWH*GZ1MF^wljRBvBj*7i$VdLuJdje
zZ9gG9ZNBIQAplAUw=1wLy4g2CWOg}CKiw!8;dQ>I$!uW-`>wVP(%AS&nAC6{+j%RG
zIpig8$y_<PLdKy03322u{{Zg^E<B<#N7<BeG+OG;8QE@DYB}-kH&%26zd2tIhc5-t
zY9-SqZ+w)lsoFdsoikx&&4<-yx`$qt2;Jy~-;2x1bfPW9)yb%_yu1Yw)L8x`AG+~P
zQ>!%=&Tq%|LdDi~c)7>bdib2=tZ&r!7u7P?FIDw5(Y4kO9Iqy4Sxj(Va;B&1392L)
zd9t*5*dH1_V^69NaIqO$Z9Vq`E6zGvtjV{}mA}&;c7<zbl_tx!oF`uj2;GG6<h+f<
zly^;Yf^Ov$ufbbP6vdKY6b`Bbx(2$WFdVG?ez4fDcUf*Dqgna3`3ZkEJg+`~Qn7@O
zP$oO78Z*3E2MKyc<rC3AHs2|KHs2w6ySlNU+i*-hUd#TW`=xxBp#HySrV6(CN-CS>
zd8q36fU%Gdx{<wO2X}&(m-HSe^p@0*Dn?EZb?215Sqy{#f4aKU^>IC{R_3hS4SQq+
zd?$xpRngD919f8=xJ;dh)e`ca#T$RRm8XP76*&ARr(9WM5zBiOL#(<$*KI36@o-g6
zsTSrOB$BjJ4v!$~I{Nr`nB^nru!E_!Z&bI|Abr=Ub)KKSud{!$^EouKD?drGQc+zN
zmA#_hOV{;7V(AGBSEqFx%xLu<e&uKM-8?oRcBg6)2%|Q?9#ip4qj7X@XgaDV5DUW6
zX`0j$+R_8}UpdrjQbSnaBqGPkxzak8cwW=$6JzB%O&soP+4Q9yWN!k*BK@x&myY!J
zShd?*Bi83h>IkL-_<>qEE3#6@eHZmKjd<ZwYFbcuKHJ@0)7Hlz{XtCd$BxR}?301!
zdbdxp+m6BeEX`(u#<<!)?7fb%jgP(+6@Hk~4Vt+#_*nBTi&S|XcADszeYROGb<;*2
z>5|p#n!c5}huejK>K!7^b=rSr;Q2p^QGcQvl_SjLshqfnz1Tg<jnce=F0?foEB6p1
zcibk824@e@Mc1D2IJ%)7voPn#9H*v^Ne#$XZ_u8{dx1sK>7j%4@U?LU%IIkbZbg(8
zZEHOItLliu8d?D1P}TzHk@BYIJYz*^CC{+FRPnLETFLBy3-F#x8^zZ7E$C|^m4FMJ
zd?0EaYk(1zFZSagD)|W{+$%v?Rf!n67gjV(_XB<vX8oLw5fM)2=Oe;tLA9c$ik5al
z1;x>S>TWFA7_!YWq0a6~CMn1OsMO=5Qfxk~zEE8ET~)|-y1*j6V&U~nY#X2M0R2-!
zZ`ryh(~GPL7FJg~ctcXLj2W=9ne(-*ISC(OLj^mZC%D)vid{91ixG?4x}#>P3{Si4
zLUm7CQ_{d%!R`aF<$69lUeQIMPOj6#DWrRv8ZF&;hOipi`2%t;ww+(qb+zT~w$bud
z4p%wuE_Wp5d)_K_XFgV+K^l9*BnRbgx_eZLor80Lvh&804b<_?E4`t_4}^2zS$icH
z#Ptf^xPqQC7~oxHlht~nvrusixM}jJsi|Kx#raxo6GAfWCA_Xr@vvb1p4ijRFGUn_
zO;IN2l2z`FOB+bsGvuusI&;&DaA7K{zLsio;>Hnf62B#6{bEbL%erw)*sSfN3MlGn
zVyXZT9po%+RYs)eZELLGfQZs*YTqz(+~QV_8r+!fNpyV~_;;+q3{AVh`Cf?btfgcY
zY=ZX2SI<2!6;mM>dzw70R-W+LTfRc#k!Mkt6lIyDdhV58?Mh34cHL?zD95HQJ1k#C
zPa9YV3w0H2O^fvo7t#3cDhTFta(gQEIu?+9t2tFeXB#zYYik(p2te#>&lf``ILy8&
zv|@E?X;{;?;Cw8Gqa?6RxDpN5tZFnN>^5q}Yx*;ZBrxCTxfT@%(bp-dA)PVQu86gd
zc?;6CEoqanr*iQ5sV1hE0F2`cN7EXt(8$&}5~`y89Q?gA-6-U2_A2{Mi~uaK9XY8N
zv8O+Ey3(dEU{4k#sJ(yy6o-WbB#;#0zEueg11aHf00q}TDGIx?<;w&DxO+<Szr<$V
zC$Cl12n;6umy`Y=$R5YEAt&h3TRc};xTzQNy=(A*gA8^H$~DH`r|MU${thtuEXQ?B
zF07t-+efs}i?m@F0J0j1zQBr0F2;%@lY}h9a!M{nk}!grHy+C%GP6*t+6!6Au7Q$B
z^7p$6#;%&~B~{kT=rr8fQVk+9O_AzSwgw%JyOn(;brO>2Od1b#JylF{$?lK?@>7j%
zBr)v|GCXz)&}*`7Y_WYkJaO)O%iZLa(Zbiq?XU;R&em2`$lyRMVwM`3r!ZaHTjj+*
z>tHXVrGz@x4=Bl@V_^3duvumXwNFXSLtg&?0NoKwQvFPidDwnb=abSNF|*JA02OFI
z)$dDA!y`xPE5o{%rlixIxCb=f0ex{>r&7ZKA}#N-@_xP0C99mwVzV2-0eQYv@wn}k
zP)zVSBAKnck9Dows0CbYHoeW(*I&@3F}On=kI`eQv^tt%T;`vxmz1(b_A|ujKTecL
zY^@_;b}$0V#aJl~o(ABOU3zI9W)RfxirEK^qiYYMEH^hD)K#<7FlEgr;H;%Jbg~b0
zhwP?&gtqQMNxwq0kX2To*vSlSzQ|~`d83y90I3XGWp_A6P|`)X1DmH*^u}#2jSidC
zm81s85Mc7IKlKdEitd%c{u&iD6wGTIwY`!}HlIrH>bcs_g*o_<mfJcp=A3jtQ>m-e
zm_dA{r@3(}C#%r9orT+MwJ++;3Z6Z%G4r^6g30wKQZlriur-bPtfLq%Fev{3ZOG5d
zEWW18pM+f<KJW{O3Z2ysFE1eFIMmN;hY|Ewjz6+@T^b3SPaJnLw<9WozF3JZjNL&j
z?sqRP`jp0&fpe0&BIpcb3Eh!oOKMoaLqR9y2_y5u9LR37Y+4DLXGk(XWH|-Ia*#+l
z?4)D26pSHMF|zk{g1w}gnic{`B~e2dCinj7?t2-*2kw=t8EDWQLJmVNJSZltbc1Un
zXjDR><l_p)f#>yO>Q<JPhFcNz^GSRl<fU*v<#8=jS~h|Y(F$7Eozh6rf0a1RqK+zx
z_~R{h1{B*3u1$iLV+(&x$`)#n+%cQJRqjn$2_<ARw0Oc8v~J~el@EFMVGktZg{UO2
za03W;xZjk=N*q$RD5!-Y%_L`!goK-2DR6HAME8<NN3b2b#@5Q7DfWVfx9pIV#z9Z1
zxUoO7f%22Wj@Q8DNZ5(B(538dhFrUz6T?UsB}gI-94@c|%Qn3LVFJR*yKZuv>v;)V
zZh1ky1)SD*I8MES;^Eme{*=1~99^3x@||ISszYJn6k%Edcd<q};Yu@W45HX*YmLtd
zn{I4Wu5G)dXt_eoLN%aql<l|0l!1+IN^?s=xc=!uY=>bsHe4IZn{eSa#NQZ90z2D|
z6CZyHcQ7UfqMZbZjmjb+Zb%6l8ac8@yEg?3vr!}8Y$osTepFniFj-?Xhq_DfppX(U
zo-S~n#-8C6!_W_)=R1Vv(z@9eRvUT6k^#ytPtYxu&VaVcHf~{7PiV2a9%#oS2*zJy
zU5$o9h-<r(bP>B<juecLfy&%$6vDR*l@zW_GX)#m;uhj93S=PRAeGm$jGKK*bY|}E
znvF$;0NnAoEq;v@VU70oS#2l+@%39x8a4ntcU#eHU&@1?z+<>n8oL0wT4{qsSjx<6
zM!>Fi_IohYO#Gal>L&m$KI!tGaZ$UD6%iKD*L)@$C2_D!B;h(D*wQ|UpxC5wOC9c+
zB5j05FuBRh1ORN2=iw_F3|P&bb!ARSXgn&o&OlZ);E)hYWoGnAG3|96C)_L)lCbR@
zsN)uWxC+rc{GFC@A7JjGsm?B^rykW6KsP@ssEY=U;om66n>P4DHrws;ify*=lqedg
z;?_dPms|Ek)nTY;uebzPMl9$t%00&j9Xw?k@o{1-fr^bz#oyc^see_GI*_q99niGD
zuNFYXgF&)%Ansf^^YWG>Y=xp?NB)D|QrElOuB31g=O)UFQ2j*PD4BFJl#=Clr&E`>
zDtZ{)_X`7+u+Zs^+HGZwSWr-guoBc&Lqt%USXmUpB4@jhv;9G-HH>wgWuHNhWj4K9
z8E_9}j;xr=A<rnCTCmL_$^nhsRFWOBV`cjy1WEMq;@DH{7Fx`a0~upwZKX8t76k`Q
z0eglpw3<aJYe%#rUd&k0ZVesLgpxA47B!8^b(@ufh6@wQa0ze+3yY1iE{Mlicqu>t
zUdx9$3E{c77g@6jV0Z)NaPn-NMZ6Q?CVu|_C;_34YC(JR!gv4+6r*PZ{>xYfw4VT_
z8NggXBKfl7%kZ$nN$ySVkRHjwzxZ6%kU77?#vIX%1vG8AP_!N`WgvZ;K^R7X(IK#J
zBPdy%0I_mc$TBX1s+<5;Kq9G?pc8dVUtPBQU4*)wa2EpB3pZO<UP!n>vr#2od!29`
zRdkZQ$0afEzttccjlwh*NXC~7T@?fb*>xp5oJJMZB_0LZk+7xg7M_!gBO|34!mx&r
z;@|!RTohU0r0jLkQYp`cVMhtDxJJ5>qc*aZ7;V5#m)O;0v{9U4T+_g8F4P{M9mvPs
zT)@Hr!pyW{BvD*m%6OQb)|(6|K<{fPNu3dZjEsvFCf^`gC~3C|!M44MlVzh6N4Jj&
zj{@8x2>9hj{s;kN!qtGifV`VsFh_IQPT~WP38mxcs+rF<vRYPwbV~r`Lry^l=%!%7
zNj6ppk)p$lr;+<60!P(29`;CG3w75C0m4h=VTmr^DWtVDc<#6htYN0(goJnQo_wKa
zk*paj8PyG`Ba5Ktm5gaO?1$7f7}?!X)oO+2&1oR2By(k)QV7&*+R{T!)iq@DNZT|O
zGh>#bOZrC2^H0+^G;fGs=&H1jK6xAH%u;Ff6%H3^J{E^c&>y%LF#gL)MMV^C7ijuf
zSc#b%J**e{A|+T29+?$58@qW%`i+QtTmV8<){9sRpeCqu?l=W0SYd3RR@F8#&41i1
z^tH3h<98b(DwqyU{GfwuP8QK<;-XlKuaZ@z5F})(*cwM6TG2FND`!Mi1+ZI-sTeGB
z5)V8jAKe5{kQ2yUP0w`Jk_EdZ2K=Q8LR$GeBp5dMN>9RQJ{Du7cZJsE+Uv8BS8{;I
zU+lQ|Nn*H;JRrwHTKLLGF}_pn#|aI)@`1Y}+AZ?94;M~0xLki_f`kDFQUN(36zk{8
z3aERDzxG87ByeU0j{zgtM+HRf`vt5M1EjgjRSp>~htah83RnKDp=nH<<LakzHy7mz
z7Q`sNEV|_=$A#UG!kJ+W*IwWyHXd@59A4>+Azk$4A+qC>V6ejf0F;NEWpEb%0Los;
zOmMyaQimQ5xlH8vw{^#lgvdt6?#k}hu}lPJ%dU93AhbEh7Velx@5)y@vSW^I{nlpa
zQd0}NV1eH0u68(4z1@wGNDfp<yY~7fy~mtd*ijh(X|jp)fzOoONx7sEdtCA5G0(Sg
zWE8bN4b&1<8z)dBEXf8*KmPy-Ij6I7P_tGvAS!EGO|8PBjU4mK^ceb)>RRZSY8Y%u
zy3c-Lq>GR;iKU-;vvcyBM?0G?pDPF;CJQ{-tvT?bqoa~%3%?5fhfBA6{FJ&Akx=R*
zD{Lb_brUoa=Ulb9;>%pkJX+0gw{^~?3?ED-0%aW@gA;#K1-s!|L8Vg1mk9n6y~Vf<
zu^%W&TyJ+cTk5l6NU@Xh(6nvY{!|lJ+uFcCWCyIk2nU4|<zY6t&&oVo0!akVUnc^{
zIV-Bp0Juo`BNrz>bTOPC($nynV-NZybwyLZQD{&;L)?N&Lg%}(;LD%VpGai}$lW7~
zX%BKJMmvsEwlsG7q0DuK`z!r7TJ|ZfVX^G2UOXsd0?Cxcc&My+vVrc-2lhtHJAKen
zHQSDCwb-sBPrytgAEXrPJpC6Iyzo{Lq)P)&gj7t$?1zDm+sQ^k*8$x8EbM5KFaQ*z
z=$W*ijQ3JCr1GZO)dV~q{nu}B7QNSPJ{K0GMTVC<`m&I{)*|I89#cpj6AIOw9PDJJ
zCD!KY1_jTQqs{QJVj#V_N<Qg+>xar#$4E<Gp6iIml<%rjZvHHVg$>7?uC;>h*0SJx
z6@bOHxwi|Al5XbXx<Ye=OvNEJ-fR;5-w7RK-4rVk*vgIWKW^$kE|^9EMv2J{bG`?{
zVR5yrKFLowA9TZhPwbeJ6g!)a=^Wrs=}o=3P8rS-1so1;aJU<sgqQhBJD@T{tTWpy
zxv(pRt(z__Kf1*c*2gzUZ)_)9z4DNKeu+#si=-n7*0|wu7CsgT)AUL+*oE2s*BqNH
zFrEHV+<*2LWB&lMyDI@7UsBVCe=XI7Eq{v-gyse@ye7?4wYC_t_^339O}2GYT4Ot$
z2h^;lw+mmpYfIIRp<TA*hZUXF>*}O!sp5ClcVUd?{{U1<zS*4CbkQSR={B$|g-twB
zNI-qU)oK)ajZWuDB%e#FI;|#l^SGat?|9gpRY{91zL8%PQIl{_?yfYZF^>mw1}#2j
z+WVEJpGhMg4T%f6Ku?t4bew<@V!azmec09JT`<DOv}X&^w09kiP{_7)<93Y%PQrfW
z3`YSybCw=lR5QB;NbVF;3#`mi>V%e?EKa@ZS=cteZp+XsBHRkiYZO7vb;l`HraEem
zG_IY@c_!k>W>y=UoGYzvfZf(^7H(=chnov!cjA<&;>}5xEtt4=Dc+cP;R6g)fH^-^
zWknRY+zI+CCw-%p$*zb^BhDIBPok&?0IdZyHyLSG5K;qcf|=uly&L9e%TdKx*NZfT
zwdtW$OLyMNN=gQj31Iz}hfAXkx3zQR@uTRrFD1PfT2ovYE=s$HfUD@Evp`l+1<fc?
z)Td;u?w-<`I8Gl#v}+s+Tl}Wjt^nN)m~s-afUw*m)KfO?L5!J=*XV?eb`~P9NdlnR
zqa}Klp$6b^vz4@Cc{@@xS~4@Vv_X*mp4n8LLlJB)u<Tab&<$zA&+GKtqIH7J7f#XP
zTKw;aQ9mj=T}y&Z)t_1E<W?62m2^_XY;dm!`kXmoy&D=0QOqE<>rbNfJkUA6#Wwn{
zDvGK`9N}0|>N{OxQE^O;;(Y_5b(3ARK2PqpnrBf%Fcy%0>*gvAS<N7a+RI6$bu`eB
zJyL}=(CTUFpGieu9HaFGA!8;USCI7o09E>qXneT(uS3xFm?dB$Ku^^?XZ8t0=(DKP
z8zXqS&g#87*)Qx{Dtf5pXt4@sMI3{GRc%O<iRBV>t9?)QyQzmtw{7+Sy)pDm<TNVn
zN(VMGuvv2E!vwB|f;_8U(P=2*E_<2?Sh|-nt|5a9(0aa(c?+%y3(a*xY0HDTUnS+a
zbJ{fH^jGRqfC{3PR&VXfO;WOVxQ52y-<4kroKL#<K2%g&CuN1p&O50D9@~}FO*Xxe
zfsZ3RSwF<m3U;;t>Tu(1CQC<*HCsa)K)r?6O3Q)(?2_7g3Y8hT=}TO2n95fZi>(Lc
zLyrKbeq09RaHz7e(`6$dEe7E_;kLQCMb#F9K(Yy}FMcqYyBW%fnK1E{D45tL$4`FB
zVM^iK?v*4I(-`W97T_UjDje36zm+vZ9Km6QO<ecqCq5P71lZjXRL{BDa3KR!-OV-@
zOSSv2VpOe$Sp}OLmwZx)B_lPdQ<oEqs+Uoa+>0&qG<hZWIiJ}_RiTD5?hOmGAD0-a
zIotX$4yPd41XVRFoPDh%tI22@Wepkfv^o}q*MLhxto*c<fwGT7(`0ko?E0@q>AgBQ
znBBuY)O5OBG}d<(3Q096X-?4KyniRid31!~W`bIHy)0Xf6*Yd79OU~(RB`J2!akOu
z$^o^n-Ff#cY<ehN(=0yX%MYUH^vZfSU~sf`Q?aZ$94dm}UR&H*T0TVDrp-u}3X&Ql
zW)+^8AG|!9lr=RhLdMrB$^aPKt#<7Lj*Tvxt3Hu~YpjhOSt&bxLO$yiH0OYE^-iOw
zmU#x!PFHV_<mOJ33dDLIpRO5S?tT92OQ+U}0I^t24@jwXjh$t-(lptbYu$Yxi<)y=
zLdp#nku%k@N{u0sgLdSjblPVN2Xe2Wr*7PZ(>6R0GS+%!uLQM<4I`!B>VvY`@V!E&
zjyDg|5gJ_-EpYaPxc0%7Xrj?H2_g-+D`BS6m|6vqbn!4W00JsDi>o?0(xLS2ASseJ
zgsB+l<;$0LSSKVT0m@^^94I7tT7h7?k=+}!*?E6mM$pHvOspiZuR80dA4TMj*GnOz
z+2TDzcFnuNUYYngUN$j=@VwipTkbZ(*M1R~37cftyP<P>K91Am+`;mV94d_{xWdn(
zwr>c_utZeXG&p5BasvTWLNc?O)|~0Vwd}RBG!TQDAVI=pPDt`iXHS+HNwbI?*q|fS
z9ZKD?Qn<KxBJ0$3JvKR-eYaH~=#=a`p3m&55B5e;W(r!(a-!y*ouk2U;Zy25e^6AC
z`l^Xv;f*$L_Fk#z!w}mX7e7RziXz?fmM|XJR;YU<;@RUgdQQ3dkmmx}@5hzt-6uy^
z>9wwA)o%`;O!wL*Zuzp%>2wZY7!4i(LP`-`1`0`#!KLqDGID^{I&vDA9MUh33t<#Z
zV{Dc2wZg<MX*DHBQiD7%S?I<@UubcDO7i}?(;%ab;Fg2qy854}s6>>~SX#pC<3GoJ
zN~(ignwBSE+@FQ>{&$Ar(}%OC7F3lp%{q+76+_5yz4%m+%v~wA0*<Cxsw6IXB$LX0
z3{GpoA#~xz#Z-=bjW?r7qp{Bd!|tr*fz4suaDme*nNG`=5_?%brnXv}f$bk0u8Bf5
zq7+2>klAd(dm^cI7+^c5YmK`#4;&6Hz{&2LEeoA>$l)lv9Z_Lf)pCgaI%u04c-(ne
zZA(y^qC+H-665l%B-0!leWg{@QMi)OERXvcSz2l(b{a@dj1zL~luUG1_Z2%LV>nM5
zV!1FEG1j;US={j3T&sD=+htKu@Yi`N?WBVi$N)FFT<6&1mCkv$7EnngfdHjj4K_MQ
z`6@4SzKSy?&&nnNe#ptt!x<Bfdnu!794SD}l(EBql$Hu3ZsTFQgyXTI%2!jp+zTik
z-MAv?r(jJnJ<dMWI1dcV$RAY5Nx1B%G2D4g!pbQm4C%IaE26B8uJ_zu<wa7^3K7EB
zSw%z+R$j+jNw;Vl&vnmZXD4emkA+7aN2G6Sq8qD7*4cw?(UWgTREet~3<t8Rk%H)n
zYacFNNxFx1^I?^un(QPX6yjZca-_BGZ@NRZqvdM|!MNVxa~Mg=R-F7Pn&EE22WBG?
z+me10O9zE9b8nP|%{H~r*@ia2<S94f3BPNuArlB+n-i5ApLDJU__9FXD5Pe_@^8sY
zkTRcunUuyAgeMb(#*3UOHk%=!5%2j<2N(j&y)`Q%MAk3@q-BO~oFgElb3h*{ModQ$
zep8#a)(SfkRIL^XS(uLTbd3a_6s>L4j9?tuWV9~G+QW3eWiy9`3)(>Lg@%U6N1w8c
zcwAa<aFjIpOk;q;OI=B{kD})N5}0dSWTXzs!sHyJBRr-s!`{iwBz9a{LQM8p!?zn)
zD9f&STwGHv@`^?r3TuHW;ik)-f%3K2MzC2LZ{0_<+rpYxl>u|kES*`0TG;TG-IFu&
zl$#rsnT0L+%2wDY%$5ne-FzlW#z?x-$lMmoN-eOt;b8RX92^SP=@o4NUiVq)6~eY?
z=5R4s8?5H80WQc^@=v-lK<u-c!Eq#AK_zFR+u~PA8*Y8UG{n*{K`3Lpak(i4$8&X5
zMw=&e1NwrD(~A*s5?tdc9`BS<HmQhd{zcQ72p!Z;d#}zEZjssd6m|y?;LtI+COSKy
z_rBk$D3SaZ6{yinEs=Y!tmzr;%BG3VxXD)(SsdkH%E_f}F_i-V-SUc*drB5N`hw}A
zb4`{ogSA6ZamZ7_ZK@ic{{Tg9$goS<-1kJZg5M}!=%#={L!g7zev$$fBkx4i{+l6T
zHgY-vbEf3?y0Cb&Z)IPm-yAC$549*($}Lx$ps5Joe#q@#locoH2nX3<54Ao#*+$X;
zH&2XZWM)YF>?)qBGWmd4ByPe=S|cRD?M#-z=v@ke?gws4*wIsnV;AtE(r7~(324HX
zQmGX2oQt6+Mq2~ctD6%D4zly@cTseYa1KXx9;RIPG(Y>Std4Y#F1_-TvHC}4?!P4y
zPZi2+5nS+(hARu%B$<)WvcPy#vLf;<6QgC#m6o4PaxM^CGi17L8%2p}D*gsGHj6gO
zDp<BO8!64tWkwW^alZr)DL}>(Y)R)S?G_**Ls;P4U-wS{4%{Rb;>)*-3=}&E-~q~A
zqsnVvVQbv3E;i!JQH3@J*9)!ZKT?=O+;}!pGB;$cMiA#1A4J`w%9g_Sx@os;tbo|U
z+Y17dBR!M$=l&FKCg_DRxALW6CEpfNXN2awjutUDWdx5PT#F{jG3MlUK-JZTw<T_X
z$5hT53Aj{xj-g;cDlJD)$<7rWRakL2x)=0iAF;KyPI)5ys^`AvDoJE6>=aSP=M+|g
z_0i22DC#<W*|pQ?sP_?te?daf03aab3bC4H9mv623OZJXjlf|#ikoN{R+R9OZr&1h
zQ6ea5m@GpS!T<;$BBPIl@Xw1TN`_^0@mm(MV;Ny=BkCJ_4Y%@ybaFJ^t+-4WhR`<7
z91hCb5G~nLQ8sPYx7l1%2mb&yl%*;<al|F9&5sH|+-JH*wAd1)0dvY$btG^YTzJA;
zUjyvA*A_@U4DW+<$MA1uD~F7I6mp9<g^`~{eM7dm<0x?AN}5)Z^OX<=>aim=u-YPQ
zjR1=t$VxVm;TY3qq-7$G9H#&{!fIP%j>%C(hg%==lmv~kb-)WTgt73E?`uWRggs4D
zW8{FTH62_w;2-Xa*`(A~%NpwT#?o#t;b*lCR`(5Z3QCEprLze)D9Q~X@}19VR8adk
zGWkD6Zpo_Oi`bQQr09({bH&efaYv+xnh1~kBiU%1VBDv)x;Yzi8A+wn#>SsaeNkjV
z6G&r15=w~$$7DQ{mv{QDW5*L@^)v0gi)@0Ht?n4Yj#0SWoT$h-TFWd+4ctk)jmm!^
zGy}?!fb(%=By>Ro)Yya(Xa?%Ss90Da%Uga$mP}@ajDclmNJhbH4+^p-H_Ef505|*~
z#)=Bvw1AX4=>Q*epb?Z1&X}OxIPvsN7v{w+$v@1q3L0;IGLw$!*SI9EAf*k7n|)Gz
zC))o2{G@REEIo)g%Ix06F3Gw>`cjOA?c3;+D~3)NSo3v)C&m&RTa>v-O2$GQi`@ZH
zxW7DjN1k~>O_vdF=*O{T(1oL5xXNvZ^o#gY7>>bbTqgQwm1KGI?3#_EZ)CE5qh%#D
zXKn9dqmiUMf>h?q;1F|U>zja^-q=gRL!@<$juT5tTbtXmOP<SFshnDDnnrob?Z(Lu
ziv^4+=ahuldH7r~cw9~M!pIGXe#YrC1?;)qfU-wl9|?qK6JiIHj<xcdU2K&ElVZei
z**aED$s%{S0s53qn150dT94bZ5?Rk<Wa}M~o@9gNouJ%h4<%XiWnU!D&QQ|S0f1Fw
zj*eOR4fI&aSAIz44K+{~CB;?GRPW^|DQA_}7jkVbh`Gu|r22yZ!mpoDxWn9rZ8c2J
zuxo|<t6C17no=C{5V0JJXH-ie_U<=CQt6eoE+46*>&n?_{W{3qV;f4)&}nUk*l4m1
zirtvaJEi7zi=%PBa<p21OqlFTY_vYe8-1<Ef}xvKJTf*|cie-J60#UHcwq#%xLfGD
zUq&1>Jq=N)$$iggBe2}7>UBwY6!DM$085l9v9uj6P#E6f@pLTJEpxBx+v=-itCjb=
z7}NWxT`S%FDb!d?30&t4N&6^-Lf3UeZiIA_7J%CT7d52vnvx7)+X#|4K>q-HchDi7
z7$jN5{Hd7Fs+2Ge*eQ8Y(Hs^I$U)9ZaDaCO6UDGTQah93BbjA_h&?-B33mMypIZcn
z$__&)5tiH}H@-Y4o)a8FK{1?2o(@zpUcgyS^#u0GDv={J1ugD}cqf5>ghTRfFrX(n
zHcw|P(1+A$x1>IoTubgfm|W=y@4`<~{t>cN6991s*@R0AydmL`hJY09enwDb6iFOS
z)7x-4QH<qE!TTg^>Vh47BplpwoClPa0OcuGh7pgHj>qhtMapA>#Msf3WZ`RJA^QIS
zWUS<(!y6n9GyT^jZ#XzkZz)+scYLnrfx<(R@Rr8-D0C4VQg*UZ6G`Ie*rMY0!t8L8
z!1-J*vJ_k6>YH?@%4TqiG=)F#qjkL6>Bq6TvS*w9QzCL2M>b5s$M#NlZwbF-<j%nP
zO&nV3c<z%oSP0;GN)5hOdUqHlDT&??V=aleTR2KyErI)`^vDEQeacOS+$=SmUIqS(
zn(g1Dr7)WUcnJ$jdnGbweeu{XH#V|BEy`1V-*ti~e48%ky6fKu`xJoKrZC~k@45Zb
zU+xm_OG7I@$pPKmn)upqP1L1<jl7ZupepO)h#j8d7skUJtmLw9$j0-YK2wgHO405B
zs%PrclVCQ56ZLm7zUPvB1>Feds){D$uVMAnRLyC#8WvwwrlV`g!9En#+T4;fwV?e<
zqp5teJd!zHuZQDiPn6h_nrLu_0)3&j?xhT;jEmU_$X<CIDMU8Sm$6MMB$<Dr&l!6|
zTlHJb7589XbE5(zZac01gyLE(xw5KfZWp6bPHxpV2zpcP2!X~|Gdd2!Yl3*;A-dFS
z1)Z2wx|18U+$-6dNW!YGgqEA4y8~t`Re`T@0C!Z<P_&!?wK|jp5-o3)ODkO0Wp?5?
za`ph)7K8r)!ZMnTfZquLa448}ABALdgws+pfC90nq;F*f8(c_N6w%muPKh(A>3|lp
zw4{$|3MiXkh+~N1EZ&F3rdU92WNdE2tbn-kkAQHvCf%N#7J}G9csWrs>ZET0Cm_)x
z<bb8Wb*%%VmpQjff3k4OJW~r`RWV!@NncJ)>=v2rx)OSD{>ZF01(J-Lsoi7kRJyze
z(|93oUqUQ!sI`qWxr6{wmJJn-ba;1GQ#bPl!<Ch&)0psmzq<8Kr_g46h0SR;&DKh*
zOqL>dFr`@K6f4T5BL`KamXcaBs^+Ga9xlBN^hM&^f3mHu((rEHQrojhCSn^?EJp6(
zO%|x;n^>!A-6Hq5_*C^eYuUp}qHEbXK(^Dh*<*0n^N*FZ>F%+X63}EL?!2{-y^ir@
zbu6YlT;*p7u~TtAkm<g)WTBz*Tkf~IR=o_(AH)QGSIOFLt0W{4^JTBldctT6L6F#a
zDJjRH`6(@*Pr+FnjTUfEm93Gh$$Dq3TR3PkUjG0q&~&{`v$3alDDvf_D0@U2#+Mw-
zceeLld9U<{na+Qw{g<v6#^I6>lhef}EHb$BcyP-0GJ4tb-mTHn0_#VAvdh<W^XcAh
z!ajk0IaQ=bAU0rGE}-eC<ZF(=KFgmc<J2Q@Ip(*c!(pcoi(2J5#l+aHj<cbPcRSmF
zvenFNMZj_wjh~!dF;F;g7#K~GR)fk4YM<g3wIF%hcNGN?EijW)Y~cw}SoZ+!KoY-U
zro-xitf@HxLk8&&7gbP2dFYx)UoJO3QyU|1Y}hGZ6NGsj1OX&SnvL0WM(z9*cxl_p
zsiKn2<RjZq#xm}5lT;Yl4OAij0IKCyR8zD#*aU4&b3d0S>Vb5xd&PzdX!1_RY>o;x
zz2qxOT4)&1T+x3jI#^_Ocv086@igS{o-=cGW)6~~7=@c<O{vT!xL{SEn3_q;LB;<7
zb#*~U>Nj)E%IWyNJ+d-;(VrC0^|u!HS}iuDLe}2Ec|=L4Fakqubxo^7G;BLff_{G@
zp;W9hSJ&c+g`2=W7JfR%)y=qG%ATT@SJd6^Cq2s3bl#c2X?6#~zrzeru*zkQn+x4w
zc(-+S$wV>OI^{Fbik>^%U&02ac!w_leOCmcvN3rvwY4vMkG$LK%9Bo$+%i=yW}{8N
zYaO_&9SFW>iwh$xG=@&QHB?z(Q%xq;{;MvdgJeGED*aY=vhBJsN$DLCrb`TrGJB78
zuj!9L&u&|F=6{-blFiDy(X}b*UefG+*QJLF$4!dm#h*fS?KL~1X|q<I3TT5xfGfzl
zN2%Q4#yR-<uT9Z4CQ8PV@NT`FIaO#`E?X|3fCpRzd~LICqNRIY1&S~<ZNj9TfoKw-
z*eB4+1BO&}xM@K{P$PYcINrgLXw<;)Kt;rORCG0sAPcKVB@XVbM>UosgqBgp`-Lh|
zlR0wagsc&=0c10PL_DY;-5M6bDn;5>2d^4GF8=_c^a_vCev8lg=-vm9ge0^yUe68c
zYX_6qEpOoafSeDa$@N$B@qDc(;S7LPG$V^_T=sn(rCZWx(OIgkA=iPQMQS)&U79@{
zxpL$NI?5>;qy;Z!fY21N-3wC)*l?`e#RROlvUJ2~^Zu@ux|SyzMw0&4SnW2Ws46PJ
zovyJwlD&qjPl{uC8VVXcDh9k3#?kgj?(W2JvJRJ^kU+;w;^!YLQ5zb@*aSTkO^LP^
z2!kVA-87xCp%oGMUD+^6i<|{rs%p?u#C_K`;3aw~Xshe(ZVe|!npZe)Eg_@jd`bAE
zX4Q51YF-Q6_YzmozlwUzMQHTe;LuJ5_+CY+Y0Z#1?q>HM{g*q$@;*}ZN>i?nAew+e
zMcc}BRKN>>70$8gGO|msmbBmisixHS$+4`k`YA<kX6z-fy1)Qbt@NQA<UAn`s@UV^
z<x*-|oU^-VBn3v&=vuzbL^_)uL~#cEEniM(@2g;vQ)`9iy&*{Yil(~c<$Vj#9XjfW
z7#+BP5soJ{V@8aXevM5}1A|y)aUGTiS&YXkn%K7I!ums7(RA%Hh4WM~t+4NcSA}&M
zb#|>Q;DcmWu)_1agrPdSIucZ5>FA}M*0BKLOHrpjHsllXwc1rA6wLK%3tB!^M^tL`
zf;UG<+r0O(=UM*%ZZREURcyfO^)HTd6G#9m_PcYg?4oMmmRX%6nr`ED0D<klW#}cN
znbqh?90N_Vf|$6Q6Z<1w8?A<w1d-)3V^}<5#S+;zw*^P(oBXFWmN^Nu#eIcSox~g2
zS<=2XHs;q<>?A2YQ)^tMYtfpr(rT^3&B6vlo0F9YeeIhiE@iM0j8f<eNR~I-DetHx
zZ3gH<;&3lzEK!m|cIgbZG3|TYN=YEw`iKN_jWLF|1qD>n2_-`9l%OeWNw*3;w(g$u
z***wd@-6pOPLVdoF_&mRI8tmQva_Spq<;-XNv1uGyYLj=Xx#-SP?2NGVI16|>f#JG
z1q-)13F7R;X8o5o=gO2b{{X_CBSo-L6Igrlqztu_xZ!hheiE}B8;=PHPc8!rKT)^G
zWKsyBxJ+=jg)gfcTVRHoP23A6pdlS5aFu`+21&tF#5h^48NHLWt?h)QWiUI+>y)M(
z2=1h7z7zuq&2aI;#wG;WG>m7uR=6ZD;U$F}Ex_!Y-!@FSCf80GM9*ZbwiDV7?wHGA
zPRk(J1`}k`LFGvHi)BRMLBa?uR|brg6P(bT>zsE{?aw?WNGXV2;dSto*m+EIjqtS@
zvEbtFDb4v%dVmgcp2vbdRtIFH_9?DQ@>gMG%rLg=y)%9k&9%5nY&qc@2eBCy!hhvS
z8B#+eV%J8Bm_@A7@|hu&N~1zZHU%f-4<LVKZ~4eOwJ+zO?8|+VTOWx|>K6u_A*G~s
z_*bv2iQmc;CU_1@R@gX{CXxMtPGuW`{Wn*FXa_6`XeFj|u@D71VJm4VcI1MsXiHe(
zYbyw8qm{P;*H2{wTI+#iB<!X((+Ps^V8W`^nQN7I0|R5Ssn!LsS3T1`7=IHw_WRRM
z%6z9j6mB_Ih>UV;hm@=<oB||YWDak+M&K0g<uSk_m|7yXQi0_tA1i<(gjf*xuW@B{
zrvN|}RPginS9Al|v6(c-7P=LN&ikUOZW=5wglFrzXq=f97H|=>DjJi6&D50l4Hr>V
zgOz2`8wD0F&j`52FobJ;=Hmq!9k%@zqXShm?Y;7YXX~=Cs26ELGctHt7_`$*#ubye
zRoZtTm1OH}z`_j6MHa1n-{n`*-*??vYW$ljxPje-y^Up)U3TWl(YpA$6}WA#iKJ;V
z4#UF8%(S4VGIm-GH&5GQMo{`BBH-KmE7JDG9_!euCWP4)M2x10n~oMEsdZeq2Ux2f
zq}2mj=7PNc08^@b@|>v2+bbOd)lBK7H#Y>Xr;g{!NFpvgWmv%h7Pz;<R_G@|9g!?)
z#j=&Ln+si8>6Ct>fgw$7QIs@qdx5c6lvJgy2Ez#28dfo)-~>#&Skf9lWc>_~D{ufQ
z;9T*9!qlO}1jE@O!Avgfk<M}KR|dNGvcR$Iw{+qFT*&Q{^(p0}fL0BWH~cACw-*XG
z3uP_9wiaNpjm-r86CC^8g$Z#=4ln*tppI|5B&V>nCT_9eF6?LMfsS*BZ}OpYyYQZT
zCO7~%x@2L6-ZGfyk;>^D)`D)UYwFs@k-S}N7Kc|>2*E2mscKm*x`R@#xga=|OEiVV
zl7rY%B&e!$+<7Q>z0Tnyu2hupxx^xpMs1CbH@)5LtmtT5;xKH8p`*R9v=mf8TNVji
zgG?Vyp<``uujpymE$sy|mX9LVR<yK%q#Gq$9y=cd4L{0?jw}T%aoAf5O@_k3Vzffm
zSxnfjKA|XYYbgUwk+AV}2Q+qf%7CzLvMNw_5p@$lz0N*Su<@XZD1g2dj7;GPL<Ot|
zbbLT4O`Uj<=8nUJ;q*!eb=SsJ8Dx$nCw>=PXZ)_dK2{j(4pSt{Ph|1RWQPPGf>%yG
z#X{bAQ_cFwDli4rqtPjL6-klZ7&3>Z01F}ku(?RbM-VT5>D+frd)nNRtLt?pL=U(n
zU(no=EFUXa+mfp5^+rSp2Zf*1wbwfBXZBSMb!BXT4ZtcaZJhahn8%{eP}O9R?PbmQ
zvKo?}qN+={8(msx+7yl;$lKj&sPwqtXeKs`DyXD!Pc)`eX&OjnoLiNlf;L74!2Oh)
z*&hvP?1h$mo00ZP*dvX|nreXD0!PscB%#-}{t9cPztARt+j5tY*N+8uFyv<HH#B^G
z6vw@WRBkDG9UM^$vxLGdY@~6rV}WydOoVY7E)&DRJ(Dcsj#q3XBGHqgI*A8l8|{1f
zMb5%nd!Ss?a#mUzn<Zf$1{H-Pfdd2KRWuv-3d)ZBguzQ;p!o_xY+Wz|iyS4ex|mq|
zjtWDz+@vkJ!QnN{#qX7dLX%_4QT0p>w<RdaSYg*4l5jhmC9%5Zivxa88pO6ZNt@w5
z*vU<>vAIeS3Glfm_(@<^3S#2lRn``;B_J5e=QhIY41|4ya)Foq%oJnoZcr0qOdjZ=
zB+^9W5(htIn=bBC1D&)c?tSnAsyyjEmJkaw>J&~EeY<%}1Eky8M&~#`gpBFJ$AAgS
zTLjjVZ1+wC{{Uo%OAz^8Voox+gqw)&jRCWZTu%ii)8M4_9ez_?Bd?cR=!mvFwKQ!%
z%$e$fe^QC_08Va=2<1f1u<oLgYj+<+B()$Oa)g?u*(FjiY=rY97c}<olpOQ?plT}s
z{$*QHTJmfPx`Ia(^S9AyH9!X?11)D@>niulEQc9Atca%5YU*4FVX;Q&=WVh%s$Apx
z$V`qo>K*I_%Sop6tnag*5kEFsjVD0#K)pD(k`lJS-_d}l(QD=)hMOzBH>Rr`;kp+6
zO7u!vW<t?;h5m|JYomp~q<sTWZiQ{V87fYmsUNBs>^qfd4GZD+ksdw~l^VG%BH_03
zsq3{zxS!$+pM<w&N&76z!w2b)_E1Yu&@%RZ%R5nBE6D;<Pr?{JSLDj?{34>+PBvdv
zRI`ok3c6>t#=+v>2rFIJFE05?*pFo04zV^Y%w@?l4}}Aw1mWMZBtR|lpXs-ez~u)z
zEe{^RgcsnSoF_H_JEHcEEE7&b9LoF%g|TtvIgPV;Pvedfaf=}2$Br~}YzO#De#x$}
z7Y56&I~1*zNg>xGkdXfXmBfr?AS23K9SWLx?R22waTm%Up@*Im4>?jBT`|^K3nC}+
zggm@n{{U1=$N>*Ew)s_yIkEste2by&WBRY~rl@eg3Jsv29}0-&kk=4R?9=6Qc9JXx
zep0#scqtnIxEH!&TCmD}yGAaHi)Ft^LO}(ZJ;=D>K5&thi1vZ|saP}cqibwbt?$WG
zXH*cUj&PIcK2qIrwh$eR=YX18Z+^;7_z5qY;Tr=PVmsX+1pL`a-++?G{{XPC5Sa-D
z&&qYN@{se!5E&hEdoH;FA;RmEjC`yX&L=rZjl?AhMg^|027}myr~9tW%I%<!m4zBY
zL&)%yfyL8EJ5e==afHI}u}>pBl^JilCkc@`F{e1W@|r&RP9dqb&N7`7Y);rXTmZj&
zuC_3Lb=C-2HaV^%xGCPFt!t?5#nRuh%w&h}Ae;*>^$oa8#kmWed;BFFd!;x8Cb`?Z
zeNrR<+lyH-yA`82NNxqcx_D+k;HBID0O3k&BLLj+xbuLe^vUoN>^ZUxn1ou{y}Yj5
z@)X{mjHL9>!qz%R*wqm<;rT$zN*!><U1%Q+10}$vV26Qa$1lgX(dE2}nPa5MCuIzs
zJm+6?a<+mtb^s^(EbtdbA0Of;CuRZNJ#H8Rf%+4{!$<7B5!CG`fVfbw<k@zn{fK$n
zG*|aw316f+x!S!9(8fCj4Ae~HXiruYj2$HlqmuUSwOS)fLqQ5x(EG5!K8X4nQrmlM
zrIQnA>cx>nv!(qa=%6s8r;fvfM%BvkNa<M+z!R;6;1cZ?L*kLXL_qeSs-w6#R&Ht<
zc<*%4#=z!`zM}yo;ZW4l67Ck(dVS=fU8k^{*>yq<9GMzsH}a0~iKnC>k80Ha0H-jX
z0&_I>gL^9RAw@+UIRk>M;D~|3Hab=XGh%2)z~BuVIKrMbcT)((l#F0YEuo_tXF%Iq
z2)OW~i~y&ME<BNKo$!{4T2!Neqi702^-|!*<cD6#$p<N0ZtHPo<c_*q*rdYiETYg`
zL$?H%2`m$~g;eB;w3ydtvVv+>%X^F>fcZ~g36!KOibVx(jTD#m1NK?1Tc#qAI?;vb
z&R`)8Gz@j_6S+1jNb$<vlr3>BX|m61oj&+lZriVPs-k0ovqH{m8e1OM4ZN)wDFx4o
z;dL5t4mW2%2s!j{@ol&JFH)`P_L&I`P{-5lJheOVpQ3BYN08QZ`-nDTqpZ><h?}z=
zm%hKI+FE^~RO&q@91pXVIe7AkMVc(|hqhR|AC&kip4X07s8@7hb?q6y!mIxP(GL<|
zW3Ti|vB)lQKwUMf$rO$DoE}%EXdPLxfv$C}##Uob=|@J}7|uMR-=WVKHUxbX-YGYt
zi!4$-7f<TQWw0^~{H-RLsz*2;;BLG|mrksXZ)=<a+H~=$fB@o8)ThVePRY;8hexWz
zEN*9IU8{N`GF(7Z)cS;tXFLT-uWD6Ng2rCnRD8L-F}e~tBFz5)Tvfo(=EY*~h36HN
z^Gr>ea<<Y?OH)<3`<zMcuk`MgWQ-1T2kgFbIOpX`#?w4rT{3w6#kdGL+aS0tE8O*N
zmxxoi1`pYJ_N}2gvzCV9>V8L$EF#J&7!S+3M*{1GZKl!y-_vz(CX^!tmK-2zY7HnM
ztUHtwoO?lq16IeersBb8B>w<#+sd-3si>)WXbu_5vCuRZ)jg%nCjS5m(2JWH%_5qb
z8i#|it^>*?^fe)uaB}sH6QhHoX>@q{BJ~cEiYQ48&(U<t!klBtf-|$kUkjM;aLQPS
z4jHgpZDT}iMZ;$cBVSDDWg)FxkLi@s2#TeQW=gKqrhKG^iv#ecri*jE*G0<%Jv@t#
z3Ye52?FlLRGNd{egWRi)H&AG6LG8+{)>$KNLr4K;=hUUAaTyj~io^3E8orN9ey0l=
zmjJWc=CJ@6a9Db+cBHg`N~f!>sF~M$&Hk#Ge;V%Cy&Bl-Sv2;=hjpW;*J)^A0^!a9
zc~o^$uwlh3s-<`rd#t)A;B(V@HLqspS?cFJov+7$vlV?oTT)9~DQi!KPV!DJkYKKi
zUKT8CNDfAeN2xxbE+n6-^lq4~jf@u~9#@f4R2bcHg0HA`cQK$7{ns~@;=G*!9?1P>
znXzT!{sO3;pw-Ro81k{2UZ7?<I9mRmX`V*4t-aSAJU@xsI^jK0bEfILjl)SkY^*9Y
z{jL2uS`7nCl17U#+vu(8G&u}sbAPhyjvtT`if5m}Q8gUF%_LZ@w@P(%k-4pV&AwG0
zv!l8<8#fA#^zy+b;c;&ZrWkkvDXx#CdTXd6osB-A&&t<9TF0{lFPpkkS(2H}4tcOX
zSEuNmNfYB}FU`ECw!0{xq^$G`hX=O`vUtu)j)PES;Cq1z#>{(guZ@wK^i>L{Q@fI_
z^sQ9A!M3`st);#~evtuWqYJ4!Ib|9)l#)5^2ZVHYuvPRpVEQW-aFu~}DFr32oRJF}
zhL&A4#uSMU3s@)$rM}X<{{XI<1TMFQ=ygA&tPfna@IM`veHuNU5!Efbp057@2|)bl
zvF@q5q!461)u-Vz?Op=dzmRkEeI=t0`gs0|+#hPF(GBUN`YUUD5uakiqrE|UCjtr*
zLP1hfxRe?Vgf3jV;Q@sHRNc4aBy@l#i9tmQ+OwX(R3(|fQ}1a?Hj&w80AhBGn;@%o
zIB8l<i=2<B+6C4_sogPay)j_9e5~&b9FWnECMABqETrz0u*NyLSk9^IogYt)&EF+d
zw*4#^ztvK80j{0yV<g%>6<rTWOI+>JUBvexdA>K~GWjoz6$W_t_Gh(Dt%|Ot)iXfn
ze@tL-v-*a;HlPemg_Q9gdoM|@{5}k)bcKfCU3iD$7Kf^7^>1?<C#Sp4EWH<#BogJa
zF-Q+yI(%(*+1VqHA-T%M)yKX<<_ur<S9DrMMM(~nxcya-(Hh3(nffN=+T_LdVkCj&
zX8!;PSs@K~xNx>J=@L2Q1|6WPO<s%87U1|?%RF18SA(H?V^y0@s%zqjvS){Iy~m^a
z&t0mbY*dlMOgP-u<#;xb8p+%0SPS=F=lFF#p4cKLMqjwTS43AORwAU$H2P+tsI%3t
zo>`oKsH}feXp&Px_c5DD9ha`ht7#EZhRIP7HsBCRS&pJ~8iO3#cHM`)mp)Gu8|$(D
zL&B@#t0!r5x$aO7qKURL$Szj*s<gIKK>6QhfxrvTY9x26Tu;$+OA5y5Ws=ac(M0fe
z+QC;=(!$2$B@sPTmfF$+ua-jNmt3cfvpFt-Wr$euWnEC_2W<$dr#RdbgaKi5&Bhl>
zR4CAFNy2k?9GoY%ATFCDn$u&HS_O<H+=QTB<u`r8d`CYkT_CNCvE=cel=$Frwr-53
zfWO>uiIPexX8Vb8w*f*~w@9pU>ew7~<-COAM18WECZOlI2;$m4QzPE<b9<GpUc*uJ
zPWixT#gG*;7ZLzPJ{R}Bkj`M=$}mV)4-_Tt7`oAD)B*M+D%v>7c;R2sIgB6~06z&c
z$<~EPyQZXy816v215}RS?M2f)gk`|r$x&B;=9TA0)V4Z{k&mvA+-+;1#CA6-&rx#(
zg{-kYP$XXD_g=0yqHRz+uvczUxtKrMLi`0y7*czb!tJ3TaTzHbOR^BF1yIL4lz<bS
z6NG0t;W#$kvY$xJjJ6a{2f{6_xUo+3M|3RR0kwy)Qf)jU+ZY1rk_)WlZpc`|N}a40
z2^ct1fo!B~#4i@$C?4VpG0eXyj)W|kfy2%CQnZU)gwq|3(}%PsZ5qcC0^scOnBq@1
zObvbTwOCUOjl-KMnIN|aD1iegmKzVEMhYe`;3nOwGVEO=T1m<Q9QO;@1i;K)JT}E6
zoGhBbL^2y)4*kwH@`)z*T-FPFg4P-YYY92JCMMgmkgyH{a09SGy8zo8Bm&vCRF>{i
z7K?I)gl_ZqvTjNF@RWcJiBE`&_D+mGD4a)iAf}So1fwXno)LRS)6LVV4w+71ka7xd
zqb2w%*~7h*MA-3!Y+|s}$b8v%qad)gm5I&2;WqchuoklceqHCWQbQBk?1GF382#51
zzzYl)K|GCMX*??^q%R`*RM5DzfrV>BazYGvZI(@F*}|jN&9W@7zxKY%JFb?S-O5Q^
zj`sM(&dTsyf69m#6X8tevm)sm>ED&mk;}=mqXx<E7*1>B9q^p#Vj$-WIu~{d@Im1)
zq8wvA({`|)a)51v_Y09elL)~}=>%-bOpcs;h85)i_VBA9iJ`*eD~dgh9HF7pbS+4<
zX5j+c2Uyu3QsK2%i|@ju5zCS6vWDA!6Dlum%c+O361sde;Z{8y>=<R&z_KDc2K`W@
zljRV@?eJ0dZpi8g4K_i?a^r+t=LZ=<#(no##jc<Fm7BjsuB&w6k!5D=wFYET>c<D_
zs-d}e9o4R^3At5pwC~DD_CG=N(QhKbT<NqVyLF0YiAm}f+%1hA3uA~J1jzxgdKlXT
zK)6{~Ynq!_#{fbjTB#63?Az$P`&`sq_qn@@o0i6}VA|fG>7^hQR}*)-=P3s1A9AcH
zV9o5eKqaDrz#Ajk76q3=%L{i$QovqD6vi7zOTEAmb*0m&+RzP!yeRbQKmc)X3d{62
z2sh}-3gX595RY)k3#D--M`8kWha4@N5%x+N+t{XB$?X?6B`^@K78uHPiSE0B%HVz$
z4@8Y<wtIw+#z9KckFrn$nnwjGh#qX1WFK`jk%MgZP&yluZ<N*w6g(GUJT#HdWY#b@
zy~30fEIx#2E%zQ$Jl!cLk>9#w^PAWsK(VfN3W7;CgxZNi2_@VrO-oYSaMG{>bsE6N
zn>Z}SrCMH1o%c}c74LaDRc1#xo7|wb9)*%Z<8rx;F2D)U!d_Li9TQE0Ezy?B`g(Uc
z!tGZYZk}96wOLVV?6AVRqNEMAnv(2g5Ly}lEpSz=G{K-*rApQj!%-1~d@VyHI*t*1
z467KU#zKyfn7xtFuv-f@Rxz=GpbUhzu=xs2wkbB`5AKo3vVhP5?UeR3ZMsn0`~>S*
z8*-7dv4AA41=mo9i`h#(_b7$$;HHZNl`!fS*k0VD*euY3qXxvD5v@42)Th~KA?FE>
z7d?`0&8)k1`3h{Uoo_3wE|sKrNJzg4LUqRpl96mD5(vVEUI|4bFj)X3-8F%t-V(fv
z^Mw(SjTt|<Rb3IA*<nv$+u1gHhDOVhtEJRpiHF^lNnNTLFw$1zV!Wy)hNr7q;e}_W
zsi>-yh6|#oX=bdK^t#8$TD=!Th7cU~Zthd4sH2Z2XD6dAL847FgpvcFA!#(tHX3$~
z%>(6V1Qf9|^nqj@M6q7L01@O(Mabq>Q$y`*0U%j(wGH?UK)I}Yi5B~*TEH`FByyv&
z9y)!Ge2#t7ENyb0-yEbRCE3#$D2a=4WR3@b6YYck5@)glp@+YP8;X?V*d{nz{{RTk
z84HeYgwijCFm8BG*<sr0)1g|j5go@0P|o&F4IwGV*SZ!mh$UFCBn4dVd)->q<+$*x
z91i1j5Ly@r2R~(HM{R=~D&XAQt12O817zKc>@$*lCEI+0eu)LV6sMnr0&!{i`AS%R
z>xb1mHuqRP5V^TITnBS?DPbr70F>7<!;rV5S>C1BdVpTRGvzefut+*X%kO{!Z$DJm
zTn}n#F19YP!|~edzS&G0fZ;ixp<vMKXOI3<PZnHqle)tUlMTqqt*LdKY}@_Sl$Nrt
zpY__^(T`;3(B0Aof(6fPrE8^ew$P>bZ5Rn!bHc42dwU6|FWbf!J1*f%4a+Q}aXXEa
z+0}`i-F3jd!b{j%>#u%RFK0P1#Bft&cm~K>ry}>lF^gp7G>N2mZ^9Nyta2`fo~FZ_
z1O-N*#_-~+9A_-EqQY8&I3R=^^;Q=y!m6m$jm?~^YAfY+>`C|u(xaMrui0@?sQ^!q
ztEbd%3Az2%dmC9$?`v!i!n2^z<dxf`1vQ-RKtGw1S9=)u6WJL>K~YfPT@%3hTD>bl
zV?%EqK8r(3K~D&_&`@kkvp1w@O|x9+Tuu2}nhi22w*LSIz#=24ik+itTZIKqxw8SR
zuuI6)%V?yhgk){9Nww%976q627g=hpdv*gGe+U^h7t4R)w<zq&29BeuU=A(Z-`!T#
z^&~Q27LYy_Gvj2LbWH=`CjLkhhTH0jiuO@sY%Xm{vvFWg3KHhH`?69pjo<(e%9KDs
zxhUwQaWXx-kF}!7?TDQ4p4iAez$y6y?vheEV~A^5K*$H>C<534IA1opOJlXln~`-C
zga85m04uCMsV#fhB?jdI(i%Y`_e~=o<v8<h$vF!qZX-><WQRPb8x+ton#H4l3A;f!
z{^|A>Tt|h6p{2F~A+W`h?Sd05aqyD%VJ>!*mjf0{W1J>{e(A;7gxugJpVXb6QUXQ5
z3nnD2VQD7H386N%)b2OJ9$7383W(;Nfy)D~n-xBDY^9P%5__&=p6>(UQCZ72E1(=C
zWMB|5S6TT6-&?0b9dzD_pr~38WjPHEu^+OI5OIYm2E+oU%fciqzi@t3fS%zrH!46r
zsaratgu?6r<t?s|^K=GiP2UL%yxA$YYyFZUA;A5Y6NT2Xy5sahj3MV3UC2v-Y`Yh-
z!>SrUwo-GH;y#H8`dMQ!x#IavxWKx7yIdqTSO+tbxE%OhwZhgS%bY*D#zRRYT#i>?
zDQ#}|NC6iiVOkjDjyOzr9CuP4$)p~BQzC4Q*uT{w;^92@DXzfEacF6^`2PUqC(%0A
z7dgU9++V`T2;e?`%0@60z%k)F)FHMOIZDGrgjn*p#o;Hbi=;9T4lm^mhhx1n;3P5P
z$vtcp#&7;sb`@e4yEivT^6Og(-lf69Xds>f20~rewaRwqV#I~mBazBpK2dCQfpE>z
zY(LcGr<0GAng0N}115cW4AqaxYmdoA#VtUvAbpgD%xaC(Huhc|zbBD<I3tEW!lSB}
z7idxnnUC`S0CX$_IP#B%8-=0e=gGS(!y3?nre4f9QVN+nw5bGOa+EQvuNGY2_L06k
zWM7z*`buM}9o?lA7~iU7u?t`>wd7Ci9~2k_wat$urpaK|8*tXK$_n_bcu-O_2^Hg>
zO>8d&S4NVOwemE3NC?Kx`yll2HjFC<v|E6K%ER!XqIU%0Q11!bM}*+k_(SGq_>mc%
z)=^0@`XWmk;YTDu_FLzY2gHD+mdBiZ69mmfz5shDj1BOc{D}knbTij#?_IwM#+-Ob
z`C;L2@+5EZ(ZXi@CyAMU$v-UL8A>Ueeir`#B1ZoJ9S##Tcux~H{jQn$cBcw<_($iE
zegsO%*>S>}I)(&0Y1?iTtbwRJ%-;z+DjIO5WX(`E7O7hcR{22jk_noZ)&Vp^6NC*z
z<u}GJtkj}bruq#X*LndDm^=sitxM`PGtmis0GVY60pdodwpQ|?5Ra83A_)9|a3wN}
za-w^}kU|2ENU)ojyhvquHy1(FQ?_1Fh8*&o*e<V%WOBnrB$|6XA*7;>nX=P5mf=<E
zbgvCIBrdLO<l{`HF|cCcM*4W3a!_@UR(gkP&6Fk@(A)Zl?iA-Y^iv!|A3;t<{iQ&3
z%4^@+t17B$p|~;?TP~wqU+sPrACT9htKe^@YMZB10fH=|n@)k=6%{>YaUSUuRobOo
zO*VP@r2hahFGWAal)aYj(;yDM;H8Qhc#dUY`>!(BI+ImogfeHh=(DvQS*%8GWOKjz
zimLN((a$duR(r1aEoQtqS86V%Ye{shULh}CYYiKHOIyX%1FUOgb>=QVb<dtlDykJ>
zaXq4nSPY;vwB>7b`C@D!k^o;mQ1zWucH4vXR}poUe8R?i4+>auLlV(X*!B%tvKKV5
zuW3ACQb(h<u0s1>>m{P<l2l3zlH3#AuSd`&jnRN!-`ynf!cOEmgMF1X9WN83H()2=
zES9y=50TC+iwoLmqk-)lDGr?syfhUYzAPrFbrg@DAn0j@K)W&YTW*)>Ax`GG%>Bak
z5uw9<+X8c_84$BT3SKvd94^?>ifctRH54@PfnY4N{X<(%8ywxhpM|E>>B)@U#C;YA
zs3}|vg8_1XHzbsQR6#B*$?Gp<j&bs_+MOS&_ZGEn{{Ygao%t3W?w>A(!5<l4Es}C_
z{ffC+=8(}jl30QVg=q~Vc3sW7ysXniPd09E*)}>y7VvDQvb)fX!u2gJqH$|L`!6)s
z<J%*?tJ*r6iQkuT0@%Xx4y1|An2Y}a^1biI<ZbNMXCwfNgglY+*&5bv&68gl0ek3H
z%I7x3rsn9Gqp;wp2mk?ZvM2&t=dw`T{4N6@RK1Z#5Z$KgT5?P7N&VC(Jlv@w!MH@m
zzolAcm@sfxynY(=(Wuz{m-{ac{5>J{@wD-A%KG#0su&qU!Wu7bS2k3n=)O4GwrF%N
znT{A*Ok<A-jYmz2HlJu(c%H_>K8lB3s$)UTlS7PjhH02RYffY2HfUMOy&N7GwpA0y
zB&XaG2pJ&2x~qzP2?>}7=}wFjw#ac+QAX{|dE50~gH@*QjF3L7E3N5{0oH1Zi(Q=#
zn$cs@y;)+`Nhj{T8%WopoubkMf0gs}kj(^_1cDD`ccE*O)4i=PHVCBA8}!eh;;3Z6
zWEEjU2;K_wj+fUPIA|`p`maOLsziWUS`uXDl^Qxm*aUkxK+_Rmi)+P|eH`yhm2!*J
z0e7g?s5VNI`BZ+OOS~1R7C}-lRvWF_KQ8|Op<9}Rg0S6kf9ap}D?W`L&j#wR)gmwO
zso(xIX!%2RK)av&r~Vf^ZmiM9R>S;;&HPWNbPUqR^jBZXsQP%`jz6Nk93wu&fIO_q
zd@Qg|eUoB%y_WQEWU3jRVPI6fkn<pdz$<EfHkT9+`n+T6r_|yvjDV;lqmT=Wl^Me$
zf2#$e`VC349#PR$w2#yZ#yUEdA8o=Wne{+expU9R$&a;T#VK@ZYHDI*ZsHbKU#R@U
zT*&Y~6wh(B<as|*fvTCdA%S?_f1S;7lcaQG$4<&0^x-7F=Hly9q0q88#?}GzWlCn+
z`;&!hL$A=&HqyG*P593z$HccP7c?Z_Ma^EG$z!vdd@nBiP3f9xsUGLCySrg->iWKv
zFt(mD<K&f!>RnD<M7gp!2A;uod4HC`p~eo`DB*3MIX0a`r<ZPS_jUj(`QG}2>A^}E
z4>-!*Rp|_xqWep(RM2QpQ;_Kk8hl?XlNXUZ(5EU!c+^?u)f!bnWu8L^z{<w;9-8Jj
zfX97G_iajwh9(&*CyFM4+~lt=>w3CJyvIgEfc|SBlySOF*v{GJ#sb+r*s)exT*f&D
z*`6)^CdeAPS)`P@?f{}_D5cyDkKJ|4DvUNo!rdO5(h|ifX_}({0R2w7^fp)N@lpoD
z!!v;GfV{7y=;bA&vEh2BPiQZxiN3S;w%jQA-g9lm5AYZ+wsf_j!)1Wsjmq;aN}fpN
zEpXbtlGgfuhMJwlvG0ACiFMAN_Eow@w`k(arL`ww${b8A?XfmNO!Cozm2o5>VF6PU
zK=P`RLL#1h&N(TpW%G4B%)7`OC2IwS3M$5`1(n1%2p8O&lC9*YbFpk8=A<nbBFWaf
z17&bF?xc<OH$3=VBxE~<7zAY=!n7JEkhZ|sCWgK4zDZEik-LlhEe4H5Y90V@b<dJZ
z8nTHwXs&{l#N2{WAi5UenFqSwX`MB?9nNlkh+Rvj$-84^`~|`Ob~#F!((p<u%oRmc
zjwBKX(FjY4$;#X}qAH#Xj80Yc{V!Ec4dQk_7fd{?Pf3uLDJ{{Mjq(F#m0?2nHNcyb
z^+mHqs2SLQWXWi!gkV^zypWcVsw_3Nu7$jdgdJv~H9^bGyaXtP<ok)|i=$zr+R*1D
zP>fx%n{`MCG0r#zNZLGmk<muL>}4L>J<;C)Ej+c+qm8paBO`7Qa{->p=TL?yi2=g@
z01BdE+^a)s$;ve75VRAY**Sru!bc0Z*rgFU#8_ESR!MREsuy7Ji;kK0%2Q59AtxkY
zMiNg7c-niZ8xBI1v4Ps?N=75waHD);=!4^g)3h7&Zs~af$XLJ=&4vC`tO!V24lQI>
zz%jXYcuy_Gl7;|MNZ<fQ!iXdsj0C{Kd?y@|oHz>%(AKbWc~1=q8^@IMa1pRj!-AcB
zaGI63&AY8eJ3Y#f8+giS7alB}(PRuSDW)@S6wUVXoL<qv<rEqP^vK{RFk9%SBp&OU
z-vMR@$hO@(XbND#Zd7s*-fWb@Z5bS><Zl*8WwEkQ@ZsSaH3Q3VZFG^if~1k9L<57l
z;W`OzKuIIAvyb#!vZ$eUMT)nI<-FMzJXXdzsy8z{VNOT87)^DBk+OiUVe?_xAZ?W7
zT=9g`JRh<)EezY90!LUCAsEQQYk>%wg=M#Vt6e_?4g#oY0EB%cp|-o0p|QG=ctzt`
z-DVxYo2$sC-5=RiYQpX1N2Ypz$|h21?Bj&Zr5!77@4AG6oE3E<E;J9crjSA>VC<31
z%GL@XT;6$7mIW9d<a-s9!`V25*zwAcgp4q&8q0@dpM_&e<75LszxY;EBH&+?6DvAM
zbj0mYNBZ)PnS){o58^Ap^Ro6>(~C1d;YU;BvXY<l*p!t3b6{1ML;w%!u|&uEI77Fe
zIYmYVuCPIBZU+cBkGqeuI;?w2ua5qvO297k)9xQC$=0?)sndU5t~lXZJo^x6B~Ghv
zvJ+2)$uO|KQI*lUNiCIOpwJ!R#9>Xk8mzwQ+DkR0iz}T%p|tepju7xUl&}&=77H`f
z+PG+NYrcp%8;uoRPpe(dXmZ9*^E|gIdis}COilacbtEOu;RJ&Ihta{ug=<e0tO)Fz
zPYr;=J_w0$!dnRHNDIxa_gDID7Dhg*9X5~~6NRCpiL78CAl(@wqku7^7Esg-cqo~q
z4Fve?tLK+?0V!ggjYJN)CpcZ3<n~H(Qij_H?5jW;1;$jY0C!EX`zLJ8@xmcOpZ@>?
zKnHZD*1F&c3mJ|Vus5+t=U`X`zzd9|Ej_qFnFvYABqhhn?WgXQfNda~{2()8Tw8?K
zTn~=v#=|L+I0NNi2u?42A*yHCIkJwfq%ox21)S8iGjap4jhH7>uL9sWEX8eOoa3HT
zD(cLH=O`Bv<H`wHg?o$Lboyww8<gs33*E)l)}KMRi-gV45gi2?aTr(hG*-8@PeDQ&
z&{f?fD8?|8vD86nDK>$Nt4exc05&L?X~RYZ(Q(Ia$f`rA*<U1N8>M4NHa)x|=VpFX
zZDu^6*zv~6=>|R#t#1}X(lZvwMzx~W?x!YnLNp*~;Bu5SSPSJii&%m6NzMKg?7Bls
zMe$&`@SS6C{G@Yn@|Nsm2`IbrFqqbhr^*kh$tfBQ{HjEo>^hV*H-e`F7En@?w<wTo
zGNk(}1SZf8isAt9m%5Gix5`FRj&U1vWgW%Mf#D%O4gzN7s2vgv3jm{;z%-sPp_-|Y
z0!ahzskI$k3^vK*8xnaGO9@?YNV2J}lAw~-0y}+FRC85SJK1{@uJrvbc@F7rtfNN;
zOuU|q=%B8hq}Y^xm7qM3>4)}O*l8oDWt=~7p^~Mn7He{gmdMkSI*N)Kc8dXjq9R(h
z#w-vL)i{H;;ST$|IY?SKTN_<nBb-BAglw`o*FW7Xt@j+Jfsk&4mX4TXrWZ)#xC3Nv
zEpP0CqPFWJtzm^G&a{L-s|hWh$>3xg-6<b@tboRFeyIipfKmo{DGz&PI4EcKAt48Z
z`wQdloEj~ajYAmGd;b8!=Q6-z%5dL+yJ`Ob%EqD%rq;2#M*t17h!^o-qj|CYDQt9s
zDust-TP|{}YR(UJTH~9djQScoVOUXqk<JhRo!nU;NPVDWrVumWpYD`fl*<v2cuRA9
zpcE-~I9+pWT{IJXf}BmVuvmniQe2Ri?vU}#(Eypf@06FZ<#7YLOZ!r>tm5w0x=s1v
zcOvV694$dRf5K34!r_9J;|KOYbS26|fzK(%#3uab=&?bP8w~QRrg!l;vOZIT;a1M?
z;&%wdgx-m+Lq>aYk&bXY{Zvvr+7xY)$1cC!St~sGNhVvva?o#&s)g<w&B`7bz-Q{e
zge>)7J;0tjtnspt%#eHLX!@b0tF`hns_L}}+CNgNtkp$`2G;P5aW7z>lk{HCTpA7B
zt7^4Ii-7B_?N+8qw&VMtjFZlNjd4{;E{;j(lP#+CQbG4B`D>i-({iMy(W+`4?haSl
zUrUnUU4Od7T&&Mi!BbE{7X#?D8a|713z{5zlC@fYO);Pow+iMBCMduJkFiSFy_A}E
ziv`+W7$ImV=xCxJ?B3m!zm}$rzUODPiWZ`HS^7!Ggu4PkvObm}V9Ow<tfX!1*Ax37
zT`OgI1iS8rs9+doN@^*^j;gI=n`SY@`MR!=?0NSv{N)fSrFJ&~_fKw|ZTkNJx;CO#
z7#rIG+7IZC-&G_~<XjA*gdwMDk~WJA`BHffxL`<zD4M2g0OR|GD_SpM_f9?uN}ZMA
zK<)r`{giHRltZv>e%Mhw_9n@!Ph@8e7s_dNPExpw*qf-uw_PadGE3u?%{bvVHcAF8
zmdYe>@^ZKWp4%4Y!FPWMSm{w29#7dJz)y9%T{pKsR8VwAeh1MY7r8x?yRHo;_U?^~
zLU-XSNbWyn#1X<mFWqYm3T?_qd|`0H>wKUJ8^|Q#HyzX5EPLHG+*uR`Fxc>z;dA9l
zf%2nqL`e*joCGYuWS<C^oFQg*4lJz`mm&ir+?9k_;9+%%KPZS}_TIwhl|*u62L|Wi
zOCKWx_fq;s_QIApPc}wOoO>27I8G<PH&e1aaFM{bzzRoH2x2Dpu};2D3g+h*`=@s0
zD>`B{n~=KT_DkE8nB<~n=tIJ3$-VBB{B~R|Ym$hfSlnfGjg!8GAsNEP5TrM<b`p{>
zm)OG%?`7Wyx?2Q>-cd6<JYgo|^<CX{{45F<<eY%G9E6`w*>V;UemPAyPrZ+8qy%`l
zM8sqagu`GgRKT*?8BH!}2&PU%M!<jNFyx!|Q+s~NPp4o3OiqY0J`w|QeX46SvAW{c
ze^5rjL^jB{`XmD6gOxR#a(4`HyK8TP5Nu*Cqk?(iG`EZ?2ms@{M%?|-u&t5X+vRh7
z0+fOdQo91!x*!?_uz32eKiw#{Ik*d~EzTAgOkmkOd}Sa9gzIE~gcuVVag)M!Kl=#)
z;BuDZ{{XUpZjY>8JdVIOQ_{gSj_v}MikI7SWoZO#V)(3ZmD@R*LQ%jN1<p~y_7-SR
zdW;>DOn~rLde6mDCQA7Y&TgLxbB_urfpJB|09|;Sdu(d5SlNWK3j&<Oh0+ma=t7ZL
z(NCz3P*mp6N9sAfm0T{gs<CK&G->qX?N)643ZG4Q+A^(UaNCuciAT!elAF6Ln&D)o
z9!G`5U2rR|v4%OhQI@HkQwa%-N3|~0w+TT^VFOZzr(Jj1DlmX2G%glS1u>2T?4H)7
z1t@aH9s-e_)J$;YNWzp-MvSL?rnNkOWEqZJxbV8@7~{fQ<CKXmnK4HNBT9r6_MYj}
z117!`9l~AK3OO7sp2SFRx8X?{7f=`cr^4a)SHj6<S_~E;30D^IMUhb)CQL=wNyt;3
zJ+5`^hpeG%SaF4P4}gQz8cPZ-nmRoH09%QoTv=6!8cpyO=DN@%_`0cS7gFMx(-|~L
z3?Pm!fz+wXnsBY@Y<nWxK-v2#O9C$+B9Y~K%>$hwA-4-RTc?og7N6OBolj23BTd_K
zeim<9=~H6nMx!is&{kV#ja6xzf%e%|)M@fCTmyya_1YVuBo?39Qda5BXf|p}W9gVD
zGFYx`aHoQ??6tqT&{XMx!25r)s;Sc6+}M;8`xWD`-9K59Eu=hxwmJ`2OA%;vhTm1@
z62UA-0H;M$BzEK?>PT8~XVLvV))CFLIzUg=Z*+}bIhY6`e6`aR@`->hciDQ!O>0IL
zG&qxmH!duq-)FNnsjeKRJ;B!t6;0F(EdaX8=7Us@OI_plMmZFjr44Aanw!)I7gXAY
ziX^!${>wv4JZ~I@Gn&T?3#Q8zDACWyXP(q(;w#})YA^;gfET1!QHO%FI-Zy=O_$C2
zJ`|g@J4c_%L+eZWd!pH;HL?Dm?5~9u#~U{Zm0-3q0A6gdJY9w`O!JPkrett9V}iUB
zs~QZiJ+8g?tyt&A?bqRWKUXw~p4%^9@l$R><b@eV;lvW8HZ9>oZ@AbeG?FsDoRcA)
zxhN+Lqorx(3g-K`%E-i4J`y;7$>d|YYlc2k0BFGqMySW#D>=2+GG@1-CM>UIu597L
z`rGifwcnFq;kF#FlsX2D&#a7qN!&PJQ~n&&NfiqLAR7!W49%ybqZ4TK*|iqMOi6bE
zdB;?B4AnJGf|M5@g{+!_T9#~c+(Ay$x<(-;{{T!}u1QBON2f@nr>ZgfEiGiWeAlt;
zwNzBbHt@9ZXi-BL_KXh*da6*tW{WRN#(Whsj!E`a7=xH_s_XR8D@~hqeArF$jijRA
z{Hvl|Sor48Fw}Z+&S@e)*dS;+UP&hau=2f*Z74a0?Fsr;kqc(IU`Yh5dGu!bU!@%g
zX#k(H-{~52plG;OloYYY7!7DgHa3pSsio-S*$g1GCRJ6o1`^|IBAfsUqgP;bP8Le^
z76&&{QnBT`lSfk1c`G+lOZ;bHFjLs!svP8GY$<i9=Wq<Vwx^W50<ro;MXwmL)=_?e
zg;+aA2%Ge*Pg^qZKj>E8PtvjdWZ(K{+rnvd81{G{REs)A2jRo^YfJ|hHbwPV_sBb4
zR&)j1tuzCBIVLaUHgDp6P17#D6nX3xfv4KDJtu$2M}G@S(d|^9WZ}^S@3AScI_^tS
z%aoMuu~~Ewq54!(wMx{F7YS1f=&zbP-3)1(dn*|lm>8PDMStX&dnQRnzzu@64GK9K
ze#u%)-5EVnH!}8A^2^u@t$w9U*EHhmJ68aX<*i>i`A-2)_KDMrBVCkrh1*YMpRJNp
zAq;6NOHmw>KW(fOW`TjboC5hdc<+@RPI}Rkl3AGBz1u>k)OEH+aMN-Yhp1v;VQVs0
z7g5uuk;cK<T=GuoFh}ejx2S5(#4@-O{VJkLy<S%mCzZGGZm)Fx74MJ&-|V!I^ym<W
zIe-r3d)^=8=Qwg~j!d-Z^Eqhis$cwRBz^mmnI?l6X>`^n<!yDUV@@_e(YUJS(A~T0
zCLc?!mVX4erXsnRx9HJ_`(qg63VLlEUgehXwNGs`1*2`qQ|Vf4_4NUaX$>V$=E<G$
zh*VT|!1M|s9IXMDvFsP9=rKFeZJS|k=)RHYnAjU6tu8BZPoTvU0Bm4cdLBRHbK_i?
zeq`B()!<{HH(`0Vj4vPSy)Dy7{{UsVwinU*mX{C&TKM5%_5PlYrRMAaDChF>;?pl2
zDr;xW6X+8e4hi}NQ(vPx3z-4?ucB%?S_Xn!9naBab>5JDPT(TA?7BQ}$;MidIrx%~
zN6(eaWO7-clk`wRZsB&=uV<U^*LBO<N7+}@ejhd?`W#Qsb?o7}#^Q2KQ`zTKl+K;O
zt!?h5tJ4H*CQN-+=02ExG@DuoD!Zw4#!^zcSq~mmGR{$SQW(=#d6jco*+>8?`3_Z{
zrrXTo1}>|^9OqaC(~e)Ql5yCyV7gE&y&IzG!FvFVeNI+4Nun>1TrWrIRyLKbE^zu?
zd4G_|oM|1NG#%N#()9BrO}`f4D{37gjK~aygYL0aJwYUF*%Y?NWn4Ort`~_Us5b1r
zfBbB+R}<0YA7`>NNz$87cMx#1`mT*lQu7=!G=uQG@^8dL8@4^~BzP*{M*Kj4fp(Bj
z^%W)J`7!;P3zjFM>Z7D0iX!(hqZ|Od->tOv(>dOoK(h2X`mNQFot6zf$ygq*suPD^
zK;!VcJUM0gKVo@t!9mgHwKWfpdw+$^td-)|KXkS5pIOcU3dc2vH(yf(nzP4tnPpE?
zv)tfURO)q48)E<ust`}Q&1)`IhMz+$<T%DdQ%4UcZ2{%4WpOjR+~P?p8JPR~iCRjk
zcq!xexB|1)&klLp!goud6Ksu*Z<S+56la$ORLr{hM^j41kZzJ)3ej!p!p2->R@O?v
zeW6ZfX3K?LRO0e&l^Dgg6murI2#APz=j?%sCtto%aI}R<Mu6HTb8p!~_E?-0Q%EAq
zoYvT!sn~1_HcoBurz`~8$&P3VuEIn~;_4^g%9X~~QJY@Lj7MXC@}3$#i-#q3{nlE|
zvB98rTv}~_xH`c|!qRfHW*8Vq<14myvY6Nu$N5IgHKN5lSPP6O`|@m*V);Rag?p|+
zQQY4pIdLCiiZHRbTMAY@?NHj??4Hh0U~G}ja28NVNha7Td|NkBkU2#K5Qg1I#sk?n
zfGnElfx%kr)GM2WJeYPArcg)9XtSNdWP{N?9rppsyQj-X!l!_S8{rtrow>TFXn3&q
zSZ3-IWGkxAaH4fdJQNgI;ny5?NNscn=13zc!l?XRZY;shuu!=SYK^hVXXa1tnMA>-
zZzQMFOAvS$$>CS}&UP%1(xTq*Pn6Z8W9-mUG&&(*fz{cyq*-23#MZ;W;ZtkI+pM{+
z+3Lsjj?B#e0Ib+3i56Wu?DC@ANh-=DC6Nz5y5c!egLH>?38+^zIzpki+?C<wb0Tw{
z-DHWm6GzyoO|RJ`Q27bZVFQF%Aoel8sAMZj9E*ikz;_Sqtmtstcu7Y?l4v5Jorn;B
zh>oZp%OC~!@D*TiWh`l&Lokw|#@XR@F!qctslYcER!c`a10Sy(1YCF9f`cEdc1A)C
zyrb+C4OM#^D&}9*R<$iVPxn==Xx>7|V%JSM7*@f%o64x5xNujrZ4NC5K2piikos*q
z)p$Efy`-aMJU2ELQt9lCtpwO1^_u2G3$tt}xmi^bpQv>YNrkO-m!4|%&Yn^OxmF!T
zsTn16L$8%Z105r-Mam1KNsp$5&vy#qmJ0!kCQ#E_)(X-n?S-2VY;h7mR#a5^1ca27
z_aK#J97UsyEQUxjfq*n)DBw-GRnR@n<Bq{i>NyG=T9;g*{;6ano>WAe;|bz`$p!n6
zmdEIr)1No&r)!(HfQ^J`y@w?&u0T>;7T>y!!#G$7?~E12$Af-Sv^M@cCkG2+#Vv$J
zlg|nF#k-^qu{cOh?~ANq9CMqf_geh@RD>uccHV4)Fp@sU`=F|-TE>z}j=r(1Y0Zkw
zYFd@a0HOp-s%kud<({gY(i4>0nT&^=rbNd*+$ISXi8vQi(^EO_7Yf3PfWF?<c|)c#
zw!1~pay3{Eo2L>1wr;fAeG3J>s!AF*fDN**XlTbI08%mI2FPh>+h9uqvVxcafqw{y
zVE_v$+Z~4qB`P{2h=H(<2vagU1t@Mfx{<862^`DE9ToKqv$#-fAmfB>Q%E;MSf7B3
zV>pCTGXSFOZJrb~ZT63Xh`L7hGE^|%ZURmUbAkIN8-ruQ0~|6B%I93)l$;+adtnb@
z1%K*35;K(fGVT)_{{YxjLO#P_Ah1{|+romL+W}MEqnoKd%0Ov3QM&2UI01refvT!x
zWA#}rSkjVPB$7bO+^V|mMX_8p!3ABZ7r3>AAX!a4Q}DuX%Cup9oSAd|2~k}n@7f7B
zMQQqBsc>__va-`OO91H^dn?G96b%gwx6xNf<dmF<0MS4$zx3)jDI*xlHcHmS+%#DU
zD}#-N!h|z%&D7f-IGl+lu6)M9xcaDrOTSgZk&I(gz#Ls8pV8M0DG&(2%I%;joYQ**
z#{{j}(NtE{TXoNs2yj!?w$3F%Y=Qtxfm;itI0)<Aqu~KZ&5E&T$I6>3jt&>fb8^r}
zmB0*N?xbl0vL+ZowUQCwebl#Yu2TtZ?h#B!p__1?&~KH%jlGkH=?Q?FI>*h@l5NWG
zvW>$er5y_A=LJOf8)T(;&66A~EDzZV7#^(QR}wC6E>YEk+n&e+Ya4{g0!Lh4_A0`Z
zfE94H@{gp;LF2+<0<O4~z+CuT1(qCJn|3RX-Y$@V;UNf7j=#!7YjTrmKm0Brj3Ns-
zc1TIRxLsp^?vULEYZaw9eN!*tC9{+nL^|2{N_nzO0us1+KxEFoQ%TB4y{+VwJhcJ6
zf+;pErjYrad)V1j)HrW9u*!X1a~ji}s#?8CoBse<<ytUj9!$|Koc3%U@P&M^wB|t5
z@`Q%6DY<w7GEm33*pJ;+DmW*VHW+K6V@Pa(pM^)LYG1{04o3b+$S_Dj)M#Xrw{ayK
zCClijo~}t9X56MSin5`=T!6G1e@{=mJJZL?(&@T9vDlV0eU`C#vnQr><dTqHE>^2a
z>A0h{+jVyhG>sP6z&xWE=EloCz$Lc8`y!>&DdA}T7%1QRXog#41l7!INc9DR0;a95
z%cLkcwlbtzO{&wyaMn2ds>+RdjeY}%*;Un6T#&<jcvX@~Bj27bo8ubm(V&~Cqdc+a
z>J%UAQOki9kH}R5AYF2&iZ<L}WoHzJ#+zlNRguV2kmop&f%2J03qPb;PFuCt94NUS
zjy!3J8*VUi6N!DlQtNTyG`ijbotIEZ>|ZHCB{Olyj_J%VxUgHXx+ZACM_hJJ4mP!d
z>ziE^iAqE#fP5%q<o^J4LxH|5pp!VUOinvwB%5D_!x>JtLF~ATl9tOPIia@UI>6fr
zpb|zCfU)|d86<Ym%4>iJ3E{WRtdO)~!D|g!6OFBF1ed?cS2K4hrZL*-tj!2rj4t2z
zx<bzPDK-(_=z%LAdyYG<Jn@CVTkN{uC|GD{xb0=c{1mpz?DO4gFw$(2`N~&f;>nIS
z83>5PICfJVj>$`hDTUYbWkiIN7~y_Uv)<VVm$)1ur*I)sCpJJ^km9Ffj^Ee&C<*sm
zU@kGdi-Cnhmm;!Y=NDnhSls+w`9TKBf6`R3Hd6lp(tl-`kyKg6UR(N;WdsY7qGMfd
z3RhpaHb~B#eTvhJ@|M}c<|WP4?C7Jio6mHlCEecvGGe`m;fwN{{gb!f77Kv{+QSHl
zaPoUD<lQ(NWCYh**zlE<NKQUdT#KJ6QV@eP6S7QwS6d6M_D02L1K?RLhr&Xa>B1uj
zxc0(ZXR%6b4pR1Egm>gFJ^)T66MH7V0@p<ujX$zzAaFpsQ`{a?EJry`iOG#|Byy48
zHe7Oe$w|q`;W;M77zg`==7ygC0J398KSZMA0Hv`10HR?Du)tg)DXnwB<u9n=eB2?h
zq${9y1-ZiSN!`*HyS^-t%KqpDEr{ri%8A(IDZNsBsGM$!3qp4u7hD$<ybGkY#zNE!
z6cTQD3Bv_2XU&tE4`dmvQ<STSH$GAh5nB$K_FPPB1&K~`+BhnTI@0fSl3U{Fn5u!p
zbM;>x88@TOat|c9+USTOB=<woyLF9`(Z1X(V}e^|O_RqS(RC|DhbUK0eAy&Y?sp}0
zM=NfkRu&u{2X!3NfH0WiEs}<sMzk)-W63VrWdKU)obJ{Ny^i<&)cS<PwCxJEDIO)U
zU679yI#i8LnDSaIuA(N(KckXB%FxsPoP|bYJ1Nb*(vR+(0J2k9otF|*?3&^%iZH@c
zNlHjvxFBRVH%=ExycD6r>4L?|;d?G5F5DIciV9F&bb-M=xw;kx&IF|wPirsPKW)1$
zVC04b_M0xS?7Olp0?8WW_Ble_-AcrvA9ci#lnh}t=F2gLz4lPPpbkxtnuS-S(sHpq
zLDg-cCg=B4mPCh+J4XCex5!TwE&iaqZ2lxb9b)YLQB=Ku9Hd#-`=YXcKyY7YuKr=R
z<R(6GZbI|gKCX^Tms{?vA?hfef7~Csf0OKAjMn<MJfa|S%~EQSNO173=;|8aEa19v
zO(UN)3ueB}<wGo)O>4uOV7SM)-F2*%amyI^+%3W$xcd%N<Jc8OuT~n@2HdA|La4Jd
z)E3-L`>H8k8VR~TSC&a0TuwYHDwjIu_p(%0v{=$qdxlo8Mgl-CRsxOW$_JIX>8Bm7
z%AQ8iNJSc|dR7(;1TB7_8=8HgSkpV$3hIGyR3$c1BL}SL(Z1(s{gxYF(mf#J*8ahI
z^>iD7S?yCzY>YQ*rYLh4EV!e`q@&shEhrhOfx!#VwS6V5xdSUVHlFuNY}5NKn+0tf
z4twm%Po=g%eZSdO&!T&<(gO5&^s-rU#T5Er4gD*L+B+0&8C?TR5xjd=(vA@vV<EWZ
z3rR-k-*7EtZpMRmy7=L9<+0W=AL@sK$GH6!j-Ojq3&qJnLo-C7tpEjkrqZ%vILhRC
z+zClEUg-L?gtQWFwDdLm+A_2Hc9_rs0b0jS=*P7*eBZGeEuAY|-a-nZ7Dy28e1ScZ
z{{T^1UTjIU4J8vVfUB!0F48uu;P#vhsA@w?PYcZQvMhtcN0)VGjvWi!M`iQp;vEO0
zRPxb|>*{W&jgE=KoG%0XOrmMt;y7FJvvJCemD)T-@%xB3Tp4588&e+HoH5E6jFt8g
zc8*dB8;lGgWEMBK)T10Z&QQ{ib_&A-5q<(=f}PwOsN6GUg=mD2DL~KsrFIuHBwa8K
zheB!}m8*>IwpY_1hnm2eD8M_e0{MrdC{0aMJKWmq>CeMmBu5l>2Y|fKFDzhN6rV@1
zXr;0>q=luX3~L4g&gk&^QG@WU89!^TTz+Sv<b&sR#e%D<gu5uOR~Jyo{l}G6p4mAf
zy_Ej`6~zo&SQJo32@1vrST5XiZ3_{SFl{&ql$H`?spi8<t@XA@uZ`?^bZP0FHiSz~
zRSg|;Yym3H3WmG7>Nx{WP*qWH1R~hrLS2CTtYU&qG&qxF&-AwV3qWIPLdM&Kw2Y!t
z)6j_B!nCK3zy$rRQp5r%)k9uArDXcOx21p4Yo_7LC)LOPmHz-mrO;8}omk)E&Gjmu
zp^n{gx#8;bs|WFA`jwvO^S54YzpNz3{D;Z>PpNuE*PxE;PS4U7Q==VyK0l(>v-E{Y
z_DUTH_U=t%Y;c|mTP3mDIU%)@sHJugGb53}D7{wSl*!$M8ITgAlQN48V`0X2j_Nng
z4+s~?0!GVq7v(1E$KVkqo-(VeB4Gy2Ms5TsDi5@z%{1V`mdx#JZH$v;NnJdy1T<l3
zt76}B>;+3z9CsjPd{>umC3-s6k({0&;&%&`S6>Sl(snIdsSB@Ws_N<%i<jjEf;?@B
z&Y6>CYv6tvf3kgMy)lbpT2a+>E_;sFVN&X}Qb!p!;RodBgm}g1Z;eZ39;>Lz_Yz14
z{3>%&_qgwU&xGwwvIiU8Q%xhoh`9+d+||C#DA9LIGo+YC+>*V2@Y6+&@v=t?lDuQ2
zBy061wnM>RNq!$e7^GvFoCWnii13nMBRH~7<;5F4K9(pVXuz=SlD4i0nn2|}?ID=L
zq10o0<UFpg$@v*^W2{SMe0WAr_9LyVX(aP?Q8Nt2_OMp5QZ$RZB{o`n90l<nOnix}
zn>}277ezUtjEuDpH3SWASQYyrAaI#A8Ih*pFOB18Z8+#@PAjt`R}~asnF|`x@UdM{
z)EYGtU+L35?;p<W1?ZaP3~|8!0AS&Gzgo~qSu@z&G!^ui{Os70#*R7RjK5<$sr8j4
zTg)`O<UQa20EL9=9Zs)Sd322pZ)Wxi_gK>5rM}`^?*J^_OpY!riX&_D<#ha#p5DoE
zNl}`vq<Og@pc>7GEGt<(JKY}X0BAl{E};`ctk+zwoOyXFWF-pOE}JR100Hz0+F9kN
zi}mgLm7S-Oc>e%N0C}<{kV#VSd!F<1aG{qPZ)Kr6L#EcI5}$L3Le%TB$O}orE=?zF
zWzN7<b(H%gA)^Yop^8FEb4N>F=Nt>4B_ukPL~h;cTj2;;Mf)aai!QYYwL~1<no3@y
zsc5j=<NpBFgmhJt)(gpS7ES^|7*;g(4+6lDp)VR2X$-T=rda9?V?ntW@DMa~W~N{o
zE(udp)4rkEF0#|~<qIK|h0%-~+?Cnm;I7DI$;h<nPK|8sYu^>Y_*)rzCuKF+2?pL3
zk4|gaW}e2i@fjWm>1euMtLv>wT30fTm6Xxj4<jqSa>WQ7={L4{Ctm5z(<Jnby+gpd
z!%E^!+_gPLEk$)x=bi7B?l;_4YNjU#+RM!3r0pFk&?$aw6p=B+-sMRZIVXi-PfuVC
ztc0aNY>EgR;cTNKptw$94R+CMs|scpG;S(ROjcK#K*4YnLZ6(gX<F8ca8UT}RQa}G
zF&@!;sH6_&=*gX7gfx%fjFpzcyCWA3$V`4s&t)UsjHnz*HnMaUM&X|+w)j&P+;W=W
z0I^OQA$hWlzujc%f69b|yT8>GhDedFIV7nX?ku1jC$O90W`GlMY?aR8F{JrQ4g2EA
z8ixVdcHb#4Y=olr!OF&BTe(O`PqF6<gD=Qf!!k-+S=^~MfHT=N?Y|d99StsVT^J=i
z3*jxSF0q)`+yo58z@F&2AJ~6o8(F_6lw+ZmkThk)<SFC07DPt~9fC;!0|}gy0Kp}W
zcwG71E&%(e#!ZOICMtdH$W)CL#;ghTPZz?A^O9eJRja5099c$a0N@18qp4tQtu>Ng
zguj}T!aUFm@RhVcatG|Sp&ls!erii!x?!w;f~;Rde##e69|&3s!6GOsoZ<zRucsn(
zgkQ?e(oq(_j_YC5?Gf!i*)^&c<7!5ckhPExqRs2xnJ&4#`C3QGx*HD*HLb7^S0&Rs
z__;*O&FOD8%8ZzYDoTa|?mMVm9x$$^Mc|@F7;dIxVmu&#w`DwL)=rttHALl+_zBHy
zL;nB@5=uZ#?u`?$o$(GDnE4n<7E!c!vTy^(C{R?WZusxQCZ0x&fQEBHI2J@xMjgOf
ziYcavW|X*K5QkyAiABj6^uiQj{{ZDYNMzY#N^p{*+fGwyjt6v=E;cw;T@j!``uSEA
z=FH<h6>Cqwgmf;mQoRKoRB+{2!|)NcQghrC9Xm_rw>K*$W?AXcImB6L=qa2wk`6gh
z^zNU(X*?|*L@a_5ZP_fk8V}J~S6JG3jm@kUE2%Y-=C}ucbZ=B@1*O0_V5_PhG=}H8
zl8v&h(C59=%ea%uveV(nRS-JP1zl<KUdf(>E?{QSVUmuegp<KhY4Li560Yf>Yg!Vd
z1U8;Mpm3$Xgy#SShEr{9qeG-Qho0$okS%MZZWj`GSS)Eb?3JLO-E&4%tjE{FV;t5V
zZUT@p!uLsggJ2h2+mM#bhY^&=JB;0PxXBqwV16u$FyII5kl1npOj_YE2Oh|ne&B6k
zWcIi2n!#go(7H*(8d9454Vpl~d#Zg(y|J|2*G<(m0KisTQLir~B{yUBI`HyCNmR2+
zUU^F_j&UoYh3|I+r?0bL(2zvw4+UK5)K?(cEe#>Y7KVn6))xsR>}3(ORLyOy(5<Oy
zjm8wzRD5F!(h6V)=|hO=5z<ozkZpx+PRm%?M+{*d3k9y0Zj0lMoEeaAq+<o{q+@Zy
za9~h!I@Ct7xlRKaN&p=8Tu;gc5FJqW8x$cHHo-+y<=N#8VpB!28VjV$RObTTR1|{k
z$g-aKvHj3`3PWxG0O3s_lm7q-#Ny`(ro{tL+b*?%BP6E+FO-DeHn3R0(pu)}g9jH*
zc?6Xab%!dkLQSN@Vs)4<QcF8oa^kC|t!zxmRP}m`q&r$pR&cRCWfWRh>TPY>({ibu
zG__I?E>r2Krm1!8O1z+;WFQwXT@@7*nt7bSC^VAd9UvZ6-90=M?Yk^3%1Im}000NV
zgonsEMaV@4$=_D%5g7qTd0uk!^twpkx7AF>5!)#ozKg>Ut!Eb`sTkaxVIu+ZRE%%R
zoSD@a(3a22O95kir|r)vn?6z&NZ>Jhu5j_il7^P~DILM>^hFItWo}Q=4RPC)O<ngN
z2w{W96QX{?Xsx=+%yD&DMVI7dS+|RF5=oSf#Tm{QGXDS;TrrNx!#67?7omH7JSG$5
zscbD|g}+3|jJp^xZ)E27xJ$RXOAwgIQG;a18{nlolTEF{Mo|cn%o(^+1CI-_V~?`P
zX22^2hE-#Sxm(s{w^eci9pyR^j2LhL*;rBAZTUc7JPV`gc;OQh-FG9DfO0!7$jA9u
zVSU!J?!bR_*B>i^9uY`Z#Q+X}vf^3f-{`nFa++;>{^(FB=NS7qrkvm;u)Xe@U$o)N
z2cbhrzBo%_Gi3y|MZe63n!LA%lz6i|sRueh%s5#OEo5MlN~NvUn~+>wsj9VcpLh39
z9Digd<oy~ty;3F*)D<;$w9p7^uk=}(%}wqkG!yhewY7Bz+Q(S<3aTk|apca~ZCR`W
zO^whDsGg!vYfZjUG#U)^JUPs9T3s`zoYQ@_w~VaLXEsym+AP&JbLK7hy_Ta+>4^4=
z%t7z&R#X~6jkg4kH&#(VV&e8gkT|evPMv{+^}L^|Bx&@JVZ(R)CreOTEL;!W15s2%
zh$vHGpzFfSF_r_mQ&z?|7C&W8B+hWX$oiBk<bCWOe{@tvj4ZpCP;t9ig<Vlp@=o`m
zKZxsD$M;Gi1m^z$H%CaUaEy{iKlGdYl)}<Y+(|!FK#U9Uo3LK}(BxO*pjWT~*$m-h
zj#2W*Vujdu+R2j=QKU0;xc1#o3*XMboCAR%w#Vctp>e>n5;iWvsh=f>vkGH<$NVm)
zb}UB=q(1U^E0y+ocuw(z(_{8aeDiFiHVI2mmQqG7Y$l6$PZkZaTEQiu?KU}T;^Evb
zX&u5qMXmy9vQmu<bHL;qs9r%kfUr}@dyrIC$pxd}rff(jWJIoLyQ~4p%6YZ;T*6pz
z0Q#h|qna=Q2MKHeJmox8NPCNS!a+Ol`bItwHqK}Oadg-112_67dhhT*WXYcA+W10%
zxe=Qa{u6C}c<pqqxHj^e&m|GIclSuqlh5wB{Bn@q)=X`k*>Uhe3!TTp>-?f)hXDL0
z-?DHb`CLzw07iTL6Hf|94&g@bQ9`meTgr{YDr0X7C)gXRCQ3?}#{u07I2_#*A@<(L
zY1{}mR757ht#U>_5fKNL<OK^{1-Qy3l0~!w*-+)4#@W|C)jV6nf!Hzfm>(AGVNXu@
zi|~JR7?JFmo2~j&CvHC7)WOk_&ngM6ixYH@M^p&gjuQ8}=8KyowoTG|E`%rl0F;-p
zPH^EggLRV@M*?|VJEn_cI7@SE6yghW+$H34nwN}(2DWh|72VPg)Vk*O@Pk3<<KZ{s
zDSYP3tS!I@gzJ2+vA=KKc2d|L;bRCho7r}3lmVU+kSwvbH=F<x92<X>xW8q`9j>vP
z7~^o5>~Nmz+Xmlc)4{iKgh{c4X88pn&B9ZjKuAHq_*hyS$7J9~(Kmt5&@LY*l)~1>
zw#PT&IG-tvHWp3>`9YLaD~106n*RVHA-5wb5BW$*w+J%|M}8AF+~*0-B!E%_e~*=w
zf%GYF?6?l&gx)yeC?t{LVOkcz{StsU2?2L>hX*SfhmnijHs``X@32X8@|huzplIr4
zFSDHIWoWe7UVoOzeLGEI0FiLCR5Z~<0oX1V$wH&q<>(@YH;@Uq2<w)M0hI$D?ixPG
zx@eyv_Z4_W<$Pj?=8*`E?>R&=7ch5LRJ43u7AV_n1@3sij^eIDe~?j@yx?6lz)vdd
z(pdOQ`Am8HFGu`Xjs8<I_0;&lRR$s?<GR{bQk|sjR27uY5ApUv_~{J1n+ehTEgd-a
zg+Zk>Hp2H>I#G7uCI0{%XXGK_rs=>b15Nl&3?~5(@qzwAAaSrm$n%tY<314bK<69;
zf5tcYC<W3R@}n{zDAPvc*)Qac_*?u_f0PEtIF&mtRKk#s0+F=G!e!$mEAniD-*nes
z!ZEbzOasA1_~^^X02{81r)fN=wwpX6V5cENCyeVvr{uPDaf>H9JYXVYj0GcD4`syh
z&MY|cwpN&(oF=+A46A_!`zFasEUJ@dQpi*^WlYs9knK234MT}VD-|{W0Hr-6mSZMT
zYSHdtURl>PMa_A#_4?*rrwbF*^ggU^!km`NMp`@qrityVBWcOz%J)g2cEC;uS5^8)
z{Yg7J--T(W>HA{+J(GGgV{FgWK3ZsrV~zsO$<<X5RF-eZ`CBb|lWZ=+@(!X7i%@Vp
z-zdc=ErTRnR*y~4`qj-W-7b7xdIp2mP{<k`CVs2tx=OOgfDMmx<zH!<ypa$@gniXq
zE2Ed>e$T2j&Y*^1Eg&~nbozvH0qzUtjT@@vg22dc^;>Ndt%2GfApO=-lzTNsN3=RX
z_Tk7Hx@Nxp)>};Kh-GO0ApO<U8njY@?+TI14~!DKOl!gRsyfXb=JpF|3)wf#)W(gD
z90k!Ck(3WMZkr<{7_!y$^kt!-t4XxR7hE+>LqqAfVF|koG|Ngs><RLWCqT`u3#Axb
z?5bcBvgazgwlTK>T1*f%f1ufPU}SR{jY^%a1dyoROu*w{7M8z)sOQ7a$z3wqIq}+L
z4u!34&~wCHhJ<6CizhLF{H}L_GqGl90-lR1I{I5Qk;=Y;A#O0Ctb=f{3z~j6(a{eh
zMm6k}vx{&F*L3THLw6NhCYLmlTsQk8=qRP9A<iTL<#~Qzj?%gV$fV7_pCdMlBb@f_
z!p>>+95uHp+Bq)Vn=cM(VA49F<0S^^tn8a7)Vs2(sD9USqtKFNt7?Nqo0SCB4t4UY
z89q@lwbBb9?s^qEDz&#>Cw&);{vkm5BbNr*Uh7{?5QvwMaJ-B0CRiedP{0AVE33qh
z38rT&K6}*|Sy1t7AV|IeR$8s(s(HU923lH8m)GO|B$zCXu(>%wO>6uk<Yo?Tg_W63
z0A`GL%11N5WiHY=OqR<S8NhidV{M!QbFIojhb+xUrT!UH#`?HPHu|rp`Zii>YFP5y
z+sgSr@cLOlH5hBGE*H}M4<7g<B$8K&=3#Q5XGS?Bwt7T$&U-**z(&*0VREae;k01d
z!9H1|i;}q97BnoU$g?#LcXX_kpycIINvQyRi6W_c-F?ePB|Q^t*U`$;Y^x|<+bo?O
zR=^F_tu=P+1?XbT6w67?!BsVFHz?*jzXdDc4hzx3?_)U>Mt4H&oFiy8hKGiiDD?^}
zgJoGyOy*8JU3bPwsyU?-dqGv}G!U#>aH%vfL_+HJ7TpE`uD^uSbXLHV(+FtW25U{!
ztQNJ@n*iY`YSsopHw!J*O}#Ugu3#*)JyUPWzvzPsJP)hIr<8n^mg$G>*IS?G1#0@o
z6%${|#^?wC0LSgO^#qWAvMZH-ht(Yn`|0uh7Q#Q!79*ey^yu^0Excc#D`f11Ivlxj
z<uZqML&%8ip?F0Kz~^od68mnf<rw7wBW_CN&y7hB2St32CCTw!Nh1d+X=Mxx$oQ5i
zTQ7DQxvd#03EnNr3DrOxls!dbOHGPt`MBzvGK(S9s%>_KR@q@;FOlihZgiyD>awPm
zLJ1(1^4?ZgESCgyN1&R$Vip3}n{(w;PpP&?UG4+o>Z@9kT5v#c3pX8Xj;Oq^+%C2Z
z$;zfI)omN-W^AnXHtM@rgLFpVWksh}?v0=j0y0Tp+wX93UXFa2RystZDOrNnbn<Vq
zGEbW<?M9C|yPOCM)xRny;eZ4VrKZNniG6@xJaSXD(MdNW%Jlu(Zlu``Me}v^PvNG!
z`I;En8yYYM7lCys4Vbc?JCb<=g{k~It*)oo-%-pT1$$UODL)$>)uCg8GLiJdWod{y
zM}hSy8j{IfW@LF;y&9qOF{Vjeey&%r$rAwg1=ox6KjkmkQXS#p&|EabZc1eFF`)5v
z6uOiw8$<4X7ezO(YYtLo%Y!HUc(%g@HMTZ30heKO-o~`qg~b@!cQ{_k3Yu3DmswjE
zjXY5U$fV4tQF@ax%_KA)z^^yz3OaaN=efu1y<b#<k~SUX&v%9AeOAUy;?_rNa02De
zlMXGpY^+qDT^>o*LYc9-!J(t)y7R40yV4|6KyT#my|TBZDm5I*7q`O8bst5TA|b2|
z`UMOhkjCXrhFE6RqsHrMYUL+;$oeQ_hFLke`mHvnqDfC7+};hYLJA5=i1xIB^j_vX
zk!$rhoLYM;8%W?mb^^Q6X@i~ZZyyMXJstAA7w);{>sh5~l=PJQ<#1>p3SLv=8y_0E
z8SO%hhz{{=cUYZUV3e_z!O32M)RnZNCpIEndn`ksGRWc>ZhWbDl6|t7*U?2IFThC^
zBc9=cZ^F`3Xs?j|l1kTf=SIFj*FGzch1HYGhBevDu*y!14K|H4#r-!AvYGl@;P*MD
zdt5yzA*TdF200;Q`nOJG3~@HN@VIgQPvptP9TM?)#@Ub3<fDXxQ7yg)D`nG>{{X7Y
zBci1we^ZuEPSS-%Lrbt6d@rMa2s&Dkutes^d<@&V`kxb&*7`hr&Yd6)3!!He!bh_2
zBeQa=`m>{IW2Y~4L^K8T&Y7cAvYDW<gB})puPJCD)1?w@18K=m<U<>aOb~>-J}=j_
z-$GKr%Q$vfdW}88Q*d&<bE?js?M81xH^}Sqa286lPc8-SZHZn4{D?u+S#=h>F;0ik
z<OK}%C4*~1x7DI#cNfZ|Ef01xbyzhuV-BTz-ykjrm3>O#w~orTmY9vC@~k2uh|hfq
z+0!x4;Y1)KH%3P!efUk9R$CTOx6oY`wG8Zpa{@MU(r<J1K+bJ(by%Y!2@Y%uYYuR^
z)^Soa2HPp<VZpZq{{Z$B5|1hFlGst+=O*avD2T^<lVux)j|j3c*$*JPWX2)mgM^{M
zJ7PlKEHaItHa)K#1v4|A$~c)|roEb#i*|Msw>HH?a!OPBR-+Q`9ujT=MqSt>E?R<#
zT<ea?HydaBCW38$D~3q$hzAFz$n$KQC+s#*N)AFRW<oi_{PL!!<XE7rZZ3<11beKR
z^cEV{5-tK`<G(5K$Ssnb=QT~eiEJIQd#qKR1Z}q*AtMbg7V@lVMTRVmome)>9T+*V
z1w`nFbVHtPabz>3f0dIxYH1Oci{L2E6pnL<`BAyA;FV5ZiMYv$yY^j!j?1>35}w8_
zrf=CH^zq%;3hPdcw%x9Qq82tFD~dZ@Dy5^Ab8VI}k7h}_r`DThm46In(ca3FUT)Tt
z;c`i<J8-ARW<qiA!X5q5H5cA(oT1)sEp+I45d8|0BBMOusUrF=i1c~cyC0h+0e58R
z#&C%N?FPwqliT)EM$BC<068~8%tAro6HD1b<Kat84Z<c`Cy~T7-3Sl7B4z{+gem<(
z>7s?352hdsSX#-oL~SC;X>!mmlBe|G;ZYI+zqq1fAhzBRXZ2e5$|4)wSgg!+tuA$k
z2;Clp$uJ~gK7x(XykMKHevPIGfN^M9BY#2q9V=ppZnp`#?2T+BUdh#!tfY@<ARh}e
zs%lP};^j_G*+i>mQ>nf0chzL&XS;>1);++UaI><<a#2QLOljR~E3GaUIm47CH8FFp
z0XJH0B96hNw+W0}X^|GND;>l)B}D@o&^sv{JQR#5X>li%=I%Kup{D9s#jI8hiqJe|
zKW~td_Px_?Ny1R}KWG=iOOQFT<^#pk!)|hZsf;${TOF4<#>zs`_DytR_`+K;5G3aL
zx_eq|Z*?qC-;k#e{gJSA2=GQYOmu;yWfLnvKSf<xGb0B!S%h@;VlZ;3^*vU=fb5}l
zO+#(Ka?Vv$K1Ul8PzgPKd!A3Ys`ok4I~Vy+YfHJxE}EX?dvLc#+ajf<CBoyCb45lj
zF4Cl;r6k(Q`%j`Kz%?UwG-5MPq8J-h{S^)XAdiJUpF_6B+4?K0T42yFGM4DFfF(U3
z0DEi^Er2&RMzw@?Nao=OBB}taW_uzd9uq@zi{rYME=ru4XvT?HI8MMGQUXHb@pU%K
z(Zu703*2mOo=M0FhmQy#HU&`fUyc(PK?-TwHy@P=ZhR+?Li-A*z#J(~eiTpxwMu)S
z!jO*eQ&0C!aZ$LCRt<}O_Dqm~&m^einXM$81zB6EF@S(>dnQq_B{Yyk(`~;BqPtL#
z5*WjOg$b*cd29i(@U671HS;~MdpTB$uFgD}Z=$l63d+s5h}ijBO(&)ci(M^;b#+Ba
z4LoA)1LaFKV<BytQE%vm*w$%KQ%7sGD%!`fjw0>*Cf8~YefGIjNh6;7xTIxc1`{N^
z+-wKzr-8Q!C`hovvZl7dg*h{>5zzL=25y`g=l4%(76C7uBy6IH#)})LTMM)GU3~nd
zvav@Hy2);kpD9ZuG>;ci$T8hYTsx@bxjYn6nN?a&;t-c37bvRIcQ_D(zHC)d2KF05
z;%#$lD@gd{{Hm%8lC0VKN>+*{JPfB`cpg$V_Ofuf2~5Rl7YX9Ytr+1*c;z`ZHva&!
zY4D%?x%(y(E||zekD_7QVsf5I0Yq<q@RVf5K5i_WB#zvR_fea;TK@oK!x%mm44#Ho
zO%Q3~%C*jE@KLpK-agk=+cw_$x@1m{1Kobe>P$v5f(<-(MpAL%5xOULJf@StDGADH
zC!4Hc+p?DU@S}0HjqXz)C}}z26bB%S;|Z>K0R=T%S}%27S*k|c`|;rw7RkJ+7ShZb
zI|W}=TG;P*1wmV_4g>!Hx}vPrUm+o+pQ56T9P{!%jU`^N)?5c=QdVm>2Jimrpth!^
z)(vt#gF&8W4a_G001BEp9!9|=t$gQe3YMQwo~6LK#>-Eo^uZ?1i2ln>r*z|EXuAme
zA!1u*J5TAyID@c~R<BCw=$O&IG5agnXkw>m1RvQ;B#eYzw+J?F!Q<25g}7sXZdX5K
zP4<QhafJl+ws99I3Fnqi<|FEsiboq{wRN(y4GbYyI<l@u`<gBAQ5#(DP5h;7J&r;j
zsxKT26iX|KC8zgGwaymL?u+!A(c9{i1F&0>MS&n@#caCeD`FP83UP$C7sgh$I*LSA
zx57(UWln5II4La4*n`SjD3J?CJf@Lm@svfI-sMK%JfN5yLFLPDa)UP#1Dm7d7&$>Y
z!PauBXFTIWi;g+Ed~bEfDl@j&DoC0MwbL?iq{E<*+iYEd**V1TB_s@Ot{gA*QW0ld
zE?FLqA-1vQb+VtE`AxOCQ?sVVn_k&V@Jj0oqypy%qYn<x&?f=~fKh-hoB%fNoJk?s
zJ<XF%>~dFR8xB_=*#;_9G0w32cu~7KxKcP<7Q$c`y_`@9%@^<4E<m-{1B{i|KV^y?
zn_~X}Mb62=OLM|$$n#~4HOCeuAa#my!590cy2m7d5kgp(1YXw#CC7B;i0$rw?6@*J
z*gOmOL>4#O*p!EFVxIP~qy5&C_e`^G`hZx%dsiEIvf|*^2HN&bFBjwcEDNDYOm(ly
z;^0rwAuaE8L1P?wQJ#O{NaAgN-b#$wQ4*OHg$E%QHz>(IFod4=DyZhjL4rm_kt|>>
zxCmzctQ#WQYykx_IWh>?h4@p&8+!nvV~Hq;Tt$y{m>^EZ4ZZnMN-Qich-q<dFrb*Y
zn<=xd1bAHIi>0x(k0}rKOGSk3Viyyf_`>VuA<4m5!hgzew}jiBz$F+=AmRo7tFVxN
zWWN@=!*+GE;Wo*}!^&^nEtw$=l5luRd-+M85kVY25@*NJB3^NTvo)Q?^M%$OlGyhl
zb%5>`U>NWI?39uP`zL>Lkc%P<7~_9&9g_(oI8GyxV3_ahnITxha7hWb$?~2<LSY#h
zM4jwTM?YoDwwn*HDQ)|#3$aHwx9*nMNI^aLN;7M6uuz8`%3gcjBez?~NN;iFC~V?M
zD~0j<{a1f7?lPDbb-);1$-%Nt-2GB{;|o!n9e=p;mv%E`%Uh2rcv^wTb}h}UlK%kx
z-6u9lX8f#>Ia&3s040Fn1z{230E422_8gUSM@rj*;=WT9K3P&YoM@7g7e2<y?uL*6
zE)!^DiGV9eOD$&EeOHI#M;vVBo3=hU+R?&SI1b5o1r&h0;deU}a4jWG8(VG^5VQl5
zie;>{LD(%@8dz|%dW#0~wH05a_gT$Mdx{|&rNqtS1C^$vjk`sH&1r_t3r|FSp+BR0
z2@$s3CD=SCt{k8+-%Y*~Oil2mU2Gv{BlMeY7YLi-NV#h;&q=GjCiqf?%UOuMCiqGs
z7vV}cOKTuujEs0s5vMnmD+0_FWFeMQMgU7?)+$nhW5v-ZZ~-z$izv<PqLXn`c!yaA
zOhbx^th#vxJ~5o5@X+5V*1%6>uBJBO7Z3_-4-0%KKQk!msf~^ndsd>{4Z_>X#-9qG
zQiY|ZN_Y}QVV$$gwGA=8p(I^L9V=sPthD-+Ef-Ysftv-&<61i*J2Kk!Ht3y>%f>p>
zPd}U_1ACS3`m;fe!?N=psDX~EAP)V~q|+&p+C0PZvj<=zDdC;AxFg|iD0F5{@IwK=
z!oG{80gOA-100pv7+O5}x_Ugxv&#s*h(}TC?r9c&R)?v2bVUQK+=1C(q@|iSo<)jQ
zm6>fDtvjfuWxeO@R<}dyveMBcg#Fiy!%-tU;3Mg^GSV*Mk;O67X!=`2>d0Q!g76l%
zPuC%tqR$_?`Cm@g<c7pa_PW&R9b+t321EO${g7=w&!wrV;*+>2=yo0#ifEm1#|H0|
zEzXbB@YFTCWe4t^W&1Y^=-rC|pqSxT(`syyqRvykp`>zym6|bVWV|41a?@m6o*bim
zCE;HSCzV;8tZp0?En70Rb+l&0+bV{>mE!hkT`osFV$&(yFr3K?a1zZMm@|AKUoma~
zMKRhz@zh%cs|ps0oI8b^j$6E3_gapgvxrGKP*SqupHB{D!vOmxRB1qE!DuL&Ju!sp
zn89k~$x>S?qGX=d(_yUs$Z0Fy4n?xBYiWTe3X-yu-F4)7o);+GLCcF6DxDzknIkSP
zN^~^jc2kH&uD*6y=Z);OsUo~IgMf$=`fbTmx|?_D7g0?@^3q5~EtBF<brz~)f!lM1
z;h%^)oRb+E=XqYw)ikBF@>@3x!n*36%zKVcmD}Nd*;Sdsm7aT0?b5jn^JG+wv)nE&
zgqMsJ^|<ti*$j>zEQXgn3n|FCIZShGRR#rq3Bk&R%{~#E1@C1Xpa4Kap;H5J0>mZ@
zmt9LIIZ>WaF}VCYX?<jEX|>$GsQf&qYiT2Mjm?+J--m_5wk@Dva9>k&2dHS+Tx={C
zndHi(F6`gA?POLS7JF2vvyN4)?+u5Z%QL9C&Uvsa%FRAbkliDhQcJ!O)b%?>)kI;|
z7*Y>Vn}3BQni9+SD@iuGy3^+-#Fdw!r;w0bY_F*cSOw1uryH)qrDl?zqyfq`l})xt
zS%X#w=_)ts4`z5>*!+s<qW;ZHuWW;|ft1a2?gF5u)SmZR<zMNOhuZ7X#gfsQUW?r_
zJ**1i90gfKeW4!5*e;~(jF3nxu7)#Py6;?hT7h9Cu0s0b%I3>;j7cfMS)QmL^so9Y
z8_n9Yy-)uD<c|ojMDQ-NAXUmcEJlp&y6bbxfm=?qKlQTxRu@inwbq{nN*~DR$@~wh
ze-52}Hb0hyyN~^_y!Y_Y;o59j{!qOF1N<Pbkmklb1gWn!3NKSCW42DAkf(<WCOX+g
z0fS6Mjn!2}Ls;T2tm?l(SxsJTk8lNYc~X>P`jmpOnwr)$Wx-X{*6!g5#z`~H+)A1B
z%xg2s`TqbXJh=YnL|4!aO-uZwh1<`$$+e8zn<|Q$=_594O8JbL_|3Pn$}G~hNF#1+
zO0Cs32DOe1X#JHlYvp^aN|dqFVaY$rl==-(lj=F=ndCRWg`9AF7jYKPb?8-e40bFQ
zdsU!_0#0q&PBL(IX*(#JtVt7guzuwqr|O0821negYT8l>*wiFZR5AVRt1ekq$>|=I
zL8!;+k9tbE8&Wn4xEw5P1kYu+tJ)n_7Fc0Hsln`Y(JS;=9iK!w$I2&9(u@)Zxtl=j
z5mef%9NRUmy6TG3T5`J<TaLwAdM)X-Cet(m`&;D~7PQ$7gO(C`rIGyDT^*)4w2PB<
z$lT=WFGoaYU7N~Dn<K$-T5U3DTG3&0u^KrqEy~wvt+NIfwfOHISf4u=B-GUx?VJ|j
zLnty1EEG|f0m5v?LfZpn?d9_tkL;|3aqmTTrvxoyi6E7mewQ4Qm$`u5XsTFCjnI#?
z4=d$7?9$6Esz-h((f}H4ZI5VZRC?Zl6!AN704-A<4+)dP*#(bv#g1w&(QoMReyr(e
z{ob5d9}5Rvr819kk)^F30{U-J(y89Z7lCEwook}P_Pvlq3HmQ<#`C2Xh-Ad2v&n|H
zK}-x$L3i=F#Y-IGy}sj*0ZmoW(wc(u%M18c`UZyDcK~B9E7I~j*iJfoIpK|`(VVT(
zL)&)5ZS+(%l&++H(FxCxy@sxoM-CVpj!0PPw1cT?KsVe0&&uY<=2vB9i$#A+Y453(
zo11+03)plGA{Z%J_lArhdRL^qCNcX+KSiyZPBB6O2EZ>nKb^_`s>g;iE7bL|K>=h|
zy_b@86y~O92V8~ey-!N#J;K%t6<4P>c_o71MbqJAN%CuC^ToADpwVNcWbO4{;bIMg
zSE}@fShGvm+Gu5v3|y}{Wi{s83}ld2n?rOojcJ-EIsO;fc)nG|TcgCwhNWk(Mfj0l
zEIVSR+HK2<%XKchsA}cHrenAIM+z+x8l6SJ2>mGhfs(X`r)lG-BtYpNd%1LFg2@}O
zMol_AlT>XyPj~R|^JSFQYD<{l#-EHYO6vV9&?K1o>=&Nul#@BmYhod*=5oP9EgctV
z^SxcONcVI0KtMe?Gy5%0tEav##lqR{vvm*_$#ILXPYlyULnEkbS>-ZGoa1)k1_)*e
z%AOKlMl2OSv3ezm(j0C-L_m$?aHpY#r?@EDn-pxfdnr#PFceiRa26`MVgVqPX<sRG
zj?k+lW%<f@J6j5L$nbbvUM!K~-IR85RznVV2E{hU=|JseAdO~WgxDzDNh)UySx2;8
z2Es9|H&S{>!j>>Bq`~-F%-I7Y?v#rH0+GN0l^dP=tYjsH_{wRu%HZr@%ICejA{rV<
z2O}$h@|(KlICw^Y&I2k~+6O8i;G|&|$wG`d&Hz}U<vWfP?*N-9_KcKMqfrxMx*{lr
zlSQv}J3D1(BMIq%EDef6($RvY1SD|olmlY@RtnaQ))(bfv<vX8sTv69m5z@c?3!0t
zA&ED_Dps^Jo1utrYp04ws+^h|e<=yN>ja^#CnYr|2PYIXoGBt{zZp`~#>3pBV}+nz
z%8`wn`7*jArvzk-s~Qt|04QMAx5_t91Jo8(lB9Ae@{yvXAHlaPJ=BKVye%XfTLy5m
z9Z2}VcH+GBu1Bcn#u_no5_`%W&Lr6rQusHU3uQ&R5%Ri{NacAZ$e0c6h+x8Ck|Dsd
zM@rtoHi=3uM7UB$MbLZ6&GMb<9>r@D<B?z<JgD6B-3laeBH1a<bL@?SizNo-S<pt;
zbI)Z+9P8m+>25X%SkcDNbkH<Mdk-q6W{*)^PF?Aq{{Tf%D7(q-o;{Mtf+@~9vPz?N
zn=Yq5+$5-Xw+g<906b?X%{idB4p70npJ98ey&{Z~(t`=0>H2tui-r~LT~t)?9D!h~
zX@ek#o;<Ao08(n3THx1P9#rK&MI#gouj<>TEe<!j3JFY&+)B?G-%(d`<6>5ePlSlU
zw`8_v!1YXw{_3VUw?5WanuIPOTZFo1pSi)r1jrqc>690-Ey~bSKp4@BDXHmO8wN6_
zE&Y;m9Yl;Y{^`Iw!j+A<vHt+@Cjc$w8x2_z0OrX_u&}~=tWzuzMmP)o*I}ar>XZ+#
zT;O;dB5sZb#=&tewo_Wta;0Dww`3bPV;Ot?tf^vQE&%sa#Ty(lz>R_i+T>g8mcods
zqc#{sNWjLDQ{L#}ZSWOdrK!fok#Te^%!^Z~WNkTE{bx~N+}4tvu4?x#4ImP-m6a}<
zLT-w7ZjP*}bKlC2CYO|u#OIu=8cJM@BF)&ebm7N^b3;NMY$em^%ZSG-N2h7$1cZ#D
zi(s^LHnu+M{{T&=4Y9IVsY3{`M^i={frJ`VRxzOJNQTgCj$=UVp{4*ZSPLR<ETbp0
zrZ5l-rbrExw;bIvLw2A&Q3b3MqaNgmW9Njj8YHBYm&YkcNo0jiO%}iYQjkU04(X7L
zh3y2Ka-%E&+rO1FhJF-oX(sovOoVKEK-vH)N$!%?7r3&9qIN_HBxL}pXp!%*&5#v!
ztc*C4fYfzHw+$+#znZR=%_M@U7+D;dlzIrQ)L#3wmns@PGOn?~);Y@1Xq`E5*UkOb
zo}QYTjxYs<l~p5(c^tbl+D?LDZRKT%R>91rZH1HTE7~sBkX2OEI#(N_XvMIp>s<TT
zp&sYF<ec`pR!4D_Ga}k}Q<RcAVTpSMk}q!;J<xAui6L6OwqZThY@^;()V|8N4378z
z0EKBu`bTwJ5WBLiX&YvRq%=vIF_4~|1^Xtx!;+-RCO3}BH+Nj;0(nT%5B^r7iHo~D
zeb)ng17*Yu{3Nz<lqj+hHP!=^{CMFp<cr*_EQ*@!y8i$uI}lHTQI%%SC{jlyRS}R@
zo-^=OtY*V1uTQnYvtT3xZc;Jh(I9hebi2nrlNtai#>Y1LAQ~LkUxbAANq|SnQ}ns=
znJ_dcIOTIdzsf)lWTWGR;&ds%Od#{!IG>_Rfq;}Lk)LllOmXC?LA~%UlJ~v9!YLWB
zI;UB`L<Ej-;?_S3#;mk5__D2;);COR5Iw-|AR?e~EyzHZw>NT<I)=5stAxo4<d<Qk
z)(88jWSy-XkKI>RYEiIqs5KpC-=)LhGJzTANYYeSHGrFiQCqCFm$9<SRqB&UNDt4|
z3fOBZP4^I;Mvi&sZ=&kATzj2iby+Q4O+ogx#3HD48kq>cf0chh)9-6RK6|FpIo#Va
z&`{J&>&Okh0=J^k7(gzK&hl)wbXq(yfL(9dS;0+B7z1uRSu2tjjMkZ@Qntjf-{`OD
zX{e(EYY~opC}|r9?4W$m@YaF$vJOKiSab%OHsRJOB&%Q+WS0A?i3oQe*)wa8ixrzi
zVS-FPT8ZC*F}Gwi(oFGTF)B7O!xvJufF2a3k*<!selqq&vCsWMNd!#ZcMK;H@)K|p
zb8PBZqKV5P95i7eWLChs8N{CUP26p8Q3F&>J0tYY(Uc{!q})z!O5tKGN7Xt++9S4j
zN(F(!b}?YM3*j&*KnIK@AYX*w-zV(2wB0QXhFi~X38l9f?4&L7n&99qWvC1qQG;+$
zPG#SfVJ-F?lnd<HGH|OB6IMLJ%iSv=2G)1kM(2VDxjnC7Kd2)oq7hpTrhr(6yRugj
z*W2MXnnshz0^hoGh~7=|xukkH2Lj}WamrD9;dS$mx}9w4vA^EQP6AsKoD_z`f>yI5
zn__Yltr)$&$}yEBP8?k@l0tyq<B*VmE|+sj$rnlpJ@S~D6qW~!C=LGr{0e!jpgt_H
z(L3rFV+QMqz#Q3e2gVYF>zj8-O^?UIS6<@WCY&DV(83&(Yos|mE++o~WYTeb{Sl#T
z;8Nz?CcC$kx9o@ovG_<w`Af*M>*nhWke0>#CXw-E^Lr+ogeVM*_w2ai3C^;Qx@05K
z#@nr%CO+2TBZ<E$rP)r2wl%{DNyULhIo*)e09%zrLVE@cJAnfTpxh{#V&P%WIYjMm
z10DHJj!cMbVcq#t!Z^1+6Bskfnig@AgESF1-T}S7Q1dz0?1(Kq6T%it?nrb&99(VL
zaW)(z?7O(R!b{nG2y@{#kNl~?hTp6AO><)4JvfYu<#su;lhcfgi2`?|&+7{?Sr-X!
zYgu%SYY5ulev5_&`B{vP88|87hRLGWu}=-TxFusYGig1(=?gojmYedL*1G=ysD+gR
z#4J0lY@~BYKMDT-0F=k>7X;yBF)TS;2mb&G2LsCNa0QkNIoLQU2*wIW8+Wp4Cif_c
z*tzbQ;dRb;f}6Vp_wtz%l!lw!++OJj{{Z22@=8O<`AtNewsW}TuDym*94^5)Ia#Av
ztv)Q3uDK`SN8K-c8=%n2M1<erA>)u!3GbAG{{TR>0>^>mgr88F4c8YCiLH+W2Hd1S
zW!E<!93=N-twwC)er%K+-w6-S7h=~Zm4Mj3eivWlB<*CDD`?hzaZ4<&wVP#YN$V4k
zNclriF`>X4E1GE-01aiz`9BgcPW_znZIVLyTgWJ=s-E8IvBM;mCj-Ki(gu!7_amPw
zS|PzQR@WAeZlaS?cXEWDD;okzh*Q1Ci!OYgepJR-kz*Zw$R*0co~$?pOC2l0;FUaK
z@r<sY7t76&)R42pk#97>vz14vxLm0ws|;>c4yCC#c?8%mYBE)_RLfm8-tm>G)6Li}
zu=*`iWN<ehWwO(y1*0mSg?eS9dnF%58y*PdNDb1lhkT?;KT1b`WDIr+a%lKmi!k6*
zlLAx>DCIdK<%~JJsaeTTw+dF28Hoo0Dr<k4Ibe+-Sv0fZKe9uWj7H`r?XsH7h*%8}
z?=4H~5S-?OJmA|430pd%s4=%B1w*LnOeC~C5}m8ISAqdH_$xg6c{k$xsZI@-$2g*D
zgX)4%Zl}HM6`eICjspc59-eKGr~W(kbT1)#FxtH%?CSz>yx*y)W&FnNuKkz2)oG1z
zHw!(f^xSja?Ec7n6g0E8sUA_F#^$}Cw-@lYH0%$j7XyS_I$5zu2yKyX)13@9vBGqy
zjkaUDhLSf#><&AxKC9AWdySecmFV41c%yJwc2u;;LF6QLWg^VgW`uKQTjI)=vr3jC
zNCkQ@bZ_NFJrpwofR~TaN3+Zv+2K4C_SeYHZ-u$4(4&)v+v3WWx2GLqSj%`y{{XRQ
ztfJN@jo5pD_$zVJy-fJaL*_PErs%UZ_Obny&Yz{p69KWul#)?pBAM-4A6LX9Xmjs{
zqNVDXC9o0<{I8$qo@!PS*En0jLs9i5RB{i0_fz8EMLDI}^(LLF!!3w-KXrLcQxm|k
z3+9~@ttE}abcB7@`$6ki-T-`-`>IA#k7VSdBiCNWNIalwXd3WvsdTQQf>w{>58YkE
zsKX#0;rpt`A|~NQ7Ne!!_G-;n>C!Nrtt-%`d~$dwNhq5xKp9tz$;t<vGLlxv30i)h
zX>Ea4vS{r&*e~=`P|z6OEG=Xv?9jB!x*zt!o>A@LGL}880ZS(fnnjZ<Dw;d0%7}qH
zD{7YHm03{W)j3H~Jctd^fRU|lB;9n6B;hk9cphXNo`DHaTxGVv31w(=N`f*Q$z3f|
zSlp1fIPvVVWd~5e(-VMg*M@!}(7nb-I^bu8?pob!WsU=t<h^ecwVt4BEERl7Rz%UH
z)gBqBv_~s|8SblO&Nx~Qq@;B;&ID%afHapC_1I;}SrLt4x?{!92%VNu$lKg@R1^^4
z6$FOm5iq;3hIr)mOcW0&wbXYvunJiLvAT!7(wUo&!`BwpL_zKs)LjJs0Qx2eJF@vV
zqbi*ZQ!Utq^lv~{%{@F|U=SCN=Ed?AHD{_#EMgKbbx$pv<Ai+`JEV*kUxZ_6VrEFW
zUTcj#j`z_(VUgT33VLW<*IvrnR<_(*!WhWLpJ=+*5jfE#P1-NrJh|lJ=y5T25wx)v
zXN0az^d2OTLiZwFO50ueL_pBi*b9_Y5c-cB_+6efZH&+z7M|%|Ha5X&G|e^f*pQ9V
zY2jl9fL76l_6z8-D8@91w8813b3&c_fWn=CTZGvHsuh5|N=^zw$$zO6-6hkAK^$^l
zE-0v(Yh0#+6WH#{4od7bXL_Lj0Mftcv@YRi`j}pk_wbSQ6nyj6&jPwp@>U9tOKU77
z_gk*JX&Q{*Rp&Kj?5zcWmtM*+dpe~Q;C)B<Ra(c;L;>u*I+{;tUI_r-Kp?;PH9cFQ
zjfOMXd#0YpmICf<x@WzdQPz-Dt|TC&khRF^S?xf}5p$F$b)lDJu}g5IFT!Ln8z;Uy
z1QL>48$gwk0MfGhgj?h!twix$6-!$IFCxpEG^CL6NUDW_xCzd)zDgm~<P70QvdhBq
zJXJewmyD<eqL|5iVN=%7H#o}CO#Q7@(tzh(#|!8DoN$GtSvJZDXhUCc+o_~$+lGrP
z8j6})cKe(zsVen&3y1_SEu|M$SJBdkTP0Og(wSYw(T%G0-DZ_%K}G6-Pai9z6cm{@
zW!<DT+_aR_p@I#g{>yS{=^<~phaZFuU0g7*mat=m-wEQy*smLA4^q;kf;Tvgw&7!{
zDoiy+yUl^h*!5<v=>wP@Veq`;QLBnM4(9^mcv<9*SNfr42NPqXYBvF+bC1baf0}N~
z$lw+WL7DSd-)KG-st8zE3!ieiGb(f#hJJ20I?S<0P&~Qgu)3;fjxtD6#aUBu+IW8H
zu<&2VYiFVK^pxx^GC6GMY9n(;rqget^S+U#sg>=LVB$|=y)R6oaEN<szKg@blQeER
zMstjNB@!PA9!rNSs*50P+*NthqbF-@x0Q}K6-|u?%cMH0;a5s7a*C2~QuZiUGVjS>
zJDo+lJ0j>nc8moSvb`G=1dG`=dRv9c@i(#5(kZIs+$>6~lTT$si7dVRtGbF~a%`fB
zp^mePXh}ywcFH-rb}3u_*ea&KL}eRGn;5wGUWV7k*!WbM#BQhr0m{;oy)ei7Ja1by
zbIxJ_wYRnwlc2hFhil(rNxHJsG(T}X6?xM1#+ZP6DzDj9i$2X(m!rnmTV{ce3$;Bh
zjfk5CV?$Hy4Qe6riACR)--i}CDoBHqPiK>L9){@)oB<zYgw^!dL`!y@_5pnZsOhbl
zqy`HrS9HBQ<lQ4$KA~PQQI!G8(c+q3h~sUrIFsJXXP|U|n6=YF8<pua9XUn_436jM
zw0eGt96%j`d%h+dv#03b%Hp(VG#;FW2$~rfXdep7zJ`_xa$kGffV85Nv6gFWtMwWe
zJ~t9BY`w;sjU$mIXOH!TEHdtP#<7FS^G#L=BYU=nuS5J!inz*Sgl%Bv!FkN|(>0{O
zcgZW{yxbXnS0-KMf>exGQAF1hW~^4D7-NnXqiXO6ZdlD)mhL2le;RtGb3L;sC_9Kx
zfv+a_Ar~z$-fk_PQnEI*Tw!`jMqzZ%Y;CzWNl{b08zAI(Xt6g6CrsPfs%|#LLcEu7
z6cRM~L@~`dzbVdZPYIKtmG5sUn+?WMQpS4(&8GQPPR1D4TactJwXUAaT;G(AdE0Q*
zz`G)IMUE71Xtq*KA-TEzlqOG<C}d0xvvlUWI8d>`+UjPUU?WCnIN?CzZ)+7Zn{c6%
z>W>-<BQC;;@3$u@WIU)Hlgea(O4)l3Q}>cCp%xvJm`OGqEYXQBNWfCX$JsTFxW@~P
z!WLpyxg&@I>JZ|TI>l-+D{sxz%pXMy9?@juBS(CtW~vEeM=ASoP_fEyi>Wuf_9=LQ
zqCf*pj|$F<X=tztm~P$f3f6`8V6a+_j~&wsoC{<GA+R`8O8gWtaXC*Iv)7JQLc1N5
zWd7@kH%Lh%gy~R|nqd^~7YfP?mIYf%4>ndYn>RRDi#T$-M@a19SZMY#<yRkb>=lNb
z*9iesmq#o=k*Hu{gOIYFNf0}%wDhcTXM0&tbsR)6uQj@n>|<90&+4NA=E@Myx;mw!
z)i>hkcZ@EDAt)TQ+aWZc-AexeuL>tx$;rvl!PhxYVICAV?w-S&T^5CJL9y)u_Dz}g
z7)^-dl*vzwp;Rn;Ij=jiuC%g99fHrX-r?rz_eyxiRvq+PN<W8XOHkq@<y=hb#;RwI
z?=A`B*~yU)r*YfQDP}is9Hoh)ZIKZ`WFu%Qn;_C7(`k&7<SlNQP9lsFEo2^*L9_=E
z!ZT2*Z9D{A0)(V8h$gkDwiwGn3jwTGzM@lNY>U_R11yefUH#QWFuq4zsX7aK3(?~S
zP)NGi(y_jqMg|sJPKnHWeyd%jN4x>TjqF6N*vHa(uD;Z59VlSPR#Cvf(Zc5dI85j0
zvOv!S1qnI2mP2xEf4Yxt&lvin0FPy@o2d>HTVM_@K}mDRDu%P3FpvScE03PaH#l>A
zB?BHny}OT;(a-7$o34D7!|D4bF)Kz-7E-afP>;A$#Qy-GL75`PjiT4Go=JpkCjkQ4
z+SdM{Fsn6PN;WW$RB)6dHJwnf5FKE#nx?BG$pPgiwW*07?XD$f<&?;BNlg`C>5raQ
z%1I=pri8rS$<)x7+XY<E(puisZnR{qijtR%6?Lc3xx{->T74G>YSHPGV#4eRS!l!`
zOw+J2Z?e9orLeGSo{|QD2mu=t03DQ^j+nxcUifyKTlP<dmLlkh+niZO1(tHO7{g(7
z?XyNy*74agoxa=w!js9mi#ifI#?}e1%TttcJKJT9(H9BPTsbuGGM^C25(-4!l3NRi
zK2nd|B(jMJM_?06N|PtLW1I(c$PE#=a-fyLqUFj-CJnw-Mxjvm5*RM26PqNsl2+;s
zglz;8s4KM@rgp{)-@-5bKB}qLEpoWiv?ee$^0z-K$|&ZZR{AJ3-70#whfBfowi;HQ
zPe{OA8@tMJ{Ix801Ox>|dv9ht3tj0F;@NdQY*3A@AX~z!tF3&b*~cgsNMD~R%p6@Z
zNp=+x%>~Bpxl_j*v2n&yF^8Vt3U*v&PEtBy0nBQ3`;_0hcfy33(-bmMW*cQz)PAC@
zq`uS5h81MD+;CQjrO=UBJC$oqeS?Kn7_+=9dO_?7nIsT0nIkX9bs)95O>wt$3P6X_
zu}%@~IN?7fb@7y}v_=t}q&$rN$>ffFrW<%bsuBMHDmUe){HZPbrjc+~7EGwFY20j3
zV11Q^YcA{jp*D-&;CWPu7uh`vZJx@_r`v~iK+rPg*8y0ypW!TqjD=;#B{%|@;Oksv
zBOky$l8lK+BaEgJ;CRAwTn=x_;z1Wofb=wze+fw`2_u3(bkb}&O+=d>ZEXG1Ngh*7
zg7_gd(ss5H4T@c7TacRfasL3_)NYd3B>u>GDq7p3qGu$B)jSs3z$%)lTHKz>N~+lV
zk$<YJlCiD@xGIVyWtAXW?MyQEJSuvPY1XhR)>g+c{{UnY@SO&e6x`Ei&6BU}<(^A2
z(^b_}8#FklQ|XnGkm(xbv7_nhNx7{6Ul&&p>81vc(h4_AL|wBRN1=ma=#BfW9+{&+
zEL|G0V0&L@2A2I1BCZ(udq>-qt+P<-Y6x1;*02O)D1$}z+rknpQlA!hx6yRE%nh&y
zf51xM6oMv+;8<LJkdKAH+_^FOiI)IaAC%bS-hIUW=^l=VV^6cB4<Dox_e>0N{$ehQ
z+BOuzE!ihCwir<pSU^&=XTn6F{3UI&$|(*Rz#}Qv`du}y&J&w}a+Gu>j#FGOg!7P_
zV{}Z&+|z3m%Metyx^r7|;>nRFLe?DiP7#}Ng*a|IB@M7uBkY7mFT!w$cvA+hw;Z6x
zL_UxMgzrn?Nn*PwSZIf3judWSzhprQIX|*C8lXAYI8~ChzNL;lt66~Ba;qi;$;xPv
z$<U@Yd|7j1jPe4B%#e@wFrO1-zacYPIpMZgQ^OG%Xf{glH{bvhX`3h)#}`gHc)48i
zJq$++d0a)iuEn@qNVxib=?;UNYhft&cCu(Bj|p4P`B=zXSYTx<K^U?5OOScGX(!GR
zK#+#_y^`F4#fNp?;06k7i6o2gn1d19iQ>tk;N)}NbFcE0T#Mf;42~A>$CbyN93(yu
zWRAy_rBJT7gvTCmxRNrM;&`%TD-h?xKzRQEDI9)&siya})6pi!;_HCTf@4m8LU{P)
z3JPPae`JE)`CQxceE3RGqKH9(!siyA0$#_9q&6HZ21fS)I8m3hi`<0y1;T{10CV<C
ziAjq0HstqAac^|jH0R+)=9^@vNR*^G_9qBw>@Q_CtS{LQQ101ONQ9(D#~tH<rzN(?
z{fZtjxxo@4F7llm(|Zww6W=JP4*(SdY2ADi^h8Ai{N*f|ag&eGa!~I+?#P1^{HPql
z9pz24st7@AUdxC!N(M+bNI|+3RiQJKhm5CK@|(1SlClM8Z_uT&`z|2%7fEBvVQC6%
zN>Og<EuK<x2792wKEU`$``ZS~lY1<Yn-?RwvP-yk{gQ65;Uk@lCZc?W-s^H#7w#6y
zXm{N$(V=;q51v;OWAKx3NxJ1~4?P@CQ(ka86sHNUI5)C13$!r0=iQXU@NQF`U_eZ^
zacd@`O^954UdxHbEV|gR@|s2wLN+b`0A!;lA7tDG!2OY+4j-#>Oy0m+%eMe-xRIRy
z0ClL`s8<7EE|WZAChQBQ7XjausN9LMesg8mwXc*pc?k@k-{lH7BoJ_NZWC|gl>wAn
zH@a`A4}L;4ZbaqQNcY%eq0F{7x?|-77r)&QatQT_;WO4APws|%zz+&N&Hl0btYsta
ziYi^!u)?~drD(Oq(9}+Z0e1jABjc)wVZ8ZX2aDrEJ2_=08x&!qI7;ZZk7!XxGaZ)^
z_fs;Vrwlh<lHh=?kqRJB2)b=Gq=G^slx`rEXHM3D6=8}J-5IuknWr+}q<+dN^v1Yg
zE1_VQXg!xo#}&{Uvmslfmo)7QFRJJ+xg;-Bk|vSBRJy$=a}9z#OnI#{KO-fJtOC;M
znwv`noU1iWInqvT-5I3mC9NIPMr{G4XesN#0_7PMTTU*jPM;%20a2LdjPO(Zf^lYz
zlL9$X2ZP;a<EoXGz0px>BK9eilQTu*E#)Z6u7b6XwTd<=LzXcp3#^nl5SHL9VJw#5
zVKL7ELiyScD;Ovcq+$v=+D|t{MDS2%Xd#P;NYX5p_X`A07Xx6I1SIUSg#{(<xpKy_
z9HWu994QG%Mb-l==cW(Elr7Vv2IZkz5R%B)oIu-5#)}57bavn(?S9L){4HSsFoINW
zr)mCBtV<INX<8XbsFIDBy_I&MOu-ozT1g_u3a?R%+Eiy}OdXzA)-*;&xG*m{pGcXq
z7l7_^y}wkVYxiBCtmST<9&FbB%9!z{wofdn=<=CkmJUHu(o9L(R>M@%SZ`+8R!5~Z
zt_N+br;`<QJ{j^7jv*))2&r_|J~MW!3JNW)9@I?j3~iSr=F#5_X_<HF4KMb9i)M@r
zSZc9^ZkF47tqmP8G~c8nAKS5JxSnCJ=_Qo!yKKD5v($>E;NHQ@=nkZ#X@$bwmyhdu
zbALB4x4O;Lg-Xg8D%{HgaIL5{iDM&U$os0giUQk^hIDU@!r<XOi^7jY(fYP{NW6#l
zTP-84-+<@e?z}OT4`In8DB5jB@!Q^S@Rh|dT#@v)i`7l3Ed{_|xhrF)>QKF)`hc&M
z^uD2<5-lOe%Gl_AZ6ss|N&V2b9)g;eXVH;Q6o6QSR83(xUPYpHv~mWAybrqA>0L_%
zz*<0l==`<WxL-!zAOloWI9m#`n^R=17IK;Mf;n87a=%7Vp_K;rRh3OSM#(50&{I4f
zaJ>A!RJuaRSzi1cl@sL+;1v3aV`<4i%{c9a$1LyJIvr6|;NEPis;eI2Kyq5i2?bP0
z_Xn;Vv#^J@0WiCb)fZG#K@~f&FKl64)6{^`cLkg3%C`DXyMPO)$J0POFR#D+u(WY=
zb&|HzfVEw0_Q_b{(|q!?FX#Rj)%ePwjQbeo++?VqVUnehz%&3e<p(3p?5<&x3uOxM
z39_0^$C9CN7qylYhEJ-2OEbF*sJpCU@1|VQRKa^Mq<;(F7=km70{NFgzvh?+mGp1n
zOCDj1cPq;CtP8W-wDKJg1HvWD2ewd}X=7pr{gE!6w_Z!9*+Lm%xVgF#ST1pdd#7c&
zx*WJTq-}aNSjuW)dy#c(O%1T1rD(b>()wcobU`GofF+TJj=@h%-*{Cbsm^zVWjw@@
zmDPq;^am<5)Di#yy0?Vh%QL6W1+G=?EkJM?UgikYNjX_$&JsPOro{1OCBX}zRt)B!
z3O%Oirxg*(0Z526-AfQFfKtc7SsA1$7*t(J{{ZBV`YY#fRUc6g`d9r5%*grMuiI@(
zMdz(({{T~9AXvCBM*Kl<{{W00SDiZ=i$D68JUcsI@IH|IAche`5o;O^xn8wM2dBdF
zAHn$nqljO%m#)#DV(Z9x@FpVRLSxFEcV#Om)s1MdOmPWbO_Vnztza27tg5Q8<6x~N
z7a3LcHU)6`iMW)3RX*ZS(%GW!DC&dRp;uHw=Yqap%F8&aiPae2Wo>m>Xdo(D+PO<e
zVY0NXrZ+0ON^WkvH*$ZuU-V|R7Su}Px$gbYF;PvshaaliQ|Y2-ewAhZjT~`YfERy{
z_;s0c^dz!1qZ3Nk(~)tXm2CxM_IsaU@r2EGHb895s)sUpM$kwf3xmnTym|0jDGipD
zT9X^?5&~5&r&lD5A*7r5L`6c@W=x-y+NMSrLv4E~CfQ}9&U%^i+4dwaJg)r1>aIxw
z>(%;_m9}$<x5D#HZS01p+sG@`@Yareva;`|i{p)^`R+>8(^QbrcXn7UGf}V&9Q{?z
zCZN|4-S<8&r{rRHY?5Z{Pqfc#MsBw~JE68f*OmeGUTxFWtcFIp>(O+6qlvMBxQs4U
zk{JI0k=Kq5qj#m#MMwYvw^ru8vB#GH0`sb#sAC)aA-UFBy<@5MS?<=zV`1#kmFalD
zpIDa_8#Me&*}CeUpko@~$p!waFGsFze&@N)B&^I5Pdm3ebKH3(t15jySuAs6xIDi;
zepLBA504Up(X-RFM^sn~0Iz7v2)Q7Yl+ozSKwOojrrHN83Eu2_EgJTL%4CuQz(PJy
z1_~N#mk#N2XGu_F3ni>^I0P#8#zXIQ&Yi@k#PNH%MiNqXQku~-BQC*7Bp1L>Y@*mx
z)5q#}R@2fJ>$0`_dme5@(NsEX1A(%&j*XyPqG64ZkztkB<KW)O&n1kdrE3~6iP`{9
zXmf@zpXlQ&-ob@MX&kbj*d)XOfDjU9OA@SWEXEsQRm56m_va~YA1YE~E8}L5NP)hX
zb(Q2Xv8})glTDes0B9o0)+w3>O8U$$JQW^fuJ#aE(l|iYv=$M<E7p$La0q!{8@S4&
zdKAF*K8(tc<LTc0?7Y9J`hG@&*rQ(iSrCvM1(Vk3VLOQe>&f#RQg%AW$)7Xpx=lo6
zf-P@_=i1zFjz<Rr%KAg9w5SUnMTzhN@s6$0-|IYv<HGRco-v(R(!|!!H<6^0p_R68
zD(1F=Sb@7v6-7jD`>$ITNVTF)C3Q==0HH4H_f}?(N9So#$weba3cRCWAg3-CJ&~*}
zwT~z#FtDdJ=KyErXRtr$Dn~SnVL(B3tSq<!U2;v5mw*#TK-htX$~gheliemSbra+y
zTFLCl9!3(P^qhPm!3UcpBrRnYfwq?YQ=28ZDe@3hFK=|o*_kkvzp`WQ^$=+ovU_(6
z-zc;Ju8Z!Xd_ZKW%dyIh`MLo>&o(wHHp!fQ)Uq_3l@`k!sx5>nDK0+BTY@r$jn*8g
z+UtxYYhsVEx0MMNIPRr9a+`zM6ci+2-zb0p7qVj;aeF0m4Y?>b0!F={_ER=d*#;Tq
zOw3^hs4ZDAH*!9d;}}(}1h^|oHVwW|vbcK^puBg&968tJ8$5p8VFp{3Nc4J<suW+I
zQnvR^2G_Ff*;%F)D23Bp8{H8r$N>pXP7y9`$8|^}lQKi;TwMEntNk+99u*ZdU=T(;
zE3H2c2av5dQ8{40V^v9SM;2M`rvuU__E+?O?1Benp6ZMGWLvfum;V5B*^MX|3hR2L
z-3;PBRMo-Wslphs_g%4$j#*?@HSV~=g~$6TjBd9HrWX`Rxh6tN=9{TK2PI@Dc2f(;
znlIDzO`8Jhc%#S4NueYq6+M81?pGRXtZ(wGTLXiEu~rmJb8UpfS!XPyM{pHP^N{nD
zZ10oPI8^er&XU)%G3<=?T2MH>;9l!jqtb_ME*M$85|onCJ1vzM5JCy;6&oW#6)t5g
z7X)#Yhw4pGlI901PNUU!M&^V4))KCFR7-MusWGmQ_?l*t=gPLFik+?ZkSwWNA!Bip
zilS`Q5`YP^l$4}Rt2A_Nr*o{!AD~)IG6sf&Z|tiy4Kr&)oZqU^#>T|Z1(HgmqLG3)
z+zVYpDLGO;=PD<CKBytcUd-V#*6)=02)`;Pa;qBv{%>wmNH*>+mAJ@Ddu3G^Yp{H%
zoYG0Lz*7_9Fq3~DC>TaG+Ues57)`hx(w8>bD;uP7epEBg7&%O;ovdlOS?yC(0^k&&
zPQvvqP_P?2`>e*Js7&`8y5SF3TKODuhiEbthV(@%oabEJscGOZaKb8{kh<9AT<N-N
zoZ)uiGhj-{w8|3mU<g`D9XRa+YBx#J$PM=4U$&4kJOqwKqXM>uh&I<Bb#<q~!iqTU
zz*ZD3KXo}s>VyJW9xd5Q8ayRvz)m3BB}uz1kR?k%a)&*UGg!NWg%dzL-5UjLBAgwZ
zsV(!AkPmIs$QM(+l}kfN941M9wzaUNIqssB8vzr4`?{JosJ9O)Xj}=mbR=ZSErq~f
z_Dzyjv>TqvwzpAiVA;tMZ=#M#2TdzjJ<6`TQVcjKCsou{Noc_!{3}f}LVVypUj9|%
zkL={j<Rzq3#Zgf-p4K>mafNxOY3`5*NZj|jyQk8rX`>h0bsbdk#fFjgRjN50r6wSb
z7+Ju=2DYp;5ZhzHL(e>qehEWJ$6q-sU3M7bU{%t(R~(V|LI#gHQ`8S}1wo7DI%7D8
zQ?yuIT@=>fVGT?@p%%;Vl1-I_N4Dc5gz#PPk&Qk$PYlj^Qf#s~AEH~E@Vj9JI@rpb
zhl(S7fHNZfm3+?t@T?_h+Hk97Z@W2KA(GJMI5><eN>9=)-Bm(3uvTyrviadLItsU9
z5^V>b$u3u47eS7wQ)Y}0s_b$S0d>UNC^FGQUB#0QcusM3`BB~cV?PKX&L=4zd0cUf
zCb-;K@|0EsR5OGdn`L8D4tcfEf(x7OR*ytv_DMttAf8o=39!FBs`x;R+V@3=V0J=V
z9w?FJ!=5~*w43pC!t0#yy8i$vXl{vt0lkw=yA>HC=ISR%25u9iD`c)c?wI%3Tog2w
z4Hvn$-3L>tLm2&F{S&B>l#qOr26jQzS2edK)>O5+yIpYCD(N3BNwZ6h)gv1@=a!4A
zomH*9oGz=U)h3er2|q;rJEv-@h%UGvD^;X)tZ{%Jljh0jgUZ>Df}Xyy;>|xLXf)oM
zmPX!SwzPUZGz}YA+<YRP8)Fs(1TKlUW_FLKDd88|&`}a;@kTwNmqpb~_5-!T>YlE)
zOZ%QV;c9Hj3Su$1l3VssOhyZaJlzQ;TaE^PR1bX52I#1yGEIcbB_JN{*S81?p#$*1
z{{XssVZLl`o+BLC-D^m+aIg^oXf{!nS=`}RIyT#c48z=PijdzDM2rI&AG$II*#59p
zV7cs3blZc53YJ3HqFNE{7C+rG_R8j5j~`T|1p~G{4cvGOw_eG6mCOqSdv9xm@!>EF
z50w0@GD4sJ!c5;7J<?yk5;&4D5JHZ&Q-e+Lp$>P1_7mYc5<vmB7yjwtx8sErZZ{ah
zC`$(fBXmuoI}R+60dJz1z6;^P>7~&d`<84J$d5k-aRV4jcHEmJxGM}H10Y#JC59}g
z&-EyzIV%_jql1N9NHXLVX;LoUY!zgnZZ-s-RbobJ(ItVl0()4@SRqabv2y5(uWP!=
zrF23HnQc$EW&(-l+(!yJXS;yoZ=#TsyyO+k&iq4eM|6eR<0;?$*)rB9*1A&6R-1(D
zk19Xr!gBy8AlVu<(DvAyT|5pFwW7eDLRPh-x+xQsh=}A_A-J{deu_fTeh1Y>CJD|{
z2%f}s?|c0d3$gzI3!X)}u}m5N0O0}ACGo=NNbRD)52#ES85j6U?2O?GDQ9mc_iKKk
zGWHo|)B9L`%4R|$F^(XE?aFU#Sv}W0i>A1q`A&(kq$ROkVolcz-#JXsEO0owQcnp7
z(RJ^OC1_<KbBl7gwZvStCwtj(F58C@_ewKh^0~nGQSNcI!OD^Q?s8KJdZ8Iu*Erm$
z+~bg(^70M>gtXt3(d?TY^THBxOOb~G2{HF@oe`Q62K%s4TMe-x7wvRB4h?W|;Ss%`
zx@$S5*yb`&aPo_VlMWtGtaEXa5pcX%WTcZR2$HzW7(unHg>iYfD3{1K*cTz3Zl~GV
z6mYeIL*FZgFLl?s@UZQTJbWZ^HeGzKJR&0!=G>$g9}B<x;df+E4kVS|Blbz3E3bo;
zOmV<Xb~q`<{8=^ML{O3&yUEH-_FQZY(m0!A3DP4e9O2nHpbL)anXn|T+(Gb-31p46
zv2=$Wf@pWb;^W;43X#NE@|gUKoFyb&-wA}^lfo$(%xTFvCkc+du$*281x8%oDX2#w
zP6w37JK-UC<CPz(ER6`{OS`y8TrQw=fOE=go(FVjUPR^A?vvCP^K>(%9&VfJk3U6$
zVFpi}rkOF$R1I)(AdDv#7ZO&qZio7}7TuJ`P2D$byC%7*TSiDnPi_y@M(U6M019x6
zHz20EoxIqEtpeD`R0~+Bol*^kQobScpM}B(U!VREvsoXg4enQaf2gPW0_Mdppga|=
zhR?L%)QEMO{CCQ<rPN+Xu?x*1)E-TNKf1os>R#sn_uuNiE*?apv?`6W&?%~2As2oA
z70nSg9hO^2o-o#n+^q#PuW-P!?7*_+cV&NAqV^hwM{UkTvr~_N;Hb8f$+}osXXM-N
zy^L;fRcADvnreF8=LYEbo?I@d=l}o}Zw!LKF8p%V$?PTB3cFHh*iqrv2s-}&&{sfA
zr19Q<JFA^82J9GBwHT-;<z8t-7K9Q5>?~6>jD-}GEIop-h+#Uzm8fEdqf2QYrB_d-
zI2*R>Tv$9P-3UF9aWmPIhJseRlC3FWdqBFiFgE-IzKcRB&^Up#5I89ve!(5-j|;sf
z_*;`V5~@Z@{0u06Cg&Tu#H+Co@R!nR+>OMmil1*}OD;G?`fW-h3vx3+!OrlW*B(ln
z(;gE{e+a1qh=I$u1cisPjo^gV0$sr_;Ds)5;Ui={(H6q4xbUHDia_CYf+^$Znw@Z*
zv4*Zn1($YM6fr3R$r7Bb5;-kpSzbM*S-*!W+V9X*W?vDO)gNovDk_V(n}vI+fpV%|
z-fv}0FGA+*r>&0cDzrw>?gF^3umlBA@OK+<sV|~<uEJs38apWJ16&G@GDymOug+IA
zu_n&dk)f1u4^xGtq-CH~wAKy^>XGBqwb59q3oN!#^$RZxfEiv{tkOKyz1vB@fW4}&
zkMmamT~kzahpJ25)hS~^jz)OQl(!b!VuY4}JBEeoTAxV0gqE}WEd6GR=m`axNx_xo
zU?$T?HnIv@C$y3VR??!JMB)xCgOUi|a?qBV8&9JnX(KntQb$`WEzSO`M=qKq2EZVv
z(Ovwl!p=znz#fxZo+k@P;q_ZSm+D#fw{+O}D-d+2hudl8T<J6>A{;@#l#+31(St|0
zXdO<+M%%q;;Mdyz9hKrbeNlqJq}UG2Poh>$G>r{Bd0uXJ=>l`3)0?S!hWAa9sJLG0
zmrn#n9Oqow5iH;~z%MFxh`Cs`GvwywLmAzdAm^XlZc;^56q;<GDhjLG8G(hD)$08d
z?a5a)l|x|{Sv_iI5^hx9JM3;?)9X)+8@L6L>TP}HuWJD}<f|&UUp2r6%7a+boY>95
z{g-!%g>p@YnlQS&u9`yUT~|4QS?e+SQW3(b-+Zs9$EfHOHc%Sg5K<k^utdll<9p#o
z)&`S{sv}VZk@p}WXBG#rN6I-i?0~8l7+4er{1n0syeGQtO*|hf7_#Z?RW#t(uc5yS
z<_&^7p9|+LDo;+Kr1@UY_<O6iHZivg%<~qkR?nd*s(*wt%4F3~F0gS6Ev9PW@PWA+
zE91XAz88fytYsrXPb;1JiZ&NC9F?4dP;M<@^h6rFj%=3epr&dWR}5|BT|qr~cLV^k
zv+5fzZi16kd(DHajAbVF7bJ~@b&&^tpscBCTJS7Z7J^A6ee=rKX%RTI61^WCTO-K6
zhEfH>HVsSDBXL1R3%2l?EIH3B-NPi18Z|n8q$RK!R}nb4ET)FbJS|-}0d*~#qEgaV
z2#T4YTIu#45VHe%cuE^(JCax<U?P9QrPtefXZ;Gjla3W8z5f8@ulgXukDfmfM%_W{
z%_>P6gDu6^r+y=g>JGOH%xf`R-q&zk@a*mX0HO3R;M?y<7twny7w9X+KL%VsFB0~;
zANIoRpGfoL*h=Ngl!}dWZlf%+nMWZ-3c=*ys=B5U<!L7fDu6d-M=murv7+d&a}e{i
z0hMG!Y=@PNBg*r$cra?qDYG|R`(Di|sqS;1Viu;Nj7iT5wz83tgS3FYSIzKcjk&j@
zsuNE{6f&|PH(5HrP;SkwRaFiwcP8nKaO8`wcz#nPW5OeROR#z2{KTd53@7?AhS{tN
zesV>WHI=bI%VBZllb7tuMkQ@@cDkX|rx3Nk5p-6qtF(szKv>;lQ6xFnD~>X9l_A_g
zHTl|D=gl#<i?1Z={bCs9b19p1epZjGHCJtLFS7Icm}jh;*vAliucrK73jL&V<j~zd
zy0&>kOogEK1$q}t!DhA3D-}mZ`fEAuwZ0Yplc-Ah8x(h4zGN0f`jLlwJsOU9nPJb>
zX|#uWz+(!FqVy@NOCIn_^<5XG0E`me-WSeh@!Qfn@k)w_p^sn%prI=1!;i6~t+~+K
z6LQo)`ddtv+PvqAQJP0jD~X!YC}n%V5ue#>sI<2=fVrK#E4>RzV?g!=fB6<QoCWnB
zH{m`^e3`*7Cyc1a`T{d+C$y2mvDG0Sunn?;I#X<~3(E1Oif$<EhD73<1}^ecQlEru
zknJ2G=LXy^HHo)Os*(hA?CuvfU<JTYy{@^zQ8?J}pW<-#YfLg39`|E~ZA9|hWl~da
zJ(2M|H!gLSPm8cMXuXO;M=EB>z(=@UXN`7tvgpbQ9``Qn9(6j3*%@MWY|uj`#sYM&
zA*wn?`$f~{ux|_3d9u8A&R#LHx~RG2-3rjwI`&0WJPX}c)KsuvE5(jxvU0PjM%5N@
z)-}Dz_y~sAJ;U2^^;za>6w&^t5_|xjbym5%VvK?2>*~C3IY%AJR&mc2y(2&?qlj*r
zPwtWW^)nlQO3c1VrS~2b67B<)&!6*ImHcZ#kBc8=<z~G3K@4WlsVgdsmoITY2pQyf
z;Gray`76ZF=J^@j$(LB+6`*}uGcyPP3#=x;rA6*@$iK?hYIRa<A*Rb4s)^@$7juf9
zHze(eB@+#<>5#i~S!I}Zh8;JxyS{;XoEih_9eFNptRm^Q#4aNrvhK&`I4Vq+!N~H;
zPMVOi<)90ALh9NPhBD&O`!8CXM|)aG79T~B>Y6zj3%~@GY<^VbC2SJ$l00u#h(#f2
z2o~6V)y}(1Gh}gdRWP$%^j|}UNyPK=DrC3D0**s`BzycQ_i}8ig%!k}6l5iF7teH?
zfWn|rz}vnT8(SqXxSR#e2fD#R<Li~z1n`}100Apw;GuLgXy(Up-7;1N-yu#Jj#N^{
zc}}Hbr(lNpN%v24TrQ&^{HF~KcqI=lz*CF%O>=h}6jGq{243K7iG{}5O)%WuJ&Y}~
zGHIYTiA%k>NWynmE)Bj80-81eZj$KMJ~BWaQ?~=nms-QJh33Rr3Ni@6NbF|n7CzZX
z=?TIVF+4I^!uPtlp>Qo(_=(-gS6X4h+-Rm4+bm>g+mm~spRgPRT#oj6K*;=@Ef&vF
zLNqnSztU4THuo!@^%*yJ!m4eOlwyNvoYQO+Un2nnM19?rlx^K$JEvWcpG1_y0_xI@
z)_Aww1q4?`)7h`K6G=Kbqe@1Wl2X{Nv;9jqwcgv@E4nfad@7Eih#1Y+pVW_1H8|0M
zs+<W8*>peVNAy`ws5AJb0$O`6$h$e^1cF;o)BLzkGdKD|4T8lxvMmXuO!?dWBMF9~
zx5Gjm$ByZiz3s{=0nlS=z`y}W+N=KnAV4s8?xv4FDA0+k3-#^57)DV^xPxG;ws%BQ
zcDUhc9Z_RcFCSn~5K_8H#fCepIG{2#0m87MqYQTIB8X(WqJ1WmM8HV3lzQHy=t4jv
zgiUozDd9Qnu-!pkWqW`(3pZi{YL(BZl;;QlPh`^U-4#U(rEnX0T8z-@3TY}O0>;-{
zo}JNy8Vi~~WH(P~p`orV%Gl9{M8GTsmVFsUhtt!x76yi;dvEZj-rjH73sEh&vV(@o
zH$z+$QegS=yVWPUYp!@qqd*~*!u)WU4adrR#!bTJwByQT3K5MYrEokP1on#yf0CN_
z6NBAgjRVR1CX<|-E;krVcGmu)n!qcpIYQM`F^xXqg$;dEBVqRdvl_0T=MvVrDX1$}
z)J2GEip|ta`Cd)RNo0~kmtj7do$fpvCP>6_LgyUwb!A0FZat{oH&5PMg`uO<Lr5ec
zZH$lxo2J}?Le%M6Sg<Y%O+JyWAEjvY_ybrlr8)6BG2-?^NkrBF07Xj;m~4%XAUh^i
zGzOIiGpaBuoZmRICW*g1sAO(YG(!f<H=>OO3)p3LK*>rjk=_y}U|H|DsM*c#q@VR&
zL=Hwfs*76>g`;4~dw{VdsG|Kg?wt1@qL;FwI@UwfI>4vNCefQ&S65W9G}xv|woXz=
zS5DSkkM5z9QDlAcsjKx3x7tDum{e8CU<nG#AKA|=)zN8FsmUqZ9m!79=qhUD1;N%O
zS!lXDMV%+rU$NBmZL>fY;W9}Oo=HfHOVOi&pud%9=^}xa2P&GYSpw`~`dtMjT(jo*
zD2kxjXIrRTkPX#q-sw%rDWGSbRDrh`A5<KutTBiMfb6-z5OSopERo{C<31EyI%5=(
zQB=?#M`BQp2e)KpXX+?7UyF0fv{^Z=mNZ|aXZJ=70ED3)(S%?GVF^8r0nH?F!Acxb
z9xrdI;7B)8WmOUk<tVkVQwP;M=%!H#AS4xEASKvGKX%^;CtmixQ9xoe5bLWLKS&&)
zV;Rb@fO}SAv`RR_a2GtJu_?{|%OfR1AEHMK;X1`32FSAUWMo-JNf$h+vNM91=Xn7w
z8d4x6pYpl4BIktidBR6p)=ZH;K$UYa5-(y9W>yYO)RlJJaD+A_<R_t9vU+p6QDcOD
zEsqMijDT*7bj%I8AS}>RqC!9ku92YJkgKZeqmKUTfT`<saeb^mu}q-ZIc7+_sI6lG
zyOl+Dt{MqxRa@$6oOZRw=-M8is;Y1=4gjhs(ak*V^jFksQ%>tMaleJs+I?+V77wxV
zwpwROh^$=Pk1Iz_K@<%ZV@12!GHQ-y+c8>SNy_%#TO0f>9S=>#1&e?-SIw1?x3ExD
z*Tw~fuk}l2NwHz2iU!zNC4EC8&g2C3>@B|Qp9;QunIDFI$qRBGIAqytQK~tuuq9VZ
zsmw{Sb<m#jM&onzvQGSeWGy42I6lWqQ8c`~gfpWKzUPvAshkpbzbTZ0@S+yR(QXBl
zf-_)6kI^TByDs`ICg{ou58CY51k%zjxLkKB4ee|FQk6)GLeMfYtDb*}fqbhO2e$Y7
zAV6=ZNh2tsWOD`kWfe@*xEo<a#;}o;WjJl}l5C_2hv^)Ijv+}P7_m_ikfH4AOF|xS
zp58gSODA{;*^(3+Wj_Agt_@4H_QDo0*ILOxvUzG?wepGup#aT^PiPm#xJ?Zgx^pm7
zB5aj|0F#8JmpDk%aGX2m<uH#!Ons6TfH(={pZt{I7*8kmMvcjg91t;uz#o+`YXHGq
zSU;!_ss_6UxgeX^s9YRRD5n8?VMP84C=vpkdk>Xb<NQNzd@Cu24Z^K+wmhEqRf*3j
z4li*2P@Ks!4$p-btTISW610(zvJw{`Ver1~%WZFj(svSU7e_00SOS`SfnvGY-HdmO
zjuH`kgoN{Z-pNKCz`ukGoIn=APHllW!fUVPC^qB^psWm(5#2S}?wVbGQwxuD=$#L7
z`A|r2gr(n6bkoQDq6CKI{*~FVJpEIxfI+>I0bzd&29C%`PmFm^0_82c0<o-XZ^^<!
z*Ix<eA5RHxHrtfQNirOR<s+_p1vT0~mdU4KIl?HLWL?F83#^=W`Lbs}M9F}ABXfZu
zW9paElK%jwKM9R<hA(dEeMv3)kZfgRwn^QNzhxQRFj{|P?_K=vNa@}NOHbJV+aqx1
z_e`+5S3J1fj#3gp!olo}fzDGLGk@@;Jo1`t**Yg8Ctu1AZ`623O430$$_i$i*x^we
z(`QCrP5`oz#lZfb**2cwaHhHL6Qpv!&S7!EVk#ov=qe^Twirf0<{NfNBKXF?BKA?+
zHwc-wh7G6ta-eOjY^P^jIvPd(o>LADuAc4_95ZsV3((vD0P>RQPTnk=?MAGdkht&4
zOOHIJn_BlvZ~KScH45Z~`1ndi_)NJNz0wz3>W>j#L_dL^6CQkFHPRjrWXH>%6C_Sq
z2X-liz#OQbH#i|ONqeVAi<nbR=U9ZUjPO3lNa_PlNgrh)s$u?P`z_F%nK5g*7B@|B
ze-<_>AyUJ8JY6rW%l@!_h*)i$?bp4DQ8~mDd?_6`zb!#lRE#un@U?-qJ<qZFsGlhu
zkcE82@SuFA_yndxy@k45bCnaP#tsl}dx<=#%ici%oGoCWsb_HRqIE-o#~<ZDJxkun
zb8LW>$Rw_)0C!320)A9hApVs029RzpR^)9HML8XjQBHe=4h5_;{uGUKN0Ja`EDVh&
zHcBLp!`c;jmA+Gh?l%My0c9MK=N1>n6Q1~X@stAzJ*=c|O_rm2I#w~{mXey<V)KGg
zP{dvPqhNyltbP%&Xa*_^fphm${{W^RAKhBVPD60pr-<Kg(tl-^!DppXRM_JrEe@4X
z`5Y{47H$YYI12MjYk|nZ_;irzo81zoDB26jC1_*S?7$+3{Z=<hVIj83TD>xf@_~iv
zc<OCZVoE`AR#i;<4`}#TdQ~)!A<iVF(zM33g8MBk3=qZzg7!Rr8n-4%$+9|HS8W(a
z!v@||%-d{PNEf9T#R7(g*kuV^2EvUe2ui{1R56&V#Qy+wZ=|~I8C5!f4V75v&K3wD
zGX5SD$CVr>0ZNF+V#}8%p6eKEij2H2l$8L>vXz)6rs>yAkMyZ9g&0N2a1tOEa&YBx
z;leZlz;|6>lzybPM8h_Vrj`PwAt%*qFgv0OCqRw0(iWp&paTg7b%;imCb}?Fas!AU
zb&`iEofpDkjICn0oYy6|Of4g_OoYZCe55=k-7fEyj3k_0Rq7w1%FX8(RrRBDN|r^U
z*vyWqNV=h#q1%WYElqVHk;GY6ze(o{Vs+SZt21>Qosv+FW!-Bn6;_^Ge`=|yr*jVl
zRkB$0_6pVjJf+!WrtQH@l2QU2Iy*uV7*SMHx$g}J7gaM!cM)}Aqnpap+~o;90VQV7
zMW)=*b$=e88E#subT81=ql(*CE0ZjdL8$4GIj7n`Wslc1Ru;I1i?2wkZNXF;j2rK8
zv>R+^q<C*pX(f{zHD@NJk&@x2%i1-498UY~RFm}63BRX%p9{74>Bi0#oyK%|{S7PM
zhcxrbv>I7+Z?pR?R2m<oaKfdQh_HT@=H<sIy&je<iI`fADWTWe6p(3vGYlWH(o|Bp
z&bHeksWj`iBaoo<wpnp9Ow$}6dtGTda*JW%9^E#_gjFmi6YUvZc6l6`izowF+a}B$
z?C=sty4Q7r>1Jz1ua)J_O|lQ5Du}~!;;Snvy(SVc6{N2Z2RBsugge0(<w{uvQ7APn
zUQNY~B&x4n(#g6<lzn9h+~Z|kEjyZi6qZUEL9p26g^bOKRDD5P6Jl|&I7B=;)&)~*
z6s~(Na=ZLYoTQU8$3_=hl+93ai>lVf3CLFZv<_s10bqe-V)s0+s>NJUfnO0LjuZug
z=;_Bc!V_<}lAgmvaz$`eZEJRdF0G#6)*JU!^@njQ1g|+bD~gwGzn3aG4i-#NY2CI#
zmFPVaBi$<+E<*FlQT##jSEzm*(wEA@)?IOVjVRcYSEJPQRzJ{f$tdY(F`N`ukEb}m
z(r?FP%}R<u548PP&CTp(0y;|9ZUXsNFv?uZmtALQ>E#lPAG*>})3~s1L9vuUYKxpr
zvZAJi?r_4pG=anZ5fqd_5q77?OR;4VZ4#7Oq=mB6V{1TElo9L#!q!%C&RDt@ZZAQG
zGWs_Q069t^^&OR8MKhk@NxHqH+CaMWF!?Etpo#R@Hn><DEBFP1ucg`s5zKf2dl+YE
zl+aUMV4dm&3+e#woB50@lMXT@-hvYo<vo%Wj1uQ#l||H22GYFz6>8_3cv-%wl>Sw~
zC6lBSj}7bR2iH9PSDI=j)h)mEFGlM<#;N4@E6ug9Y`4BaT=6@r^*z(@Vxhj2V*C~E
zlrI|wdoP&32lYV|jANZ^+mgP6(sf8*19rOR-IrvYqk^fkO}V4GZ>Zbys$X1o;iX3v
zVRNzyni|W%;6h`C(9lX;Fo_o<DAfwxkW1ZE*GeNfR`ZM%pVnAO=E_;8#x^{54*K>q
zo46<)s>BVq1xct~t|6{BRsR5&na1VrKXt_)Cz)<EX(iR8wVLE4lZmoisHBEQ8*aLq
zoJq!4jpulh&h5Pwgw#T+B8=wY5BYZ<FcH+W?s*%Eu>7k;Ys~)u>Q|;y<}-DG#?Dq_
zRd!BED_5?tfJ0VBvAap$a=ec-6tT;XqR^6&ovm$&E;w18Zd*0Yjii#anzX<I1652^
z#->4VlM0G<S(rz3{YIr!9Vk0*z*=21qXS{Mhqg_Y<4x0PsiXBI0~u6(XVvV}sof1T
zJ;NT=>c_~NN-;SliMM7GtF(w{qH!((-GEhH4@2wMgYv7j&0?!ioW55PoC~cN;jCoU
zwZ!7<y*XpV+=--|sUJrE9O&`GNf|8{BJ0uMfsBs80fmU@`l#ZgjBdSx)w57zng!Pk
zJj_d8&cBXBt0DvyUFmI-_U?}}#_#4AQAp;IaG@wdQsz2sDhr~miWZCVrk7HD!)$G^
z@>L9{I5u1+A+|3otN#GE$rZx%PyBS<htBo~UCs`2Mn2==R~c=>aFxd!mz9^umRVV4
zj*wi=Zycc{X73Awi8oD==E`x7?T)kyRkeVsr_9p(4pCZzj%=$U2iE$nl3zn2-j{QL
zutYu=ZMg`ICLd!?)nzR>*>l3?$&OM$Qc0Q8($`^F>GKfa6g8o(Hf~dC?iBn<tW(;u
zlU$-|si$LDH#mJ4R8$8x&EZqQAZQ*@Et7Y3>*VutW?Ues<5-kkuv+<FV`ZJxCzZFd
z)Xf2rhq|EFDQpXF1=luD10*BOve3%9Gryai((Pk+8?7FTLsvKsb8U4Nho>;i4S_4r
zG@2GNF>nI+{{R*E*P02<=;iV=@p>uX(jT;6Dk{A*V-7At*|G)(p>+sb={p03^e^$4
zlqn;J=aXldRySmYq*((t(%j%9I<{s}&gVGWD>OABQ0<ZBd}o)2Sh6&aLJrbnbtkYL
zqa_VRNF{#lnEESNDMX&<Ht6V~Y<K~!Tz0Ev6m|~<EOD~?07KQt#&!zAq2Ms(XZ2a$
z0W23NbFPadMN=bW1aKB>U4j7{oIoe#J5ki8gcm&Rx5~ivUs*B+xs7;x#xa%AgBDD(
zN+Qm1irJd$c3H&W0pVaIxp@PHW3Fp8dW__~#5VjY=-B5K_5Lm?V}(fZGvth=Xlc4>
z7dPN3-3ydOwmI&)QzD4S1G;VdC!7qX8v%fx%*QYUu05AClDgNz!Lb@n6s;%7Oam%b
zMo73=HaV^%z7u3{+Ek5*+l-aZfZMV}(6*BTmp2M0H1-I`#6m$8)#K34Kn`n$cucWz
z#!>P_LV?ZNc}xpq84_%ky@1M>b*@ReZVDd3V;C-{XScFeG;)!`*g=FxI^{$~(~0+U
zbdGg}hE_<)>}hR=Q%SQ_a>(Tgd#}o(fm9U}?BQi|r#}lj8Fj{0-k3?U&1j}2veHKq
z++7Orctj9(<;4!*ZgP?>BfpET$eh<6S2dZ=Q=ADHa)rU*-*y!_B5xaEbmGd+n}L;2
zO@8F7dQfaGR!mHhq#qd|a;AqbA1HA9c0^LX^0x}Ujz4CTONf|-&TN6|DE7qct9>v1
zjE>5usn76TmF7*iGuXhYHhI>gZ&;ut0N=7VP;m8~W8DVl3*PIpB&NmyE}TcTba^%k
zN3;h06%JW2H;W{(zdWZ(eaV}$m=-*F<x3t86am)moE~}Xu)e}W{30n1LItlk;aF++
zE*MJ6QGcfai}+R&&d8(W1zQxmBOgUet?GrKv=S_WCp0HeYJ`_Ht~UCtw6d8WxSz6Z
zRZFFP$-?S(x<`No)f8xzgi^$0Z~$DbXHV&w4s&jV>HRRgwZ)}wwAwKgV&d3IDF?Ci
zbmArs%11nd%5<)`2xl9Td#tU6l9^n1Hc?1i?n+zOVKkiE%3un@Y;dFwz6yjJ9#;cv
zo=|AS)*rg-Sv9UC+ywJ}>TJUtG39e3Cz1WqJ-`cHMJ-^7xlDo)EMPR7g-5DYdO+sN
z9amf|1)%V<)%ug?ak(}@Gf@3bz0PqPm0jN<<gOvoyNs(nI)%<4k;-EcQPDZ}$148-
zP15gcw4?N$G+14$Q>E$67CS}$i5!w1Fl?{WG{De3s?+j~U>0Z!-kz1L0|~WpfH?ak
z=5$986*OYtaIWaXcB;lV+!du5yF!LXXG|kOEx@{hs2zxle5fk!7^G5)*S9tZnjv9y
zGp<jJqNuywJLqm9X5G6kJYNYcI|Pn42~d&+s2=Z>J?!NrT!3FF873jz*<LEqE@>7l
zmuq||rm79OE>*P^tz$Co6*Xq0=?>O+PM}J8i%R`ftOmptMLlHoG6u98cnFFuHm0^g
zxE-rerD!q21D|WAbdGm7B8N=TC#kcg1O=*~(jlc~_O|H8h-umFutHT=5(sHqYzZ=I
ziiW_#8(=J`D=Vax<PI*UneUJiO^1bE_8r&=(nCfqj*9Mm%CdpD7Zz3UwC@*IkT&fJ
zThY@Pj$pa6lnuNj12#_KN=&LkXT}p;aD1osO?L+=8yu>w9^+&gKK^ivtNmu>21p-U
ztH6xYvc`w>f{km*?1H6n3<$=*8ObSU*`v_AiRCB>HxIf{T0pXyR6Dp_T)OxPZ*Fpx
z_Bt5ndwZaqedqQ@$Z&Cl3$3`7kXbBak1EavjiTzdB5p6;S-{{Li`a~C!d=)%EyrZI
zN;2&0pDApT`2PSY3&#nHA;c(OZuv_20sjEX9$A1kMF}Cs$BZT(;Xy4^8q@9r?yG9G
zSYvJ<pQ<SnZo4O~Aim{S&gQYE=Es{LC)LB`vu<<sN(D_}_C)7hRxu$w(L;r9!)B6D
z)it#eII)K+;)kZ{<st8h;1zE}(*hYcxtIE<qncS+kEYW#3fBM$7w%Q%2SrTc*Glkj
z@V3-+kifz0Zaxu)q6mfny4FtHD5yGNl+4RPx571)q5<t-#}-eo))^SVw~VT3b@!Ww
z0#DT|Wn+!9%38@|8$%FsSI^190oshyI`$zv7rD0~Cnj`5$6m)tS0nB-f0Q$WoPFn&
zF>ZKWZ-g9~(;P8f5QYJcQh{O0lmL*AvKBuShFj}ogm~pY?vnkGu+bCvQFp?f$|w0x
z7D_^2y@Gp9$6%Np=elqsgw2SMj{}6qSx9)zlN{s+NQQnnvafIkOB01*F!rD%Vc+fN
z!A2zK(B`yT9C$@iGR_|Blr(I0vJq6{-NF(MHW)>K&t%`abFE?7F~nlUN7>k$p>3Nd
zGyed)u4_qez)uVx)Go6PiUu=uyH6oGw>HRJNEa7M6vjEHDZ6jkO?w3yu}*--5Jobb
z-ZRQjISI@e?n+{9ir!S93w={td)~@Wdsz}vvNsDR+=8TWzDj5xJgj6RU2|fcg1W>E
z*d=a!EMYOW$|(TuaHOyx@}QBp<uDj6NE=G7djq7k!aAX@EW?#{!|Gb(szm3T(J7{9
z0nI)VvXoy2<uJ9^_K*O?Ks&#lH-q|?n3&zL$f>=zzu7V12N80lgu7;Lp?iko?L4k_
zwt5(tpxESPF6&$SCf&dHebSNxaF&bM;y@WqIsX9gt|VUJciRgfh;#AxOn+nK{>kRz
z_EEUp8}f?SjA=e{y5#2Tuk=U=&m}bpXA57PE++U$4ifzW#zKN`V7T2QP1CJ%auG8+
z?gyLUG?L!`0J3mxvbeVSSrd^PoJh${zIab_E%!_<99=pQjVH?CYjU~G$jM07k;)-T
z#rm$zmmjfRn{u$p2tHF}wXw=`oTGb%kCZCF-3%wnP1*QdNZ{cktP!DXLQe~?bCjeD
zl8|zl0kMz3@PeBz!ZuURP*QxJ>Cw+NOHRXXRE2<WR8U>57|)dQ;uE8mPh`wtxV4dS
zMtfKwVw8e8Ma3xdl&utm(j=BL2RtZ)aFTg(l2igy<tvSy5z9!K<2X%luuOE_$xym;
zd>$52VU|=q*z%fPZx}<#F(>sE3+6l@vZ9I4ETK+)xKSCe-so4(IW7t_Qy4iZ)JVDg
zh8d01e=tV~Kh8uiatdj#r{dr(NM3E00<4}}b;hDI`kTtFHP93KfJ!PLe=;`6IzZ&Z
zy=r{iWi|B_mgEZ|NrA%>H;*a_V~m0U$B<I<K&HZFsf_-DEQNJI+<n5zAxcgGDSsi^
z&o*0<FxOPKxw?qf0Bi}m>WUcHZ@im)sG_84lbfSy?AAZ?4|UfABfA?S;i3)6aQ(PN
zGM$`V3rN>xZ>1^Wb6}7j<yx4)Jm4qA54bpaK}yZCsnoLV{RAe6Bp?F97OoaG(dDD+
zo+;uk7mdGEY}U-5pzB*>x$u-yJ;x0{ve`vPOmgM|i;GXBck)}wx)y-jFwN86b7Guy
z$vCn7m!QX^Q@C6>eTt4vDWUdgHbT%$6LhKFz`}bpiTLB;Z==&18*6`cC*&I57(S@E
z2#h0iSwH+LSoCQC7ia$fD{$Ivt^WXT`zN*lFk?CRLfBc18d1;i&O6yXnpwCdr}kSW
z)3lxxf|fEc2kf<*qa_BO;B9Z*BO#)DY)ydv>qP1{TK7#f?T+^&>W3pySqvZmEqtl{
zHh)0<kvm$}gK!VkC#>HH(Y9>pp>H<6a<6pSeeNFBM@2JkFtj>U?F0fB!={ti=Bq-c
zV|LsHu%IE00C-s)HmSB78*i0=M)$mat1kZlAIamSZU&ATrn27TeI0OdvsQK>*5$_N
zxT*_C3~64jA0zCXl^VEeE(OXVlLOsnXyujUToA43<9W$mhCGs=LN`I-*HG1Eg-pg+
zDC$2!U6DXD8le6nCq+CV^>OYg`YEvi6e~3la1_XTW9=D4H4%~4DG0)H<%|z2ZlYr{
zig3DZfJ)3Ufjw~Ha#I|+a^Y(QgF}Mh!sWx2fIM)Vm^k_;TqZ^pCRbc8zsklHazIjy
ztYHf41nUHZEMdDsLcpJ8%NT{s366~sgoIriFe9Q-mXMAuOmhKR!NdXJ@P?Iy;HyVQ
z4`ek&dqF8>v7@53(6;#(Ono~D;X$cZihJhDx(#v{yp7}cQFG$x=!|(F+L{JDaH?xG
zkZ<i*P}jvE{Xt6UB6#E{Spo5wTFoSjkQF6u6pbeZdQ|YS`~a(}G}cLbHuqGHKsYpc
zoV4--`f{u^RynV2!q!cpG~Dd|$|!VyN%sv-<eCzhZ=s)SZnTh`1w*C4=<S7l2=;}`
zGVyvDQNdMpEf-dkD$1Tp*x&3Ke-ge(8sqwIlxg9^gj8+2f<6YYH{4gP8GfgiKjczB
zOm91GtLpTyZ)UAzl0*fDN{7+)P3?s?qb|l$YoihVjBk5o7f+=IjJ0cp3w#9(^zCi?
zE*~ZlqpKcS8Hs2b0uowgv$E1m#@@gx+R8^f8}Png%I`(xZ5i6Rc44_yHB-rxWuu;m
zabyJge(pvW1k<CQwo%1AuQtf~BbiO=Si34l(HPx^qbZ<p8SJ^#Y3!*}Ri`!0zS}JJ
zqe2^iF1IqoEN_)pH9H*Q2o^_*Y|YV$I(xSpw+Ky3PyP|Rab>rfo;Ct@g0fvpQW)1Y
zrr7Pm?eU{hK<8(ibp<;FmTif;q<k%J3gcLpbdDt0UdoQ9Z~?a-O8Trn!2|mQsj$8>
zf^o8SRQGo|LpYP1ssu`x-KAE}>zjmCLyfI;3+_)Su|^w!hm!ZYG0gy2oS~)w9|dMI
z9j3Gy#r&^r{4Itz7Mpm=@fsI@90lzE0ERUV4r>}a0=%!tUkwVh&wkPA;%z%_FNFHd
zJ+pA!C^~$(@U+P5V}*3-7#m^PeD2#V$rNAdkwD;fi=ruMZtRb;J-|5U%9<G3202d=
zY>qm1f%;Uj!Y}%4r2@f6B%y-|&>JSZV``0(ZhtsI%Q1I#B`)INPYJ5U=4dD#U@WgF
zi@U7;p5V|G?G%@`S5_QrRyv-G%10X`##@vIo(9lS_x7)$!5WDfI~d?Ekhli-QBNpn
zHbOqAg-4n(bSjOOP1+Kf7%_EJ$)=FmrokBlLvn88<f5}C2LOUx@$CguYt+Hi?k_!+
z*f>=h{r><i?DkCMpv7$Pj=ca?I5&*1E7xo!xyS{2ui^mz0I72Fo}jrV{ge~-cP@=L
z;hglwsg04x2g>?irCkH*SR-$4SIS?8w6B{|Y1~711@(_aQi$kTj>?d8m-;v-{EZVK
z4sJs4%di{S9TZ?P>Nx<qvZMw&mM{hEh&UW5;QcB`aI@?ypm~;WsAcrq&6bXHg0g*F
z9Oy_1GC@sK8ZL~TReVBgINbPCQ`DJ9wYCa^YC4Bhlb(Dloi+(rz${lTd=bYF)M(^#
zVWK9Sk#eSrCi7qtHW>iBl7>8+1>ok%DOybFia}KSL$Hi4Zp@IYF4+G7Q?iAt)EgTJ
z1eN7a%>Mu${g(LD&ek0fxNV78y=1kUuiaVd8jP<l*e&w2^{k$9ORiU+o6Gr?v{Eop
zGdhF)Sxvm7bXXW<8>}p*o`=1%gq9f@a$H)~4058amztFHvC@zokQb8mt)-F9X!5l>
zolQZE#{*B)tnEgdGw%9_7Zc@rSRFe#vgExZ&gyApZQkLFtImzp1tjfZweGI!G)BtP
zcAwb=Nul~xLE)AF--X>gu%0%V&j~dvJ(H#N(fL+;j|)c4a$*2&z*ruar*mRxwSZcf
zLq&k)e6D!$pXz$?cD8D??M3oiaVq9Ijm_m{w8l7)uj!-q3$2STN1!?;npGC^O@LCC
z0-9PHE>*rM$$>GOh)wle4a$<>q<ek12q?I{j+$pSa!-W)#lpb`?aen)OEk8yHu@{9
zi6AsBd22zrxj@sst&|&GHledSH^K>|vQKk~BeIi+Ewfp)(<d87KnUro1DjxOvzlox
z0`4Fy$U{R%36z?RBqeUaCt-80K}`2Bds>fv)fs3!g~`I6igE!jn7hIvo?^lai7C>C
zv?{9Fg4_dP@VYSEc7W-ZlWHZbA*3}^RZM4n_ZKSmOy|40GM&u?T~>J~H~TSERC+9Q
zg6Lce1(vf;sF2%pmTyga2@2WO)U?rE^0XfTeP818#||!2k-_9e$>|y~R~&80%Bt1%
zM+lrEXKqT*RrMeQh#|krilo#vipr~pNE+V_7FP0qIgKWvv2pm4yJb&NQ_rc_6S>DZ
zNvCM>(*Wn#lv5@)<dpYL0Ofq<UniZjtz&79k<5vh04mC=!*i7-RE}`?RN9QYK_ss-
zQF3QQT1b*=>t61{t*z7;T3Xv(XZ4L(!dx1D<xt11hs$Fp*>&LY9F?=5FOwMPwbr6_
zQ(bo+I9_qo+B9t3;4XPvw`vS~eYYi2>aqS{8v$~?UmZM8N1c{@`#g@ah_+h*rKP5@
z$iLZat29#g7i<9sE}qzh$hltRGN~hpnfWO}Z|Nusnr*kiT56Eiw$@cOKKC01NVXd(
z9SJ7^HPD;zRi?(bB#(s@!KUYhRBO>&>5<7?Tbl$!*f~)F%3+fh7TnobK)^F(0|_0`
z4UpTqNhT|>$2FiRTv|qXP`XDP5||x-)N+zAW*+`<nm`sd!caxmJ?#L6(5)i_%bpN&
z@`{z?lq`glY;Qy^CxM%%Gbh4nwaVb@CrlwB;5UUFuD!~L&u#*V(_GjEs>4Lx@VJ6|
zD48K6<w_g?%G44UjM+v-&kA=CLX3>&*HuF%HZf;s%D&Ra3YH)@{CySPmM^p=n$cK2
zhf8h0WFwAMgP7YJi<BIJqWDvd9qW@s4mdsvjGU?6w-yPOZTKZVh2<ginJV6xS-sU|
zJDSsQ6`T(w3?@Xf-2{f+*F@3+Bm|-3zjRG80zj(zIMe-&R+!=Fd~&IJqC@GpD>?^}
z4T7fXGXDTf`$d<VCHtPNTj8SvTGyFPfkT*_c?Srp*__Fbv>}aSzo0JIHAf_ruVbNz
z+?6SU<KYeY$8%)yT;ba&wkH-Ol#VBa&&oT(c+?%AZdZPF$FN$>#AoH)Kb1GpJ`oL>
z&KJd#B#?!y97eVxI10l~X}G^CuuS`_9W~A*XDLTXmQ!3rY_i(J9AC=S$`7QdH3-Y(
zAv8(kGolwc)&na;plL3V;JK#AjUP+(qy)Dd<!-cXE;yJSU@WNKh^>v%H1QN*?N(<E
z#uScoBW-}N@`aXQTt{U(9FBKbTgrry^dl+nb@G_&b_k;jY+UzEb&fBPxL>)#>t~ce
zj>$g>(X#!pk+!%Tso-yAn>7w(b{9zd4pifd5y}#-Mz9cEqQa0hM6G4-Wksr2F`(JO
zcC)C40vbZe)>b-VKu)$6NncaEoZSf<3*CU9PXpw49INdsOWZ*%N24H3GJ(${3t6UV
zz%XNkUYDf-x7m*CMNdT5$8gY*x+w^-ItoC>i-4~vVgaC7sAGsW*hkVg88=dtj@1f8
zp@0q$wUz^nqX`}mRhI!FM6?dhcvf`B+AI}Y04I}$Ye?T<Af%Y+pMZy|!z_snHc-^J
z+m$pHRyc#$luafZ<S1U&jFP5+v<_~lZb&8W0CEu0%16;G(ll~ab!A&we1u~gIr8Kq
zt(wN=Qdd`P_O~bMompGzKWlPR^!+jQF9q$w>5oSvn=9dpqP5mzU1fiy=nZKPlwazv
zwEZ>;Sb_H5*-xmff-$v+D_!&_XF(hk%m6e3nKeznPYSwe-7EZjsUu^Fz4<|<+Z`f9
zBj27>VV6D>&255E!j;IPfdixV+x(y&%Q)k@xN}Csm0dePaq^dyveAJYBF-3Ak&Fdd
z0kneZ&O2CGtk}qKZz)LZxMX1~h7vK*)52r^IZjCX0B_+a=&Gz2dC1BU%+66&M(-np
zFb8$6s}gf8DMgq8L|Y@mf|wnE_ER|gEg@oYBpfF+XDOh9G1)n{zc?uv$dRc)zhs~f
z*>*xkRWXkq+Y}4HxkgG(({vd=>+p&kk%NmXC_g}Qtzi2r2v4wZvlfB|GMeLql^K<-
z9HA;}SjL;UB}geCm&n}bvK{peZT;LTTHR(QUd~jNn#_{8`aqkfP;5zNj5}tcuTqLJ
za^Zifq_5YS(`J%Nsbw{NbL<-?)9|h|-jJ439Xp5zk#$v$yE!s>Jim!cHmOli`$oqQ
zRP>rvWn-F7>n+xs()6$flF)3gDX8Fv+hYMfk<RAiW3+yg4I$E-{Z_9}(jcd{(T}1$
zJ{Awq2i-$8dm7sWISa%wjfydXqne^H4nb5knze~*K_|+rp0;_37a$@$VA-Iltc+Z4
z{grgp21|zD?5kqAKIamr1h;}zWhQsx!xRr&6QnmJl>;Ey+yaT6#1Kzq8JgoHEg2Na
z1dz1tvxh3g7KrVSlnpz;e<H}INYXH~Vnbq^eUlx}g~jQvb^E0*aQQ2Z$hEmm?wxBJ
zEoK^TZURdb_Z$5a3Cd&vjsz&5apg?wl@YoqMmGNdvQeL+>mMmc$}9*&<0?TEWD9=E
zJER9T7x_Zi)JY@}mJzsutK@_+?sHr??x&vnc_CLi=0nYst0gs}c*}qTa5qF#mu?{h
z!Q2FOFdTO&W-d2D4|V}Q6L$})d)P7bOmt(-l#a#F;OqDMF1|)n7}3uPMl8aIUDiqh
zZMpKCE`<y{Bm<kI1ouh_93qe#6*@ehguo5?Qn93v0SVDJNR~U>!g(J|CV&97@AA6B
z!y#nIx)9?0CZ2PJ&c*I<kUUz}xG0!#<o5|}Va<x*Th7$rTYFfoVGxXbC?(spp9*&o
zW9>uBw%yS}usQ8)1zT_>H~z}Pab^`*EM?_dCp_6U=I*_Z?w-do_q&uOr+3vT2M0D<
zLSyVcBHf4FP|i1VfV!43X55k#7bWD~L8HGC9y^W_;Nz5l^K7o;9g-aa_qaInxc2uX
z&8!X*^TGbh7-P3z2I;QdZpAzHO*ip$$driQTn;P}0DGr8_PS4$;@uqF;>A2Sk#vn1
zPT*q&D-G;>0J?BsaJWt4);TMKh{t3GVwRoQ2?#g3P42!=_FP<TgM6%=2+)C!H~`qD
znBCkJ+s_wCx#HwJkD*PmHY1tvyJ@i{FR1<l%Hu1zCm%$1GD8R)1c$m@at(?{ACzp&
zjzgXbi1VANT<@G&HvNc9iMO&pH(UkOmmTs_UpcbCOlI30uC=peARuxsn~aNCcuavN
z4=*POH{sa@87+=@K|G!PlcSb$qFCMS9hW%xu}cwX2K=OwNCq5BN^_m;M!LreW=cnu
z2Ksw`v->B9)7tHst6Bm~WkioT;>r(E;NYmM>SJj3ygTlzWUV8ISge|$+bx|lfU)I7
zY6o&J-BP}~LxB6JUsW+a+@r|b_FcZF+z?bIpq3J;T~kyY{@J(DIkU<~y``vF6$i^H
zxw-Aahk13twZ5ou=R5Ti_fo{bN9q?tk+gH7k?k97Pt`!`Nys~+HXka%k-LC#**r2}
zEE-5l$$+U859EgrDppY20q+XQteF1*?VF;Yj%!@Bk2ecjF;>b)FyY9E>Et|E{nf|i
z;&8|pvgT>=lXj9m>vnEH4T5&$wcljzw;tf{*;+?J;r!11)U2X611IVc&@Hl)^1<UJ
z!|D`~>16ww;uZL%EoS3l6p*olkQU^<1*TAcr_SCVxP3TK%}G`N0N^WDVvXDpVfIlN
zT3iMYQm|7qP{BAhaJo8~k~9$Dt_?duy@A4n$F}xmma{a$L);r+RIok!h186IyaGmi
zB4MO(AdjaD8IFOZk^RxJ5G+Uuu|ithi`(H&#)i7vMeLM1WYNkS!jO>rc|$m~V6gd3
zeMD@@1S3M(Wg7_{)S<Q+x7|`Yy`W*`4<@H$`pVo`O%sb-%8FT-8^9%IovOGC2jLAS
ztncbfpxCCN^-S$#Jk{-JARZQ8O;P=>hc)s)&QmBbI(jtnYPP+e0u|b;iNVUwzIh$r
zl^B)xCg|`QjTD-JBP1yQ0Mt*FL|p4$_f6jK1!V!O_P80eg03hFuY@>)?ywvyEiw|<
z-o&qm`0N&6=;7oym9EocaR9mY3pb`Q{@V)$rPE-Q*6_NqU~Q^K<Xuw4!ZDR$1Pmtu
z4MR%s1`4u@DFv*(Tv+8FLN{S_P_$T^D_BE704nNOUP!vLiIxF+*e<q&WP|jmY8&k~
zL;-~qzof2^8I5Iz<wK*AB;^^c3>9Cc5+^}+D>am-*byM1X#W5}MGg@P=x|(DF6^*G
zJf^$+r>NYN$6a;8ZP#2SFy+`y!c~SB=#(A`Xf{eXSW)+~W8@7NB`N(Xzf+aWh>%fc
zCYH7~8y5?uj<PrZ05D!v)_q4dow@foS-mImG9xa@B(d+6FO^*l#h*YjX1ltTj|<B5
zp1!1*592rPR+fjVDW(F_4E(24OcZQGlHF5NYS739o<DSKb#c3g1lDQ|x=Ud~*;+>_
z;o$Iy2avkh!bT93eO58qT$OPH!p0gvLe(^SXXuL}$ZDbND;V>hyq(a~$mZVxc#Th2
z&q=7dH%LW__Rqvf$)l9;EWS_cTA3l&BmkAmG@Oo%ZKQh+k=Me_23!5sr%mf<Bm;DV
z_g^nZsy(?6Ar}Wx)I>pSuCVz_!|1Qe_I+hX)YS8k8zt544Qx_?cLnlpmDcqTJZ^a(
zb+pib5(y36DIZd`$|1PO`aO?{;{+!NqdkK1Z5OZU<=P!6{noQh>bhyHM5Fgivi+Ik
z`ZjRF&~ao)01PTBEoLbIv%&kT80#3}`hqS=i^ZZ@&I+ul=NzMDnWS=tb3@J$gZ+k*
z&?8($(<ZAe7P>B24&P{1HI!30;d)WZs*gHYn|4i4Rk{4Dniq!!o2I6cCws20XrAG~
z!sXB8@I@hx%Y0b_Rxfa-5*@iJ37viylbg)6bVnU9Q5SNeo-M-x642*6DrUqjmE}qf
zdoQXeC8f!@LQN1K%CwWj2;l=YDR4Nl<(lG2!r7UtEsr*`3DuFd_OiIt=<sl}lhI0F
z-<88TF!5-LyHYl@bM#cTTDPQb>y>pa2x~pdFR#QIbvRF9c$|o<HK}GBSS$+7YW}3G
zbDVCiXei~HOEepHR+U;Up}U$mUWbn=kQO7yHI_M!Cn0Al%ZV*3f7X;@89lAXb&RQn
zpc7^FzBIXGOq`W6lrhEkJaD9BcNiE?lsT?F!dS(-s|!GNkpQb7YvT&iyx~?mo_nl<
zBhR$m2Qj)TPAp0iY#)Vyhfv?u2Zii^hEEMGzc^kyL;mo;mFpje6SO^>hyi)tdbkMm
z&wJ2n9${!07FMsAxAiy=s>tcO!(xT4iMMi*^|dp*bIupeNjCogR5Fzs*e78*a7MPS
z7B=p1SZ8VviNC8TcWRP5mz#VhN`U0e#ZIWfhM`4E<tF83sOK{gbIQJ>2Vk%_Opv^r
z3~SoK##7_0aCMI!5OcgVWaTA0T=!pTvTeSBW`c^X#@&Lv)9XFKWY}K8W`u1Fl7|bM
zCxo0?OFa&Tux%dXYpYqem5rmS+6CQod{sNSE76acDx@AI%#(VD31f^n<pob5J<;%z
zcwHD<o3mO$F}1B6DPpzmhb6!$jLvDvvb&p$HQ8z$(A7iKbuDZz7vv|;s0i9_R!^w)
zFHx=m%TLUY@kWFjXPb4q{Ys~OO7lH^zpEEsht!YW_maH-0ABqrRmR^Fv2{h?;a1kx
z$9sOY^+!s}7@}Zl1lzLtKk()8{(Y@7ZTByzdNI*{PCcgh<#fhWsPm@3V`UTfHp#)a
zDkwinA+`ZJ105K!Nhbw4q!f=ASl)qT$SR*!ruCa^E4cy^p@6L~=qSxMNMScEzu8XR
zIgA)+R~v2FM&_<8u$1&wG>U0yM;1^%0tN+@)7T1$@wdA3C*wgnDx_vBVsmfGrKpAO
zCihzE_OJtts!2z`i{*Uhn~xN79T07zp_+c~Mbb&8jkemZFR{6>2uhl(0va#!x#c`*
zQbDFt)amSKB!H<k7#P-@0I#bm0KVd=H94H-*{vmWw3{9*psjQ<G})of`YQHOO;;xE
zgf&>Q2_>l9@o$BDMGSDo?yweB<;4=3vn@WHAdlQLWl2#hStXj#Y_!__Y#^2gU1aJd
zYo#O+lrhQ6vTad&rB=+~&@2Mi=>W(<dAa#mO)2HJ&K8z~R1nxb>7F=WLq{w2&q32-
z0iw#)pn$TvKCv5sxmqeZrp|q*3%AGc@wIK0dH#cA7dX1<;&#J}eNohGU>E?BihVF}
zyO(tQNX8$i7Dp$uI~yIlxkPMnZwR^B8yrBgh0eYQ3+HlTZdA_5x<GP9Z^l$Y1ACB+
zdCG!W00+8;M4&QuSJyVoIaHI)9B<@Z71R|nMGK2TC3*ctWn{JEakFpbR|H(cRIK#9
zHl(;V#_HxNBp`CLJu>0wvvIx_q7iTwc=<X7(K94)!fe$JXt~9bIEFWsQK{6D2n8hY
zHP91HlGN93HV(28?qki|LZy~>Z|<ays4!jFRL6o)R>InEMZ|4sKG39o);A`~iTcY~
z?Tw_LDhKN9bMGvJ>2y8x9xTu@rc3RO$LywSCV08IKPWv8M%1~xZDp#ZrHr&(h3oj<
z6tc$KIj56}o1KquC`Z3;30f^wQo_<*BX8IPm6@HwNeOQSa`}EdaJo*)W1DDckht3T
zQpN?cnG^(@l|H}+%HxY3Oa{7O)|(ZQ*6Xa-3$13MPUkR?78|JPWNzbQZp*74B_o$M
zR~4fptyFr&%?|E@rh@JTttZJ+SBHtL0X|V$b?h;o%hHPB9UgQ2<*{Og?QPw3_J)p9
z)=t>Ry}*1R1y162fIg}5<COL++K!3q9ql#%U1xO?E<iU{b(6Pd=SVO0S^Da>0&QY^
zuSXO(kZcO7H$B9Eg<m`y0xD{!y7o8-8DzLOE3zg)Q;-joBi>2>00_BTl6&1i=#`Q%
zF)p@pnQY`K<Y)myY^*Tm;?`0$obaK|(z5qTVqyWxZrhV$ngQgc4!3J2LJlpkzbXky
zPkfm0qd6R-Ln1w-<s;+AWgrIs04trg*+m6{NC4pu@&_43OfGN~1}782Ool+kz?>&U
z!s3Z#Avr2h2HXs$<ZB>oKnvw5VN;envW`z^&nTl^kd~kPE(72$FBjo3%loPnqFCE^
z3@hy&qS*^N$$i5%SDHk)0_kUM700Gs$+R-yD#<@lzEQF{#fTXicXFcydNH1cJA}jV
zo>**?ZaK=OP?DXFfP1X1DF!XV0-3qxTEM^=!f5tGE3{5508fnB;|e@@QbyajEBZKJ
zW`j#{EX}fo*IRf<J`tKsf5T8~jQ$Doyv(|p?D)&|Jm*nhGdt>me0J=uH6i?G0b~n@
z&O+#fg`9Q>S@4=$VT4PC`B6Ax;Zn#r(F2?Ck-w=*;qs&YWW?A^S!(G8!SIq3fVxs_
zu{1*8*UGliYzskEO#^lnrj!owK2|7P$^O-?_f>|RzF=%}uHuNfflmb%Z)KoMAl)LI
zMg}-nvCXxXLdOteMU%zG22-|5hsg5mT|xmjzjWsknhC!M2IyN0Te@*zT+4HwR}d^k
zmI&8dzdr>t!h45ckh8hU#ug$GECX*KpvksRWd!wtHW6?F6kzI_mPX6&3o)!}p}T-`
z7gyDQ+}62fYA1Zpxg_N+Afj5zmrnECT`e6MmDeDtH0nbk1dFY1jiv*)2t5r}0jBAO
z!`igET?X3?xK=cJcxwl@D#DhVXyVpO%8Nr7{XUorU}0Gpo3QemMII3n3pcuy<!4l5
zK!KS=KrPutY~4)&Ja$vNDA6I~2r9vjct;R!gsg5c${xc&k%PEny0@bq!G8*}AW0pS
zttcCAmTaO#!vfY&)Z1#6#@V{BuBd2lH%S!R1f-$|P~Z*JOsEV5pzA9vY(Cad(z2qY
z`$4hzU66uHXAVr;&`nKk{jJIHgl!#7WS^witF1dowVx?gjC2&uvu$vmm!qAw%8DHV
zHVx8%j&mWV8(0883#uzz{{YZ`WE;!gbKNx=CN{Ep3w^FO@pKR_F3tX^sUmT21wtb`
zye(-JP;8Q&mvF+cjxaOX4@$xaI7WbNWeG^MU^3Xc>k^z-3?#CN2wUtpRnoVdD<|Qk
zs@V;RK^99yP5ol(#xw00u<WZ@mx1!EV+U=OJrR0j%{B=fR}1)E{HYkxV+qd*9gs#!
zb*_=$q@^6GtG51lLx&66*$9fDH)Quvaz)i*PH$z6EvyMs9H^+pnm(9QI^bivR`vun
zqrz5^!f$?3w#4VU!!F62&O0t7+k}D5x5|!5fFGy?m1Eh`k{WN}S4kib%9f(7fDyS>
zR8)sF>~OlQU`kn13^i?M>Uxq*UMS<s!phcuVnb#){fdFQMxjtZFOtOhPx0F%{F*N7
zb?`1DzwWBvSyx!&>9xgMX<Z`X8u?t}etWG>ouETb&}`eRqLCTrl#E>tgI7}{OszIr
z?JuUOqibI*ZE^BKx@0Vl&1--vR=hX$O3Qs#<@8Un)Rc75w#|j2-w1;fE;hEvFV007
z{b2pnH5!`$A+9&<ivGdHzKb%z*52eHXQ*Qb>dL2<zIiS;I^QKiT<2xZB_yPD<H3D~
zRMp<$w<rk%i-{!t)R*91$*#EhNy(jY!x*9mH@Qt{$>mCI!jAU(r&1D7rYi?@@pRb8
zBjHE@Bb6z#`1B1?$SMazyaElB^=-n9tTq`aMA;e8!0_%-ew)}X6i~Ir!zjYnY#II2
zGH@awcucV;Dnc-mzD80l9Rol&;XHBQ>XdCy8*G?X$i=(&OnAk(DpCiZx{crwkGfzH
zI^D`=esG-oT`>4X2*h_bO4G<8Hu$x!mx2Bk0HwqFKf2;YvItCbkKHtz43&dpX8k!q
zF#iA$-M2+dPRv{(qht3HofDJMD|T3WQB>`1@GX@C8vblibhqx@c1b2KGD$!LSg6Ry
zDrsy_94Op8aHZMZ6`{TI5`b-Wz;?1!7*aT2!hdUUk%1|>93qUx8C*q*?$@$MCqgkm
zO2>hY6EB6>x*{=5#`nTOGrkgrG>!srjke<mr9wT8G7>FrQ{fh10NkZ(8ZHyVS}+!2
zNL-HPIi%p<?vwkj&Hhjsq0W$I<Af}(Y0dk0QokqMhLrd`CP<952~_WC&6Rv$Z^^PU
zt049kK(IB&#H&Q*lL!U3wZ*;@n``;PAJcD=m9c<Do>q_`_E<F9Bc9wLhEE;S_JGVh
z{S;v5o)lT#i$jI{lkk<jlXrK&{!@Xm7)o4FbN5SeYz(H}_)0!IpwX=2Y*Sisk@Ziu
zdnTI`%E(8tq=U#IG>r56r@H(kw--Irp#&H6{gVAx07h_=H^vWi4P=aIwn$EEO@Jh2
zMSkb9>+%xQ8t8dp+AKb{O)M=O8>ZZYg1OH5DY${iM{$r-JMo02*GX_wr9wF!fN(Oq
zw}gejcNa?8BLMDj81A!1=7c=hkL;R!1m{Z^X<AB&&yLt|KSHtt$b=&NCfUh%4scT)
zD8AI_pCrW~_QGYzDIG7*3MWV}f;{CiLdrzD{{YHk<*>>YS(*XL4r<WSZE`|%k<ToQ
zK1p$qhA(dHj1^xkaq)!%Yg}FP@|cU2myw803vPR-I*u2MhP}W3lB|NU*B5WxD>$Zc
zXaFC$L9rbJNv5^L?Uq*m0C1vylOS)lpxeO;(kDpg07eyyTNcsnx%wfq7>cbfq?2M?
zf|E{}zpHZe8KY@w0lfSw*{Q>vKtkW6bYq)9{2SRy+6fQoaJtq-rAsI20^V$<W{WQH
zEp*1SA}A_G1<CrSeonI3!rHSzn79xECLW%h`7FQFlsg5ONNDOw0ze4*BU`7n*4-7p
zY`66NJO)cmzKVbJYH&7|54b_IU6?pDSl#+dfj=ntG#L%H$nH40*9|U~F2pG#rh%l|
z{t6s|XQ_I2pyW7xY>0k{_Ou5xald7xh(gg|@)tYPCc)PzTLl@WXuuDAM+#W9$l7cg
zTlZQJz(ybNQ(aE?3=l#MvlPQkZrnTjraFPZVc$h<H8i5+3lD@8k<8PUxHWFVfQ38l
z?z@v66iqveN8BTvcDBw0A*7L{oc)kUH9#^Jhu9kgf$eS%+kB%o#Nm)H^iWR7_V7Ps
z>*&_m47Cj41Uu>*VS+v`mPRw4-H^@z=EX9K7m!P9fZ%<ThNSKS3@{tqsHNI5WZV&x
z*=BV=l)<T+-*Hs~H{dR{%5Dh_*=zo&>)1P=DjBsGyT8=|v>PSZ5m7>qbySW#9Qjc?
zN1jSj->ORwsx)Dq?>7m%E^<jKLIUH!M$JP51&x;$=Zh!#3y%Q{HxZWlt^>$U9AmQM
z!p(++wm4n1{4Tg%Z<Gw8d*n3?bb{P{RrZ@CRt3ZbkA^oin*)SpEb=kKmGO{rk7$YM
zdQ7o6jkfxguhLxr0^}0BiicBsY|(Y5(Y0riF5_kCc>YfpR30{Zy)2QC0J5=xjduVn
zR*|YQ!tWnTttA$z4TrcdXBJ3FSgkVlHUK;+m_n<MQiT5iIQ`V@t%&~sF#Xq3YtRF(
zqmzS$6KWWLnRJr2+@>*2tdD6`I(vwp?yR+$*cxs^r=pprqaIQ&!1^{cB$fnYI91wn
zuE4AqaGWTT%aSDSv5q~|Zcpr^a#mrat_3ia!s$jIadfGHIb#k6=|TR<mkGfC0A-9k
zoFFwA_r_7fgvl5PAgn3nU1^~@wU2Jq<a)<J)G}Ad#yDKu5Wb+Sq>1<3&{aiFl?0de
z1iu;$v*oFDZDxS~019avZrzlWy8gYUxO$Cw1HoTJS9HZR*St+XWt`Od8k#_M!~yMu
zj|sURf295<RK!DOE(iYQvC+R1Y2RS!fIaf5bzj54;O()6mehJ8ss|GokXwr-ag=%w
zB+qivy6Tc(Ejxd8q@n6Mc|f#-J_`9&)LP!2`^5P%<rPWQdd{BkCiOAk;T4igu+jCc
zKBWwU4+rjxj-`&_!F<c3ekaJn8z~_Ct^WW__1h~;S{^|@Q!J^0qu5&@JQW}}S^XDK
zH7p0pyolUgSW-tQCmzzLzA~bh^sHmg`u084lK%komGV#GEg>4q-DAr82dx>pnnBJA
z`FHUim<>(Nw*_-ee%5qiqs*j$gYu#gka<_qQvz*ox`@(WvdpCw4ZCutWl3YMFi~%!
zHvK=ch4fDFZ}eKh#44LtsfdEvTt4deO6vO990#c9TjgZrq>xzIOGil|csU<soit>c
z==Oe>>q%X-$t}L6dJdV^Fa{0skKKIlMFfzv5J<Y}-CnAZqin7pbr%PEE~Q<cP*U|(
zG^XCDSF{?m5^(mPy7>Z!tSe%8CQ@zOtzL`xg*<y&=^QiV6r~V3#z)mq)kPrWDZ?X^
z!tmam{6G_J4wN6d^lb;IqpE9t-`zLQ$Fgn<(W^9(oY*FMA*b3GQ`ScIgSaXEM!7>S
zSV;*~M8<hdb4P_Mi25jGk)W>&$<wjdLb1708vunh00VM|matotvGOSb!yM-PA?A^w
zc|c8C2QENVSNJQNHe|yV6<M*_HdS*%9Bcyb%?BQCh>Av=9#@>(li6E95>W1LLZj5Q
zc;t1<Znbkt&@6>?ZIIlQG@gf2q-Qk!C6OEL0W)7QQ_~Z)Tm_-2ba2LYjI0+|)J-EE
z2NvwFgOsL{3Y1pa<{fKT*(wWnWOi7pmx~Y<gQ;SaPUpVsJ0m-<xbb7h8b=i0DHZaM
zaluVEYMwv?iiTSj_`2z0m9?eD=p$rhQ7$(KM}>?+{xXD`!51Zf@PwB+K*v(L(gM8;
zq9+ZJmbqSa3EJ>}R==g|C5`O#nlIYxm&%RAl+Sh1GYefI4R6Y@pHPK^WNrkkCX*#~
zQyOG@t>7FhgB#&x&Bxt*?Bec;-4=CKjRSMt_PPoh(ImDGu)3kt>twr{&}=-RwCUwC
z+>_6AI5w=-+3GqBky)ghm8On%Yz<%w&vYqXLrElk*4IpX0|9%Ig)+)GJx7N*9UCKK
zZG~KGqibvkNZO}Ja8<6BhDysP%HF|rQaqn%D0mBSTyBnxjkw3kRU3OBpqL~r7ju!c
z^^F7#*HrGgJlRQ3_D1kYRDwy0<jsbaC#XWvQpfEWSxo|P=KvPMj@t#-zvDqTiFQ22
zal!(+J*_2Lx$OZ`>h%|C0ITJUR83}QRG!Zw>ocmz;?lGgz&YmXn!YA%CC7#2M;uh`
zmBlw^3tM6L60m(h1)RMHs7Nk$-U9Rfpcr-6rw3^6T>|uVQHN4)Y)M~F{vB8PlyThh
z7s;AL#w|&v{nyYRhdP`804%^>N>?s2I5U4E-RY+rMnWO7ZYw9H*SbIj)`pGcz!JK#
z&yg!FBH=r-WF%QR{3?4J(G!A(MqLwS+X3u|0G!W+JdL&0o1(%Nc)3X>Xk^OQyX=RR
z*eIHa$UG|QsRJ58UQd+c1njg}4RoBU*$Y}X6iq{moPwxhj|=5<C^<PJtx44aR7hTa
z5bun*SSh6ertUVf2CGqIK!y>2E6>SM+Zj6>H6uB7kJVPzQnkR@p*n3!HiG$N3bv=H
zX~DAqE0yHr$4Gl9gI&7WRa)$`M+<{a(PTrl!tg^IV5l|9xn^l4)(Ww?YK3VT9bT#J
zncnhA=H*pKUAA13Ps(<%T<M*#6O~xl-q(jojIT=`6r-{dYRz7sSm!iZUeK}cv2xAm
zEo_be8|8Wil}%0|4ts#Y=F2A?BAD>0_Crf7uzrwA)9AXS%>#I_@pVO2JS_Ic({DCW
zL0Cbs!dz35*-wU^k4@9{*y3(%Pt_Q8xhgE!`}kNb7(S*@ELWp+){fE|_cePyE-xd?
z{ce#gla4?3Nkc_FQQYg;t55WMGa+8lQpF1f08-RT3~`c30C`^IKN;iVhwP4jo^oar
zRHk(}akc`d6J1^PHESv!VuvHSS;sW6<lTIq<UDMA+sD!AVUuy#F09tQgmSYk(tS#u
z<Nz+TI)tT-H^<dbO{&JpLkxqJ!Hy0+9WB~58Z|p%V?fHihYh(l3oWGA#`d<(xjq(#
z68TyVKw2~4#Ar&na6>^QS4m4e?*5RicC;G-l`Ji2Hzjpo{{WI(7FtDAdOUb9_Z1yZ
zl-;JxS8~-y5H@HfS5;R@Ex^F=yRzrQ2-j?kV<zmv^)xjwu(q9{r^?1f6?>}p%Ojnh
z4-3^Rsf9)NWmDBrK>#idAF|<wMQzb`v@cFpKAtv*l0NGCPNWTP#yQS+fU%8iwG)Ol
z&TD=a$ES377z3W$lx5~PE+`yP3~sKkef<&|e5)vE9TP!#%DZTW23d`0Ra%{MTGO?8
zx$`&dz>_#I+TbpVXl<7TL8w(rB$#nh=@C8eyNOi8ZZ^ouZs@w0i5qCzPuXVm-8xAa
zcK`y|Q^#oVE~>S*9fXn>Ok*mvE2`P#`n>~Tc{~+CS398_TI(&3P(<fSLqRwAS;y%z
zO6#~2_FecJuh`+q7T@Y;XOYL==Uky=sh5TeTguZ<qC7I?ijPyJ6u_4o73kr~7tzf;
za*t&#T#{ekCGM){b&qn6s*#`@D#_$;V!N@elSpH(R1#YEwURzxn;~S71A}$h6dNXU
zyk!k6&fp6sK4aSnt#gki>CIL+ZYPYVdPL^Q(UG)WOds%-n1DflqT>@<5g_&#QMsna
zvPl^Oy`B_L@B*E~i`_=+eN#kY8y^=+8Zb(mVLhz5%&@sy%ntltggc2G@`;oJhJPF;
zR%Jt3e+p*Uc2NuqrQK@}l+<rw4Y5mL0q~(~&63>nd?J9yJ-{I*JFj3AvK}&_2i<_3
z4v1X~i14A32j0P1v8KtAFkAjpa%W~Zr?RcFKXyr1x<oFx<pZ<_3@fc9Hw#KyDHz2v
zz{YlF{2-*muB@eS^zC(9DFw&Elv6tHDQJiSPbscv$^FyZdnP&8$10Q}l0>xFcPi$T
z-HMi+66J49EZm%?k7RPSS_@B$^#k&w2m2{0@3<@aJonkA(wqD{p|$g9Pn1TO;Mjop
zKy?(K!mwUuNVhZC!I4G=6Hz19cfmjtlax(<<0&@ohS>6Ox?=)!&WPMcV|5#if$)hC
zIQd-aQl5xBmI6rnDEowe<#TRIR#N8nR3_v>2*uY*({Ad<8ekjQbLrYa7YJCTK-{gg
ztCxhx=<e$)ohpO^9fhbo{>yzmzR~{xD#f4<0v?tj8%9wK<H<yvosQZ$Tw7}=XO0pa
z3k86NIk>;dX$IoOKE~HgaX0hjV9=mri>^QAAU{-~w%_uxge?~0_fg95*7jXA!J_x!
zQtFz6Sks#!X0lB}wXp+ZWtY`8N4${Nk`x+_py`}IIQpO?iPF3hg_?%B(oF2!qo^oc
z^K#OS({%0RV3n%Ubdh20x>1s_9Vbl}Z?$Xmnh?-1x`$6|EoRwXQ9v31vPrr+F~edA
zLm9%40Glfr8~i)~f{~|xWec`-MkMrv;|Q0Fw*8Q_nC^*r_9T~OB8UhVQo!4l3BAqH
z6y%_o?GG)o4zK_+QO|dqD*D#~K0?Wch#Ek4O^UFFP#Mall5pPlDWb8?8(Wj`sll>x
z$f8+RR<*4;vZAT0mT5M$BjKW!rPqDKN;$f8P`2f_DzQo@4qUEGuhR72S>e)K@7ZYK
zhMJlzY~fZp&S~2o0%V2cdx`zkD#-B+s;-P1G=*IxhDTkcN3@qIspHO2a!9msjg6le
zQ!+I(Bexh&4YHi4W#Nn-R#}91AqYjC{#Auf=_m(t!c^IAG*3^-MUT>hr2SpdmcmEb
zsNgfkQifQrOSxktHNxyFwpQfjSjv5;wiSEwP1aqNeGoFjQJh~Y&4rsrY=L82>I|b8
zEEO+DEW0MVEC5lu_gn{Tt{@)i8y+fzx<`|=r2#eHprvIIQB{XoKnUKas~+-(2i=?D
zQX*t@Thf8)ixl?|26BdmK-OU0M^RSRe>eAAizeo%A;b>qC)6}tlBufoW-yx-TQz*s
zn=^6xDlBAWpXkt3>P%oh;Hs+ieb`}9Q0W!b&j;Oam7~(SI0uJKbMT!-B2voPm1wN2
zeWMP~fUUItn$%`Hjle!u`h!QMrC<Uk<KZ431Wn)tx+L3XI)kO;j>bR_m2XX@#|Qv`
z5w&`ZF^oI~PgksweUAs|gV@OzA<;z35&{mcz7_+u?fWd``i(?{`|N~tk8$@rlvD;$
zEUR@eTtggCUz?Tr+(&Luk7+LFDoS=ZJK+};knmd$itjfU`O2I}kCh!O96pGy$`X;=
z3~GqS7Rr!V*+x%rmhLu4*+i(2Fk1IW;hbF{F9Rn1mlJEG_EjP$@S-4>6*Poj=fa5c
zQ=)AO#{Ahx1%<dwZT`vQj3i?~illpNa-nY4fTpOrjh44$(PHFmd@ljOU;Cp=fnWgh
z*$ER`ToF!a48qa`M!S%hZn&Fv`=*y4?tw-)0#uDQ<R&n?{{XP0U~xG{g|QECMiU)n
zDPjH8ayH$Q8o}L*@R~@rRIUQ&0_rDQfHJTU5baoH&Y?wUh_z@Y_+KjkovZ}v{_
z$w`rp$fjmTD0bU<QPTqFTJ};(;uvl)nM&)DQzBAMf?FBqcL=Ixy90RrknASNs%~<U
zMuv`*ZFP@z5g|)HU&4vQJSqD-BJ?M;_xq&ooChgD&(#_V5xD!Oce+q=mf>L7fa2Co
zwo~pcWWq@Zp&7tilz``ix5q1o9up=chqBqRztK1W*x57?0(jvOIvfTtll-N(gwt{4
zAjU(lj%=5An<%bNB{A-|b&y#sju}G9w%5W*p5xphWDYnAi07NKI=gKkpP~|(t#qe$
z6RNl8k`#1UlXI_vs*Y(U7qNrQ(y}qRI2fJZzX{A_W!4S={ZV@oFJz8onSRzna8c3#
zBCvJP1D^^KJMj)SBPm0Tt!t*=DMw;5mX3xz5!_`u?YFg~=PEq+Jf{m-d?7-d<Kd?1
zo2)ECk=?SI;qZz=v5tMa6w_|SImCX-Cp-?{x}u3GN{0*a%1fU=Wf_*=%%c;u1DqyM
z5#>lHcq5g<Kn>3U1nQA%0-}9I`=jyLuR1N;EMp`Bk@LbW?NqW<9@hivqIB;(gZr$p
z6P9#cK6pD_K`gL~lHjV1N0L-es2g%G_e`K8%Y7CS)He5O9rC)?x(U?);DA1*K`iCH
z&+eN@M>#O}Joy9VMI*=ckKI(uRWUnTypzR+)GwB({{SPuVzrB9!Ke+fYySYcVXk;N
z7y2qW9a3xqNKFw{J2!CpVFv6RpQc>Ns=d9+9ooKZ;7CBnNi(?*K1oxyk;1^S-?G5w
z$xf>i_+$R5%y+Ea+hoteSg8jkw)-n8I(hA8xt9L`=|+TdU=5}YAF0jywHZaE#`C!C
zKLlA^QPR9R?u<EKY0$>oe*(j~2@T1VbUHyU7LAr2tgk6_mVgVPVzq(@?h8Xlgjc06
zAY<V*fUFu!B;p$$=IDlKklOcn``sSVQr3gCpPjc*PghveV9)He(Sd)`STFA<91x%y
zQS~rbenOr~y7Ds>$I0Og`n^MO2AJE(Y8x_E6CDt5v@m?(5gjaS&d`F6uA<-Vka*yy
ziR5s*oww+Q%~lqDq*yfkDPyVFKSloN6IW*2ljSq>)*ql8tc^^teS5!4Sbt>$>K^|9
z)Eqv@IW<PJK9!HbQJrC#z-{xM$*9j^hjY$&?wnf7XP)Y=ZF)8f8x!9MSL?9kjQx>O
zW-i<#0ABdvBV7w}U7wYkn_O+Zt#$sWIkjnz=_cM5;LMGas$d`cjZwc*f<NaA5bFAa
zi;?n}>E@FTb<cEuHWO(5S`DZ8hxb9xtVgtuSL6b+uP->>LXFKi1;nDUpxJ#ssvJoU
z{m@R-iFW{xfU2E-E!jFJZ8;ZPf<|n$73A8%E9(QSPh=w`VHXVnN&`75Tu?5>{KHNN
zxKCr@c)9y1+Q^P>0&tC%J6)7PL!>cn!VX}|a#ZrP0c(UTgCF5CF&@wgQ}JZcdu2EQ
z*rsf16SxbHkNHXf2M6qs{noJ35alI>tdx%8={Rt*!J~$IB`oh`<_`9{e&7ZN-78>7
zgf`da{{RUKPTuH^%?JMggr3{q7E8-vpnG9=f2tv&q?{yhZ#*N&DFd4fB**^%Wj*#T
z$8^ho+L<wE`Z8)r<8QT>C<nwnL1CU&qNa*xFzjWOQPbYn+=5Ta`K<7heH`&bG?0_n
zT^b!Uf1vF|(?Zs_Av$v#8`*4Ft@Ko7KA~9?hS!vAdi`@S97?Nex4c_~d@!&w<b4;V
zhr@4V<&uJ1)m71(xSJwi>(5QVJ<bQ^Qq@Esiz?^oEOWOI7p0HJlJ-UA{*ObU>)2dI
z>A$+LcU;nJ%<cWxkk-%`o9!iLwLx0fS~(mC9I8B0PezVa?Dj2huPFBxwov2nQ9UuQ
zvaV1;<nq3MZuZUUO7ipMt$$8y!jQJxfe8|EWpw&Jn$l}n_}ga%bqt}ymE#>P)e=;e
zGy=UZM4m}l3$C3z6Qe}abneP1cv7Ad1mnVq%3jJRC1xS+xL~e+5?v_6&vc`N%i%a2
ztYJ?H!-R{6`B=n*3OS#(q^GljhphhqY^*6stLm+%y~qlhE~KV(g{D^Dj#X!0K1k{1
zb6sKr@J&;xD`@p6vvaHs`AFMOL9^-VeOjJCJ;4&$ppaVaUo`1mds7)3<gocGSEYU-
zG+TVPA5?iY*{vScB|H)i8iA?OV2~eZSe-wwXx;|tf4aS+>bhCDlz!`TOw>0}>6&S8
zc!m6|&Z*GwJRPhV_*<xTig|#u+EERf2}dCvGg0FepNGTLyJH_)E1s3<H_=Yl5Jip`
zsET@b=D|$`Bq6|n7UH`G$@*@a(TSmHA>b<N76#hZR#EU1ff6X?7*F_3aJX0|SE?ZO
zAb9v+JpLnTC-X0M-uK~sFRex$6RtZi9qalbBb{dQk;d4`*3SZ-jz-8pZ|<QmxxJ28
zpiQJT#GRQx2uU<6pVMG|6&@Exj&mIaIgs0J)tx?)9sw=A{H+Z>iWzTexu(-v#@}k>
z%NCC8Z;~++=wLMaf3k|3Nep+joO~_iT`OAL0ec`~r6u@o6m67IqKaKU(D9F=$n`ZT
zYaDxp>a)^XE7@YYu9P*7Bn6`O7PNVzw>90=&`jo$ltl3j#@<v-gx`+*u9S{Oi|r1+
zSmtR2h3efMtxxQ{mL2lEa)G6e$-39*HE)T{7a(7<=khUfh!ysI5uoa=dmDKPD@{*c
z3wd5K(^{b$L3nE1P-<J60Cm^Rc^PMpML5~9lDJ!xG?jwf*-@IJMh;LFRn8dPxTWO3
zVzgh)T*3Uv3XMcq+16Rv>!fw;Q2w*ra^)YEQWfaFHM@xb-9aSIIl2a%IF3<m0@)!`
zjiFOx4CSXcPi=ghHvu*6U>C)Z?vgg}Mbsyby_8c9ZBve1<o49L#>2X<Yqy+mkE3e^
zu8}}?+a+{HM%~$2&ZVbgVR72Ea!(X&>=q-ebvA}PFlVy#JZP>;g@4)QU1G-ihk@|1
zwK%<k(sdn4l6M!I_F0Ofa%>ma`0AjMH`oN0F1?g9TW(Pg2a9D5P(8o+SM&nDe4p^3
zcmQyxlzY6Wq!w@01Yjw#f`gNURY5uMgp<FOs0>K5;oj?e(As&ZsEk{|SZYuATXpMS
zh3#vqBR0C_@|{Egz(7C0mQIgT>3smY7M+&+D_ZWH+RemWX?kKPg*$lRTh_J@NZ#Bp
zpUC375;3#Ib$tx6$JzarT|ExTxVBfMbqsBBA~vk$KA$t^xMkFSUr49M$Y@&Vnk+1=
z;jDWH>bf!=9#a@4hW1tU@Cs*baToY1eD|@wIxHz?bf)fh6~#1-Yd{MzNi!NhP(;60
zhA<k}0`G;>86hf-Om#7{E^zuHW2|(9ZNOP7O0gjhbFi-IDjQ%LE>S>j`Ynvk4aQ1Z
zc&3(6P6Ap8#H4px8ZAA=pn$E44sS-L6`{Sf;9Y5{^%jQZ)>&Dhk_MflAy>9~=_c9@
zg7^G*%BV-9c>P1v77jsFhe|o+0i;q-C5zrl(bLd?%&w=8>|R!7D=CX^KqY6jXeBHq
z*bC8XX(J6d3nQ;W*0IE!E)3Wsc2g5}d3L(nIm5cb>-GW5f7C!1y2A?t)C1aW;Zh&O
z^rG}+Vw-JnxAj?jAK}$Zu44c=!ts#b`mulNy7phg5(8r=j4p2_oOwTy?L9ijmNb%9
zzJ~2+xmj%rR{CvM@JvmBR`F#>lSsXSOmc|5!mgxt0zN#2=ym~9#|ehPC@TdHOmhKF
zxJrO~0jYpnD>baMVK!R%S_@WRsn~xm?YJwO$noQrG{T<}gh>-}_lx*J*H=@qgzf=V
zJ~>OtE^#Od>Ukd0J;&vI$C=?gO3sL6ux(>n+~U}c!q3#!mbAIVlC8#&=eq7qsnJ>)
za@F&B@jJH8h|0`$eRPr>k_UxU`s+H@%F*iDX3Okq%~eo5NsrkKSknu1SWwhDKr8_$
znKb%}v5-JM6S{Vi7@8eD{HyAXR+63*wV+rozA=L$<k^eVG+_ft^!VhEu=>Ce)om^u
z@U|UM)Nh=+8ezEc@D?y>)io3P)4t@KuDo4a29bTz?Q^#6Tj~h*LJPTB-jUM?4Gn2O
zRlBCr$&7AZf0LDRq;%rCDJJ(i%>=Heq?OLYY_#xcY`$6*tuB<nFSIG+=(V??E|g?(
zNZ(fr)HIz!f*1$!8Y~tM{XMNX$I)16v_!ZIlD)qN@_8|?5kxXzP2HOsopF}iPSW$(
zs>zLAX}q#J-Ub3QP1CN>cB^=(n$gAAwI3fhk^5wN`Z@kc<NhejyGkw`A!;;d4B2et
zWKp*^LP}XC8U>T&{AL!Y5zi|;!>P22gHHbdPU8#7bxKO8bqh-846mhis3H8ji>z?G
z3-K0a$E%3gKqcLmljZnP!oO3m9%nAiCq+kim_P*iTbSBJV3UQ7=vi1PS+%{nTKCF*
zHS*atCfV4wG4IWRO?1Vg!P!E|DK0im4sq<B8CqHdqDv#3?n)i}r@L?&L%rdp4au1c
zDGg~WJFL{?fUf76n+nV8(%%gqvg?i}kW)cg0gd$+wr;n&d}Krj9haYUfIhQHZ*}PO
z#?TA+QJ;?F#Bx>xsYqB4xo0b9+~PMQx~9MK@wkqD7oW3LtgNr}<Bi*IYpMSLjM1Ex
z8oGD{(s6a6(&$4#CAmR#-4up4x<GDxtz|TE#K2u-*x|Y-TLOGi23exYs=AHRUvcGL
zR#w8mKp|3AY7GFKeM+RHqV(*dg_JeAJa2X0I92n~(bEE41=O1MzG7p82`Axs*HCpN
zpu2On{nth)<jbUlmkfJl-%x6l(J{?t*4SBjj=x{)%;GLb%5JBv`h=G~W_2A!(vr|{
zy?+<QlpV9r@-s$yLe*4mJn*ZkCHYZHG44=u%1#%v2vRs-WX_avbgXXf{{VCWea|S0
zdAkFJSff=0x*=|POl(C>83(#qCxS3bosrpAF|#Px(8JsdB_*vk!mp{-*e)XoFZBZB
zbLCm#LpYi!-qFTaN<khKG&RJ4i4{fIy62uM7O0*}-ygbW+}$f4U1MORAXpqJ1ZGA4
zI8A%-mEfExoC+Z9Y=jeK6@mCthMOMgq#o8xf-talQJAu&4n4|1@CCwjZJfp)Qn*-U
zG`#l0jnB=K86itS?v;#S&D2Hd8uEDI3mSr~0Kr4fPn9bP+L<U8zbTIFT?4cm`BwT_
zwS~&6AE{eupl$=QETSx2@EdKV1os`s2<HK}0_aB(yM&3d@q%c9=iwu5yM*_+4$3m_
z>C<9PC@!3fiv?*<kT4ZBG0L{3J-eqzE>shnsUbe`*&rD4WcG}OWzovs%c>~}j==-2
znH?D;m0_hqUeHu})H`7}1#o1NQavvo9FgZ5ho~lZy4gXO%-`lJ(^DVDb~~!~i=6PS
z8E7-ahO&8kl=C~l=am>9aFOE$Q5@4$M<rCZKixO;lX(g`LB10<pQ?H$**E6q@}!2Q
zc@3_HV+);N71oWXx<?Og7NibT6{Nu<$R_sgw3Kk{XusKZpGE1kS-D4u$i<M*Er`HA
z>Q;+m`=&LvPtAZU0);0bGWYr}Bv{`ong;{2!J*6_DX(Y-_xmSsqLJdu8I3NpbIO8h
zjezAcs-dm!v)Z<!Yk=j96{>1&WxzKpDX3SvR~r=-RYa3N^>UJ$k@C9sN*W`liPAp#
zH(CuZPIJpn)i#f$z0MbE+UXidV_J6N$t5I;LmQA5lcftb?Z8@^8YZ!$7*bNxHI`Np
zGQ#Ronb!<d3?U6T7DT`^dn9lm**+nWbvDazNRnFye5&bPV{9ua>?8K7xvX4~6iAkl
z*F`uRA*h;BZWaqOM1+eeVIVibP)PQ-n;|6BBVfVG99uM`kabM$XCx{*{XwMdY04U|
zrh2EAL>#8mG<h8$eB<|4hCj2HFOljbbhOjfNG->eprO(k2o8OT?u(;sH7s@v7YZuP
zKoMpF2hmrfm-dsf^2*3Y*4pSfCXz#wV4-m@b;%`93k9;0StztHUt$1CN3@Z2Ls&Zm
zlDFICC&<~+@FWBqZ~p)So}3O795aBXgFTRL#!;eC-~^yt4CQzEU3+pYm5z}eK=%3a
ztH{qN`QK)g4fBEZMFo>mfx8w)c0$q%yNn{u`yuQUG~VfUla!?2?383I*^tQ@?Kf5O
zw#4T4Rxda=3cgR*^UBfeXVDx?_oGGzQ1Je&B1yt~BkV+m_DD^KH%Rw@F0kW)=NzWU
z>oq|oOIkAEP&Im!8V|h=ErXguRq}IXRZ}xq@73KldiKia27-QyI4ESTkOCi*;aU-+
zmo8NL5^YSewqd#j($`fw(Z=Em*lGPQ32R*-ztk-aE{{n}&_r#p3EMfFJpTYp&}wIR
zbnGJk01IKJXmk|q1@T<`s|n|)gpdHY!mg;*V+4kMlJa0tY`%a|Lckip0QgRlz8JVI
z3oh#U9zCS}R4;VTIVQzx`(<H?vq4p?fqlC`_*FGpr9_tv#n6H?VtHI!kJ7cGs|sC%
z%=u(-E^$8!0^3@_7UsLcjm_<3$$_9?P0kV<l`$B-ifI=YOo_C?We0V_bWb2*B|rhe
zEI?gpJru@^IwzMKT^Qqp4GVCM*|c`Omn`1S*o<#`rE8td{)r9qgyGIcQj{DC^L5!b
zBeLspgs#7gpgQPf!*6hy=SQDvbcFZ1h1a?yTG=6c0JXoeLFXzkFO?%f@RhqBDWV#Z
zdm*>De;^-pO-;vT7a)8i6=F_9W0Aqa?C<3q$6csc+6#s5j4T0z37Qr%J8(#C&-hDb
z+kin`U_KT|X)(;O7E(3992F1%4in-4T`;7e-6O`~!bZ8H9g^>8?tzwp<cw$K4)zYn
zsR-<#c)$Mufe?{)v0O+vPA&MlV9qU+D#lDt<xJ=3o<Rv6&kGGiQ;*@_fQP0wB$Pzo
zqag)*AJR@!M3m5cZXMCIt^o3?BbUf<2--<S$0$o;Bo{Zh--OE%d*wTlPx)Q_(j8Ig
zX5tOD-FEIS2(o|KFoF&_@PPDlo;b4X-uL~Jec1pcyZfw=5h%#M5)hg%eDJ#WSs97|
z{n9k{3Ay^DC$e&F(KB6)fTU>`@DS{9BaRe+-?AchO@azzh`q1Jb-;@RpEkk_G%%5V
zR8mL=J1HJ{Lq5j^7@;RB5z-UItfF&`lAC|<qj?~5Lah<93CpZUl@uGd@qdK*oIpGk
z)W+9wZsf?Ex;f3hHrS^^+dDhIbdt=={{XZ>OC0dr9EAReC$NVL$NGryhHbdz5j8{}
zo*W7Af%Vusq~T{?JgFdomlS}WI76D2j_M~>fC>v3@5o3x<D30bnFC6!eP1>|vWeAX
z<fHKt{{ST-*Vh1Jl*3X5)l2G)xlq2W0e!%asy`YP`6a9B!MISms2<9qTGsYMNnUM(
z^}2MDB`mUK+>-)_d&R6s{na#;&N#Trh1E}Rz;)5Ih_=~q=|%0heH1cPhKyL}%BXa*
z5PifH(#ak_-9gCT?68`>z~I>jE~5P8{^}7z_uu%0j`l=TXs(dwb-q@;2bZ8n>M|eZ
zC+NB=nx`AJ-(nTzKTiU4{uP}sPdgUcd>f@^vnt6eBq5+(6AdM6pO~CS!q~&pbt1*A
z1sfiZQxNw+;(m#2-`$wDP);&f@%B=-l5#*B{{VHhWgD&Uh2c6nVAFElzy69A7VOH>
z>Cbb6-?;sioD?zKTw6cVv<zfqV8jQ=O(r|o2IIolV$cLybvy73V*daZMa84SM=Vka
zpbxW|`(aAy>4y(<R@%@kh598p7XgI*6iw4Me<N|>66%&7CKmZATU5sj8JYA28)oC|
z5!B9M{T4q}!SlvDqdzqOKH<B!DU#OGTW_XONwIn&hPGSU%2PDN1HUB>`if$Gt+(An
zB~>s#?iS<9ZZ-=n8#Peoq2uURGNxgdPUjy5QpsHqzS^Qs$V0nOa3as$_DrBLrZwi)
zCf7)7*cwTY1(rI5w%{mao>%92%G>~IrPLT~1nj@;gr2_5B+A!Y!p`k;vPn)5-zMp}
zp{m2D)g5~<08q}<=g1tWy%vwEQxIB^R2duU=YQ(w;Xvn1?<k*00rHTy#gR=Lg9g~*
zP01;CV<1^iY^I!c%GPcKVS}*3R<vUL_D{8wZU%TL*f>zF0J_Q6w*fR8Wp(r63l9-p
zYhKw=o>R$Dz2ElSBA7Ukzq)K~yRJ%E4p&8U-DVaM9ApeRIliVcM`Vp8bN!cY@5(_K
z@#<V<NFMNV6m5OG6)RnSd;Bbe=xmR*_h6xAeeq;eq#l2|7EXL73PS^|a=QC+xB+aX
zAP(00tT^C6y{@|A*0{25h#1L9`z#Bw?&ApvcRVJZ#@G9<1lzjCq4y!!;dcJkOu4aL
z+l7LnNxH)zBo4MyI}a<Z@%yD{aqV!<6I@zwyU%MRBa|q^NX`2N*9k}%IbF5MkhFcZ
zT}Z|>?Ph+9C#$f=NiDMUZAGz$lVSH>d)3plF~AXZ31Nfm;^fgoC1%rW*$E|4k=&aq
zx$1*uJDe0IwY&nYkHm`F7Fo;aWep<a1W>PNZHty*R%0c1=Se)PEKPJL$rfoFS-IHq
zjE+#?vo!Swo1)uP;cL4eRYatK+Gw(>V;&92x}wx+*=vz<ijuvdry)}6T9ZxeRc}P9
z*-5E12c4KIZ7#*lxaAK!{a4=I(VAehfL#90sOcV=&}<vpNaD-cx_|wa_g*c~ZvG&@
zkiDCy-TWq_=uc*rKhRXF7>*Qxpiv5VQOUx2H%xL<5IdC1=IPRROb01KhmKR5!fH{<
z0UQrx;rdfA-8g@gOi0cOhNyoG*-FJ7K=u^Eo^{u(-Agage9hJEE!7`>>*`Lmj`Z>Y
z;_K#)xThmgakujo7yOOr&BRVFQo3Nv*x39Oy9g*r!-c^L{geK}S*lb=`XzP`m1RZL
zwXt&{Ab44cH{+4?Pk@`;o>K6MlV_sooo`bS8{{MER;Nt-M6-Z&gZExN86~`ZRE&+~
z)*rGC2%?enK9$#SO>4Y<>sh1q3{@^0UJcjG+Bm3<?K_=i>fHilGO)P#OU2o_9_ysk
z30eqOF>teeI)8-KqmO{8R03qz@RyX1;bD<is<!c!=ABthyqtGlpQsOEST3b#yN#7G
zM&u?(Q9S+hU>lGRl?1RcxFA_t)dO+>K+OquSE%sXJk^<|0^u7-unI<GU|}hz&kKm#
zdoB##BWI_B%SalcFjFaM{nxUY%yXTUGz_sAT#v(&I~SK0#?;e~K#&$EspuUvZVe03
z<BUDFJSiE|&8rtI!T3}7Yq8#YT0VEF(W+YVeKK;QZl5y;x-u8hvUEHpg!*9pl^&zf
zEM?v43w;)3mm|cRPWD>j-(_J)=f`cN-EB2)oH1NBJ6qvUjWO}g0Ug$qbSjlShv;=v
z?inl4G#aPuX>ltlqG_h>!rJL{I~p*&4>A$iM>bjtmpPW~gsGR3N}1q+U@U`tMaJZ>
z2P{5?uy;$GSOm!`gn2nCc_9tSAS&9{o?0%a!K7qN{b0r|l^NFMcNbLk0l?g#-%we_
zlx}yjoKxu09ZGpQeZJ_LS%Eiu{{Xtm$5P^XR#XMj5DT&ORf4uFjT%qS!y7+Uln&Q6
z;i1+;M+{cU1pJ|^qH9`9ZI#jSrMAT9x+kvc9g&;5-%_z1L#`RigH6=>yBtX*pWSAv
znoEuByF4f<OmAB$>$ghtxbkkRY9S04Jgd2b0m7=UaJkC*%xa<`Q#a~D)Nx>okX`6%
zpwKu?=*481b*!S4dvX-g<=9cl`c^SrIKe1ax8WI3J9a}$#zmGhLm{}3Tbr*?{57bM
zR57gm?7YGZ%HOK>zrvbU$x|8eY<XN>WBm!t_pX<G&!=FyI9gB1%OicjmE9kwv{SR#
zI9mo#us8ID^RtEQY-yND^oK}ow!s&s^!#o2xr<!tHUn}Kn+u#av9=4Bi@hBxHM1?L
z(g@)!iK6!KuzJ3SQ6!F)z}b5^(-?iv$yK_xnHh|Ypep=)Rk0+wA3o}k&rb6j1CZ2o
z^#)DPE7f&AosLOMwp^fp^xIkqEKL{oLQ(W&p?QoApp|E)Nl`SQevqy|(c@<fR(d{+
zJy3RY@VYT2H$eE=dD4`34JSBTs!C?IA!hbf-8ZL**bSDZI9eHNFQV~0XvQ|dCq`pb
zg~s3n1vN1eUv0|M*TM-R$a+dYb?m(e#V4XoSh{N*EpV;c`!PWsIcUI6F+7VR&=R0p
z=aL8<tiG>9G^}wTf%3MI(+)^OYBbF;8`(|cOl4`F8P!ythVoaNbqDEp(R(N2EKOu@
zHUJB+8rO~;aoI)2ogRiKaWQf{va7d0y7gbfYL}MAFW4_8skp1Xv3mvSe}_`Jt&B7;
zH_Xut-P!NmKK6*3WPfF-qLHp3G%r8VW_XRaJ(jOXsB@kNWWFY5-4b<1#*)?r8Xt=)
z+9FE<B^n$6vi8?P5|>>eCdrLAQnX<?i0)L;6KtlIgy2B#gEAIR(zDw0H$vdAWq7r&
zsP%KYG6I%Mtqx*lV_HqebR?|~HnOp)g~jgrpeJjZ4Y^-0`6;)e*wM_6CJVTP9emK+
zXdw+*E5<ijR?k$%W4ihI$|qD&2BOg+A)qR=rpDr2{FGF+Z7w${8&=Vf+m&A$DY0e)
zQA{CcvA7E<tv_?zB$wJdU1;^Xinqk$V%G4yv#Kj<VUfpiu<*L4<H~bfQ5T}pNh#t4
zfYd!C?VhEqk0h0ecC9?JZMn7Apne@uvZ|&s;t3^nV(=T&0+L6jbY7bC6Az|y&BEMA
zrN~%4rC9WSlNhFq28;l<4AYny`a<iE;9)Juzxh<D7$#6YGjb6T#&|1LSwPSZ0;rmw
zYpepEU&KQnL56z+Y#^%*E;~ptqKS^Zw%J|j6oioC5_rB9<xL^7WvG_)EdnuwTZS;B
zianrNNtN|cRH*ap3a%Z)<x^Gq@gHvsNb3-Mpeti$(p*C4&5M%L8ZL|%P}NsH7qzY}
z7VNw;teYfShWR%VUCCcXYf&}PxJJd}-Fu~f5Xk;Xz+OIo5v1hZop|zIkZ(d&H}Z@C
zT-YtB-z0g$!t_LLWNmG&WxR>tM{-xlXOHgD-3Ou<$MBhUw~`a3khqZ50fomV>#xW0
zqckk1Oj#ZXuqv{;O@rlH#YHT*0IA=jvu^1!SFMBbQE}wi8F>`x7)?)7bvp~3EpIC{
zD{A#h#={lb%jAHzy-lRC;D)yym1j?B4~C;~ZHLiuW@;^@UNUVOPLk2R2%6^$pCxMF
z5oA{QRrC`GBLIxqI(<ZtR|GOU8OF+;XH9)$i%G(VN$J=rPVxoQwGDPSE?n>m1)Wt)
zO^g2ky4i7MYTD4sDVo>=AYcN@3d-v=fK?+k_+=JjgNad8)Vfxaz+71+C@MoJqqQAO
zGUU4DW;IP|<QrgpQtLC24VF^ASH9pn!5<wtJ7VOY9)LQZUy+P<+_`zisaI1__dZ7)
z@U_~tKHyIz`B|Mt7DsSL_g_un$`MqLD?5~#ovAJ-D07ZVGNv$GNZ|!A0jD=!v?pgI
zqCqhiLdb7_g)GMA>N^Wq0=iSsB0^bmrG`74<v6q{smHs7(Pn6#7*5bLWIas`vT!UF
ztr-QNe|2?7O%WG!LbIO~bzs7#VCB+e0_C?s%S8Ckb?Ft*!q!+c6`9pp7;&?5mN}be
zO#EoY8H+iE8B2E_7f%T;;|Q8I23rcPrj8ttpqQ9I2e4DO;^~chY*!h1?4Z#GOSF@c
zn)ZMcE}6-qM;=NPY8ArQ7v)0t02ACrxkJj*@BAjx3Pf*^<RorJN<kO~>A|33Wgv=3
z@}Yc!=PE}u07{9?9#bZm$Y$%><vKT9_Ogli;W4gu>~Nh$G0RwN8*-9hEN-HvF0fL`
zdw5GFOzXm(1Cf<urn}q~bBnGC!m!gt+&d%ar8diBmhyy=nK=jOj`YW;a(f`A025@2
zUW+Vltby!3&ncmnJcO?21tA$!vVR+X$?3oj<SS}E0;Yw&<#VU-FND!#vp}$om<2hF
z{w0!M9zM&XBuFjgU37WxOw;Ji9+%1=sBP$!R*U}82yUYP0AQ~xFY`UW8&N#lRQ~{d
z!B?K>{Z-$^a0<D^kGkrD(3vExOP{J&j3$C_#gp6#2P&xI$j~ICKSbEubA=?WadrVm
z=~Ql&?YmA>k!+JlpmeVn81A-ubqgVk7XgILA5Uyif?BL(A+50CBb9*&UK@*xE)V_w
zR3*(O<oyzd3vjT+yRLf=gwh=0%2qb~@|;`k&J!4nk1LykmB3pg9#bCXw3UE`k=XDM
zRaFgOHz6{<wUMy<zq-om+OaolT!Uds!gYO0*9|K-G}27-lVu!|K4~*`W2VtMM+{%=
zg@p~FqI8ZIYSZZ&NhA`~UX7*@2eT_%LqHhDouMS9MX}>;>>EkbSimmatprdtk=O*3
z@dk@=<ri;n3zky0cg86q5W&X<O&G=skG<5fi-Ln=Q5?8DrHI)5Q)M|_3HL4NESi7z
z)l|nS&Y=GQ45}*0!wEM+A-Y9{9DsNFrK_%vHk-IC^YuNThLvADl~s~$ZR|>-g|ZUL
zq8+Mgu5m4h+^97Ada9W>8`&SEXonA*`>V~7Q%CG*7*tfcIcGUcf`$m-Xx(e~MVZa)
z!akt@`5yCOfQzP%;9I)QrPyPQvCR*8_Y%5D^PUk*j@^@H7Aj75&bVW)!Gi#?wUG>H
z0Yq+yX!iW1lPse{bAXvA1Svb`1vXF9$M-;YR1LzKm-S^tZG0(U=Y-Mdn?&NnvW?{D
z3Qs>o!Y;9>9;0z?0t^GV+^Y%4u;0QAfE<coqH16Rky)}HkbAjBhJY_@rDh`r=^Q}r
zmDtJTC?${t(ME2LmFHp4-2o(*I5$t8L1UF&B*muX!q-%c3C|@KF+6VPg*213qm@GX
z<}t?avI?tLBH@`&@!1(=MuvLUG;$SfR;bqCI{yH5M$=zdeXTo6xYGK1d2H$KE}20h
zPcwZ1x}u_`){Gk;2%0?xuB?YhNCj%Bw2Ek2H#A`rBjSW@Yq;TVUqoD+E40p-riG!;
zvyXLg9W^B&!$A8gx}8nT!(6MUubMzc;t{6AG!;6OF=3~U5EVMxT-!HrDv-KK4avRy
zq%peOeN$3Hq}nB)P%;yJ-0-7d-s|&pJdGjOvYwgbZ~_u(BAC|88hAlyQn`lq93-W6
z!jytX#n&@?JEEwJHrd6~Tn~;E*0A!LMTSB)ESM~usE9V<687`uLf~)0c(FK;?a8=J
za03J>t$W!u%*S-;p&Bcyhq~j&6Jb8#l`TshbjX46*=ao*3uTQC;qr~#ZDI66P~cc2
z9x=t2H?ysDFz~o;{gXp(NX?Xh*jOeqVztJ}OOJjM19Z|zxJuCJi2R!<h{}713BL;k
zjS5EI{HB1M0PIpTCPP!l0S(&3@`|aokZzOVG+2{XNf;r+DE5Qtf=$(Qa(k`<J&xSK
zEo96PLx~9izX5apQd{K&$7psGtrr6W9n?+0xbCEB0C0_n(DK247dfE#P6z6_wz;w(
zvIoX5!eMS~i!3B(gu@>sjI3(}b8q%dEdzu@*aj?^)`IZTY&@(w26dAi%CI!ik?oKl
zs)*7OO`a}_iv!4t+0EIGR1gc3a*Na=F<{u=!VU|Yf-spXB{yg#v4VNBE}9YCpyOfZ
zgmn`Q`6M9K0~q%-wbr_DZ<MYUaS6k*DraN{IiU7Ta2^znz0)0p0y5-c_6aU+d*O4e
zZkzuA2v}%S!fT1fe#r?xRU4cxnF}G#a2EJYIVq*qJTBZ0Q>00<Mw=-Et=&M^V*IWz
z8&go6!h^u%roK=+ganf{zhpeM79GMW79-0=gXI<_4J6|Hs`)C&?ojTjC%zS91D<(H
z7gTrPsGV1JTIsWO8|DJ}3Y-xim9oNF+Cj(JbuB<^h&NR)sf+{fQAJ%F9hn7?q=4qy
zFXWsT9E%?+F(|(y;Zr|ViK8W?eN<oTG2Xy6Yee0bwU#k>`V~~?xPLvAGU|cx9lWZi
z>IArp9#Q0tvgFOTmm4A7Sk{AnK2>O)&*V8cMe4W><X_<qV^B-=7W{tbX>}8OG}#dz
ziyXr4kdLylpy`-Pf%O}2o2|%OGw-XN-=sMI0ECU6rN-Ww%Jd3On2%^I^v~QY8g7?}
z<;`jHl&(nD&oqt-iCvaCsFrB6NtYLW7pKM2w2eD~xBmd7r5Z#rTr`If@P{M|XO|rY
zKry*V28`?3;lX-%q+=U%PaB8GP)!sUxquG90=G0}W*(nG4jhm?5{qw6HP)~f`mGeA
z5c>u>qv)b_uVxZF0F#{*;@MdbP8K`)2nhOpG8nM%FK)_M<*I46>yMQ886S@4z0l^^
zI1i4VnZKws{9P9WRDc53pQmM6v8^_7H(h{zwGC+SQzqCPOK|qH^p~{W;>o7Eq<)Ew
z@7+|Ii5hIl<8bkGhO$rQEkATrZ?IW%H43n9`674Kp(px-i96}(oILQTrLT++ctgIq
zjyQ~2GRAG1LtjT@>QJ<w`(I_vuhXxJceC$xlyyXh4RHYYQSPbi@^A8+fvLSwt&+Nn
zvHt-0niLY%QeSuQo%IVa8&FP7{H|<n{$N((iboqQ>S|~UjpG;p0I;BEsikgN8{6XQ
z5X*8flrUH$X$RtCT~=>)kEPUZsFa?{Qqkc?K<3GlLcC24GC9NDf3Zw0Yp?o;)TuHu
znp0T32#jNJ11Vb@MeJ0A<Sw=NLy*b?cH;L5+i~aWmcq$xfnt}C>llp!*8czrK(WUO
zY;T0E@7N`BEf@%SKPfL@aGz_7_({%jbhbAUi4Th>SvJEzRk;D<8-SaGl=3s-HNyV@
zMAj>T8L%9rw>eM2b@7GA&tRL7oJJ6A55hn%_f8q$1cYOpEyxZcIAY~TCAQf}Z}m|;
z++OI|ltlY;V{ertO$6L1h$jH4>6q?uZ!0k+qF~k$l7DoblL@$TcGr=MVK-^#ZV<6j
z9LP^+e(F%iTNx@Q1AaJC<Yy~v$q`gB{{UX-QXWO!fQg<-I0V^3WIez(MGm?dZr|Z?
zx{y2!SS}^GxUwN5vE^`SBwH#`w%!w?*c>myTQXEaTVdri4%W&t@SNJi;c#pxgJf)Q
zLOb?JWM`tna6(VZj>LSSU_ib2U2mQd9*OxX7mE@*ge)jTmbpu8goKrXCp_?z+u<#-
zd;Jr0{UtILA8qRuuX7whuwHZ36?t$MCd*e@Hs%|iLdfe72}wM!mci$_&usGNmA;QZ
zua;*_PC!dcUU>&9_H8&h<O?|bBB-=Sk_l!$i|R3Xk&G@!D{ZoxIG*cZr<h#ReE!Q_
zPogvp&#?L^H5zy++Cc*TO6UIo?PBG|I}xU5nCG+vrgz(tq?8x9kSseCJli<E*RO(W
zA_plT8rq361J!YPbNN0II*C1k8lES=k#*AGs0$;qb~ld5>LIn_*7Bfi5;R<}g(O#N
z^M%KfE79GGc6uK~JPBAl+Uwc+ao3HuULDbL+GY-Ny{o1lc$@S{mWI8W=zmC3*+BvJ
zg)&m8UzEouByv_@c{ouiWKe^YjKqV4;8b9z1C@pz4VP{SgyBY9Znc;#j`>M0T2moE
zDoH;{On}U9S4X-B+;%JHZn}U9=VSSb`bVl;cwO{gKXvqbYhQ0Fa_m>pf|3l}ge0&N
zd~w}b$Zl`hMCR_`s;-IIM^O!w5sNz__E$A9;N$3kb1dv}bQ_~~6+;&CFLJNws2bo6
zvt?7IiyykxY2a-bOEx@5QBelDw%~HN-4!0moAp^*X7IKhA}up}<!H7Rk6h{FXq$zj
zhlQKa5Ad3_ksJi<$dnb%O2m#>AXUTIRvW2X`j+mndkVz$D8A)PKge9a#KY8!ID{*L
zE~U0{A1Go7?7ir8cyjE9L5u|nj^yLz5=InmIqao0bYkd-(iXT}))wRiGi+3i1G*|H
zp=FV&1nE#0ylz`<B9XgW?F%iWkQ@jLXQdx#`Y$KUTwae~#Fr(o(@7rA0<5p0jm;pm
zE7AVi3aPgRd3@cTgi>Y$UehAj?W`AA8vQ?QNgH!@>$;^r_P7wU6<T9oH|Yzj8sw>*
z*_Cu>v|3%ZCB2q{D>a!$QRy~l!Xj!7jl)-!=YBp@wuOd5mU%!nLm3=!00A3UOyEei
zP;Q8~ki04QGfaL+?VG<=R24BZZfpTl@3$FI$qVEk3R3Z=mq9anovuSi3WlIM=F4MO
zr`%v5o1~W<i+rvr!Nu&Qq-G)#1AY;4)IKgvg1DDT^u_^IwUja*#4R0yQnAr$j=t8E
zV`hA;xhkTTjm?teABB5M542o%RMmD*qL)-{!NFNAL`mup0`wZnC&~?*g`Cwi_eZ$c
z-{`yl03R+h4=ot^foQq^0Prem=a<MpSDKt*uW)(VJE|&&GUPY1`nXEa7%Q8$=J{3C
z(t(R*8&LlMZ-rSmxx}V0Ey*_`$&y~()Xo79JH}Q81IRm+B*a-uEQaSOIh}H_XnisM
zD@pRbv+#Riord-pULQ_Lm872Q*FOs9Evbsf0?UieU!gPWZk3gvmtb#&sB4DMZm?Y;
zQa>*pk7cfkUCkGA`Pn~3pwbO-1gT;Gc0)%a8_IE<o)p%Ka<Hi;4Q-WWTiq$J7(`{+
zB||%!#+!1TeX(1zwrCj8T<a>@jjwjrkL-=AGDuG$4;&;Lxk_!xf;2-FBS{Bpw$tfY
z*8)@!hTh%Pl`A{;U7jmZ*z(zRrn#*EG+|q{{?$bUp_Tz36oum}==^-Q8b>Ua$J96%
zsVVJs32(U*PZ_<}Y*{j3aF=p$jUkN_SfStrU#nC$I9y3Z$TothHL_h3kZ(p^o=f<L
zSm~bT3)y)#yK>UKSFS@reXVundf@iBE^FD}kNB9WffZjjUY+=K7&czPd3K`hl^ecR
z)1b8-u5NfdE-xusvzy30`$hrLv<$6Ik~TOmKk4mLbZi&>mbQYv*0(AiJfjwKU7NZ&
zJ)-3t*MhUUJd#af;;-TW4syMmZq<zz6CaYNXX#KzaHnCytLP)UC|*b^f8|j<w<sep
zc?ngu;_NEb%s|!0c952R1sNLYHoewu)efUO@&H=ux<FiTs_OK;;F1^5dEPsk{Z5EF
zFm<xX=XX?<@)lgJ&ZDL6y_&Lmu9){Yi;zAS$Y#MPN}1CcBPUT>@gesjwEE&s8FGB0
zPJ&FAAfK`>n?#mBaAEzIZ;6gkdM7zq6x8z8MQ31qEY7>rEuJ?3-Ndcbbd!J@>;!x?
z4B3{h%>Gp1sVWvQzR#XDu9TLL85+VZo)xd*jZE~~qhfnagRs3ftLPvQInDrKdFF^j
z8t^dzhhcgji1MY9Tx2d-QqlECM95u389l<*u=`dIpk{mMVlF(iEz~D-Mpx5piWxLp
z(2`Jtz{<31LX%)f@u%2siZAs0I^-)#7@EKWoza4y9CqPo;*4I99GeJ?Hp!AQ{{RW?
zX#q9B_c&Bw1(XmCl~quZN0#KPiJUEE3{3>!B$O=4lyy{-7)WbC$0d26U1;*X##g+O
z3ii1pyABouuEQ9|18c5tCmeV(nB?z9C#NX=IKl3;4;xwCL7}oE9f92A*{elOq`F`n
z=Gc7~&Cl_xBeZs`)Kk(x`A@aKb#G0kv;bdY^+uX813j(bRq7RvfcuKl#r`td3Vh2W
z95FYLfvlaINV=q-RxWnX;(m#SS!KyKA1jkTpE*a2bW%8ydnBt6Jl)nox}usN(9lo9
zbj@$`dx{2qt?WLF&AE17kVod-Be8&)KIg_p<8%vU0o?Gqs<1L6XA7@a@z`T0%1F|_
zk)7&Fb~HG;LQlzFd#F|#dV^_QZvd@VRaVID!MC#WO=<F(98K4`JZfr;qLMeAHLbL`
z07?3-#Wh)$8~iU3=_-i@SZQ&x_6-59l9{~lzDM%7RypXB$n1|(jL1k;57Q)YxM>Sm
z`fS{VJTOJK-DTy+BaV=+<+IJTJsxt>8rxsUSxrwvkX*j&+pA%v3_G0Fkk^?;8sN(k
zy&oURlt^TO;~K3vhV2bF?z5Fmki7D}H&~z(JeIP-XQt6flMP=(<9Si7oRUw`kcye_
zHz6#r77PWmk46n;+%08KtV0|@&2KBR9!is>Pm42UqUuPUV`UVk&N)ceuE>h)x1uDx
za<o)2J<S=n(PgyigT0{gwc1rn1YYYcIXXN1My{D1T`PzqBgwj?t)vaUGPD|%aV)bM
zvlaDExw*1frg~FxpbD5;+ne1$*zS2rJooQwD49~**;{mZndt=vfB_dNjv!qimvd8I
zZg3E@g|WBFcozvGVI>tCEHXk3iou-Us)*qkF3VUUW#r*6V<t!0AtS;=xL_sPPh~_F
zMov#Dwk|dbQp5C4Yj*ZWMobn+{HVo)t=$tlt#NcG^D4pUXxU**2LV1nNKw)Loc+|Y
zn*)@x?Cr(SE4cw#X=5$nRuHUo(m@Hm4|L0yIEG`w0%CVtly*xmZpbOagU&w56<K8F
z(E&c>(&9>a-NNRK@D((~e32zJ%YavOR<J$QEKjqn0=A=l?Ucyp%GqUWf<6+(ZP&e%
z8gY!N8*SGmUOgOs%?^_w49*Z8MK$7Z2PtVK_5pQUu9E28&F#wJ$py~OM-<;0Mn1nX
zxZji}z<d7ybnQSNSCkX(JC$hkPD$8gY+yNZn{0Qs;HrJ(*b=Pt>KP_@z3iT>gLDx`
zLMC{&L0WAmPh>zHw_T;_f;I;`9m=%<tZj#6vUDe6ld+h>5^2G@A^8UV&{M^H-6TSV
zY@40gOBug!q8>QNJfb1z#g#+YWKFw5=`X=eW5^jQ3aXa09Q{zRAtsP8-NjUDT7zO?
z_b4?@MXU}0thIGalfML?qSg{!Q&e=WEo+r)BYe_alBcJke9i>7`z;=oqY?ovB`b6`
z%FQ=SFK|0nw@1=I+H8)~G_97qZT4D9DmKQ}{Cp|OMe*YMA=7A>z&*JN*|CO;S#(U=
z2V_77$`W>VMktMq?n0Q_)=d_=dylsEQf#UrBiy8C=}})iC$xandjS-#_Z%j%;il&b
z3dw|bCBahGYR!xg(|?Pnj2kCBsy&wamZ2PRA9%XTR@T0vLe@I>P}NOQSnCVeqx6k6
z%^~j{_*RS*c5>v*<<PojlO)!BoF6Lwl7<>)iwyjPtR^;q2mb&nMgsR_tk|%FWbJl6
zqY62rE@`?d7{N<3J-A5ZbS!0S7+P?SrWWmG6@WY`-~!yGlPZ-24s4*PJ;+l96yx3D
zA}WY2lvHBux*Q9hQIU^s60wFBg&e#UE5EveVm6U<Oh8JOpDF|Tl=R%>rt~O9lSm2I
zDULZyW<*olZ`B0*UkJI6wN}d|oN}Hj#gm}wXIaRi@CELwV5kksNvrHILOdH}-e{y9
zG{9W${^%L%o1Ci3okSapf`nv~)H>0${S~7M?B<?-py}#C1qCZ+n12ttvY^oFXK-|*
z9xSwUIz&)3Zw)r=s*Y(+O_*lr71cRy^VuIk(vq>j%FHd;bv!KoL?u?C0|5caTlxm?
zWko#;DOq6{7E(I7@Qtjp62DV$aS@BE$5hJq8~*@gIN3;+a%xkOc_9rnvd95@iBU!i
zhyE0sYyvu64Z_H|@{?)vWaRb_gn0vqjc*D=!A$_C6N~pq*+`&C?Y|`?EyxLH%kmP!
z4lHhi=y;`Ntr)X@Q2=>EQ3JP>NIjQ7v#QST-6My$%6amd><jr!iP$sLXB?F*gPU6F
z2Ye8n1mG>gV~GQlx5c?pzraj{kR42}-a)mLaXUEfx~KJ7M#1Fpi>eViWvvUY3Fipw
z6Ow?T+8fQ0_aD?hbry9dsBOFyi5!3X3yrVg5M2rf%0ew-Qh+Rw*dA6IG8=F_{^=Yp
zZjheml)~aZ=ulfE&j6(#OQtpc;uM)7BSDKHsI{^Xrq=L^sBPGw*>TD-Mwr;ZF9BOJ
z0kNbJ_f^rbToYwrE&#Di#fl#4cV^ruB#q2AIJ%L~KR-mm;^Um8L({RLt_R^fZtOq0
z;CKp1!1I+sSfh24w2|BHp53QDQ-~H=LO)OeVxAs5oF+Qg;3(YU4Xm&!Sm}kyAq^$_
zg)5$JM$|lyF5>HKq;!a+Bp!HCx<~mb&N;DBIN#&K%E2lUqHD6wX*N;PNf6`^n^166
zbivszvZ5n3qRFNbHiALtAs0#ARz_qNz(!F%P76v|BV#6)^^x5)n{b-voyOwDA$Bum
z8arb2E1i`Yaqd#M_ffgQ8Vhtdk=Zn#l?&tnyr`cz93r5^bE0<~a-wsrKk|otNV*<M
zka;!=k;ceRG7a20F6A`6yoV~+)Qsgo`pvkxS5P^gQr1a}MS>byxm%6E4;EE&Y5}7D
z;)Rz}7S0jkiMh5~%~s$&)+krk07-JFnz*|H{{UMdWOVQSA;##Yi8k4C{YDFtToez~
z;kF#Ys+*@(O@U-ZKTXs~1A(#dk0C$UL+hg>{miI+V<-E5<!wjP6}tuE4?aOwlwC1Y
z(k}@a;>lcsnli?cX+`$9DE|P_=alU(cMH-fdU{b|Brg59RutM37~o4RfBI7L3!}=}
z(zOq5z;lm+xOCj`8<^dN?9u6wwYCAH=n}h3jE{EIRG6APg_>Dt+TcM%Q)u+%-td0w
z(`VDEW66o6s@kebP1%TF;SNU8oTcf?DH_t(Ik#36-6c=BIkMoZ77AEx?RfeWTw0AZ
zc5l4=*=sdeG(9m38c38IB3Yxu1%Z8&<kjhTyMh+0Riz^mpQXF3YJS7p3=#1A{SzdX
z5O7E%<x$UG9&X7Aw~QfVtB|*o`>n>trf8j46L8sVer|%ExB>p@KSHRVQ7=2)Wen94
z7MlP{DhMhPE+o~=XAf~6N)laUxz_au+$tK0<v6vxC}4ZH`>vTnAa;?Xex^v`GxCRi
zpxfTZ>{VV5Do7YF&+eDwK<2|vqcLa<d)hv7p4#f5Y}rBjwR92U*Kfi}7#jY`lw;7z
z$&Gb&Q_r|D-!`&q-y`xt9|26(4BQWd_Ox?gnvnchC}H{i)4eizaYUAT0T)al{{Z$D
zatvTa=zuYws^J*9x{<fOZ<N;(4|KfBtVafbI8Gb@ESe7@>DR@Q@+hE%wo(##NH5sg
zH01IUw#sowINt}A+k;M9b;jeeZb#SU8yASCR^RjhnCCE`a6e?ZO>nsIiYFvEdREQy
znC+d3AuiEj{#R|c1r)_`BOgly;4y%f*5b>E!aR(jLVq>KDO-DUh1utn(R*?BLdHmt
zI?I6s-pQB830h6;0tF(6kO<)+wXOn7@-CbOg^(JCl0H*#KB@lz7ELxIBPbv-t~a(b
z-86*zH0Js2np>YJ*cu}(?36c*{gS)yWZe1v(XnVvpj_VfOd|(3PdLIuZrmnB<cQo4
z*+n51Q@-150)|^{OhxD%ybjn>!!7_(xvk|%6d~9gCnX@pON<T^guwRYL@9$u>meb5
z;N7nW>Xc1|M)n>@{{RW(w6_5a$fX#tDni*u@}II49>}F=wa~6<99;hZ!X{nz%Ssu*
z?o5Y|X8?O-{TE)x3x~?=SfUX@Cz873f>Upm!uLuM*A^>*`6-?L7kxNb+?gix#m~Y`
z@8L9IDEh1v>~WF#1;i#?rR<Q4gL9uK1n-i#90a)Ul-!K}0A+%8^YFWKzoj<!OLOF`
z1L^%wQw<v;yWQ}sHp@BPQ6OV{B@A}oY+HV8g{b}=%ZVOW#A8zNzl3f5o<mLaT2i)}
zAU3t6`6|i@VGX;8Xz;O8>aB>_5>mxmRZ#ENTHgUxJoz^%3&BLzY8s?5G`2D>vRb8N
zvJ&B+lxUA|$ldio*G2)(J{P6n#xRn-vN<L6RkX<?j^`3TvX^DMr^d%U_G@|YtRSH-
z<XwF)`LM$qmWW$rH|0#n0IN+qMsw`o#b-^Y+1rb3K2@Ko91O7H%gyqCI}V^|LD^4N
zrZOmth|15^urdAsHd-B0vh8(_7GkDHK5HiNyou!fr=z<PrfRxAYfj%cUf<HPgA*)!
zF9Ydf=G3<x*SGX@$D+*kUZh>2-)ErGo3J80Am~lw2*&V%R4QY;r=~e5LFVp<?ueVZ
z7^G$%!kiCf809|xRv1?v$`?AtIqm=;r<TW+ti_Bk7v&J+cB-mLK_e>3rtM6HGu=wt
z#Op7ge-au+L;T#Yq56bg7cT+)Okfj8>v=(~nDe8P!2Q$PVQZ!lVRXB#g<nL*Q~+CW
ztL1Io;Tcfy0rG+_1<Flq5n;M}GAwRBi&3W#Kv}Ic3$z8R(;_4TY$o8^H!YS_!o(7_
zy(-`)ZhNf6Q4j_ei>8j*+vezTX^!NX>-{|M;Wy~Cu>O#;y*6(XR;HiyghGkOh0aL1
zV1rc)u;FDj+I{5Ma<#KtYNxG@t|sd#@ndo1V5&677ZbFgX49Sl!rnTXGuR>Kp<}OL
zy5Z(Db5Fud^Vz8+XgDY-V{klKdJRsR(hs#%)#(GURbE<siT)#9872(c#Y=3fsWhU~
zfK*P?U(J_Pe26r1&&Qa}Ci}r0Ev}LJLdsB5J~=;0TFoJ(G%q{Ml9SQs_;KQ>xoGyG
zDtqA+-_nGtIOTZ{v(t%BUU^lqL?19l>MpS=x*5Y|&KF;f_Cq=^Xz5wBVJ%fV15NCQ
zhPAC=&5-rFlS6ReubsXpBzpm`f-p`3qO6Md!B#U>i5_fjR7MjZCo99rnlNWVR#U|V
z<oH%hfsKy#x?jsY9x#%inB%Zgo_KL71eg_O(by(I7<l+lP9>I3_C!S2vOI<1c@T1y
zjM^Ofc*ApbT~$Qao3*${K5e7iQv~ci!sbf5CfX^VLA2l$MKu|}y8#&_thNG#&vVKt
z2-!Q}j55Gntlqm$16)opuU%3=AT0jBBg|)UUA{N+Mok`V)eQ}lg_n_}xUC;ho6hUz
z>pfC-j2y42@$EonSJVp=!UjM9K2dYs&c1A*k|(*Q%r;jA(O)x;Ktj#>P5DPn8Ez2M
zv~9@B))J<n#`xt5NpVHgv)pmQfHd}53N1LZfnJUHaZ>22<M&%Xy7S0Ih+BSzmeo;!
zFO|vVB;dg<BkE3vt1hRG=d#?xRs#lCmh^Q{Wjj8cEm71S=Gm>VUn@Bz^k}wfU8pg<
zoT(tM-0K3df~ouRRh0z(;7LL<V{$eTPF&tnO5tp(n5xFx0;O$0cYBp|tj=^6=7YdN
z)SbBDJ=GRzvIc1#Bd>J1IK(k+lR+z3ZsT-YE5{8sRI*>WOBA9pk^+PqvH4M^rK#@X
ztl+B_<zwmU?rn8-r<X}?%iHktN$Mn|XrP=q!z$LBASx&}$7`!9T9%AmeFiAhNVl@t
ztrlGN;XujTVU(_&zEvAWp_8`-Q0p;0@wf}CxhH0BRc@tI3nFnOC2e~(Z1N7fqjMPN
zoG&BSe@niL*Z%+zD@5*d8^AeUNv}5t?zxncdOPv|029ykZ)~nSD=v_$^y&a_a;o*K
zhm{_OEP|v6{{XO2@*{CM^PcU~b*E!VcmZzoDuE;0XI!r$=~$|zYj<2PROv{)64yH=
zdHAt6C1(#K)HDF&8&--Y*kxyQ8jHrz1+cU*+=cGrq_kE9?BPt)WX3lM_VB7OyOW!g
z#x+O<lCY#Bnk~WttYFz#_CVDP6tY%^DkNauZlRg2+muAc&nOzXgIIF7@;KELMJ}<l
z1BIKC7~dzjglAG$><+WD;by7oWRhF%#n;UFSXA<8esrkP(NI9^U=?EBE+Wh{e#k8p
z7g!RtRFHzey<Z2%jaw$<WvX<>GUsj;CaqNs98NAE0JplWIP_dcV7`9*aH_4OqnOjm
zS&qp0-VAcD*F_;9F0|^3K^w=c+YgoJ+AgkYb;g)1;k&Z)9Yav8s+5_hk=gTQsr)mL
zjZPqPH+NP1Z{rpTTYD2eTa6>^AH!;y<e`YZ<FfS1IS$cv=U;}qU#CJq?7bG9gtHi4
z{Nj<#2E!R5m99Zpw5b^-lv*g5V9FvE1C%5#1gi+`uvq{O0?ChHa&^~TVW<*Ha$Uv}
z#}H>B7Mk|mxEWf(K$S0OVc~gy;zaClEn&Nfvh;mIDIUTBBj~*AtF+0aB#6&9xm<oi
zoV1F;rM5-T^zb!}AF0dGscGA=V#_JelwO=I+}pdl+{FuvYz39E;^MX=ot3rm#MsU*
zRu`yfXQ+FNL1<o+Jv#uq)ef*C*x=9x7blsD6OZgu9GZGO-YPKzh&Lq`$jPuq)iI(%
zK)FK`ZtLUo<Af%95SwTku(Bpx^0Hdirr`3%H~_D8sjVBbysNAA86n<U>sd#a%Owbx
zf~~Vh6>Fq;25;_<5;f7=cH&o)=^EU!)LYd&*>7~oT<8J0Cd=qNFA{jx!m>rOEpj;B
zxz8fQ%JYt<sELkqW4GCDI-XayHy1eBd49Q4A1P~YZfv~@DCtJao`(VTjlNCpz4xUk
z{Yq9Hqzf+&{5PX}=WF)f<$VRy&3h>rEJhc{eq$<mDCJSH+JzWn2^{<^uBIwj;u!Y;
zw$*ogNL4iyO?!zsE5e3Nno*+@EH!chT=$>4s??#9Hj?0R<$4VCZH<JR1&-=6$6cV^
zcj3ypQ3*uERn<JmSkZu?^&<n^E>RVc#>blss@bo=uwKSAt4Awt_H}hv@azBqWA&H0
z&UQH~OFK(}xFu(Gh|W&|dLAlCf^N*zg7SQ+W2Ynw_fv?QzsjAg+TP3AgCO^!IHC-(
zM@3vCvu+h#bwG`##@1BKtaOzjttXXeVsk4AaCU7CQ>AU2fU4`Eeocv2eJ`gzp@5c?
zb$4CU?(~cHuAlK5R&;-snmo!_o=L$%$s402k!vl?+E9+=%@|Y~-6qg%6Z}ado_RSk
zni<as$esxBsb!PWlGjg;vo<Enns{HLR9`XRTPfyS3>8xqSa7f?n4}KKDiVubf~YKe
zibBis)YcNDX(U}Gm|=_zkecAo4U~rdR8AtusThUlJR~Hpaqy4=Zm5y0f?(r(A;2No
z<s9fsh0iJnLuV?*md3df(mw%BA@=1mm6lGI3qH=cDnt$<{G;^Od&U)Wh0X#uP6RzQ
zXvyr+wZqc_*a$j@0`gR?{{U=d4KNq|K}AJb*0MV2hDTfIqb?+;xHR{|kJvkls-%%A
zNwP?<0NOw$zxP&@MOHvsNzPTJ8+h=Yc5~&rELiVll(Cz*c<zU0019}mybi%$Jse)k
zdMLqYHo6yFj0m0b5xRK=p$o3&Cl7_gk^aZ4<Hz+p`%%QF9ndlodn2_=`p4^J2p1~Q
zA(7K0qh{$o7PCf#fZH`vX)&<BD_N)QYg@D@lQ~}5VHh9)QW5Z%b-SkA<xIlc7PeGU
zFpzE$5ewKAJELi589-!;kkTE(nTE#YK6bUZ0?0|{Y-0D}I$>nBGqsJq)^k_Y0|5;;
zP1W@_<TcARGu=@swpKEsYAR)@lLU}aT6GiUcLfoo>8^PMv21jGAOH@`C32yo2EcS(
zFLk|(U8iYnV{c?epG4T&J+>;+Hdtc{6Uk?0JX8x6GZ;VsBI9TPn=S&!Dd2o5wsa_s
z01i{f7+q}N`>t>ysavs*2Rz*PPjUA0q7L{?sHkHZk`SQuHdz|ZO^`Kun<8nk2n|ZS
zy~VNI{Q?f2j(V4Fkhl*DvB#~P*>l#B9c5hAPum!A&t&>d7HNolm>t#i6%9Q*K{h2#
zQ7!{mG4QUmasJYKD<IS3g8&2akEMwBNgEtUE-3gJVZupBv@wIaAk&oS+S`m_OD`ot
z(gV3uZJkhxL5v_KOz&!Q1_l#mZagF?4}9Lrcr02lhR>8mH|Q%fB5*sXX5~&eP)t&y
zsS&pK`S6U7AqK)XWf>V8Rx>&IL(DLEL^{d}k~XX&&?CELO9>Z4$nXw(DBCc<Dbiw2
zR9HSscTh=Fw)sF*RkUMpRdw2cu@T&rMTm^Nis-SbuNETex>~SJ$qJ@O^(v`t9B;M!
zD}66PsgpGgHu>dMMJ|q6=5io4QXkQC^h*^TZCizb0ct3;s#sb#hW)~w#tL?OY%Sqy
z6VXdS({DC($36<VrJ$yz00s@-ReajB*hp)Nfx49PI>iNS+)LRj8xIyjRBF#6!pgnR
zFE=EVn=_D6*RZILsH>It$p}a8cO@0+i~=s0WBt+Og0YqJ1G?SPF}cc~rJ3MaM8^0=
z?0CkQO*?R;aP4K(<Jg|zYlSw;R)|Q#Kt5BjISYlY@`KSoX8@7OS^blU_T(fT0L*PA
z)1h$lo2N?{E<7hk7~DJAGkP>u%L+0!We^W_1v3a@oC|Vpq+N~%;>jF-7XgcMn&bB=
zg;WnUfwF{)_EX3&o>WH!cSgn<;oF4A4{j6gZkp~nTFpt7l|$ZCQM6@ESR5T}{gBNk
zx}w@5*2^k3;`@!yWN2lFB?G5}jH@QH;3%^3BLI(-?m!>1eX(GWv;)E;P=}SoU%pp&
z;|Yb?DMjew+>ZWJYyse;F15l<#mSI4Y<ovO5`v<+z7zBPxk)0iVou|>;{im{ES*2;
zAw(}=j7>6ji;#}Dv>Sz66~l$qfWF4~vNF&hIE#-dq*#!Yl57Y0OmT4Jpo<DI;Yks1
zeo*_ck<QzjrY6;f?qz@}9OjU0NI{7}u)iyvGkmNLB<^-D6Gz;rOudf^GcXsu(L%6?
zxMZQ^cYCHjY@G6=FSz;mSjggUa-$@R+$V0e&9IpFgPR1&3drVgEjUf2HU|FyRntf|
zl0ZvIkX#C6iAq`sYwd6HQIyh)8<2r<b?hvpW5{W}mT?j;iKLajp}De+(zlC@D!Qu3
z+bQ=8eNdBXF*F}?p97(0Nfy&oT;kY6OH}*&P1Qu2iM^X-1x;;3ze8{IDdQA~<j(yU
zvQ-cb$U{qB#<%tV0Ck-%)FySB$pG?FjW1G_*ChVR$sErsWt{q(20^&`pr_TEZ<3^^
z>AK0X=aKeSRQ(|P2T61HM#-r*XC~AOuWi}=g6O8Hb-B07+0t~>LBo47@)e~%fkVT`
z_CnPGwqfbLR|`Fxm5ntlQ@8^O`CFP^pVM*rN$quD%?62$yF)(6XgryRr_m#k*oP;z
zkumh)-G4^mY?(_1KVyZ$t+D=_pRz}5ps87zr0M50{{XZ?x2Dlpz%B?sM1T6be@mfU
z>gePa%MrF=Y4rHnYag;9v52zMWG|_9`)YvtsGmJR<758oG|7jW?@tcRzEdRB+5HCU
zqI#JcEcnBIZ+oDmt%%$i8}z!#F}RoS)mjDt`VfGhR(<gx{gphGOc&Vu{m{;+eXIZ^
z_f5y_D;s?lvg*<}TiWX(UtafTZI8+bJ>|gK-$00DF}<SX0(rUR2I7jW5`B<MJhBsV
z0vXMD&hzvN&{D-=pYD_Lk#TRm()`i%T0Sq?T;2VNu=1B<oOAvWPmj}ZXc$}vDPCJG
z4;>(O#5?ifNZ6Tv-?Eb)7g!{7Y`k#9YoU(Uuux9~b|T1-I0ZpJe#HpMjVw_`U0f^z
zz+@q!jn^Y^X!22&7`{{uX6yJ?QfC%eB!-qhv)beJQo_kW9>7Y4%s2l4<x2xyfp-OD
z&KDJ7(U&#9ppMEnyWNgdk-5NFxZBEQfpH|EWuS+&`)<1T;da{$I4&dLA!Xweu6f*k
z#V+Tc=Ka$L!f+VnD`gZ#+;5NyM;n`*U3d0eewWG?8X6nMQrqU~?IXDQE)H*SP_fb)
z2cM$jl0B*Z%U^H{h!*7~jHrx&IZ53<O9S;x`0SY((9`s~OOGi{zET?}M3|4TAtAQ_
zWho1Y&nTj7OD?^+Tt7;14JOzt80MbgAOQ1Zp`hU)ZHfaNS_lbtC1g%F*e-cCUA4gE
z94t3OOL1X@y}nW%*ZQP4@`VAhP6A_(-7W9gBM2A17U<R{E|UF+WT$Tf_f2)Xa*3?t
zYjB!JYh@|V2@6Ra@UjCK;eR(wEj)}VU4h=}Hyd9G)``q%{`OEvZ}6oqC-&t*AvfVU
z2DUQ9o)MJd!-OMmj>yV;@p1G_N<jg=?ou^}weS8^p^mU1-|Us3+~F$}NZ9LSsU7M8
zf&J5%G5S|YeYqAuY67W|!x{eo$`IWBQB#9*e`GnZ#nBxN;B)m&?_{nQ`!44A%Eo#c
zMafDp--W;);W&`6!)$HvxQ_P1cXXqa3^TRT{3j3+Sm)smf`mCaOW0!Nb?kDxwbrvV
zC)Wivz!P=X0U<U-2Ok!?ZO_Vcjq(OUXW0`UY*h5bERN>ntd_f>v74;Yeg_ND^&LVM
zFqgPn>aaam)DbnWY;FL2FF(u4h6wVWx;*z$p%BhXfN#aqs3eVs>bqIh4APx~<epR%
z4s?$9$=!U$X-eDlZZ>IOSO~Lu_)vaYYNv~|*-xj%7;AfdO16%8Vr81pT)Mn(Hy4i{
zUdT@ydLW?E#BBxk3f3BE*e_tJq^|c}&am-yBs!Er+n;~B=gavI@?=lqaV;c@;>`-W
zvY%r~E-R<k>0)UcfI<HNsEVI)z*3uQ_?1}cY^<)1NeOEL4m~x+<915WHPOG?2v#&S
zF*t`6+2g#6_MDB+h!;<3@(G*muwJv$tP#e*Lda1v2t#Z|$16jn>QTpQJB91v{G=hN
zF{0b-^lB*pXv#T{3m>LxW?KfW4J_W<lD#}$RC6ndbjvHIIH6xw#*DcR`sR~hRbE)H
zW7t&g<qG4J!#?444AZr}(#s-B*i#A)3yalv=7Bg*^@$iu460oKo_RoOs;a2Fxx#%^
zzyp;}Q&Kl!Qqb04X|i6*?k8QVBc)V(#mduD$~N+yG$<CjFAKhl!haJXCC?x)cGg@B
z4*D-1>-YqYb%pYS><sbgB6E9TK_$VxthFEMPk-`|qLV~<Ibr>lo_NQ$MYN2Zt>=_6
zYr(eD`z?vkk7i%&nLdi^8?=Q7=0e3%Wk!<A$kE|$G*|&>S*i*LMLmy|xX`JbTH7>*
z+mAFTSp*mw*6@zeM%sptl=suPGS*3^g4%}P$}^gmLqPQ&nLom6*3+M8Sl*X+@SF5o
z8gI}Pnb3j<>0C{M=J2`PED&0^ZDA`XuIka#Uvq%6)M`KMyXd@o@j`dQNh6x#+XAJP
zYegXGm+*BhJKb+pzq+x9SAt7_5vT6HR+FqM>FS={<k{F4R{DS96wI~W?0oRK*CdX+
zi$0nB^iCGLR8mb7`-R~Ye~84`8Het#w9dI?q!}g__$aB!DMg;M987t_n9;C~0>x?F
zWk}!$s0ZC%QuQS)oJ!x_QDz6leHRU&U^oc+XahjPs)Ja8{74Vo9R{Hjtzt5>%gA4j
ziw6q?6-!)r7yBdV*lI|z!nmc=VgMbW{ZNiKEsFA}Xuwy~OyF$CTg{ewwi%*vJ4*Ix
zbm-i|3mSgQH?3%~I`(K?Fp7Z*&CK$;it46&8-RrqR7~y(TY8-iJN|?z(Zf%*wo}h0
z)`gBXifRgLkX)`~iH&A#yYk+E;RRDuviB?Ie6C59=ps<g!3ixmdGLpIe}R?EtK4#V
zUT@0N*vXG|JTZ&ll})Qv`b{lkRjktoHo)0aYAg<E#maeQQdDU@8Ty*pT<elY-9*~=
z1MYE8tfp~su=}A!Bf<A!O+iSNvS;cKxE+@=wZ!}=jW_@dl@sG|{UEA5YADNnmTavX
zIaK=HM)nmTZqQ4Ls@0?=hdq}^hL=4CjApvw>y@3U$yyy+GU*8yR5L_<Oz^&=7NR>F
zM@S`-<Y5_8Kp6=jebm}}+QK`cE2RDru<V|}MmJH5Ysdjt%)(pQUDwCC<=MZLTU5(8
zJ=O}*Nmko-x)6(BJfkaJbM!(Uab<wSXgh;PmFRzm8gZ7YJ;2zk1Qrsu{9Ss_;cV3G
zsEyJ%04?`kf1f@$!xhQV?;RbY-Ubre3oRX8Bs9_6zksN8uB4`low39R3Q6@*J>2K7
zlX-2@D&mpSxR=~uDQV{|HW@%Vb0PNJ1Z5j|u*zj3Ef+M8Bmzy9luiM@)}N}cp@_QM
zxK{Cq*wsZh=+S^Ire~W3n_C+$@~4_+FcXieq1CI%1T@`FN==nbMG{u(5wM#Os^rw2
zBfX~TlCGu2=H#2HwBK{?`&+Wnw8U=BMvi2W;FYt|M%IDC#c9<|j={XGE|*!l*DKfX
zvPLe1XwnnoDey9K?`X1*PjHZnm7$}FfuOIZ!7ElmO4(TE)U}sY)iv|6<)GzhYc`0@
zg2-xa44mAlc?~UwB<-k`!tQ#k)+&jN`@1GdSQ<Z86(*@((g@tV+@4bYD0s(aSE&y7
zINs#<SRHylYr8GRttfu%tY*65wcp)#;Qj|}bdNUIBmOC}wCG(k^A$|9ZZFCMT5$D=
z=PPUYQRo`B6Jzci_Cq$+9NEuZ=-!rTg^qJCaJMwt3t<Cm0w<)I7v-790chrQOpmg@
zC`K_k7BmH;!Ra_Q)>=wofT(Gz8S7w$Z52Z{;mWX*q0*rH*e00(?t_x4pmLyfV;jqY
z4<f$CNVIH$O4ov^Bdu$W3OWggl*&n(s6Y8oRa_M>tSp7AnW2Q;7K3FjsXwK1O3G^5
zsj+KHvFb{a?Z6VT^&X?i_L96$IupGPq*dy*E_>YPl7*m|##}bRSw4l*A8=AdLli(`
zh2>p#D^0sCv}%wnwc349a{|TEmNSeioj#=8G%MipB%LADbYJQc2SD$l@L$IGM3fT?
zUhON}pT0;B(Ro+m%^*5_q>JFMPAXE{DHG$m$V(@4ZNV!?_;~QmPAmTaQm)nE+f^{;
z&M2;ud5cqx*BEeJ-1x@P8LK|g{40}opB2}r(%8lqivAH-2T?{hcwWh;$O{HiV)9-`
zvpjSb=7O47q!u|&0_(Lg8XE{8t4I&<!mn+CMpM4yZI)==6RupjD90{bO_wZTu47%u
zRa(6qZ;8OP94mA!c)UdhVwXZ>F#^VbGOyb9hAeF@NrzK=FWp}@a_IR{dC*iST~4K}
zX(X(kqgCn?V})m|%o@jTD>V5U=U6Y7{Fme<@^D9?g957|nVXzQK~ytnHdcXw*hu<j
zSeIJM%8Y(iRsN<cTw}~nvroeDzP*B3ONK@KFLUa8nre7oa5(O~W2?0-J~v4u^Tylu
zCqJ_5@w{ami-NXiJ#5Bwy*Q4sq4(u`A5T+>sQ_bc>vmovORmy8Qv#e4&BElbd;B@6
zifVRok(Kv8H;mppnmoDZag`#EtF&o9DEB$Nye|^fVSIX)$BrDntm;ZwWTJN*FQ0nK
zhA;JJ2<>~{3LZy`eH~EpUm9kk@XfKt$jgA?dfgpk1V91;@C_qWewx4@;?Uofs?fU5
z8C)7>Z``kk{IBBjsq#hfW=!=-s=z#;=hRxylBzWARvNaAuNg*58yv!S0ry@r@Fxh|
zhIuTn)%8cX5Dpe*s7X-c?I!B>vYs;X0o+O|hJnO;SO?9nwm8Qg$;wT-F!dTt&IFcO
zR95NY09^Bx>l5j2dw99?WuDeFSebW8?)t90UP`i3$D_?BZH1WA_F4U2o%@N}K>1#e
zQ%MYWvjxY(%JmBv8f*X-E7kFH{?v|XMVMz=H=B&8YHC1f;C)oOi`g5Fa;WO(-;12D
zsPVD#R>VNMobGWp$_q;W0P@D1@`;(C_fb-NDjG%?p%qNh>qoQn4$%n3$pf<5RZvS&
z39tY!J^Ve?qmN*594|<lRAHv}k;3fN5=ofNUr#X-2w2XdiL8m&@U{Izs5#Fhn=d-*
zZAd$F1D8C;NXY6Z_~e8h^YW#re&-TOg+z8u45g=)XGu9W3Y=r=ilTqI$udIFriz`{
z7eqI*8&3tzZVIxFoq5t!#bCjXBH=hvxx?zLV1cKbBcqC)gWT|%C|hL|bOi7e{{WF|
za^Zz*B(&^lE$7Or)GH0F!GEfLSELl1AeJT$Ernk@ecmjb`k4v)s9g6rjm11**JoZB
z(L4a#gxY{W&Qy>QU;^racBeX!3%6YzrwhC8f+IdvhMQpEZnNmgY`Tq?ipWWYjgig$
z7(vc6btuN!*U2Od=G{hPZSQ3}g`3Ka$2L{sLy{I2fZ=6rMo9pwxSH+C)`_+WqoO&Q
zXfe4KDp<|zGNNY+SjF9i(z-YwWyYT2vdRr>F&lVOP%wtx$_->%Gq|oCk+~k0ER_QV
zskO#q^+GZ?U0K$;2Fz}5R04W&*p+CyL?^aQrnHAGHlL6ddWv{l-~h_d>Eu{hF(z1p
zfqPvcH$Mplt!whRoY*OtBA60ED5ncE&5+SNGn74Up&V@>yZfOng$%ElMjdjpTE?OJ
zn$!Cf{cl$eyI59tbLW#cvMZws?^1W*m35-&E|JY8s!bP9+~DHdt-gz=28NxZC`wd{
z!yA(!(e#kkf>^Ya)UAvQ3t3G~0AqNvBHkA)vRU68N+@J)1G1a}x8X(s`>93t@R7SH
zl@YqZIi3RI1FhLS3}-7CLJDKuX4!PI1_G-qDxBlBnI&YK70Dshb*+lx`Bc>tRMg3~
zFl>vCj!B=oPtvR@>0^r48TeO>6jsh@<a5#i)966=$}{qhbE9i^uvn?~UAP!gIy)W{
zDI$Lx8yic=Dq|QKOHRP0lH6qpGLeN40dKM<JBEy?ZIOjEcDE{QvP4s#kE)55-Fzq1
z9H`>9>y!!y#rjifEpL?gZL-OgKc?#;tPtdcL>4232PVjhagP>3^aM->cu>v-@TRx{
z2U9JtVv#MBy$T4vQA}_HB~wdU)*O`t`owH$vxU`uIWkhpk$E)j9u;+EYg*DS6$MtX
z=bJE+qKZ2D$6=<$I>q*L%gFi-s?=E9+@Ox3Gs$dhx$Lc|dVWW3GlH&Z^y(^Rd!cFh
zDvBtB$mC?H==BP>0z-iLS9BT)1Q~%PT$;Lgn`Q=&76^GO-t0BOF*<B22q|frF3<=`
zQC$#e4Yk6qd!&$(;&PkmdCDA+%M%u&t?vfN8C>Uca*WtAqn)E}R^)^6l`j2e`BPG`
z7Y<a8Yf0>;rC{H4;TcOoj7gfy0Hgr&oW$#Vu6H7e1bc9!b9^a?O*R<FSu%<`E9#m-
zxxLf_4gnQbKsUKToWBaOY!yM&{{W|)C%9lJsmHeWQXBV5!pNR1S6|^PzKKBjvd^MX
z>`(`LClCPgxwZ?OZZnURg-|S{2M{}@W3oJ?k)rp?bZo#EO!@?S52kV0FZ(HjoS>&3
z+voOEDOSrqg$_APbAnrx*EHJQlOYl!nD+kw3NC(uOy=i3)O$!IT`+8BQ)F-#!BP-y
zj><P+ENd$&+)J%wFgI|!N-nb7kIEPm=jf=qvSp5+!mtjqt)k<ORfzgwMfO@FuZ*SN
zjM*~-kdnax$u2$=asWrlL4kG02P2h*WN#M2V0UFJijMj0ogz1}T6^-OZTl#}PXrK>
zNW2)?fU;)N02U_6Y8_#NWf+zIN7BilX~>o?ZDeoqfPso*a0m#qCBP*HHa(9n##0{P
zex)_i4=NYR-Y;^3EYcob`zG&=#~`8PnSk<#eNYDnDb!mdDMbf6(>VsokJvliR+__a
z{!~w^aqgXCWTlxR&C&~A>M11y>Z+escOQTEQNFI(-E`|6c0uRaYG!YHU*#vRz(w3F
zsa;;p)^)&5HCu<V;_0}dK63cV%=?sYnm#xG0Ci6r>QCtb!{slhQuh$}$R7m?3d|W%
zGdK?gPp8cu-*dS`(&>hB97z{i4KqPu+j$y_B`L5H(IEaC?3n60veUFU<I3Am=rrI9
zv87r!M}RbYS{9;w+2a+OZG4k^VtEI+32FLYP@IGBvG`ud-7W@XFemyEMlH3rSpmrM
znof_Yu-w;`d#Ci1SO=*I{g&%=Z0r*qR>tA3v00=GWi2mGQAW@m2IO>lHlENg6I!P=
z<P+|1-A65KZozXe^+L_q*J;{(V*#N35Op-vz!1XQc?l<|f>&(2N&f)qK~yp}8@cYc
z!;<o2aR;6)uRfc;$bFSAb(%BfP3zLK_L1Z3mBUeFV*9b!kdI?=WRTL=5;qnB^;S^Q
zNnyF(?>AJlYeAq`vHt)>JlgE15wXDhCP_4B30bFn4LBr=e4!?QG=IDrK8r6dt*A+j
z=H3v`o~A)}%J1E33}DO3$Feu(R=E8TCb_L72JZQ~0j<C4aVO-dM%!2{-4%`-Cw*+s
z{{U{|?x8bPyx-Mu3G5BG7Wydw9N|smqoO`ESTmV3u<0NBriyWUlX2x2Yw!t5&^x4g
zS!LrzdIoGP94Cm|@J*D#t-Z$Uqz!MMst#?B9BB>O0I^6wwo|~d<P_hV93^b06o%aJ
z975pv8h=_+2R6EC+6}M5)M`gL&T+Gi{!)YYO#u0_TVH~M9S&`>R|0OCXA5^1%Imy#
z!UH5Z+#YbCoO@K;h#6`6s3zcyqJbr%x^u`;vO?DLWi3Vb6$^kPg?Q}q@{JRX*#Ow0
zV3miKgZDue`?xk!z}#?Et4AKJvfj;y7b+5N>)0lbYb|uGb%44;upB@7LgBREl;B29
zu9obzi)?#k3oe(jxDD<SfDhdu+kWX=YvsWPWWp&aeQO)oBVVSn*K2|L6<7?d#8QwC
zAt<S;VZj9>wid%3rn~t{jr1}BVSm|1%|fl5i-Fll%~nBsxA#J%GGsDSzA<+ZWeu&}
zNl{e!&$xg;x{PtyCRglaAr2!02`u4!CkI$$U?*?RQ43Z;Z`@rWuqtxqp4ZCaV<7qL
zjgx2`@(SU}Pkz-IKPlG9y&Z6SS#dTu?2zQ)c6bW_R*(u)=H|(Q{g+tr*<%)3U^lpM
zN1lH}P5k9j(oM18<PPZO)dSxuQ@a|hCD6ofT?<q%q^EHG1bqtOQqnDS;X6(aQd=^x
zY3N~WWz2i70<Dl+7X<ez-gj<cu>dNEk9ki9-)0lH{t{mczRQh?DuzOQ_9;Ov;|V)p
zq$C7;7*{;ovWd^X@{g){BHRSW5qyiLL?(t485wEHhCva?Bq^R-ZZM#eY2yjVG8+=$
z1HW`s4R!7f{)z@h3&FV`2-pR<I9kcFW|x2l;-1M|EN^=zgPW%}FZe)TWYJ9P*tef4
z&z9oFp*4hgT`3z)mZ6X>Lxr$ApwB-jnN5axLh*CovNSqEWFM55&(%8P;UVO#G1oj5
z#EvYu93`;;8|7dmbAM!`fVcuj7+iB}@|CcQ$+}G234dS`6J@L@LvRxb$0^PyKMACZ
zpC}{-A+bLRFLw7zc)~+|6BtYQDH7Oz$t*rmMn0+4^=Td*l5R1TkJSU_F5e(O0R#T7
z`3JYZe<|&&8!scQd--226y+<C=CZnaR*T@3T<Wn)C9h>=sMNSd;~oc+Y_b}J<<pW}
zNkcD>@+}N&X!WDC0$hK>HQK<nw`E{|)R_xMxeGS5`3;)m_Fi63$4X3Sqia*F7dpl1
zg1UJy*OBtE)Rj+rw;P|5ts7ipWr6xC;qbm8B^zbvoJ2Rh<hz`vf33JUjo9yHn|)NX
zIE&z`EhdD?AS4szc1jV71fr5O8h*De!HtIBD(;tCsUpsGf~}>~S|S91)Y%wV?W`AE
ztx8%%)J;yEsL3O&U3I3?-shI>;H-yD(7saFNa9+y)GmgaFa@x=oD^kD&0j{JOPIs~
zS4`BlM{@Ahhjyyg3rEV0_0ma~$bO5_!R1aXj1cK0Yby1y9cH@e)OGHWz>>0%Kh<yz
z$?~q~V4G$5UWN$gZ<8}-f%=0ZW!&(qXVsf4_O;5RRcx$bu|K+~p^@UC2YFj8v(9QS
zNH_FusH83zB^4z0ZVIQ<<!Fo&S60?E0s&pGD!~DgC9SC$%Bq$}J^s*|9O++jRFb+l
zm`)cI{H%{}Lb*RdI(wYQf=!l+n!YwhH#~5>{;yVSH`&Ujt?D^)(DDN3Uz_;<09vyn
z(KWqp0K(AlPk^x6qrW#T-D92=FZ#@qn*wsIC?vTLab0lypCxP(vU)uwuJ<?vG}>e>
zZ|Mq2bx7f5o64_~RP`TX>n}4unLM+kCj^K7Mg|Nqq^iwIj24?W3hD}oNat}$G)|}l
zHKyH{b_J`DIQue`x_C2!M|H2#DFb5%ZGs*;F%yG`xdj$#L~Ys>viWjy;{$Oftr4<2
z3j(U?-rvjs-zl}T$naEJY*Lx7;8(lha^r1`k?EZ(>&D#nTS{Nh79*vDgByGmwxs<5
zcQU9gye@YM2MK?bV1ZYQ#8-}fE3ldgyWp>7trv~U%6}8$-9<JoY*gpa(d_vbTine~
zaeQv!1SOCGm37p#u4bt=Eq7chzsr-@l94SI8y!@Q{$ut<L#a%{Eb;*GP`{TTarR63
zcb*!WkZmIBm#AxDwWe_&Rc}SswXqSpPwuh;nqJI5V3bnKPy1)~LxKv(*R#_!-^3}J
z=Crx@^L4-J4zP7pj1Q35k;z^ILqSmY0kPk**7WP@Xk-r9^I|(C_>y)Xk+kUh6QiaT
z6wPqT*u*Tr7tWm#_>)sd10j|pw%wYyWAQ9H0q9b>&Lfv#E|=Dk$!_*~bdoYQlHxG4
zI<~7$WG!pjY`n`|>%B^%_kKU6xC<Fy)*6FcNe%<e)TPhTD-JiddsC|6dySk5W8V{o
z2wpFz^_^3s0o$$RYP9a5mUfIEs^ZI<P+LX$L(?_Ytz&`VQC3qI6J<O#hDP1Qq@JmP
ztIW#QKxve96rqIVl80+wd;-v|CO)aXtPu0MCN~)?hJG@u3rHEyY-7n$h|JkMcTvwJ
zjqHV%wao-D5?2ODNj)G`eUny21WY`ARTWIlbL`9yD49(4C*5#71m;j%Bmh%FIXh%$
zDEbD5Am9mIQ3z{qWOG>*ExV1+!iH%B_zI56sZm8y6YtywO{uT|ZnZPU915Y<DNTt3
z=({{kNOdbQI;_l%#@wvz&oaw<^VwVL(Kt*&1X)u)>^yzf(_?n5dkLluW=T@Y>z{>O
z*=+2UC#(Z*P17;gK=p;AaVm<wQbn$g)T-JVKsi)ZGC9PNa<bTr4y@h94y2W&o1fi8
zMt{OA!Uqubwdl9W>ac=9#|sx5L6BK*x()*Qm;g2<aru?NSEhRZ08K{o6GhM6YiQ|Q
z>s?fI#V8T8IkMX6lz`aTe5Bx<f~9&RqSMQUMis0SLA(nq8Y*@*ql83;D8?;xt^+0o
z6h))qHln4m3j=bxs(X`U8D`_2=r5o)K~qxqT~cawEs2hFhwK&ITLTzK<z;nxX{sb3
zk7|ANg>oq-u9A7J8+MEMR~k!Ya2F^@bmJSY;bn0^!5G45!(zDy(}KV<ue6C>adN4n
zVRgGJDmE6{#>=x59CkESn{6tgjV;R3(p9r)yMptoN{2>8j#ZpBle}0suU8kFENfwS
z(W=!oIHQb!;dPDF>ddb$M9$YZZgC}7RImYal^p(G$c5uYPN7pE2FpKE>W93SI}1lq
z7=6XCgPxFCa6(_Tnl{;%tPTL4R##p9F1p(4>||{q9F>UIat*j&L*u)N*&dHP*7GT{
zzWh6^{JmRq+$tS(e-PWsXHC^U8m8FyOP$ng=gzG9x21LVvXz9q18*w*+SBR<n(QwT
z>77DS*53E};cay7LQ4Q$Z-wGy^RitLf>dwdtRp4=0NohPS)<z1a<Oq$Io8QV!99q|
z(DSC14AMrg^Y4@SmwJTd&LvaRR5rsX)<|9~0_nq%&6qIO2vo4^v9t9#R>=W>Afe@?
zwo6yFg{Yxk%^P}(Ck!a3)te(uR$4$~&O(XRP9H^XX`oX@rF4y$pOg=x#)51RZq!)I
z?kclU*4);eg2U>(zbbTwR9aNa9CsK&dcp3&7FjB-W>?GZf7wk-sJz>fycstp9%&lJ
z7WOLFNi8lGShiM3;xCV)(P-5?D&hTIi_YB}Mvx%;FEIR8a5{9La<{^z#tRP%%|8>R
zy)1(Lm!SNIq>I4$cUp{oa$|4iC`~k&>Y7F}t+lBC0P5s6<;uDc8&J|h^?Sx6K8^ew
zu79N)Z;J)*x+KNWw3FF<$@oE5*u+BkUqfgWt#mE1?7S7^d|4VP6>Da`H;XBn@Tude
z7|JRMi;acXvEzAPAt^$O2IU)0%L|~X?s8R>R@sghqk1Jnmo8j@#}ReQmn>tH6{7H!
zI*P0Pl7WmRSMc?MNmhTFA|Gh715t#(Rk#SjO!E@(Jjmv^!0X22O3EEtcfIEBB~%&q
zzvWx%a27a{sof8{>*I4dslHvFlxnmYPf#}8s?MU;4J|92-oZL)1Z}nLWr*wDQIJr)
z7iPtE_)?6dlVEZ7c_-q>U20-yQ^6;s3AOK)<W;rRHFA2D6Fx(JNxHJ@YUfsJ?>E3I
zgcjX?h2da^JZp-h$Ip^dlh|gTF^Z+GF2Fp6?LUW|T@5TOY?6kCfyrJKds^2;Qdhn^
zH+c>27o*Lja=7gJGpPRn5ZgRXf{xB77aT7<t*?>KeDfX8apbJM4!I05fqS~$)8*A!
zJGVK(ty6tiVn1H4k<grwu_s-uq^r9mI6Pfh>-wt*En!(1oL=(d-Ezt*U81&nCW-i;
zUrV+#?P$R#mABEq6U9xNH1;1=^YKOLl9=jSV`b-ge~iVMT@M_xiS?&SYjNsDj*s1b
z<$4VOA|PxpZtKAR019;yBVgPH0`@9xP41_&4a)c*$l>^MIHR)<?Y3N3)wUKL&jaYP
z8ohX#&e{q2Djia;Ur?DO`l@N`nr;CuQ}J+ecE`yoK-#5KV{3^69v7Z<Hm2tn1_HIZ
z-9to1`FGJ^HInHb;#vUhW%XVb2(8iP&TX?bSu5V>ImYN4l2Nsd+DKL9)^(TD;8cu-
zaJVG$pm?*c6yqn#jzRwb;8qyC>77N;$_C@g^i4ZcbnuUNZ!5>?WiiSQR;NtW9N4xr
zszO>M*2})Bu53{|YqMqMT9r$smBjZeNv>5H7)y%B)H`&h%5r-d5gePY04D+ECl^Wq
zz0~xF_<;`Mq^5PAKBzsI*XY|wX(HpoxdGd7EU5H3V*nQ(71OHN=Gm5Bep*bGY-zZ5
zPuV|kwk}j*%)Q)HtaA=AWRciNoYGD~Le$1Ko1*F}B4!(t@T+H-zT})LMv&34ceglD
zJPWBLkbTq+ea|Z0otVPutO8l`(xat63Q50CLRNId5Vt707M<Y;=jViOo^IfYquF&3
zf2J&isxsV-z-1c8S}|l5SL(WwyE>{g3gajBVRK88-#;l?byV3W#F`T8j#2cN9nf%$
zkE${=wW-m|k@^b<A1KNu-QW;|rv=XPt)OFB7(5k6Dn~6_E+~XeU<Vkouh&|~Fzpur
zC(}q=>jJw{jQRu>$vN!wFk`fN=B&^ra;@&I^_JRWe=4kxcM7p$O;Zlj7)!^MtkYR$
z1)S0V+!m`(Y1%ltX2?kd1`;v_)QyaRo>SRow<QN%UmPqqAtPcXWEzc8iKGMYvU;U-
zvbeAkN7YTL>V{{Q$D5((sUJ|_Tsc`Ws0ozsmB5g4u5`UCaRj$2=S|WtVq1T*(rLO|
zTVu2Yu4xs9CicN}O)v`*+^sb<0e}l9(o+Tu1wE{82ibGVR(C=v3I(xnxz@69w;>_1
zHsMIM=s}AF{z8nn0dk>rLwE_4Se%mVmPdw?NkdIu#tU3sBchUjXuXPO`ba+M3H{Y$
zkL-l={SX;VOY9C0gk3!&Tkds^JEt<9C@rujla$w868)vNbD9PPk}<iuanC){v|S{b
zY;h!OdALzHSdga!+scLD5|%7!Mum@%mPCy>T>OjoOvOlMZlxSyMg_o9H~XMb1JpR&
z;YS}L+$m}XZlYluh89C0_(>plOFKr)q=bfy;X_wY#y6F}(VL<-SRPc2nXMg_HCCd=
zk~ah=`j+O|w<@0-eUX-E#JrxYG!u1EU#M6cU+Hwn;Hs>3m<YPCrs<c+FFd4tDn<z$
z^70!pwKWw}zieRKqA2ug%7+6fEot(#jnZhTKkgwmTF*(=V8?3&)=A0Buu2UgnwrKy
z3Hb`<38`TgV_Fqdl`fF?DoEqpFc4!UWt6qe;2<Zde2q3H$vqR@aEN3c7F2Ew4p8Fj
zoT=d)CrZ|WmN91mZV;Q%Y*E-uZL>xaKf;nP(Z&;B`!0Jrr5Z#Qx@5!JZWP2}MLU3u
z_rhx>MQiVMEh~=xR1!ZpPo!}#?w;)lMVPlKz$P#oC$|bMk4F)1$|u^`!jzn0MEl>d
zSux@PSTo8TSlts@f`w(SuNR?YgQ-B<!gGP<#Wt8+VLnBlVmD(5?PQ^#gn`XA!sB9Z
zkP@*+ZLz)VnEwEtQ-C%|N8F&0)C}NDjrdZ-d-9`k{vo)sk|FSm=+W#tKhgmKIot!`
zG9m4~)34b_*>)&4U3Av@N^VMI3L4>lEoB+!9hBP~Z~#p)Ja+r0M4Q<OAdV9q!NQr$
zweD=AkQ-+gTEhA&YcTxd!XEAA6<FK32V?eCk3^d+=nHLe!AG{_aeFG-3kLWI=DNX7
zNVFL(zHpJ)AlnIoOFKLzGO(PbravS(yH7u|=Z5x7GRNGTs9!TfuyD07N@|Bo^-zZk
z@}Zh`=EmqrDo#jOjC6BLB22RN8ZC2$-n#(DDxuXT{lbmYf(YI}b)FzB^jS|*(hhD^
zPMq5Q6=anS;5+sxn5GVd5(yp?ENKDeu&8QDcj?NWN~ZyV_Em12j5UP)kkz#nVS&tz
z$KuO4#hGSnqS{)sW7!2IVHe!{ebqnbD+|Y|1eWt<Ja9!&?8@l;-33d~UTHFUwFbAB
zT?;0t+uG>S)6h-@s;&wm9+!=lYhK6v-8Upjwo*S*kda~imj~6(eXJlJ>rqS7&1uUT
ze(K6CCYmrV!U`O}ur^|wrRoz{wf4WlIu4lCTmy@@1C_R>qk*FBHY4F!QwFg1D_Rwp
zx-ONhx4o@7SF~L$7}4rL)8zMBcF5ZgXj3u4!ojvE+7&iY$J4an1L;{y{*_G_AhaJB
z3gE{4k^WHgL~U~-S`D(O(m@%xYe$td1*~n@8lNkpZTC17B(-$0U)~ymLv84^rk&Qn
zBFb|uNf!=3y3EV0GBNCaeh{we8i4CHr2SJ>n}am+&!{vTI1%+g&!|<$&)rZ-uGdI*
zivWD~LdjQCK3^#xMTS_JeEnU`{{ZC!QLa2-zQe++aW1%Xi9ae68xPeKlNsZn*|n!Q
z_i_?lQhS}P048h#`~@71J9r8BqI_8w<|<^C{-c^tg)?0voo`wH0CJ$WzcvZ`PVZ~M
zA61<OgCh?o-0R=Eo<`m~a)gV0fENAHWD?6BRHn|HP_ib*!SI}7Z)YyB39kC7@@Hqq
zp$u8LBL4tX-$~rql%yX#r!}`2aQ)LM6L6w1ZN^G){W(tbi8dL!f28YibQ>K+MvzAd
z;DSdgJ6QG!?Z?xyMu(1x0Qs`#TNdZCMv_Olb@ReTi^fTc1_@1bY%-U3Vv_d+Sz|UQ
ze*qB4_r}wNIe5Pdy+Rx9BqkBEX(`TmP?$(5t)4&)o^Sn=n^!2XxIa*^n;7=FuCu$P
z0{H;_)1;Ns8@La$Yk9#+%E7;5hZwq3;>(-aDJI9|Ayq<I4=}<b7V>O{s6N~*jWV*P
z_c+39K@719N{==<Ol#U3eZ+lNOb<IXGBRz8AF48wWvz=LgW66AD5yZS$OT`~!Aio+
zQTj&3q@O*MKARJy07rs{xd)ySGVmrXZM)qu*1k^(1Fg-|O^<w}*>6JP>#gR=w(y?O
zgj)(0-Y@oC1Aw?B1iWJ*E&Cuk5N;<WacCsmCjv9rt|Sn!)HiQy1=!-;CBo~A9|tQM
zs9_f;u}I->3B-#O!(cdB3dA=6BqI5^OW7f^WGiA8k~k@)s%A*h@op}Zy{@@7D{Pww
zwYyn$uiZ{|5t{|hYddh6up$wTLhN&Nj&Nxp3;eDp0Re|JTw4h(ZVCO;2X?*JV?X&y
zYZZmy9F^Xq#x9yZ3R8UdObZmxCkKTQa5pzjcIzeqp9>^_+dAXDlJn!?Ap^MkBnX)?
zO}r#<7U3p4@!4^=)fx?qIK7;HiH7!4I^<@_kH=sUL}bR1f2a6ROJTy9!~wz?&IcTQ
zQ>048Wy^=cI-RA%!mf$dH#Sx=JK6}jS(BBL`e(^X8sI^`5(oCb?w-e74Df-H9^Jz`
zS4nc;)AkANaRZC4nbvMbR%0YrN^_Bg6|g+1WjQw%@S^$@LNwm#0sC1$H{$;QWP}TG
zZ-s^v+D21=xCx|PI@rnv7Ww%~2iY~a$q8?Sp%)-n3!jA3=QmtQ;^iT?g{aL4;d~3G
zpPMH*ox=PC-uOiTM|1MHE=j|dW*5IauDI}09{euPghG!?f}yPzX4VemoT*)@(!krf
z;pgFFg+twMc_B#Kk#cRG>*b?~^0_n5;+BK8O=4Ne5wmN5%Fou-xC4`aH$>J*HkN^4
zswytyZ2Ye1B}N98X&&+e&B`i<2Vu{_zHU@dz)2)F{{U3^9_Ys+$Yi&qYj2|BIU|jr
z6J)KZXOdM1uICaiO_5NS^T4(eFB$gPls?PqNn_qGo0Y84r(j_Af=BjVeFfS<anCDN
zpj0)j21y#x=IB2fFSaDnxsFd#I}>k((Zt>Rh`OnZR;P`Dt-Fcg7e`q6z1G^!<fN7?
zaatCcr=X~jk$}UoqrxE85zC1yH0@Fdg}qJZ<AjXVn&Eqa_g+My9#&o}Mve9RGUB6d
zs$C#!b9J4TygK2oA5^qYk@A8a-s{xx@yjF9q%4w0sPwpN!(S_f{4Jz1z}UbRUTf2h
zm<H}~{npN(d58}IeMTG&M`U><cC$MRNNujO@wED-#PC(6dmKS7R26k*7myb(mBJfi
zDOxXMsx57ckkeK$JKXR->nmHVyaQ)hQXO7bN=D*xzI({?UoJ62Bhn$QWxcNZs4J@O
z(_&5*R)bP*-+Y4pE{u}5)Mc0rib+fLwlb;*)oPC8VzbpVJ?=JEwNaNk?{FRyX(&w6
zfwuWvc)VAddKpb5MWw>`Ij3$F{8369W-;0Dt~4zNaA__6%U4aKLmM*Db?;*QQcG-`
zcF!`@DXN;?+gz!ohO>3tOIp2(vr2`)mo=aTl-H;rYfD%YPx1Ki#@AsebXlWigWOzJ
zg|*N%oQte%gVC6^j=#WGG%(cE5YW?aE0g2Rll6)dWu;D_#}WZUI;b};u==T+qfRrl
z<r2=GmOvc)l}vw*$hOTy6isbO7Ru6Tlnek}qwW+MZkTDn_S~yzi`aij{g=0bKOAUv
z68A-jM{6xTDH}q`>D3k>6{4f41OTq49Ttr#N$jCyfcH)>PPSq?ulCCGzPO}yL=rKg
z_ZD7*Q0ugXM_Wbtms@J2aq{d*PLG=PUWb~hxzZR(&naO1Ig!IK5%ph2!_(1T<$)az
zg9!dWx)d=*66H30(mxEIbLf;!FX5Z7n18bRRhk?F`3LNzZjAu`LHjNL02k2LGv`=8
z3_#DKKDI>1_+$ypP5qb9t<s?%`(yS`8e}8+0xDS7pgw<Rg46yRwTJW%*%r^k@ZaPg
zviA|ENBsdW`fPvFkI4_9RQ}HvrRc9ji%0#HlR9cmyLMaX7p#A$M{m$SWTJvG{DbyK
z<cH9lC-!+HohtV*g3^AWSIy8~yRPs^@n!8shCk^EMGHTrACe2vxJ&Huns3ASqsfo^
zD~cYK5Q_#C>Hh$bX#POBP`CP2XYtRpWf?DK0lE=rz$uT=-^gn8FUhz1QW_@z07{Se
z_<n}{{?9d+LV4sks2!k4f0X{q)IT84=nICN&*&er55~a#1xkNsl}Xc&JhZ4K>BlsF
zh3kh+Vg5j)ewP{Lici7u-=jHXe$OHr1fb!E_C&|hl`{+3!|c6MEh-@I&=rI<5ww1g
zKFU)3e~<JCsk6qN(DIzPIF$^Y6F2?evi8@}ve*OmL%x-t(m!RFgX8}I;xmN4&lP_}
zJ*~diEca3Lw9vxm3!E>ZB%_Rv(iVHDbeN=p#I$g-{C*qOg1IB(o~)&PJyV+Y+v>7)
zBIfp9x%k6JPX%wM83o(>FEXu&F^)DxMMFsIi?wAOq>J`IR8=?v0VvAjl6VT9pc8!E
zZpQQvG==9UDk1<0<%AU+qz2hHNKjgb3*o^IN_^KYI8nK$l7Pa(e~2;NdRO7&N39)-
z^H_h}XkM52b}u_TU3va%{RzzXUYQLMw+mNKQpkY2xbU)C1KP-%3HV1;)Rqzg`FUiD
zVNqtCx~OQj<plb+>@~|Y*<^lhZSt8sj%fW^QOS^`V%eb;?I!Mc{nOj1GWKb@%5Ql$
zx#bZ9oCWTdGHlIJr4os9NKnpWX!d|l(N;%L-~a~5gErQeTK@nl(R2X~H>mB;Hc2GV
zLG5V{a;DXFSsLQTy5B_xocGNjbG)vsTj-RPGf_t@lE1)Ll+lt0DyK+>;kR0f2wP$B
zy-XNe3c48$JBb9VT4=xkC>~nRh0)ZprzLMHDhRAYr2}fLtFXP!0+xElk%FtIkjQKb
z^6tfyfh%el%h^;_*F4-X6>lXlcQz<0sz$II3!jBtQT?_}J?P8o4w2U{<gAvqF4tLY
zb!Z$KPYWHaHo?p2e0TaC(dhHdcze%|>76rAzN`le<rA*A-bc!tq(ox1rN;SD^JL?V
zi8%6fdWTL?5gSh!T8dh0JP-+0{W{h<7T7ICByhBX=K_8g$xAcj7l9#Z;&5oihlJwy
zH0=QwxujW*PN$_ZNC^tD$ca2}(Jq?DJcXpw;1(A^(o=eE7s9iocG3V{_%o>K0b+i`
znNHhq6mwIzZwQz@!sSTt4gg-(9#ckijP*?kd#oFTB>GXYxLSRnUkVvoEO=cKYC0#`
zimKAA4T8_=`g6liA$mni7+P+#n#))icw9bImmbBdJmK1LGUnqb*x_s~0iY@MN|@ny
zAyth;x%M0{8MejJEMvamVREl@aNt2Fg+oOvNd%R3M_B}8o0Q4XlDB4w(`|`)$Ko8@
z;*q!VwbE6-SkBx9g6ncjPv;=2;cipe(HBVZ4QZFFlLM7bM%h7E+QUewea3F7i2f+Q
zmGnRK6`qm!V>85z0G>kn2d3wLq|5kT4ftaVeMtVR-*g7CkTT?OzE8_v^EO`}Mw*H4
zb*@$Q2wB=WTet?T7M@1Xy^qE%63SV_gnSMJSy!;wB4LumFL@DRi;^_lT`DFya*k(~
zw*x9TBy*jWfnf?Nll&s3Lsz=cl%X>(Eq<t4GF8JM1({g*E5Pa}u%7E_O(y07lA_U*
z*;A@eG3_{6eMX&-8!g3iy@tZ;AFV?p-dtD8es=^a;<kDoET6M0sz2IxuO<9UpKUCp
zy7)F;t*swQH(W0b{8rSXjtN@gyl=(g<((tDB&rPX&2{A0KGwa^EGGW|RLx4K)v0^0
za7ttkxbVMD#iWt*({{=5ZljY8B}sg6qmsq8!lN+&s4YCFzP3%IZbM2v#HicyZWNmh
zA+x;5bCm<YM7Rvu4<O1=(Fsq0?UWm&Av9oumR(V(^<TqUvf1PJU@vvi=4qxEc;mA9
z!|?p>sAs#lUqN*20n|-%o(H#!uZR54jd?8Y@wy+YHZyyhszVTSh-g+i^wC7qx<D+e
z^vQoP>#!SnE04v*(hhe(T9pp?w>e^U%3#9a0`%(WNQ*ufp7l(T#!ryF{{RkgZjUli
zmD%UIt=dies$(GBtaZwe=aAFgQMyre^f<a52eIRXrz7DD1MZ0zAZ1#|OpV6I>S$|3
zAe*RU@PnKipqm3Ht*?Cd7dAmOT;*^XPXn<+j5WbA#B!u}3KyF!W;C3frHt5%CX%>v
zgA})*nb#RtkV|3umS&0DUNWz!P1*wE%^zT4#zzx^oMj=nB_kuh3ye<W1<!OVXlCul
zB$AsXWV9)RcBz;Jt_9Pf;I>lD6M@K4fUIhO&lf;D^<#x}&iKZah0+WQDP|tul?@%r
zmTQ2wvD5kkb8O;@p~HpHuec{Dnk()XBFN~;Y`clWU<CG1PGh;wJ1O8`^v85HNU<1G
zy`3C2vKN*M*)%<al9=zU)MN!iouq^5<YUMgR!}o=7`@dsAp!Xc@{&e01LLtwh|I8~
zg{)|C;WDzcGuYGLga)CivKY%+Y*k$x?yIT>*t$KD=-B9YmBHu2J6877k=-VP6Il?t
zZoK<M>tS-_TRkiiN+t_f{{VT{@~Yeg?vK?AoimBfRe5XAW6HEsNQ~y2EVQ@#?ZVbj
zNYNO%A9aeO+|z#HS^j;@j=<$JAuX4>o}$Q@Z0jtZqgwiz3tCADWpwpYTIR~nNzsek
z3x-nv0ANvXNCQgKUo(MlBp)kdr0D^T9@Sx_=}lur+As81@IcnL04Yl+(bbO+wg*Q<
z7zO}VRPhGd;VT<rr;WX=p(!0IBihg!qj#IB_y|gwTEKH;iInJZaPFd(W{yg(snh_t
z1bvffx6bfMHdKroBRt7yDbkr7LwHhCQ|EK|Ph@dK+mZ=QbdE0e@T!uD&fKyv!82lQ
zn$T1dPb1u#!E~fso)G0@M-oD0<mD$n@|^C;4X?^p=&DC>E!itSWR}8KaFR@TBu+1E
za-w)7`BSs><R&}<Qp9NtjAw-BT$}K@mIS470X^(WBejZnz)-$sx8V;xYgp1Z0-BgP
zq)SrZE>MQ0tvNP8RaUx35X_;(HFLk(9I3<XlgwDuYK@F@bxT>O&oSE=B$Z`Nqe%Ay
zJB_=mYFY{^axT!~6QrU>bCisoE|*_dASI*%v>JAVAhV_*k;=Ao>}a%10@y=L_rLWU
zU%^GlMF}vL%MCc&8$(F&n(Dcq`dx$Yf@>Rm<sDBDwZOtxG>b<K_As_dGD;q%m~wem
zVWQT;9;^!~^K7fd6pGNm(}9$2F!o&v=9~N@DeeV=X6y<yDQ%M+4e+KpO*XbH5VJL4
zlYzM-co;cPoU}jcqhqc?;R!oMF(AmTwR4BvBuCmuWUe^Em6ejw6PkEXRDOa{4kbfW
z52jNlNtF+=dG4m9X)obJCBujcdM6Fy{HOFJOD2qRpKFB8%o$0$x{E1RIoB9aoST&)
zH@c1EgOpIpGzVBN>!F$~Q8k0VbSC=+cnOd`ko#|h=`4q*eZ`cHc0cl&t&vYcU!Fe6
z*T)Hf8*-nU3*AkH4i_Enkk~F4Np9;5^hDuzAN(m|ZTP}qX(Ze!VgwO{&!JP<J*)t~
zW!K{=!;JD%9N}^g`BI{sv^}MuXO#WX<qRI(y^<LK?h&I}VFmkbZc1b2dwZxIJ4XdW
zB}o3Oriv0&iKUd0pQ;`2!LdWhRtYKq)j%r0A6UDAY^v}k=7f90rXe&mUyLZdLM6L`
zSIpi`fb5MEc3D#vwVo`W>oWKL>bfa`h=8Lqi(I^2Gm2pOS}bI!V8F5+^*$AJwJd2T
zavk-}IJgUONLM*B#nmS&6HqhnC?8$&A8AZ1l#}gQP%W^x)PURW`k`d1b*?_iMId<h
zytJOmXmp1>S&k$hD{`Q5_5&qEt{CMcamgUuY!&@4PrQDn-|mi!rnd|N)V$bf8JOsv
z_X5-1UD45&Mgy7(w~Ik^Ocw3kSVgD2FakJQ%-SfMPj_Z82f}4tBg;T$GPN;K*jmHx
zo%v{5;p%L{)MX<l4Ft}yb9WD-HZ3ua0k4MN{)*Mc?LH=gLokwUM^25m{vE>9jmff#
z9U3q_t+#&)c2KkncM5u)c9aW7&EG{+U9C8g>B8alD2$@tqScglVdnjlnL^*@l>X|0
z+MR3JU<e20GCHcQ)-QMNl-wINY^S4*w{!FIp6Rsaw&r#MJgls~qnIw|XOna>hWEKA
z>Q)_LX0mNYiI>?lWmZ&cvb3K?psG;|8gK}@cEC7Vkn0g*b;`E@Kp{gerCj`agahFW
zF1VX^MNn2XV#zGeKIt5B<wdk`Zhofe?)eEgy3Lg0hV5@_F5BMMU2)|hciAguq%^c%
z<P_Gl3)m+a90?^i)NvUBWwTh09CuK-Seq3ipU)#IGH#wC&Q?bIl*c&OfK$&u*)`4i
zu~kfqK*h(@Qn!+$EG9suYX~_UAjDT;5PXDSv2D<hH;dgI(d_>K%IBVr>_aR*LSu!$
z<xB<5!s8j_6*SJb&@-ExE)kz9X&CO~DVq<Arm-kNaostk;}^o=^x-aV<t>FHh|RhA
zO40DRWQ*NM#tbcCp`7+k79)!(14m?~pD9}z5SI8MG_~A;buXqnl$%^QIJ(V-h+GKl
zLSu!#s&@x@xcE(QxXQ_yq7pOVDFW8F3HBEv*Ij^Ycs^0EBp|hu+s;73LE~z3M{t#l
zhqbLH;2+&N(GUg*QU3tpG`RC}5|l&S(s9ZXpb!Wn?uzv#2iqwhbp=fFmJoJ0e6<+%
zB%7k9W1fF>(8A{60;HDiept{x5Fv2?`q^D+X!9r{Q_!5Fvdc(RB&ySZ>bRAoK5
z^?!D&K8_{Wru%<bHc{H)Pa|8l-qi){Y&b}C<2!G+E4KMg54J3vUJqeprO_RZ6Tr?=
zlHVMzX#il^3o;h=DQ*vJq{Z$J?v<@J{Xn3`vxy!ok;1~^bAh%pQhSFWrZu4lgr>nX
zf^&N&lV;@(&0@Is1vj<1N)9*)r<05#fb=0L0ZQOGUA49X;FQRddl39(C4mX$fOiQ!
zB7T18ibuB`t~b566!ROblFn{0je!l|F16B<;m%TnenL@(?Qe{vBjrjhYZQf|*jO~i
z0!D3h*Z9A}TXs#dz&IWf9PpIi!b9+hhWF(*{{T5pIPH{{2S2g_>|i4z*7~HlvT+&a
z>9#o-C&D7ojyAu_VJ6loUe|VRJSK*?_P5Q`#FWN7{1M>}?4EP-h?3+HZa6}}lY*#8
zpo&(u_8@#KNFlpM+kWb*k;FJyD>`@L-zix)-pL;Zaub<O26m-u+zB0&(M)_{F2az(
z1_8PHSwlNU%()-yHrF8uR`wD4Q3`&Fxj@};RA;%j3Q1fyU|}}-L}WA&26_6f?QHV6
zixtN_5ri1WcT4*uBK)qkxmY5O2Zh%2{g)qvpc`_OWF}83q<jSL-6gwR1%SpJa91TH
zTHGWY;HDOa8=R%>{{WTF&($Hx;SS8iOMisZ$I)^ox-<-9TXHRgJoOG381heaY|}#v
zNtNwy$0bl#RyIiwrZIdk9(dB|^W%N8S3Jn#OS`AEG-QkYReNT4WOkb0UO)-uBw*Xv
zUsl2(rJAJKfZO0B2TsoBZgUB@do8C+>2%GBvP$mUD~(QQAb`gNOdmGNhHo<$kFMFx
z@;3B&EpC|VLwB%`s8L6KzR`t!ukCz}B$BElx%RXGJe5pYURc@CrJ;?ASGWKPC&JKZ
zx+PTBdz|KlKTFcVH9%lse4baU=zTO~gg!#Z*amkSFGC;Wr;<FR=@FdS=F(70N(ZLR
z&hk`j71LR-bM8NtxC_%YI!!V^`gjPQOaA~b0Y6FU)=J>%7y$4B<)7m&bseB7QRd%~
zsc6Go?*9NpEY%e>$7_iT+a=IxV~CBdztLfOuR&oY?2gt?lkvP`W5#dUk%Lid4(Vn4
zE3GeCGRy=KmbZdWD>+$5>A11Ywo|BSBoExzIDHM2<I5lMDQWh5XG&JW$l7L^ySx&$
z@M{!eFgLgNUJ0iPw%9g#0Q#%CTA7(^&i5a#74m*dBqOvV;(C^&tWuCeTpaI(melH-
zASJfB>^W4ft}Ke~co^d9p1)gbE*j<KPtW;Y!x(Z7uOo3UdHO1O9q;y=U$=E%KC0<m
zVC<ev)U-3k=L5L7_a$@cPTDWVk)zS#xDIvx>iRqE_KYeT3aFxBFLlrOM9Hj=(;Gk@
zP|cDZB0MC^cxepJ7jPbOw3;;~ECIgK_k1jFm0s7%9VD3fD@`81MN1dzYmdQRx8wdS
zaJImeX`5;ZNMIxe3vdxKSGG1_g1qzp09Jaw*iJl-%FjxzePxaJU3y<S$m%AvjRe(G
zR0FpGRBBX@d}PS`1LYSsp#>aUOPXKe`Bi4BO8LWYi|`R?Kh`^Dy=)GLM2>0ix4$-8
z?K?+`7J%5%nhu>Fz)1@FU(3N2g{}g;F>qTl*-Xkvm;o#Zx=J?5{GbFZwGA?Ij-shx
z0B#F8#dbA?$EHJX(g{f>ofWuG6|J@k7PnQ3CL6q631^B%v9duF2I;WXmY-%-T$Qe>
zb-}{4(`iG1BwUnn!Q}mj%OPb+RQG||Skvx!;HW5Q#lb4>nwSQHLg`D0Q*r|I3x+~_
zDS$jHF&jYPI5ZB(^C`dzI)8;TU;$5rw@b-~fWaF_WV-@eF0vLk6gSfz0_}t0I?Jqu
zn~D=)U9@~9!t5<(q;}EWG_YHQ^w-|lSQMy>Xu6TD7ElB3xhi%%JA}+grF#~`!d;;)
zmsu%FLv{t*0$VP!Hf|_QfiBRN%dCJY4Y2T+XiH>-fUs!@8Up7%tr<2$RMfU6mlI$+
zuRZGyxBRQ04Ku(z7hN|O*qoBmH`Q8%F`cF06$@%Z^3!m<w?Ws%RN?bYxy1J?WB$8E
zO#pP0F@oL7+@lq3hMP1GmceE^uChT+_OZdD+^U^l@drnxW3N=hZw|Whe!TolpHSaT
zKno+_yUOREmyKyVWfmzjCHRu&NvS&WZ*|UZb?17UfR4o8%J)#Je1+1?^5;7%Gpb3w
z#l4VD_EjoHB}2D3gbd8R)trpR0uE*of0S4X=^0^rp(n5w%CdWJ_CVA$ZX(F`fWR$s
zaGNLrw^Nqb*mqFRZrMSEf*<!<epjS^9~TMZ&4-od%{F-Kw%r?6BbAqNTs~sB3nSmO
zM~#gD-s39M(%$R4C1bjKQQaGJWv-&Ffvg5ci~N=HIWhjj#nCI{kT=>a5ET#Db98N1
zs{@9}vP!9$?s>b20ZLTe6jn&d+)b4GrXX9|g@S0K<f9>~fZF60Xu&i}O_S2K+k>7-
zAwIHsOnVqMu4Mc0z^o{=_e?{d{ntcsS(7s#>C#Is=L@TyI)&^v+h7)&9X1%-?y~2@
zavKvq>iAdfNZeA}A)#=N!DuL@bAYm|q@a0y+!ggCA&nTy_A$?jqb10OsK0I1MMUpw
z^6M-5wvCH5sWkeS%GvSqh$N_2*9HrcN{%f<d#!r~2jr!fCiYT|IqYS|KC8jWFOF0y
zgO@?9tY+RqbEIpA>@59FLn)tNcRS%Zm6FKYo7&2l=gH^^H0h1jT-P+LHnIn~YIO-D
zehxgW#;h>q^j<cgcE_X7x`0{E=Oqc#lE~WjhKrloSakz#@;P16w8BdE6XhqE*T(D;
zzeliiRUJ)CY%g)QfV~QnN@Pq9aLtuxM8OnPahwbVsGe4q*{kFxn`5u+1Vqs504x#I
zyGQ8?D4`B@-IXOw&4N5wA;J3(Boyfw!ICbfqkCNbLd;88_sMcim5!TIZY-~Y)7Xw_
zn+jq!jH!*4Z4`vG5>cVp<$Vv2nWadRjfo?G2nwm%z;dOnosqEI<z_WX;z`Ys&pFkh
z8b~s(xLANf&+4<fRyxHGHlP7FK~z^Y!;rj*<&>VlQtGs(M-ob?{H%?2?6h-KM1N5T
z8KrBE)^dy*WM+!TNi0B%*rRl(z0U?m8+;;Q(~QS^(e(6D#6}Y~gi&RMJFg9zF>I`l
zS;zb*9!l86S{Y!oJy^~0y1`q=P0YMrj}6x&+fg7sRSbZM7O$yb*;4*)O3Ty>JDwNN
zNBD=cbNF>u=;dI)3*EYUsn3a?>*0L&&~E~vyf1j^CkMvP_`><0G7IGzE|I*_8t1vI
zRYKC%fT=VXZW>5hns|d+7r*%YDljD}HpOGSq9JxhR3(Y=f)}Gg*<lod)=w{J`9U?-
zPTsIdB|DcyHk*|m;<&tptP~fyw!PI(yI9z%o^QZXPdRHzy2tfhbNwebb{8&u+z|0r
z%+&=+e^E&(H_jKPX_9V*zeVIaRO9_j6Wp&<&}9y$Z_#t$%Wi`uOtYDrf~eGKL1DO8
zPIwJfI+XTl0VkV}8->VxQfcV(p0$KSODntrzDN9Du9@|cM{*l`S$%WYFTE6{*cL0}
zpT<e!I+NpJ&GNjj#Nvnf4WxGGlUR>4o=<-_%AS??u|hqC&#>;SwCYlAa97vD?DAVB
zXeFejG2;aoY4(9}Wfj;7Xt7jog-ZG>s$;MxC_C7dZB!ey-pZz7XI{!OV<U@{E_KqT
zfJs0i9twrWD1yh^0SzG9?1ZMHL(*E8<tkZwk$zXS^#1@?14z~a0k#*<RFW1-4c7Oh
z>p?7OE5-b$in1<6v1M`5=~Z=7>JozM*sT_Y8(6_}Yb@56G-ZI2FJ+<ACTSwe<}%z>
zB8fRWWuB<!eq7q;=)8ljX4xc!mFtylbdV6i*?FH?=<j=;=K^l8_}r=)KV}@U(c}7z
z&U~iaAi+1vxz=dRGZA8|y(4@D_V}8VZ5+)GrY8vY<RM{<4#?Qsg<3Kpdr-3slyulY
z%5Lw3zQ!OUDQ=a;a$;m|`lye}mFgqiOe|x$N;zCocgnyDqy)TuR+~#;AY3fv00rYK
zRi(5z00sV3va1qBqzsP2{{Y!eU>3kr&{4V8Bz*!hqMy@@+;&{943c(G%Eq*)oNO!+
zRZaJBgqRkDu~c+oTLGxKB$OkE(Gxj4tXD-5dEr*lJMNI$Kth^-&{4GXL^k9oYhVln
zET);GB>F2{MfpTfk#JD2VZJy;(6H_SQ_#xnxrzS(!^QYR)HTHOlw~|e)3CSI4Obk1
zq_t(-WY9C1Z<QOFmCtLzIZS5oRZ}^f8VRS2hhKzSi44bt10L)Cqx+*Nfs>1sg?d{6
zse)Ogu(`Uv>FqaR1l<#-Y5T||E82Q?#4H7qts)KEu)07ai~uZy)?D3|C+dxgz!0l-
zqjq6Nb!S#2+A*4}(6&QsUh2G5MSd=))*E>aJF3S34+y4dMJ5_5BRpg5r>Bfe;bl}g
z1zu=p_>D#A$tR;lqG>F1L#=hFqo8C~vvJ)Cp@Hc%k=b3di>_>vXJ#yED;)%3pji?C
z>=aS(q__j<quFYq)*m=hvB9G#N6yxv<*F{jZ*sR5#d3=5GN!0Cqz45_Sv-@St>GHj
zpD6{y3C0#PfpV)DCE3k9t?3o8QeFF>a;z9O3pKV*Yem!crff*#_Qo-!oRmXZ--O1r
z1Im<el1!`;6@tTs*S9G}{G@nFn9OM+>wvkkVYhVV9H795y|x#+V{mMwf9WMa=YgBq
zAn{Zg8M}YVj%QoCf%TEGzo>rb3cW`KtRXyN!8xQH>Dtn6MbOn1t!VRgR41Ni?F}a9
z!m^^%jG3L*1z&|6(#w4nm0FA3;?~@hw3PJ~PRX!7Rpgp|3@y7{9PbuGmpU{2AS^p4
z(K>PnqtfZ30rDNk!YWDNiG)VLfsfUbE^?D)f(}7g+aZ#oNgP1nDQVlgF1m@r#Nkf^
zu5sBTm7P(>kvmw?ggsBfD)$EnO2S78HabX-BkunIm1R%*E=s73xSkcYH|PjRbP&;w
zQ1xRRsm0Lscy52n34%xrv=WJj^zwr_;TH$#;Zd?obL<Z)67R55Ny>@je#js;4LQ5=
znGv=;C7k<-9up&WKt=R6GR7~`Kf>o85=DKs!si7Njg7u}P}GuGRENTjqT(`&Vigix
zyxjM}Q_(bU$@x&b^<v6uCf-g}894S??FGJ9ZSDQiHum}_T!jM2=C;K(_ThETZ}m-a
zH@ab)0<9l)T`4W({Soz~Wmmq}vAXETvKb|yx>p^d>T#Q69uU;$9NiJ>1xAR)=vMN0
z@SZPa7U5;vu%^&?Q7-E?;Wf|p-s&ez1@aV6lw1Nu(NPPTHuHO_qno|ZQM?rJ;6i5t
zN@4DpTO|uL!;o@@sGI^W>tP2iV_SUv&`?2nK7!<!@p1x&NuAuFC9ZiM#uN5J$x%};
zwXwVG6VgQave)wh*>Zwfn8))f=F(~s8~cFy3TX5y*`0R>Bha?T$z2%W61kP8_iIV}
zBH`(3t-Z(8qM+&O+Ix`VN6~IUD;q4bKE@{>pi3iVxBF-IS}i()Xk@#?Nf}m+q>fhm
zqaP?4vjYDBS)<wtfz7Ow^v2>Bqn#q0w}#y;T6H`<oBffof6?cZ+Fe}kv)d=^ttonA
zc3jN-t)r@GX~mArd@9=hpkyDSHlLtduxzf6rT`ZXHy<dPew>}g%>a**qW=KZ4saku
z0_ggJXCG{5?3S3(wp>$myN!&Yzpz%c`UFsm*}qkpI>l*i*ypr)T`sAp$jdgN%|AqK
zdkV)V(X0Hu6*(pL`N|%BM@ooc>l-WUq|CF(euXkPoDaB{eNb~lEG*SOUZ7yScYoW2
zES*Cc{Sdr($10*0GTC6dn6Z`{Ktbdvuzi!wtyM@ptpI$XpI22U>vg_~u4o;XcKK6z
z8A#!Y8~sTM-y@CBl!72Le5nB+TcmZxv4j+vMHrz#Xy6O^P|ii|U<#05IZ)I%V)jKg
zKB$@!Ju&d6jkmGEx)L^>w--{keZ`zYa#gUo!1RTXj^f!Um+tg|I8Zx23Pe>ZL}!HS
zUyLQTJgz@P<k-$ImhJGkn-$l=<CINjdq_=o)0>3h_9{0uq+Eco8W`>kyeQs5y_4KH
zAf`B5AKfsH#t-t7Ij~OK+#~|v_eVym8saZ>!bOyYx9w!o)5-`|L`m)4HRt~Tl<eR9
zCch(u;tYwdGF%Xd0N*11Y=hiHg4Zf$PVh~_%pSuaX%4wXzQLoi3Ywtq$hk$AZ*9gG
zJi9xv=uB~Pk=GnJfRqc{AtSdD_EI{ShFJjpSzKl$WF#Q>vT3ljz)eCA1-ulO_YylK
z?v<yxD-4jJn<wr!03^k%KI?$KQjJ5}{H5Ra@KY_GGP^wXT7#j^H%-9gmCY?Ty6c-P
z!)Fum^h_e;3)?C8b9px@t}X`TVDn@;17chZ*jaN=lYzz8SZ5Zx;@f~hL<d|Dab&y8
zL9rn=$Fg32hzyX=%s6rZA4I;pd&m1FA-p-EG_{xF%V<8%bg>a&910$Db`lXA8*2=C
z!h(AS*c+mOC8EAUL$0J`k(OE42g-^-ci0;gp^kF}z*mXq<rid5AhpP-Ap~4J6bX!n
z4{7;C)3lD|RlOXEY@VVQuwS*i6ga<fRMNUlwj_|E9Au?BU?{bhZD(g&>blwGaJczP
zWpsrxpX&sDS8RQ*MbmGb@xpXq6Z)1FiDC`P;BGlnY%Uz6^s#|#+^uLNdA=?eZX>x*
zF`hs+`X-i<f<JY;Fo59YH1m6>U|W!ze4H#1q#NGFcH`Z4<;DBErUMfFf=m><t&0n!
zCAaXfj6eqNNcm1JJO|#%w-@B4=eR|RKGKddneXnD2M+%LvQS<C&CoE?4X#pW!jZ(B
zSQOUakNhGXjkyQty7uKfmS7u%rL8&K5U|-6>mC<eayU|Ye@lEOIj6;fz!*>6H1{dT
z375|pMIbhDJ{M!`xSL^d-~f+dv>`aRWZ#l3oO~vnf64-}9zECX!im@9pZ*k=KV;JT
zf(4VJa@h=yBKc4~_denj?iU%i)j;8UfSm|WNO;Ir5jeCPv~a7b<GC3k*}|}jIRh>o
zgc%=XjgVYi6*C;qBq(+~aNFTX%Z^!;tSBTgj&1I5^x+Fs(X`lu@}>^8$Ohb@CMP*1
z5TGdsyB<?WH&VV&A$I1Gkz`vaLz^1_7ZRl*gkYvQzUy*@nP0J__PvsKzl8m_!3oWX
zo&}Z&z;B!KQ{u5U$CciR2R~$nGCqk|R*4H5ZJQ>#EBu7PykT*3_}o&0&U9wh35AEp
z?3`XezjBw<Hu@$8$csq1HwmgozmQa5X9<l~G>+@G{H3+dS7XRTG(cYY4cy{NYp^l^
zD8m6@HWxoc9YbXfy_c4y7o>4n6L&cNq5{9^_z0965`3z98aXADUAVg1^z}4U?GBiR
z_sW)OsK>GyawLsTkR|k5J6R^GNN*|=tJ6l!u^ZTOfvK+&+?=nR%Z=onq;k_`ZDlZh
z-t)A4l|@@q1aH|8+<f*{8m!Vxc8h`GRJM?ZZ*`k|l2^0hev9^JOjoweFG*_RiQ(c9
z_jWEg3(zPvs{LDQWSEHm0Hk0qBB!W^831W7Amv|Cbqw)F84F8(cwWpr<fHo;!umaq
zkNrB1E%QCQ{{XtN)3ul!e_J4ga_1gbjnQhA6UZGbrr%x_%W9dn=1@hul%M^BZpGlD
zdS<27dR;pUX=8m<pVUXSWOZF?TC(Rz85>Xk0C-uKYcw%kvQ7oOf8kZvYo?@@QpdHw
z*5i}*?5CH`jctt-5vWu#(~%o)?<EtaQy<qMIplU#R9m<1KIh)~3g(-5ZRCE@@E4aq
zIYnp<+YNMqp4I@NlDE_DFW~`QsYf5O9G@i%PGp_o&wcOkqaTw#*c~9+%}MTUfj?!L
zud1EWIFfCA3-Gl5gl02fKB}^+m5z0Q7b~X^ix~D+GDxPSGRQ%BAm4?e(tvO3IJOYf
zdU-Z?Hva1W07=rFBidZtc26%EWORp93Z#Ye0kNdrS<~p1QrPVveHNpobT$Cj7JlJu
z;?p8zU<QkY*$>BJjBTqK$-a*zlSHV8+)Ik@^yv$1K|fNxCsCt?pqBu$daUh)xv{hX
z<gPCw5XE#Ptj|Qp#UQvO4$9fO-Bc9*lK_do_Kct;kY42jSy>APU!SV*pOKYI^?D=I
zu*vnQckXkYZzQ60-mi|C<8zwOI~A3vsuF`?^i{LcI#Y4ah3I&`Zdks?<dQv>lkqZw
z7_B70yRd0YsQgJ~ONfPpGqEQt$LX}ua9xw(Ug`R6nhU+H=Qv%Nzbh!N!SWu7Mbz?C
zyg0hT{FQYNPyo?qT-kZEXM&bL)+{+uJ6;SniP&Cjzaf%t+cma&g#AY5#c=T7l2tsq
z>7HNKU-GaL>oQ1hB!<bX)+7h`LdVHZ4>ihL8OG7-nr^TdMa9oxwt5Y0)jM}Ru}Af?
z@QpuKk*^Pt&OPw0Wa}E(VcAO_(fv+2{g={sern^iMo^}GBd68UFa|bOz28-H1fk#+
z^G{2DAR1}M=1ZJO{Z1>?v~R>MB3Rq%Rzw^}8-ny!Sj}CH7by0RNd+p(Q+0lqC>tu+
ze(J&<c9KuiP{a3GY_~LB{g-`}bb6dF7?FqWr)^|sxc$+ib3r#<bqJ}9_fHcr{{S-7
z9!P!{VKhk3>IrwZ$`l(y-F4F)D@SzSUA|GHazx3JI0lr*Owc(&)l?EJ7D<aKDk7?=
zv-Y&2DBR;>Ra2w^_cr>c{{X4S7}_#X=#MXK&<6`8RTPy*TM|{APX(woMPoZ8T)A-|
zAW%!Cx?zwG=>(1P76&9qpq@>l$zLb~l~t<NHV7Xhj{!VmvU8OqGx&wCwt|V#G2ZtD
z;GIFL%OtORo^F0t%dRUXudb2XiEja5^-3b*ZVi_opXSF5IIhUzmCD&l&3{pZ-Wf|X
zgpbxW8obn2O8)?hp>;TmU9=7tP)10|KSlESyt&P7p1vm^qpBs7$^F%Q+m1@NmK%RB
z3bw6}`2lYdZOFTldMLFyHgfEERFw|i?5k}~Hxf@IDzh0bH}bxt7x6gf*%rV>z(Cb9
z*|NATYa`DproK#gx}z3~`7LjR6;9E6Ddl<1f(l|?!U(|f5Qdr8x*_eg$tW6^T-)Vp
z1JKL+{H-rd5*`Ryc){KU*3+aZy-6AkuDN`l;$^mOG`gwch#1KjM4f7<e%Cp`U$I3|
z(1z23060||lq5`T?Or5t#&2l16lwImQsJWaC%Unoy6w3u6F_7S3~4suXeps|jJupy
z4u2gfSUyCKsMH=G?QsL;7pH0k#CcWKbj=(E6(M^aX5cK6<DzZe&E}n0)>ycLR)&XF
zxD5qhC>-KIxhqYjLhLxY$i*^uvuQ;?u3MX{`U*c#1GQ%~PewA*=LNFUYGMr=NV4@j
zXu%?jWbx_XG++eDVG)DyjCEvTwg%-_S5#aRbopkZv^Vhsu9cuz6aygjopPC3FS_b#
z2}UlO8Tl=fZo?s^Yg=*x167f&jJ2xHNgK13QCn#Vu>db4%Yu}O!c>guqY_MB?<m0p
zF|Z%hY^HM<-d%J&^D(#<%1A0{BSx;-RjK3<00Ct+QSCQcs^@|a%FF7!JH?mM__~48
zsjV0;pa$+ybd^btwYJB(7q2sQ?VF%9NS_^35B<r!m~zI^JdTfi={-f?mSDeSt)!Ak
zt#gIu-6K003k%<DaJJOiv@B>1aKia)nA{{wo%U*CEMq*B6=@FTR>!L`=W9*TER;)<
zaHlMRyXYCw7s>4w3c`_s5FF&gED$$yh*h<EgXWWLcxu?D+^G#pD%q)|t``jjTE{D%
z+$`3COCzk~bAIbrPZMKczboi`Um8_%B=TQCH8iqGl2tyTK+p+1tu*cdxl}r>Q(D($
zcIJ#!X_LK}?N*pZO|GdVr=Dk7w+-&JRdTjj32_!lAEMUc!F=voQqXM8%|hl3l1fTi
zaL4W{?yNEH!iA7V2reL@86<_4+0d6-z+p%l_d387O+0LMfC9?Ko}HYeyJLC-rGV|R
z1ggHHr9Oj+9hS5BQ8M_t%Jpqd=v>fjEW7-9#X3e&JWs0PADn%H$Ja(fxLa<dA=9|u
zm66n}JFj{_#SYeso`i$cs%CgOUqp0W7;F*avibY)_D23`w>brU9nvzl^31n|^Il}@
zIY>oOywa@`8m{1za9QdXf&#jweiyso<xVt5BxpI7?wlM43I;eS8}(k95>41m^%4+D
zVPRT~*)OOQA2UGZLiW4L9%j1PDJP_4?2A#Y4UE{VA5qmlUBE3qsz_<&WOXBQ?pKAL
za-LL~c+pR#w6?jVoZWh#O`XuT<#}5U%AiMLy%(gacSg{f4zkc>&2VPs*#lilHWEUz
zfx~KpQIU;=lWrHKmmFmsi5WZ5;{O1P)s3OkW+m3ay7-^2tBrQAES%lNeO3Pe>mjPL
zJvvr3*0>>jeP1uDR`cb>bAC6+j3p_ex$-v^6SV3hEAkeO8fHNi_FVlC-9G?u4tmml
zUN=XJFLEnK6J}DrX<p*iura73{5GFz(rOfJZQQ6Uni_Vgv7!Sbi?DKrmOe?qMzS-z
zi>Rt2c^R-D;RYKk?Q_C6PNEY$ToM!^ox7_oE~+Yd0hab260htnmZL<xH)A_2uTWAp
zl6{}dR<BU%_@brsXyE|b+m1@dRX%Fjoipx9DJ3Q7GzP*!SKU8a=%sCs3Z6(D!EzO^
zPQ&WX(avnAl}1o@1=;8tW~(`kqBb~>D_zqy6S`1k#rQ+?hJ_T6HO~MZ!pmJxq_P4w
zG~s-onUfad6m~){vdR~=(AvvC)b!1LJIQZuR;y2?0iy^$prpJG7G5S9sN^W#kDj`!
z28o?v^jXm!ZDr_vVWvCQcend2Yw5iwScCUppm;eH@uQA?f=3m*DJ%fOnZnt{$CNzJ
zu*WOVx)2_v{EOuX<CP@DlXU}$NkL;?ZdVKx*K?HM1-VQCt_m~4mET1hvOZFZMcs1e
zBpleKFij)FUI|*g4yB^P!2MQ2GnH?rO7@UJDKaerO3~?hbwoliTt%#tP^@Fd))AGI
zrKqTLLqV`s6ve|YKf33Z^i4*XV2bB;uXG)3V#FdHPy;LwlDNoin<=!4W4kLRh}}s}
zOC6Gk5&2A%0o@+-cU`Ivf}x?7LDxyT;ESl?1e0RAqB0wDv|&szNiY{5b%6S!=q_F`
zgLSuOo1-YC0mCZE56fljU+pMo&yc32b4x|kbuvZ;fF((#XH;CcfXKnvU+kfC5l)eW
z9A!fJ8+<gXM1-4T8o=T(L05V$8GFUX5E^twSqHSOmW@al&`9IqI!7$upt@R6$eJuT
zO_TKzWK5@MutK=xqKTqN+k9C8tT*^%1awXSp*3I(WMHm*k7uFdtsZ}@H~5F@s-1D)
z3g=qHgp+)#cMvX~9Rnw1cFMZY^CNR*Ofu`MjUCpJwp3(e+2}eMykHWqBXyhfS<M<i
z8I^F#fxtOjvyHRS$0VW~>V}ibiS-1V1srA4TFP-2(UqeG?B~mubcRI}rR3WFQ7nci
z+mUjkYn{cc6v4a_i*zJl<=MpI%>aFpI9w-f&DVb-pCY^{g!jFYkL-~D0F}b$D|Tn0
z!90GI7(NrPo)KV=WR1VsbBEO+z{yDY00${XY>rGMYr{>+vVwVqu!MW2k=AG>9xapR
zkbO;5Y+?6b9hFq|az6~^PZbQ(8_4SfTr}`gjQfgs<4dw~%O}xU1uacaVgc?|jW&-P
zM(L0DPjy>>A~pt&7e?uya_1^(6KYJG(x!(E4Z=YE+!7RJy~=w5zZgo`@rT&r!EQ-W
zh5^}5@6+K!a-`&RMktadf<B4mqRAjQxc$_J0NG-yAX0<4h18_(Dbj<u<s~Tv{A41K
z8w&>)LsWxrgisj15cPXN<z{8DXz<}{t4eY0Rk4=#D#n<L0EpHQg{tE`B5(7`9;=M-
zlq?7Ve(1PO+k`8@%ANu3wh{D2_Br0+!Mccp<q&u_Om)8GB88D#Qb>8YOklf*!hL1;
zrbBY^$}gb7mMpMs!slPgSn$viJA;MJI~qAq)fR|}=LzKE>I$cU8S<!+Hp=G_esHIu
zv3^hzxNbShCWMXrs&UY&Xt-^Ktd#vOm>xFVl^f&$9E&OO9Z4cbICsaC$2<iKr5^}+
zW#v3^lgXKS60pZ}YpUrS0X8{LsgU0HKuc24e^Tg-XoJaRgc1-uWlChas%>D~?F6nh
zay__>$=gKJWs{}1^9uzF>RR0HK^Ds{MZ%IA8RR=ixbl}l-?8#mv~Y5VeO#pbS#$6e
z%_fB;#Crw4RmC?<xDXr~2hj^P=*#KPo_m7A+}&DJ=@nH6+VaqT7PgZ~f&e!)xA{jg
zw6yKU&)s2c#}1R3#BZ3}=&UJvIuT(b%f71p+Ke&q;rpPfb=cZ{uM1hWLH_`ysG?!O
z`xF%VRXsbmGz=xI>N_^gu~oC`@09+N`=PcP4-->H;5{q-k<|5&+h~U0{))_s`OC4l
z9zuWmwAlrWC*UK-z}*^ID;aDHSqnXMb|kFyl~c-pU4iTpHIlgH=F4#VGA&=KMAu|p
zM(tq#0PVN-L9&^q*HbnK?1Pd;7B?fL)av9GZV=CPY@EFQ==Q?VYkt;F3>H&)ev88b
z_EwsC-E#N2!3$df7;{3t?PLvWZcY;Xj><d{NT3mbaxjacXfknRuZKAyO+^_FRC2T=
zV3B120ixpJE04g+Xv1;BLhBsxr1o1#=UC*X+cx=1ToT&(;b5^q1F}-<a6ht3<Ka5v
zn=M48Vqdkh-8SQlu6fQdm`-hcEGET10%7E(xjcl^fo}^S>|37-3ZK$3ZpvS}f^&OX
z=#@e>@-?`~3V5fJb&FC*hKq$Xdr3v0CQj)~m;r87IPuCM;B6LA5uOl_Wql2?zbQ^F
z+Tk>j=E(`aDuf-K+UGwDg^wX2Ch5#LK2~foM{O73G2nT^lE<}_Zv+EzbP!)eX5E5}
z=grfP9ufk1O=1lr_f5^fwUga{DXz;$lv6WAWPs}w((gPab`CjBAd%zY5o*TR9D<tb
z+V=^@_sF{E3%2-7fg}rJ9;9o<>_NxEXdlEE2$2{(B1!fwGnu;OsMEBv&F{(<2#)N4
zQI3ku1h?$D=5^trF1X};CCS3?w+csYnj^6W=IIHz99b-+cu|KYTN1W7wBY{$bnS!{
z9q=u2_fBbdVr+#5$Fv*WNX&ew+6{>0l<|)!P~D;T{{Sg3Zfp`Z{oJ_coT7m2;#*>x
zNh0@1Mmuwa(}B&A(5a3Dp5-m>2b92XjHe3$ka67xQ85TT#yqaSVh$6qMhQ&Xa6fbm
zE&MJAy^<Z)%0Ti4EoFmbZh5~LTqMqUQn-U_uw5qBe^2*VD2%*X#C)h`AdDNS-o~4d
zR1ymegi)VBBn{^NRILmxy~|f%yc=TZk4>eYs>NO`;LHvHClY7mBI(0`0}2mD?!g%H
z5imsIYZXRvN3pd;fwYT!p@VUoDe8lPvw{1ez{P-5XH-_SIJ8@Wo15GvHyOSX?l?9F
z>J~$^BStt)4GK<Oi+N2v;PSPagclq*kGgP@R*MG|gk0Ho(%_~8UdaUSI7nZ-`_2<C
zc)mhT*GWO_eh(kIWrfX`9|GYw`yw#5$CQPka7u5V358=rLgFx-2Xa>sKC1}P7z4sv
z3*!lSTtT(M)-4=I*8P_^9n#|6(}3iKtTZ<N04uo4Z~zX;4{Izn34v?{$I~YbE02PZ
z+QT+jR;cF&+*pv93Aq8~IJb9jm{?B)Ekd!c+)hqY95G;1%U$56*%3yI<Ff8XZk$Ie
zjzAoFSkyF|9#ch=k2p;t$Ay8h2<G?-H`tp5_i^B;+)cU4bR!{m9n@fC<xL^KD0jGA
z;W0O1l#Xrqy0V4Qk&|z_sHSLkLy!1J#Rx6^V64fvu;$yd$nX@5ZLC9q2oVIlvESK9
z*3=9Dg#b0&8-T0oi+cn1Q~I+GSboS#hq&FPqyl(ahE0OH*TQXzSC4T#CX0k<bj1VZ
zD82lox$Z*io-e`-WXEI=9#XbPH2iRy+w*gjq1$_Y=@{vu#&c^BNcyGq+s%|<i+nD#
zZ;T)v67OL>u2&yVg$ZkTx%(!#8yu_#hsYUoZ}OtB<#ycK>B7YL3HlSEgk1bCI5zIM
z*rYitQLN%}FO}B%Bp{y)zUa_VrKzT6JVaP3Nd#_`@8bQIlc<Yw){FL88R4DJCAR|W
z<@`xGt7n-6+Ab+&WOnp`1b0$NIl+8{pOUEWQo&}l<GO&dx$@o4a0klo_#4|d$7YT?
zh{LYwKER_{P#yqi7Wq^<eJh+nJDgSJJu|~@;a~#c&Z7ZdKcVI(xwp6^_d!(CIsV&}
zRI(Nj&dPc)UT)Uh-E%3)Y*+e#(`i67xy}9245K&0O3+a0(@X(yAalaDi%0>OvqzMl
z=2P1PoAhH0QbWnLkX1EPIF^UF4;NbfQh|ZC{Z6{iRB7&Oi7g&iW*IDs*ztAQQ~}+0
zXXKS*r!>5Q@|pQ!%RTr7PXR0!V7l2-sx+_BcS=~+j_GP1=d^%us>M#gPkSLMYpNXK
zk_UjfSB~sR#o1va7*1burh-PsK^>K4A$#3-I~{^DSsNT<X}gzxH^orWK~vY+mbhx_
zN10wOZ*@g1<@0-;liK-O&X%EU#iX13FGt74ETT(Dx6){gmJN>o09CZmw3wsX`ML3B
z7LP{AqiL`T#-e7^viDWX82HM@$1g^Pj%X>`1{wmEqgtknTht58wXJqm1GZhG>ZlJ;
z9r=*F{a2Tl@^gBMD&<;7r)t{NZwFym-B!7-dx>y4R4&#fnWNlxl^dtKNpr7%E6d5A
zd7UtGAE{SKwZVqN%Fjzs^DWD-p6L47H#F^4@zc6TUdgd|>9F6}brZJ?_sXyjj5Gn0
z<ySI4N;_l}JE|NVgN4)ZsB}TL*`uM_ea6K2MATG<vzsa!DW!1S2@U!#tbDH)ZOY`H
z9&#%bhH6@X+(13hF;$m7%&<4|n>7VP!F!rbyaehBSA&*Y?7E}iNk-Vo#TImIFB_b1
ze=5Qnce@N}{gZTxa$W<nwpw16=~&&YA5_@92}y=olIWq+^y!}<xFYJ|+GG*McR0EJ
z8Wxh1L?nP-N$>@hmrCiVgkZWbO85MHGmLn}9Mhe%!}^0ps+pzHvCJPBS?XOEU2L0U
znr7#*E9t5FYAH>OLf%MH>AfRHCI`}K`zwEkZ?Jr_sys7B(>jtc3#ult`mKJF&Z1+7
z@nzfcy{?m`=>q^UH}*vyo~B^-#s}GT;K2-i>{&dLJpTYlI=0cicb|f^6t2|(9`_Y`
zG^Rvw(20%~w*)Sy@%logFJ&+1HAsgfs9n@rluogXkhC(g9l5d=Iyh#1gF#8gEN|I#
z4Mo&7GJ$xUivIv!cpm87KFZFQOogo$U{Xn@Lhs}WT8RGuxkV>YI{yHmgpKMr+JA`s
zqvcvpqd?$&gZ5edW2ac=9k@e}(VLR&IlWIt<6$Vb${w?-s3LA=ZT_pz^)8yL{N19K
zO}Fe(Fm!zKFc-b|K2+uMHKb4Ece2+}>o@^6cmv^4RCT;jNH;t;?~<g{IzjP3;tRK1
z1$n1ZXm!+cIzZO~JFh=4`4M)Id8uih<<fmjYe07J)_EmwC~ISTL2JX8$-O_WRnbn?
z%OsAs0{C95(*17}Sk}}`*4wq$PA?@%RJ0h}S?#Quw&gNOz!+GHKC+^fgKNS2rLF49
zX2e_^sOK88%4wI{mZ-{bOPml8bp$WVq-$I9SCsXCSky}AHULM-!pK3dRT+29JI;8%
z7nhUrE)&wwuHUohiTZ+<Z?-`1m6qyVemR-xHTNCYnU11<zzn^-p(-`N^I-By;m`Su
zkM)Y6sJV7u)$N)`JIbomp@>Fvlq@=y=G?x)M?GY6I>6knDaupanP}oj&(_hIX7)Gk
ziqmw5lX3}H6mi1$UHQt;>CnQ^ECDN%G$j>dxwWKaq|r{>mX%GbX=XMXw=2_~1ZBJ`
z4xxq?MB?BHN5r)&VOb=2-mywr;?gaC>YeZo!D{-B&!`}9s$_|bZOZ!WFZ4{Mwoz2D
zfNoVSU?h{-XmuAb0zj}?>Z82i+;FX7qP|wx6da=0!myNJi)0|CX*aqliqH(F76=(e
zN<Maz!mpL4=aqssoL*2qSEBSCJ6|hoGmEc1rWTYF<$90dxR3J;Cq4q_&m^O=GoKUD
z=qMccfDP@+tkkr7%uR{=aJO1TF_sVmaEhqX2HTeN<#;)Bf8r1FJsxEan&^$oY>5)K
zA#UqesOh^}Y&$GYxE&M7XeGsR-^l5TrDX4!vShmH&_%hx0m84+sVb)+xDXbO3JDs}
z14<I(4F%8WBTi&-*pqUusitwT2F+AWf>@2*rEJr?+S{kc7a%8QqL#Qqeb3|NT2gE7
z-WeN?ae}ciK|8rF{nfscNhpz~#4h}JW9^rX(daZ4k9$FLj#SkZILfQjqj+O*Nk%@F
zM~k}&GhvreB{|VuUsG$?s3~itY5FH>H1A>Hs>w^54{InvIO&PY=)03svo2h#Ds^qn
zAURRi)s_MatgB6FaXWH+u6e@P>mxMottGj2f);&3CU9=$MCs;pZuh7SLk2DhRKXA1
zW>amJvsJ!gdn%nw?rBrQAaLbDsQ!#EqQI&;JMq044OCtBwbT@VM0XTjc>XCTxI;L5
z2v@5?lCr`sqJ1;A3xF`L^sRb&hX5VV%JbU4_p{|_`f!^xjIS5Y#TB%1Wpwm<W|ye?
zYy_OEL9T6O_bg>7kk|r#fn3n(($8(zvhr7pEQVQlmW<TqtCGNy7N0?&FAaQym06?d
zUYHhcR>Mc4c(uW@^!!i9wE8CUN^fP(of{*J1~na<T{fB!$ijPw0eu`XC?KW_RvcPv
zvU=-W0XHjMQ1P^^zPR?5xGoPZDt0l3uBef+92+730Ms548mJqbNmLTcXIMFW{Gyu^
zl@`CAalPE9r>G>{l}}32@;j?~N^T3CgdAwe+bwA3F0dCW)smJlT-jC9Nly?KaJnbg
zjrrY$DHlYO)i{Cz%k?AN<~Wmuc~e&uZ6sM^`i8X2xC3CV;@g<oN1yczzm7oivKo;k
z*;@T*2S{?Vx{Ep6^<Pm1q+tGxsccov2E#sA(A^bU(@w#0!ugLykg~a+0bb?N701zx
zU$9>}`AmPkhBIqNwQ02?!z%WYZNOPz^qR|t<b|%%X5P?`<FdP}H1=Oc;zFH>cnGjW
zHGM`oXoEz|?wneqZ^CuLcPcdqSQIj`wl`9j1qDOK)UuMJQJ>cy#<kYvW2?>g6{^-v
z$ys{x&<<CHk@Cz^B@q{>8Sb{-EbWbMRw43%QFFjrZ5vUJHj5E;&E@2H=9(QO`#lm0
zkR#<&buOydX&!f53cvkQ@!+gK;vTIlH2HS8<S5I|%atf1xZ@P;@DKk0SgxcMRWGHA
zOXte)s~696$y%Spde_ga&AgIJip)_0WFHIaJS;pgq;qDUIa#C8!Dt7L>f}@q0J^E8
zb)p!xlF3l!3}CM1q(*}4o;^L!a358ksdFDMYb4Ysk>u`iC`MeLgpXzm4{HVhC(0J3
z+pml%KmcT@CUY!SVIXsZM{A(wkemXimDe}n13SiSk%bIzx%MkZqtZ3(zrxHh)^*m0
zMXT9idtq_;N?de28oiQg^o@;&gbs-@hN-s3RhFeMsKR-=rlj`OkE$3g<7t|8dOhp#
z`n!A#Y00wmiYj9;7X*dmpN3?exA<Porc^RG1<!65#Qsi785&1!C&>oW((GUxZDa<m
zPrMLYV2Ybk09m#l<pt`Q-*>o`<>Qv^jU<tb*Yq|_97`^|v#K<w!7HrNEWU=Rh8ILY
zXeQjRIO~lw)MLvT?mhzgKgW6eB%^0Eq3rPrhZelIxI#SgZ*_64P)P)?BzIJj+!6@x
zzQPmctq`gql!XzoH&1=|vTH_FC?ah(?7G$|_OMKU!Xk}wiONEwem<&Tp^ma|1u04L
zQ9vY*m3gGFIE$({kGWiFQ#GVs<s`Z{qfboM28%UH_t^_gJBtR;p6$eNxSiOGv9iy!
z<flb3b}fW7hVIIIM%f9P(c6Lvg*>-y%CDYLy4O-vNb6wX48}R{x)D}c#)~~Xw{6Z>
zY6k2!@~6}3h;7PlqQKUWY>ygZLF}QB9p@zxLI`lmNdUTaD}ZnTSJ7J8c}<wb)HOuj
z-IUa(@qj!i>KJdH6!`47%f(PQzmNV@ki=wo7E2UPbASb2X%rWDBr2qG&nQNRLu(Q^
z_*z(67|;N+j*13Gz(7Pl+B+t*o$P{QeBl9AC}1QIpIuTT1i10tX0;tf&v|PPD1{cy
zuLbr56qR#6NQt)!yG5mzXYOz+`lcqq0p8F}l;oGQq7!SQ1*^pONbXf{<%u~8^IWRi
zBbvrseHA0B-an9j$)nbVmnGQW%NyNUX;BdIg<9Iz?&8YVNvU*?0E~IEW+k+0w4o-^
zg?mj+E3!?3tI}Qr1%N8@o$erfc2JvMj;v9X*23xG5w{0~_X2#`EJRo*I^2#_c{W{R
zNMLQg%1fpn)Rg?CdmgBD>}}a`vC3vK$qStS0B?k?8H{)QE*SbK<d6&HLh6IVLMbwG
zXef{k(;X-r8zC5FmG&RySkqC0FDd&far+?hS41L0;JCu~@@;=8(kY=BZOVdKOTS34
zMI?c8kTYoGYp*1?QjblTjD6Hj7dbahZUu>2^lyxP-0n^imJ3~QB;%Clew2<yqZ&ZY
z7rEh22*y-oX7^G@YheowBb{sED*(UQG1xuRqIJqP0!bQnC_uM$JDqmjL)}fXu_mYD
z{3pKKN@P~BPIg**CMp9^?Abb$XXQsV?}a5M9GX27m~b`-O5=oAY@urSx(0wN4UY=W
zn%jP=v7C>uWnm5&GK)j|3l_DwQB;w~`A)ruDhb_w=mJcE$0~S^FN857`8QLr5Zm1|
zCOngS-7(I`8C>UD>KDidbjb-Ofhwf4?fb5U-r!Gl1yqC7J=Aed1BK24GERx9QF|G?
zJQW+s7eb1_A{qN2>NOBAkOD=Gwi#vm4t#(P)(9%Ofoa8x0!>AZHV(ht4LwYf8!&wp
zR1zU9l6?-5*Lk-pYBxEgoBfr4r&LA5EToDG_Y7e;iv5<Zt8fI9ggf;h4U39eZ3|MW
zwVX}S@bryH%!fZK1r-m~7#)CAZ>^Q%*u#~or|F29Z&t?K;Tp{viYDYV*d?$t2x6+J
z$EM--M$l+;O6$nneHOj3(n5bjRFT(H#%vjHqBhN<mY1fQ24nunmuMS!cpqhE{bDv`
zH}?o?jdUI(2LAwLYQ?wc8Z8a1_dU%&L~In4u#a;=KPsl9R+Z=5ggLFMdA9qHlsK^2
zrTo+o{*?s!%h)}HTf(CCWO4VKmB%OLY7G_@8r1I`f`gM#sFT`T&xH{Kz+Bq|(W7w?
zz2@YCm}4$@JSoBDC^z9}D(IwQ162+$-u=+e1)~@U`m<t$mF@5fMJC3SP{=_f*r^13
z{H}lkZ)<0=A*~t8rI6!nje}~QJEnl&*+{@RNaQ++EMQ-oCuAnHI~L(}&97jiCuc@7
zLQdQ+1l>ouF76bXI#BR=2rWU@X(H&repP*QfHy`fW}DGo=}#k+MHH8HuA$u-B-nhZ
z=z}h-`XHJ`i%+*Hjw9uBTXtJ=M#g!;NKjp%{HF$y<ufCc``h`D?9I|T&b9IYTx25!
zy^~AaIC5!mJf@;Dk<XQ+WPQ_jHNyohfEP=&18W2TnAV=apM?9goTRuP%2yqv_Xvj0
z*a*TBs1}iH6h)7eJmTagLlVa4fCa9nh5q4iqiaZL;9*Y(>KGYCf<2Q=;j~x*bUVHg
z6#!TZA;|<<=}~m_H=J^s;FR~WZf%6*nZuqGj04JzqUB83@7)F%iENM!lOOj}78J*{
zpqN?)eXg2Dcu#jXOfJbyMA{I6VnSnqz0$bYr#9C4SRn3Y@0_OXco!&x%11QYn}lo$
z5Chr5>BIukKu<OUj(es!0Mpquurv(TUQ1mc1P%@TKXqQme;VYgNTp~O54cQ-Ongir
z{*!-|Kk8+dMEkgA=!wfcAY28?l<1~8vbpZF>=JG+HUTT+1=j?nV@p4p$_(_Ov_|dM
z%Svg+I7B(lwT@G42;pSIL?YeVp4$+dMsdf=OCJ0t1r80k!Ad~}_DI|e+l03l3k-xe
z=j9=BwYW}kx{ciD!p7L8;PSYT;719daJt8kh@*oC#y(eVKV{vHESHd$#zHW;uCT}1
zO4-8=-57Vmj`=q{CieuO;%f-}?F+FbB#rrLx<LIc_-yZC@aEY;&McbdgUe8$(hBsT
zc>WzsXX<RCbT1q><H$q07882~ByM{JnBqR`B|)>Y3A<0y$a(AsVvA)&!r{a_>Mo$3
zW|8iRuKHm#djy-Jy|*vID(wv$m<j!pV)Uex0Upv$a*1^?we$8}5j^bD2M=YzyT5c?
z1+Etl&&WfHSNT71r;Z6)FK|=7j(GQ?3bIA+MUdcFa-^!=y3Xgqj9-g=)Y;jLQETM>
z$#yj7clJ}l*o$oE0B_w%`DQ!xxFu|*><`lJ9J^zOgi)q&y__tgd@{D^U7JAGK34;U
z&nEmNF2J&M*sM`<S8f;0lS9q<1$ONAOb$Zdu@+oNUCQgBMi5+!-zmTzQ$@HdvN$+I
z)^Q0fV_=k%+R35o3uA^j%Hr#uE%J~*<ba#G$BsTynb7-#n~<Gh*~9LmyNM;)DF@2N
zM28u|KtTTh%4@t2*(J~26o#?R<u%v8pZH11@Vgg8Rw2Etk^tpE8o%K8OYo56k;)>m
z3y9#Q+;5zuBlbvcuo4%ZLTNYTCGL~!kg<*?{jiXc;c*G3`Toe*8XD_lUnMoou)zsU
zh$iY2_fCk&WVq(mP+vB+)Uup%E}~#1*RpbVpxRBLqV2!JuwaaVormQINZZ>aBU;mB
zteGQY7r2xn83dysf<6t<p`}X=?}A0pqZ1JzY1}S6gat#zvNDczj%#gmfPtxy?z?~?
zVdEVDJ1#ixlO(ANm`(PK@R02-B!0^_Qi#YMzU#0GU$R4BP4Q%*Q8*t3aPNHmS6=;q
z9#Y&Ktj0+0*4x73+m7ITCAKcObBv`5LqO*z>XE}12bAnz;dj>HBVgFV4{`TRvGIi_
z)Q00LCTbbm0VRk}H!i<qw!$EBBF8t%O`rYUKj2v=d?JCw-b+Uu-sgEq4x0nXYeQ^2
zs#&$UB*b^y@Ql-S5FL43Pr~_+7X;$}0AtJJMU<LFEN!@GbFIylT~?90KwK;j3c_t+
z`z;J(J;*`1^;HLSjsPEp>E+2K8by-(4WQHMponiQxaP?!<%Of#2f|1x<ZCw<5$5L#
zvs9^xj<Az+zjfhH4CgzMRMb(&(|gIi&(T^@Pfri>jCU(8+P`rC5{ZIIBs`m0H1Ia5
zoS74D&7D57+%=uND{5J4DuxAt?y~wVFuPpid;b7st)!8$MgSamRK?<ATRGjPOZf(o
zc@4^}uA_;UA)x;Nm18AC+%jxFP&G2NoSXd<<W<noOwZL)Z*lgUU&4d(raQNQIac#J
z{jKn->*|>cO~@rI9c`3XEdo@S;|BIWR4ic3^Vkxr>opDX8)yC#X{&k3_*A(+ML1F~
zcEtmKRmfFZjeD}zW9XRbz2d~G`k5P^ZmEhc_AeV2o>v-x=M&2GUXIiviZ<>d;>*k9
zckw<7&}mf$J8geu*Doe`m+EQ3Guh$SB5MF;u0Bv2rnc8G`|eN5!NI6Hz;3znQ>N4#
zxAg*kJ1;jsm6I!>6jEdL%IRivtn3w8O(l+8e{~&QP<`xBUZaWl9hD*D+%`R0G;r08
zpf=xBOJ!*ndzN}4{{ZE}v7mwPaNT<-tUt9IjR&-ui1gY(za?5xQGn22*)0tlV`ldd
z0-e<{fI|-pz7dW!vU6+;QQFAP!G%OKCP?KUtJXEGAUfqx$0O&I2D<k>kl^xaAWPY$
zp)4h>j_xD1mZL<`UtMFfJ}jzwPfPbT&ug4Y^-i6nF+?pGVDdusJRinzT&9GS{)!RO
zZH@xzgIYdTdbddeXEvT9bIq5pM?v|KXEdLZh^Ogz<aX~*?`7%B!}&YX652ecM9``?
zg81Bi7VAmU=Z+@bp^Y7a+S2s=6zl}B51S^>6cHP400pDsW5%f(r7pnqeLgTjAP+uP
ziZKik-)|mOFZzuQF&m_4`|_zeldI!`2QrzvpV=A7L1-x!+Sa`kQu<-Rfa2v|biGtF
z#vB|C{{VIKuCJ);T85xzyMVpGTkpf#y-B-2H7kP$WeguAn{reMON%|`oy;IxDt9%6
zc3JHzy`~o0>c{hdj#opAv!XLi6U!S&?189^29gt>R)?OTxDWwMlLV=hy0r2|eWf!(
z)DHVda+gzzSwXW(rey_VW!x@4fn7neEuM)>RL3+}gjkuU!o$(cR{$HstPw|Bba)`)
zN?6(}9E+xE-uBs5YBdpow2-saJx#O`dny_Ax6e~{n}ilQH=s`<NY>M`86R-aO0}ng
zFx~~$Lr$%z!4bIp*<C@XOxERvQds1P#&ImGDPnsL;1&<7^xAo2dqV=yYC5!yVfMQI
z09h?j+P<LT*rW7gJ;=#HLQg=PqIunZj|(ccfC(qJWZ1NK?z2GwZ?x{28~08e=M#IB
zeNRu!;kF2N{Mju0XeH4;ZJCao(cO!=$KvZvE|}K9ahoFa?JimtUO}It2dOnNO-|ri
z;4RrpCme9v9udCGCsR|m)^l0zJ?yg;6wVDLoQ}%NQPvFg4r>P6lA{wr1v{jb!N$wa
z$A=zd<s$F((VKjdwf1wcJf||CwAdS!SE}k_N{0x=h51g?=VA9f#Fg{@Ryaa!q+Ttg
zTbZPA2IV6vNN{fJp9m_N=)`5MvHPL4=?wK4adEw@tKs8$WR(<hsM)NftMu9~OTLQA
zpIUQ386OH>nb5^W8GOS7Bgzj`rizwl0obo^%lu>`3uh#Aa&%rpsh7ucaI^hOse;l2
zv-MS#TA5=@L#!1YeOsn?H(m}bSCXQ1!9QhQsZ#gNa53Fe)>OHmlIxXgRTH1bAyd}D
zl3o4R(Bq9pi<LD}$uo~ORr5B+%F=zIg;vf<b`zs)8NdL1p`~cPctlD-z4<{(@=q%P
z1I=uN1kA}Cqo#gPa=Rpqq7nv;uOC(DpNCZdRYnN_UfEu7=X?2DUXrVPbGFX5S0|GW
zQDic!N7P+8TLe_?7;~(x=cy7l<d35B9+=c^14(h>{Hyb-xz+%XzE?V$Z0E0{>b-`b
z7Pktk{{T)2UAfG^)mZ6O0mK(vpOtw}BMAil%5b!XT~Se{^xGL?S^)YhH))jdGiU&m
zT$Ni}X4#<!B~T{9<fK^TDH?z(bk;q`+80x3ttR#g!Z&Ur_z1>I){Cz}OXG<|4^5;*
z+_)pD=%Z;H8(^6f#qQ?_!7F2Gj5EGg!zr|=u+!lHjxes-NDNoD7Jh=XHQ?IiA5*DJ
z`0UfPd@pYom5Lbewnde_L}8EG+g)Vq9lGJF&smYrdC4USM@ad|vsak1OEyN>Et#77
zS!H>*3DkOHn%kCK{4LBn2zUj^$aK1BMXWB4NGKs(n>^o8)9O7lW{?#p`h8cbeU2a%
z?bO;6D_?Db%SWelEeK$9;%Pr2c6dGvvi{GZqd6x?@G44aV`bdJ2g-v{2X0rt>%ALG
z`DYm8Xt3-Ti*;t4X=|Sd9CE#fkK<H&STgckFcsI{P;b86E4rE&z2?LFC?(Tg*vYb3
z&0Q3hNSTU;lRgG6wY@Jy=^ESO>XGy^x}-IXB;T_14w2F7OITbixjc+cZ$}ncD=zfC
zHH-lAR;Ng#1dnQdlcT$1ZnSh7VUE@co<EIUlc0?%g_Z<>Rpb!1F@a?b6eWQb*?Lim
zLnJsGHAN$^miSRf-~xBh5H(pPrq@|rakAOPYhLD-s(n$BxrX*$e~}2vF2`Fuvs;pF
z<O_vLTPb(xy4`AYQOPm0ZmZ_gfCp<A&CW?mkl!AP3Q0^>E_Iai>V!7UJSOTiQnult
zRtjmH?Vu1-wwe(|rWgLBDammI>ZgxYlGrY?N*xwSKy&UDgnB3f!K<EBil`ORR#Z=h
z+z+a&)gqj><U8eVsC0<h!FB=ihSxOsnF%J?3cfB{nEW((7ONY<vzB*IXS9#mZ2F0;
z6PAI2b&l1Yf&lh~^%&j78j7kL3by@MvUDjvlPzI|;}kbFgX@Lue}~Z%3}pDq@joWE
zFSF8gpzAi|t$vj-V?YZxr$=bT)x|5ek(K1&o5w3f5v`-1;428-aI=&X+<|p>O8d2a
zCyV4cB5ek4vSXx4%1=x#iR5f5Bu|)vhn{n=q8}B?60wbBWR(owMMjWREt!pSsoR~L
zEWK3jee;EJugQ5F0J5Qxr)ed5o-Ca5y9|+2T=Li8sdUPRwZi0}bytxkf@KSyP7(Zs
z1$s6#^<Xn6vcrBR>d-?$E#wysCd$@XW^87}jA417;tUhi!64k{9}Ano!_Oj2tY*^E
zJPWEOH9DNqd2zBIO^EIU`B%E8hf(VrMsj>9sI*z5k9Nax@V>?qib))qEj@!=M-mRA
zYxn->jZLqH?IPAxRWmzr9ljMDzJP_Pl$RX+(-|$hpx*Lwo9Yy|L7?d;@N9;Bgs4lc
zl9P4s$`@v#C2=63UO7ZN`zT}>L_UZLv(j$q1{HIHy6LF>N!l%ZsAc{l-4>Ej$mq9i
zHnOKN7^?-vm#EO_GE`Bu`%SE~eMO+Y8Nu3rWygymR+(tQ$iC=G{{Tl}F5!ACI{0j1
zt$neD<()UCRY*f4Bz*$gY5ElLv^nIH^1L5A#l<PxWnq(sjb@)$B}JTEP5i5>RugNL
zozj`;03C}JcFO43+YFzD;AX^=q*2bxO9I`tx~bK)?^Y)g+!S>T?v>)$R<lyE^u^9`
z<2G9aT9DCJcn4o;u~P4G139o>T~s~pw_?4o@m@Gt44XO1@hQ#8$9%84{9U|TA(|;L
zSKJ(=31s<5&R48NUkQ%MQl2uRdd3**sE-O~AB7u+QZYz-r1(y9OCTubb8q=p+C+Pv
z4V7COaISQQyf_dngxw=FYIOR4;fvcLPc#Fv8kNuV$7M5~?%{F1#7kfk#b+k4Sa(y-
zMYGC@pWDhlk4MK^BA8~$)cZrT!bwQ;bUAy62FS#;(S03MY-j+Wt7S5hP*6JL5^ji<
z-qUUtYhpq*&?J@z<t;Jyj3_2~-DLV#9sDOtL2{;FQxYQ?QB*jW3pkY}J<Lh3k8{V>
z1hyGTP=1e1>JhlDcArkj+A(}89TF}UmLF>~$O??(lL%=5f5H~Np{!xyGN!0T(~z_E
z)o+>m7;m1*3=OMQx><HGobaEb=@L~+3xOk*W25MjR7lsnbMUr0ewxa502%^W&W?;&
zuWSoW(;H6AH3_aj1ZO>#ne4N1g+Z?m;W#dCZL_*K(mdN;3~Yr^%0W0+Jwg8Ku2mm@
zE3X>S$B}Gk<y+|g0IVvJ&noLgZQRpkN6{9Ij*<F7SM<G=9+)i9EUszF=AO>nIz^Ot
z;W*>I6mgMkmC{HXe5jVO*Ej6B?*L}VIcls(7yXcu)IHc2x@8t4$cqVTSlkkYmaw1F
zpk*}Do0DLBqN1g10Nw5>ls?EyBYg~kkC!8llyfPgYklV7Fk=lC3P27!qS{>wqUG3+
zdm{Y|`=)yGJoAE6p3!4}x@%fHA!Bh!aJ}wQoHccia=6~zk~UQ$JB#sz>k=<-l+rVV
z{@6q`D@H<)leX!N?S52_w#1BdtQqIM!jcp1QOGm!q>9$J1!(jnkl8PMrHhi9@;4Od
zU30=B$FfHQw!o<Kxf5VoqH}YUud=9;5$(#6z->%~SScO)PlOp%irSCVQqkC+>9r(!
zhUqC~YhCqJiW4DVa1fPTWBaKjorC#;3Z|eO0-ZwoB&Lw8Hh0}vME?L{r4=A}PJW=)
zw~!NjO^Yn(wUVF=UdTCX1=UpAlw&3LK|fG*uC#1%`2jM<mt<v~vh3D?Ma|TMQD7XZ
zI4P^D9fpyAgnS)4Su1YoOGnWbqAJTGd38wb&4LDPOcVOKR#5blh`f?GqUri-nm^Vz
z50#Y)<lkm#(#t!}z+65Pg*|JWHbnb*A#Qa2Gf#w#!Klf<)7m|yh_P(K$EVlJhX(+q
z{{TUI$MGEHp{=TkhVk17KlMZUOAV6t5~OtCxB#2>MbmWl!U=V)<rdoV;dZp9I;Nq=
z8-V(w{>@A(3MyED5)f>N5@~RZuw7IWJc7<~9|_E+?(CrCkkQ21X#HxQ0eF}(#ex!}
zs$_7pVnWXY121bT=fXD|B;=Uy6Nr2DikbLrhr^RiU0bkSg#{#8>``HWX2CV2BY_i4
z?&a80#~HRsP9%6ubH^i;d6{E6KrPMCbGQI+l`M|ulsu!`!pcFQH#wx=Dq42}`(FdX
zVPHL!l<c$kPhvH&$j6eF*t+J7r+^N4NZkyP5nXKF>CS5A*m*~g%7qsn{siD{*>gxE
zl&)`-jgF8lQ6}C320`xnBI?bJkWUh3&mjn!eG}1)-o+JcAt;+D88}7&NwT9NhKBZ1
zF`cd#ZLm%RfqP&nwowv>+q&Wnmu|S^oFu<xHp;~c-Jtu2-7m8I;HGD?>jQ+WvP0a~
z?Ibv3vaGK-J<+6ct91*4Yza*s#h*Z=GU|F3i}T$FzcxLQ^cHtuFNIlM5<$RwaFZjI
zCd^*^c2U1@H|^m>syW|Ofx_1*g~t34Qi~qzF2$1;?Be-cc(_d32`92!Te(h2?0B*A
zrH(Dlz3ifGyYQdi1f_co2<RPr8>Tsr1BC0lvx;M!?k<WLZJqKI5?^~%;m%P$LS6v^
z=!7Aq*1;SpA#=llHaSB3uW~K)QbWIZ=E;nLs!m14yx9&~J7GyHi;a#`a8Jqzuc9+y
zf7vH-o>Y$j=Y-n}gyJMVFb+`+ZGrHkj~$UQaeFDb6p9#ep2%r$*%td8kcX7p9HN0B
zM;B+hjJvgz@9*V8?#am!-o%ukV<{|i@RS=KGK*oOt)6g_=Q&RR5D5#5Y%a0^9q^-;
z;irWuXwFnmy|OTv4WI{;>fl=Zr$*w}0vvwnPy4C+Me^Ky1lB>VlhahoegXMM`tExM
z_Tz<L0B+&PvNs->vXt3uc+(yW4-U`OI1)a5D4Ao(PVN3Ipw9TJL!52M!eKWfoGyRJ
zDYvokwFQfiZa7Q3$g+%+VwI0ZgJa1S?h+fG4bz7N`AK3sEkI%dZJZw~h&=aB#k^f8
zZtfj)K-kL=I17NbEJBow@%_>s*BC?zk&xlV!TCx_@(OVSx?`=+bO*Z=wg=fF<6ub%
zppq|Z{456OaXedv*RlCby}qfyk@fI{3Sxq9^UCYA+nXkraC@$}Ex_Rl3S)@mj!@J5
zT~BM@C~A%16Ut<Tn>v=waV{W(-pJ2UpmGP@2}u4p1r;a<J6cteJp99$Zf-C8q63eo
zloMkdh}_fU6+5gW%#Ux{>Deg8z-t@~mkJ<2PMjZ5`>*nuZ1ASh*9{K4yrsG2FrMct
zw_AdPD2ZDmo5P$w>0MDF?|-OJ?<98muHXBiLD9}0LT=D|SvWX@&+e0VJ;G&TNewJ*
z?Sz|1Ho9>mw=1p=08UPX10M+wHno%RlLpHeLKgr>8Tu|3>@J)w+m(UnV802rH{nWb
zMY%~~$`%SE7P8_1@SnAzG_(#ptcRg4L9k1IqDu>N-FI{YM;mgQl!JS&7h23Gd)aqC
z1t_(b5!<phY8&3k4Z-C&^N^6)5Kz|>-5~fW*dzY{gn$byn1_Fagj^hb657Yg>t8Dv
zXVbD!!h3|geN%fPXVAwn!!`v(@!X3k+~;SEDBS+#G9e@g@!TlbTpf(%6C=U;CPV>$
zl>L%@1k<_4o>9@i11M-n1OmhLvMHXG^N)pz(;gq&`>EJj@`ns*;luY+HY2;*E`ZL5
zNak(jR@9SoYa?g7TVe>$C<(BBs|^r)92;_!3mzA8M=ORoL6%!Mv;*BCwUfc@E&^+Y
zM=1sv8;pN+=ClF&u9m~O!r|QZ;b5eW0~aSYOR)Ai_)Ew9Bm~~wkajkPfo9v~DQ*ID
zjsD4|=Ym4p1qj!3f7v1Cz+H2!Mf>+i4TaAriu5nEF2@GsrXGLgDDbhn6tr6(-F2Jg
zI?eJISbtacSRIJ#Hw{N=jC190xRKpg5bNMAFH6%pq2M)_C38arr7a$0-4=9Od!%Tv
z+kWLuQu-}ABKbdx;pYKfGKM->1F9wM!pQYN6BD#uqlB4p@b(x@(O;=+uc`L6!HnX{
zqG{Uei`@A@)U+}~x!+`w$-Umee&0pR;me_$c344ci`^duLn8zJ5R`Q9ljx0oJTL+3
zJQ90dB>ZJo#B|wdr)p#oVP$<!sFE#v;bNndm)bA@M7FDKfql=5u3ir6BK&)^WNTVL
zyn_D#3G8@wZ-tbms?O(U#gXl;kN`hOPW*Yk$x1uXX<sW@6RrEKKC@8sBmPRgs;y~h
zwcLNg&gu;_NKY!5@kKfs8qrGkz0TzAL_%G~$|fou#`Z)CGTa9K<#kIQx+%>A#tG+z
zBjVi4G$P=oXvrz^%N%Xm&>VXsjxk+<%jm0ymCck~@~&xM+QIF29uzc?7d$!r`z;L&
z184!aDKn@gwk)Jp21#o+{{XT_#{1aZtpTES>;MVu(#g);`Ce0;BOy5%chkvh@$$KX
zHaL4r-N0H3tu5m&X*l6gYFDLk+5kT*(8ZNaQXU~x;9NQ2H{ocssEmT)s|OCGL%r8>
zyQSA_1bZo(*t-{UN-j~ywu3Isbzx)?UU`5$nSB1rj;^`Z_KOSl<yRS{keA5kJ;%z9
zV)r#cDP@(>Jzl_d8mVQLz}aa!8%_1)X(HtOEYxsGB|x)pmFV3OBvd9lv|M)~d*6@5
zqbrgZB(+HO9+T<DHa5CO2IGadpwgrEv5mjV%yiDB>xSHb-`Q@cD<ES4+zDSn%~pu0
zpvpZuIKbRD9}3N}wT-|53rkeT+bGuFL0~XfH011}uSFKOQzUF5fRo@XF0$=nrNxkg
z7(cr8X*Bl8+_vQl{)ZLrS}vBMFXSYnH__#~W`|bcdWX5rD!_E)e8}7VSE3y<DE|OU
zMbtA;v<s1iRPp*ks5RMyrs;?bfz6057MIh}$G6x&Wp7JO{7VMmUDCn>Mi!P-x<QN-
zm<2AJBVYg`TT6T+iw(F>iZWfogPVIUppYzdVD?iA2KWf}FaV#0Cy|v{%HyZ7{{SdS
z{+!S03d+l@hshxPXsmvk!Y#BQs&q(R4dV+z_DO@vD=d&66wD5*)3NO(tqQ+K&|+-o
zb8~gS)EdCk!l$8({$!hC>#H7jM=nfC!YDMTTG3_%Y13odhL717OJLBaBw2IMEUdgS
zMv5u)m`Te5Y<fIH`2xJ!9C8wdi!Jj>8DdY-PR%Mdyb!<<f`Nc=KV)fYUIJH=Ol658
zqOVSg%{OSW!1cC@$!Xr!Ho%4Hl@d2@Rx_+C7|2}K+j4kRwIVqZTSw2@rjaEzV}n7$
zrPmntz*}+$h3Oi^Es(wL$txqPP?>LGg*@0J2<V<U+u7w+?t3M7Y@pw%Iv!nRs_I=e
zkVNN(WUn{XjEt0mSB)%DoT&65lkB*gSabcL<KU~Vk<>#f0e5rddGt~^zm=!y*O=Y7
za<;I$K*+f&J>N#xwo#TeHGqqA%B9rjGsx#|!7C+Asy&PYakpR*wDr%FT%3F*^1S)v
zj*eL4;y$&4<n!GC7+&%k3sr;O928=}@E0G4mgTdq0CL6|8Cl&-oyNyE%Fx%!*2drt
zJ{E4Qx<{UDy|nDID&%hK=O{^I01`sA^sEj40DB=S<J#P(Mr8$4oxIry@%_>DqQ@4x
z1l+p!M!*Xzc|pqGak*9%76=*hd>~*cMT)i1W!o^f3aVqDgjSYz$}CDrt3pd>t@QS$
z$lzmlT&*P)OtQEeVPHCKyMuqq^cn)#p%*q@PG1@=w#hhaMvqRZ*wMJ<T+`QJ8-;~!
zTfZ~0q^tTjKVWuB^Hv*`Bu&Pdbv<{w<=F6+3YNIsoGMwPnoNt?HLmoU1D|vCR-QkJ
z1@viKRL1h)qnlE{wWsz}k<4Vp@!3er2V|1D)MYoYCq|!7p6uM>iJGHu?`1<vIb&>6
z&scVx+vuKnVwXm0%eLwf!^?pCq@SoF47TtVA5pH8X|XD+)s{zloZuHEl-s0MIFY<M
zv@=PET-{%2wUO-x!Fin<-rHuuTvO`~fq{&}ysnIKc-Qs`MOo=J8k1Pd0s-(4P1G5`
zFBw>Isn0L!kghs|qi`X?8DDZIC|^go^kI%r9fiB54A{PV=}xSYmF;J^uR&*95k?QS
zhTl@X?;Fm=9Ad%Kqg&M#^z>9RIpl62fEUlbM&nzkOD84A3s0}>RXUV}zCsz|>WQ$i
z((ZOb=F9m7H-3uzoO&v$^nl@aHrGSyG%+-77FX4iwkYh|1xj8fpWVgRFZpfDMAX}M
z2d8N5mY^21zbn#ucSnvIb{7GG%FgMt#ZCceX(3z1tvHav{{Wy}3-SsJXkJ{Mvt>lc
zm<JeEbnj)cWs9ZM$>qx8hPk|#E8+Z%W!YsTOu`a9*s`l;pwq!h`sUk}+`PCo*jo?W
zEN+CUlE9(GU?RYwYHC3TDKdGGuEb1Psy2g_S5-UYJ9{Z)cz=8-TpMC;yuT+uB}tWx
zzQErbMqQGik<nV$3$+<T8gpfuuGBU-jn?{=;z>Iz@~5KGt+2k}3*ARWr!~&pSQTA9
zrxQ)y>#64ID45->ASSkus#eVea7P%n0_PYSMsl(<^#h)4!+)Em4N7N>xkbgcQ<^pM
z*25EjQ2H#tQR<u6=Cq*YtC8cns?;QNfnA;?KVWlg%<EEJ<;NtImDG>4jM-_maguM9
znbaF*xc6UGkNBXKnsvWA(tNLP=mNnLE^UCkHk_8!v=1xRdM2p07F_1b#r&dcXjHa)
z9USA+7P2L^jA6Fnb&PJN@emAhnuexHB?Oh>LCQ}<wvp(%M6Q*<-D@agacC<S($+gm
zirrB?o|plBFN2LJ>_=p!yGP1R-z%n(pk$!mHdlT|mXKnC-0(Y~E1c6A$`-D-(^XX(
zmg|g_#g;8AWl}|Etq6RjR8~W_GjOgaoH@l*>TmWCxV&VRO&QUS)|?wPfbNq^E++vq
zQ)8s5ws}|GJ*3GaT5V<1<zb#zQ6Z8^b`IztBQ3?%4!fsQwle7eC&js5nI3}YGa%Vj
zYTYrtr0gf^lgIFL!_iDWL}S_F!$WO#U$z$QC&IR<=~$wrBt|&m%h0sml&bab6kgl%
zR*k(K>cB+u*pa|p3&Qf`^p8Kx{I`paU$nM-bJyBLkWTX(F@Fors~G5<Lz`^(UtxYE
zejmqA8=hDm!@;uoukja0j)F-8K)CR_aAnB}d~;hXha@w>P7g*BN3}*=FMKE;a7gf&
zTvvS*OeB%#3$NHAxBlzBLJ_(%b`(I{%7Q{JLSd5$gpzWwqLr!WSi|brK2}oxR=e==
z*3@Gb#rvS*<f#iLlG*fMOzBa-O^n+9-wP|(`c~I9%x4_odUr!pwrw^)ZvZH|yF?Q)
z$7WA^FF!AdIBtvL@?%twF6lPM3#{>wwePK_jvxsEXRCC_(Y53_wD=1xsMl0BU4`zq
zi?5%_;!ieC%5p~S)zQ7yj9nc^6Xeb8vAP{}QAQswPsvwsYwdg6977A2FO1;YNL#aI
zr^X_&F1jOC)gywD*M9+5>27?mw4WJOJz(i0qmynd7Y-gvB_pN_TRgw<H(V7mJ~lSZ
zIJsVDA-P%}tCYH_&2i1vaon%I@S(>VIi~HANo%IGV=3+!T)~?z(rjMAM&Xq`lyAO#
zED{sSjmkstqjwiUlNn>!saY6IZ#*fQKx#(AWR&p-I4w4hO3=_;vo!Ak_*zXadjZ0n
z%;lo|2;+{xA*OxLgx^-<^<75tTngrFNUf1eWX9UbWI4tY8bJsodYC#Rn;Anpn<6GR
z;STjgJeedM*%0tcP|zHrTt>h+MT(dltmi3dN508q1iJ{GI+4$R3DFsMMXezMA%6*7
zAZ(l?V5AYlk=a*OxCsTkq_&w=6w#s4qz2b2?ezh%ES{TE*ucLi$tvG3wYj>ZXDpWJ
zmaccs^2XnlW1(oTl0hV+3S9?G^;{nIlC~6ZGAO_RC{HKR(~lR}$|_bv7yw$zcRV!k
zq`ojzGP3*vpxbQfRT3x5d*muDbdOAuaIU0o&~6nDySdR2I7Tox%SW5_0UoQ3@0Ca0
zXmyHbx>sCsRbS+a?24puPIl}9{_fXTnkOR&F-2!9eJT*c$V}QK*{0Lav~meo6vf8g
z)m@~*UH|~C9Thxn0nZ}}Qljw4{RsqbcmDu^OlcnAafLVLB99CgAww-pl4ABA0!ES>
zl$!^Vjg9?A>7phyjjRf55^`?3*;8_5V-K;dVYX71i`yye%12wh(6&DmFbvsBG203-
zY;Y`=_%~UKhECu)Ok=J<Nh$bU7JjJu1MHX(x!Fq5!bcCPL6all*X*870&R`QbmPKc
zvCSgml_SX8@}X`@ng0NwsmrmG29WqqkMyWs_J>(MIRIiR#gj;EzpB>@p?ANVA*v>2
z$wL~(u>Pe*7Rh{xGW0wK*+gY$kf~j%<bZo99a|wbXm(QkZpT@oXqh`he^>WRmbNh5
zyY^YvOIYGVV{&lQ^(p%nr{KMd{zuS7U3)iP=xFP%{zg>rboEP(<#My4(J7&^l!sYW
zB#6r-q{^dE_uMoS^a?*tvP0~R>t7H0d=0mx)Aml5zLlfd3rS7LoiiyGkzXMMf&uPS
zzxsM&>%LnBb0(_tY}SM<)ziNg0V}bRBd5@58)GSJi1Mu<)AYz}?X9>~ZI)LX4(Nu*
zGlpG+KiGIO$@LU4eufME5c6v6Z~JWfSr7SAe^I(*l<WXw3vxmD-4g!*txan+hRLT;
zsgog~C<JX6vLYZY!bc>BSnskI8i$*?#Vc6j`ka4tKNkQbzHQ|PHqh%7QzDu+n9xsY
z2I|74!_y$D=aYXS2(}j#6GleNjtZQ(9uTyF-MpfjJ;(k~Z(vcOMXz-Hu4_fqfvf|R
zt&~~@s@!A2va6GDJ=L{V(86x2-1d{@XogIlh!gW<Q3Q@q^h6SiBH<Ru(F58>2i-Bu
zHdF2Fy31HNgKc*QizZISmYkd-UJvx)K|QwMCQJ=bA&gq!-8!B#ySTdVHd50x?#2G9
zsgv!JH@GSG3xFW;b;Mj;gsqQXL}j^5b?;>{x?vyrSptRvS~yQ@oJj1r3zXo)*kNWA
z=oYAr;`mTJv$c_RF%m&GL%s`(AsP(!OGmV}*8xt=p+QX;4gUb;NEk2RqatXR8+>IU
z1pEuG5#skw+l-|2QX({Qbf6P+WWOl{g|`U`qlk6v2lq_`_)qn7n-#^^AEw9@O_8{p
zaI32&4LNPXvhu364o(wA20+2^yZLO5p>$*d#aIBkJ5B=qm87&rFJ-83wn$LOa6nJE
z0?INu!hr9h7ax_)CjS6b^4pZ)!aI+IQ6|P-{BRds**@04)g^_jm=-h~^Mw7`37~ur
zvQopq7)sE~V}Z@WVFvc>ownXr4pShy8UYFyyZE3Gr*(&vG@q{P8_;VD2*5Y_3Rqg*
z_qrN64=QL}H{5`ofg#mFq4?ycvA4z2&VBe8QG;SKl`_?$M@HewZp>XTsPF1XWp~BV
z5emRZH~XpEagE<(D0wAJ*Bf?7`zsxiKK8POqkF7Pl!e?C3&^>3?3y5w5%kWtwaqFQ
z(@lGZW8rh;Bl(gEq_-*dL9!RLwbpnb+Q|>ol;^y;*C#ee8bH5v=1g4L*ScelP7;!s
z;%|_GL2?zx&6ILsxhdK3nD936eyE@@W?R;^!kBHpa7u-(yUuKUsaX^IX2`N`td<6}
zxO?rCTkaZ#rDL~%=Az!$V#3N(I&mSaakm&wz0Ja4YlaB2;z%4>MC(KEfo>Bo@SC_>
z1#u){6f0*N+dMAYY<XM_@np8+7w(wXM*#2>h4{H#(oOAz@$r?6+1GW4aF-(7f>O4^
z*iPPB&@2ts5wV<iDX!iwLHj3{H@j>~Ym8@yk@B!aE;}wlXe~V4BrZ3@_arAH!W25t
zt^of4!e+udW6D$e<#p~>NY7(PwXblLU$IIoE|a(Xq6;|kLRO28%ZTK7P0zwsG7yXs
zR1=eKROA~HhN$`OnFf6eM*BYHm$$+#(#Crhlr0llc{Vrx$cMyvX}Y{mH!oz2k(U;J
zeo+o1)61Gr4UO0R0I7_2iuONZw1kIXbD!c6J9kXy=#}T*Qe59B3T*9<LKEA%TLM5_
za*($p$^oN`d=%0Sal&>xU2rbo<zo#Ut`gV+Zc^?y$XpLUDU%h6U{4_-7AeGoj3n+2
zlZtRQ7s&}PZp)ACko<*^j8I1>A4G(%;9({+g|q{|n)kx%_R3JuMoo(5#oQH!5Fa;O
zd<3PB7w(&94na%U(K~N+ma(u-w{pA3_CRsA$I9*kT=Ki0s7A#)%dAEFl&1l8v2+6H
zV9oHjocK>82`ow?vNN6zQWWyb*p5?6bCkl3$vy75-~HV#M*%dr@IYAsst}$mdnOa`
zpLU+sDW={^A~rF{Bq*Li9I0Fd`B1y`<2g=<HbEt?bg&QN0+Hk6gy=St?#0vCjan?=
z2WSNLQ-N_})}OMDm9g9P*z=TQS#fao{m>U(kZq3nVf!iLV*tdC9|_Hf?ZbZHr--fC
zgacsJCE#t{aI2;_AAVJpTLq3)WPr4spodg25aEDQoTlUYmvT8ktXeqW@;>QuaxH5n
zxul#G#5gwC2r!&)ZwYr1$O*R~=IJkD7Nc1!ah_6>@-Cv@E}Yj38>ORi9p3m&`f?6#
zmA1e4NbUuZ3t~7BI2P`h?rxWMIY>yq)nRY!L50EC%0fpMvhMe>MuB7R-uXzHNWX;t
z0NF8%il`!uyS9Kn6KFNsiZ^;x&1*cnx(>d#b;DI#WhPK>$y^INO!J&kzoV~`rakh!
zxSZt&t4Y0tH1<Gf&XP#Q-?gK{u&WWa0&?#OCqJ>4%yy!{B_-VOqK0_m0EUl%h}GKn
zNJ9Z?4vK}(er{G!_GVbKQkvF`ZNG&0{Yf2p3Hp>pE}gZvb%%8MquAVkbj}H&f1!Ye
zkJohQoE+-`{{Skwc}rble`V2BNqaKj`3s+i7Gp^Vp$h}%cyE4ke#lzAMY1@u29Vyw
zo>gmZ>lYH^@}0ae0(nMqbI^(u9|(Ma5>Lt{l<c*eVpVN5LyLe8!qaG!-m5|TlB<UW
zy%CbG!DFFyfi1A`qo{?Ei@f8tmX>%RiG-2~`mE-lTO@=>$A#0A8j7nL3ibgkf%s+A
z9+ZULtv6TtPL%48<<HSxH$#dh+<;y5UUq3m9@`boCrHcbR8qa|FT&R8)IqEk$w^O1
zwcn%w5f81WrH<RK?*Vw3v$=E)$Tm87!50BN^3%jJMZ7HKX0``^*;Q0)WF5mN<fvoA
zl5W{W6pbdOSl6)nZL@sYVzte$E+N;t>WyAmje+|iW%XtKX5+x&dtN$lR0}I$r!J5a
za<8=de{HN&H2Pt>)(cal&@*6jnR2@yjVY^Ol#yLe0|kqR2$<;oQ?;$flx1x@MkBSm
z_(bWir-`jHIi&vpP1m9L{{R*#-a=Duv@(lBwVc-E<eMvYLr<r~Wt8qM7qIS~CbJxH
z?5B&>cZ*mBQBnD-$v4!x&HjKa7pde<F^?Qbn*Ph}D_yFVP#OFv!N3J>^lfusXp(Kt
z`mZT$?5DG02IGQOyQCrf)7oE?+%8`pSzNfIWO}rE?uDwFhd0w3zE5Sk(#_%yamvGV
z%@?B+eYOBAs@-;zOpA3y?Q2JqV7(lXP>$HRr2A&YuV5XNa!SxLKwf7*;ypX%^yvQp
zh<Lc+O+(c$mHXrmk^VRVLLau#ca<K7+c?~Cn=DOtDvM0jpEw3m8ayLpuMQhy{nNO#
zZ;~wsK^sHtEUe*USkS4cq<1+a_f{-<wcJukK8Axt(hyC8k~Y~u*WBSv>NTSGNYm(a
zPB>hLWc%G<r)juI)fG}qRm+kW05X8Wgx9zR+?52?OlNcq^`ZC$GK(hWkou?kui6vo
z=|C5<j)kU20#&0x0W+5!A!8m}1=#lRm((K%D4PWZKx-Si=qX=eaiU00;dLS&jp6Mo
zazNzSE9`jmcL^PaoS~{K>EH)^jTZ7&SE_pEi%o-NF#OEU;5YPzIZZ`d4W?P^)y$=Z
z&U?dc<gYi@^&wQ*4(uvDU#N90R&wd&_MRBt6$YnYP}Z11*xvsDDl0xl?zD2`X}Tw?
ztq*Yl*j4p4P_cxQa;j=-oEmI%<x|$y9D@9+=JFKPF>&LqgY|V=CS!mi{{R7bX1Xrp
zwYPU=xYcG3Ym17?)<PzIn`Ogsi_zN_XDQ=<s0msvC^@3{`mTdd0NjOfr|FVN;Lr$f
z!sg4Bb}XcIH>)WPWytti4L+Jiv~I_gc9)~JHZ{edlzg<MjpD&@%gIkfoUE=50C&P<
zyNLFSqTL&Ap7_SoVcA#5jmptT$(fx>`Tqb4uhT9km3^qkVo4uGQ7H|+b9L>*sybIh
zLMF9@l~<_R#CAu^I4!}tsIQoj%5P?(mbuq?utDu3>WQg!-DL;_<q!eXT=UrhG0D2I
zs2L~+k0^nF$S!hliPL}GA5{d`xx$}J{{VbngtF*XdM8XZ<g_;!3v&c+^miNIvdDCM
zTeYrpfVGy}^AQL`T1G<gvt@kg3D0y7OwZ#B1G@QIx(6~UVe0aD3Wrape6j~Irt4j#
zXm62$?zulJv&ZqJR*}z=YQdi&5!r&*<f@vt7LtEuv8d9^A|y8fWA#ficQlZ5z+C=E
zizhGGINgv_)JW$BwAfu=Y0z!}<lRzf@a~gw^0pdNVQ6SJIPAH&#tw}+eGGLg!!7~_
zt|=^Ug{xyDb8O-V!VbO|nhCYXW$I(`p*ZZClQEOims}8j;YA%0F0sH?x`d2{#JGKx
zeAQ!NA<NA2Baal0gxv`%Vuin}C=*#5UtyA}wVg~{wXVCq3L8s&k{!;;x=2OOY;WSM
z(f(=87bk7hW~T1)f|uDA`5vpycm~bS%1pSM=v3^~($<));A~ON*5)|5$I8l4O8L*a
z>qDl}wZtwpj^#|vBwNx~PdmNWMoC-fvnMJD<Bk}~$JJEoHLba8U6s+1Mlq@uDM)>O
zr6i9xb%GKtLe8)^Rn-$*k#r%MtT!bt91ZQ2P>G~|ueG^yCri}KuDf!){{U0e+ShFb
zU39HzcpII;PnQLuB@d(0C@LOuT&*J1b_;G<h-(-lvrpX%S*W-RMz|-7i_nfO8)oZl
zXD|NgkLm`v+kf|7b5U1PK_%q|>gs_0N=wY$SSg;jO{_J;4^lr-VZGizb>;Nhw9zmf
z*;B=>NauoFRj(pj4-?X3tORA)O`5b3W|fhm)LiCnE<_DQpx6|jFW9Ayqb=A;H!Ce$
z6q3qIK`Q0*wo&eNkra%9+yVDSF4$G0Cp{fNVcOEGW`d-1a=ju*Y0GV3P{&GS*$n_D
zb4c8zj71GRx4W<vyinj-r|Ps!(HPTnWiX+Qm;e;6Rx*<_4~9T6+$zmUu4_qKnP}Uy
z^o5<)>6#jBx_meL4;+@yJk?1gg`BS*({-!XV-0!ovf7JCX$$Hh{7!<MmJ@?;Gu?U@
zN6z0tw|5K9a_PYNUZ41VraEZaZF{dj&cgC4Lb+2lbka*80f2?0&?u#I!<-5FqV#P9
zZD}p+wi-T?*xEgzdDy&vjoS+Sj?$XwTGgYXsU!dj6|_wlvL>D(8D4~E7PMM0`wtE;
z87YOEiBP_91%XmP@OdlG&*V!BETEbPs-yLJRr6_$0Gllp!3sGd4hx4TnLM7&!6O+{
zNcNH%+bVrRnfnPhTluKk;7JODUXCbXb%?s^{Cw(L5>Pzp@w8U}?B#kNOGOBUq>#M3
zT&xgPmxpkCqBP#SZ5u;Ky|BKk4p>E8k3Tjx+3qojw%ZAk)5Rr$0eOy-_<+i(0|Q-k
zuAtW)Gedwze~`hA?UDH8){O+T%!(^80rXY#x$%p(=KdEQWv*t~pn3W#%|lhGm)T6l
z!rvqURhQ?yOi;G%{U0CZfAQ}x%FOtx{>m@Kdd5Z5jDVZZBd!N<7s;Q9^b^k`-dNxd
za=xt8w82zeHA{@IJeOpzDEv*(+4)&SaRGusvhd&KW1q-!s<Z2V8TjdVUOL3(XUX+&
zY<UD{x(V&I)|aTM{R-(DYZafU025{Hr)tiiViIJj>EL|w1~eS44Hrt)PZy{nBz+X8
zmN4y`vo0@euC^7vwWG~JnHoU(RaQ+2DXT$hgaK^74dE`-qdm6;j|1Enq<$915vq#i
zpxk}er}*4a$(bf_dGm3^==zKB__3ONV2|Zioku$x0dCQ96?aN(j)|>iaHQ7bk?keG
zuY1k#akx4>4-d_o$fDWjy7PTq>(2GsaLEZCSE=fB#lhAK1Ju;Tk0#6ErTF}q<mFmE
zt{LLmiJqqpAPv^Kzv=jguHD}3j#V5bt>mk17G3o%0oV9mSCxgd=;?{;ItYwY0!ZS^
zJNSiF9CVUf`fY%;eLF<?DH`Wv3o-bULh(rO+vB?Ne18Wc%$quSMMU}YsO9x5TtV)s
z$<GSMTw!H&jXZ^2Z}7g`6nMoWj$30$&PrB+;X7(`231UTz7$e~MXi+#g9{1{bA;Cp
zRHR$7iRYB8#6;ydJF<-OmNTCV0)k*^-F0b8BbWz-1vvq^MZ$Lw5@cEx^jp)&=XWTg
z?W3ENH5+}3cN<x8zQYZ%90|!t1+JxIE)uzi!YQ7fI!G2?5YilQjGeY0R20Ad1nAOd
zLho=0qJ5}X2fX1JE=MTQHpQij)OcEbDvgb3!l%<31I8@0bWRO!6+IAt$bDpXh=#1j
zqSptTn=MULfW}4EXHmDPa;M1Xj6|Vik~+a{I)6#swekg+&{{oENV@b*Ab}Hbmn5lD
z8W_{rV@CvWGyo9=<AnfmwiB2M=Y<BXm%8YlH{Cp(TFM}Dl#^~yU|Z~pdsy764Q_Ta
zBW99S<mTa0YYYyE*%-=(loLGfT&t7Sb%7bhl_{;8wf_KhbJPOTI^ShL>v+oQiOD#n
z(Dzl%<r}6}NxTb^t86?Ybl^QeRT@-B*}BmukhEoA#P>TcaV2JSP8zh--GEV<)r~3&
zkA&uT7)TBhvj>h;nOLG$fn^)8RDjqO6OJ&Dqa4G4xy3bwBhQ6|Y*gcHD1))eQzJm-
zYHU>`h~>WGJ0`+TGNP!MU-c-XsAxRi$*V%SD=bM$=U8%peO<;bpmju!1PlJlC^I~W
zv3!law*?%P4Qp^h1~$&}J+A$fqfe=jab(<3k0X5&ism$orq8LjWq?r)7NDPVtUK8m
z28{zOWp?j5LxLCNlPaHCBaOhvl?&^n0D#vYveY)0O@)VZ1FhJh=QLp1uwTMzK(_lc
z9<5bDvsnKC*%M8p)Jk_ekQLir){(LxKFg%3m-$;{dIb?s=x{LJM*>x}bW||`aMe&G
zn7eU#_!mSqt|Q#yeyLj<gJE?Q6mcJDX(Qo8EAD-b`dJ4vKp{E+FNCf`#~637E5~4=
znXhoUc6+IqF~<p$6rA6qqBu|yjOOkp$cSKR0Gp;aB;6Gr04e#p1hJ&Z{RR%o3F83V
z1Zh4{wFfpFCFH`Oh@xgk)gHhQaek{?=#6cN@PlS(TYywk;k>Ci?`0hJBeEi<3P*)3
zK<&xGh>I08JRxJ8;*ejtPat_swXn5|yBRp#%W#8xam~?n4YP7kmbOVoEDaM<GQ+_{
zfP5(F03(~C61TCD%^uaxz~w7HNnGy;SgZ!Q#7E85b+3CXD)D9#t9TZ<MG70Ij&hE-
zgUYU<J&|R^0b}(=ibzGWO5<xL0!|WwfWk>{w{$H>>B1rI+%bHpq-l08jC&EVLM_6U
z0xq6n@B1dTmc7EVC1lKZbi2UirAE!yz0|fR=G>%^$&7RDoTfa26pm>6rW^1qf*fXe
z9H+B&xkv^Q-q{J5Vu5Pj?e^@TE;-7Yt^WYT$SMg7e4!tsPoSD(?YSyemX!q{yDp{x
z`NA^MD57?p0u$MDkV1u+3QL~J8AOgPJ}jbe`lq?Xo=RyY4u=t=$WFd8kQ=4?AW|Y6
z9u-EQL3cP-?;_W}6+M0l;WT>;x&SupZjaMRz3qev=L*YBZ?qmtthykPVlQBSbkaFe
z0fCgqTHY5qTOoKBzjVNJWcTBfbsq_lHZFXpMo2d~ObN}v3WAe0%qK0fcrn=8;X`jJ
z`&vd0QW@xBaJ{=Ey^3?A&BKT8qqUqz_)S2u*0@l*!Qd%JD0z1o00zhp9)nsLfLqVX
zmL@Xz2L2E&GXcmpQ_{;Ib<2OcdkRF=EwinAD0vq0rk%yc=am)!y^<Ea4fiEH@VTb^
z19ajY%3(xfN0lG~$3JAtp9w>5aFLFw4t2KSK`Ay)e&KOqo4Xt$gDD_$a^rpzKs<5q
zi1wZm5rsrSq7dBibhbPdC55b&qXiH$3mf)KAfF)+;hQM#&<7~p7=+!u?ov1cEtKMU
zzyUT=2szKu5m-EJCFEl&U?djB)G(4|ur{(I_?>_uA4J>PEi;|FEH_0x=N{V+D0+7t
z*<l4sF}MmcI&m|D`8Tj!=e59I#|k`<E|=PIl`1+=gkQ!}Y%g*$q+<bo90k0m7~T#0
zd?J`gt?-uD&C>gZ2wj1L&AX;Bt+;nMOS=}mmox%wcwJ-zNKi@RDL`>K3x)RB4iay*
zvQZV#=N#CBl)@WpUkOCNAp8~1lwb6MfGlpo%4u!Kgy%h_xNVb1n^_R1G>a}LvQvZI
zA$7%y!E9~pGE$rN;U%~wb*vU9I{C@Pyd)o_gq9#*1tsyEAj%;~@BR?e-r47}p85Dt
zOiyER;S_1QL#g)iLYI3l`mC0e4Y_K2<B0L?y1WlRFK0yeALa^YImSGIQ0;&hdtMZi
zGDfo2-Sj9)0v&+L8@%Bm7a=2$zl$E}!N8k$NY2O|+l1^JB*$W$$jh!<kUmlrv?Ya(
zY?$NiQaU%b*I~EHW0`i}f7xMNh{*{7!bdcpl+x3F3bLXSko$zU$I(R6LAXz0{{ZkJ
z1jiJXH%dF;-7C9gEsaA+@{sq>*(<rV_(*Mh_E`i=n`e~Jc}_MtNyh~n1q#=lwz_`z
z2H2b^?R(!Ro>ygNf`_`~=k`rMA$H=pIC#ndu`_ko&t=yaz0-I(3s5XvA1QlsyPU2}
zWXA${DK2mFk#&#F($SgM^U3hIxE>M_aGK(>6`V-ALvI|UK0kDqJe1T1G=Y3!FpLp&
z^JAU@VYfF-iOXXg4UhRuJaLrcgUV~KenNDJG8bF>scFM^8>pN`@&_o2H-h1XfXfPK
zqIkaR8`%^2P;%K5Xyc5FxLo`cSEj+i{^(m3kg_S6`d@V}`M}M{3G9v57I*HP{{T^=
z7x+Oi0M$z2e`>6m_jl>A{{Sk^q!JCs?yG7~y2BSu*zqCng1C{`<uo7NaPedrL^u<{
z<v6?B&OTEwW|hO^l&uY8yxldxl=kH*^K=4;!)z=-TpRmvp4$Y{Z<}zjgabAP*GNt;
zbiMELko@qOAT~C~Cxp-q$xi#F$77VD3?r4t0O#nJxA)5A#u_i(I_KecChM*|Ek+qD
zd!KdGEnzZv$~Isc4Vz>sFWv1Na95I~qV{mrmzqnxCW7|{50q7HbPQv*yLGw03qIGm
zw#hzFmD9Ka9^>!=WR%_5QYEg`SY#v*s%;*kH(8?R$y9X?l0%FIH7GII=If>~RA;kc
zPgFL7_Y?7S%Bjq_W*VsCndPIKBAYfjLAnEfM8X!h<XoQWSSdZi!9x_y7TiKQI_9u@
zMbw;=+Y(kQ>0H)#vahQk9Ck%dSohxt=&I-SUgB&=!cDeiZETj3a>oK)dljbBHAzDQ
zT0jHB$Uzxvu6b6}GZVBlaGoxNlKV80RLdg`-fo*m5i<hwbTu(9usnBHnsqhEzCh(i
zK4zALlXPC_?E!!=Tjf~D*0q-?8d+n4A==+4I{j6R1Y9`w0et>gWXU^|CYRCLr9o>>
z%Y~P(sdG*D6MvOHp{SV&0Q1-?*3-#6o18tXtH$wMot2OF3oT2Zb9^ACmPb0m_A2ID
zAlx)ufs_=qj%%*$50&ae$D+!sWO{rB@4qV9l;waI9HBJWp80mO&mmpc&qF~^d7K|7
zadq8~$BY*#GH+}io@PV(nood?X0Yi94|rn-^0ZlHD)o2IAq;NTU!LjIZK$en0GoMA
z=QipFaZ7B`S8JibMF_`oh|!q(w}%^&Pjy*KrEIZ%@N!m<r(=6%Y*8?fd2;mpOl~`t
z+0Bx7q-nHmAiro0$@9w9QgpuPfqOE1gm*^iPWC<aB;|S)9TY8y7hCAP)rv8Vv~gRL
z(c{{$N;pZnCU@k8VWNItLmTG~bBACTsZT)+!227tET2`=(nABAW;Wf|4p=B$qUo26
zWz#Ba`trEIW7FxxK;Sr>{>u-mRO;HDL6WwnNiW*w%IDOerfZ)(fS%26Nm-41Uuk({
z3}h`F3*4?r$_ZSZvhjoTYC2vfLmv5_BaCufRkcr3(ZMI7LwTM#eXzWz{Z?1lOHy3l
z7gpLed|#Mh062r+gump?)ML<I3RZiMN7PnVHLi8d{I5gPXfD>d=H+>x;r6BKHH~$E
z900w0Ng?qx+QD~9U!tM_oj_v0SmC;4(9(vC1=2LPvOS<#MLR(YnNHc)#*toSEm1x5
zNNffX?4=GjD2BkmFwl#VLhzFWqhrQV%^(bw48F$rRT`eD9V-cQu6!kbw!)tR?n#)z
zlB%^0O^j&`H$MwARj-+EYumtCjdQ4H{{U{EE<QLylu64qn%d1+ZYA;nJOY_PT56>M
zrp*5UE6$lySos6$9QWV(M+;rkZ<)?vb9T4F%5H9w7A+o&rZfo0(I0h31y`jIxw3+*
zS!``S@9wms?CFe>Mf{SngCs1!RqN5wz)kON!2?mQ8E)2<ORUqrv7oq;3Rf1o1D%hi
z{6S=G+4)x=l8K9|EA<C^Z5uuUsin}^=H-L-M8{6bHwKFjg;fu-YEmsKV|>)IO82;s
z+w#2IT&Zc7Bv@cCLey)cr_&#I09@Mz<WCQ)uakR?n)78GkhyU|l=z_PXUDY2ZEzJf
zuOOCETy5}=uX`zB$<45`8jhmp7aQCD5y?2hG{`38$Tc~{VZpdrs_L@P<C2T4s4gUu
zTrR1q<C1I}fqn;d<I5bUD>~rRbXHZ=O;aY@lkhttXf*f8;qAgMlT9Ftg?*<|hFAvu
z(RkDq0#a-qgGmh@_WtVPj*>WRcI8gf6iu^;+@*x>A>0MSohD0u!s&;!3ofi^YcBI-
zHAbZ!EMCUl{z{^&)t@Ycz3b0)brd`z*<czSCpHRKxuKg_KBZH`UAopi(JrdRffrtn
zi*f9_MRu?4Bo|))030msP2A!$Zz}q@`lOMPsp^?-%i4!WM0zV_yIamxWp5mP6^%{Y
z<BK3<VIZe7WhCu8_)N{LKV(%%4Zp$(?#@4Tf#`y4y2A)*Kmej&a)q0c0w62r89b-y
z<hD?oF!w1m`x#mi%b_LFzUh-84Yll7py?EbMzpx!<zjk4fb1Ne7o*ZQ(|{fV^0KC+
zLuP|Sjs{p3f__%hN|K&9w@6ynh2`<;jHZ3u@GbI|PNICHV;<{$Y`UT4N)f27lX#q&
zw(5?dr)wPrFc;$CdF4#Q)iTQQlXU0Qmz(+WtF;TBGj$j8<aZ+K2`WX58jE)Zvexph
zsdXb8K?JO2J6{;yac;`yhVuc<mkhB=SvJW@BV9?Vz2tkgk1Beq_dYTs1e<=PPeB9R
z@W!;QEgqQT9m{TQ-FleYONu2)GY78JO%q)54aRb^Z`7))F3|D;ImMTx^&XOCYntJM
z;bP{|{RaTn;Hdc+Qe2ukRJ2l-xLljx%Cypp_KX{;PMkpmf=aW~D8V3Eajc2y3g5B^
zQOP@f{3yTDfZ>_*Wv`^5X3$<Rq^N=xu<ZbwcuSi%1w_>TjC5=?yxE~0ORWfo#`2R{
zV0W|yo}M`ay{nTP?pDfLW|FI2_7dqc*beHX)=4wVuWRK6PekXC=aNdYhMAF!fNZ*C
z;>J|83sqF+vduZSDymwiSnht%thEiUxN6VTvBaMXr^kwYl|WVX8=vhZU-Xpn7c>%V
zvr|TIdn=BfsB8tK*b&OFlN*g7N{>sYm<UDBY^bEFVReR8G*$kq1&9GX(jB)8%>Muu
zRcu)+ETyPvz){B7$tCWxp{S^nb{>*FN;-3QyK(tR@i_DjG-(7ab1pbhH*00HP1PaS
zJzr=x2;Dwl?2?vHZET%3U&kwiU|g;>MnC33iALKFQvi|gyS$~2BxI5;Ddv2R+~*s8
zQO?wi4fd*t%Y$qbGsxm>O1B7fF554uHD|rxxRaHmqSQyG2^I?zrij`@p6e@VYZ%yl
zryf)P0F4HQ;#}A3t!3KMhNsp&L(0k2&+E=w*JkS4k*tCp&LZ|w%j4_y3rQE!>K@Cu
ztlqV#@7w{phO)nVi$kn|sw^xdo2&R<Gfw0fM`aeI^72VpZCKfc<npxogRpIYvs#;O
z(hB$DsU1ZfJIChRyUO<e0K+-yn*?U#ATI~2ab%Yqt)D__^2X-JxQzK+-cyugXog6$
z>FO%z8qs1btRmK8j~5Hd^qpEqLN4;UyIu61{^ifrcv&-Llb}V(9=`^$9EbG;Ybx6I
z{-76)>779Pf?lqh)a_`t`=6?OIo>Z;%KWYNdNh?W-wp~`D%v<J%-huWeS@v_D%Ou)
zV}@R#oy*97wu@uTqHljb8{H_><G<<)7X3`g`dovazGh?+R|a1eQT{Bl@*(WpR%+3*
zGwxVktk+uD-gjXKJ#_K|cOTtn^?F(Ans*X@7k}e?dGfged7{-L7t|Wpt2=`UChD2>
zGdzvBSK5w>8!gB~$w<gqX0$J<;F{UY*k4D<C+653P1m$&7=f4Yyo;l0w`vU}cV5k;
zz(p|lUp?hul;-HBJa@3kBxndpCx|;P1r4i6=$b=LR&u7Mb8;@ctdNu?MP*Sm^HjhX
zOUMCvr{Z0FE~S;R_&HWpl@(2CF5UaDJnNZjC#H~O1L1XeSlp(poU-djgY|1etK}fx
z=J#1@mRlifI*u~hr(czssAb+8+^@KTs3dW>yEK1?nn&lWn9|Xc-F++4{TWQnC56lc
zmh)xf--8qz>moaEV!ou(>DdmNH)70RJNX9XlB~W4yJyUwj(Q|Ca5%=m+ZEzAUr7Eu
z#Ojtx7{jz*HeWc(&9b?^4VR(#*Z%+&S+g|VqB~`5{{Ri;do>uqJUCfnt%9`u0w4aR
z8Ex?8^goZAhGfy^`LR;O(>}!fJA}<c9qw=zmsq1?X~`g6W&Z#SWT+Z+V__H>D^;#G
zLr?B<_k66)%WUv`JTZ>aF%^`pd3A>!mJh9|n8=-BVz+f-cRkDwAbc!`SJSvtxz6Uw
z9#mkweY39&<nvNTlvNi8I0IpIdC<^4qfw2myR&R6YW5Q&ta&Sa_$^5sy2E#YZNk@I
zAn~a)=%ng4dw)oD^pBupo)78aW<MA7YKU}+-A_(Q4L;@W-7!fED4Bu!R!i}L)UfpJ
zU7FJ3!*8l93?eLCnfd9fx$dl($ZqY%=r9ettDSn0?bNDnE&M`NOPX42aJm+dP|`8o
zJ&j1xp3(!dQv`7y+l2(U?58H-4=8cs>k9fHkd71%DpxVy6fOq*C1R11xDX0QgL0ZL
zb&L}m@QtK@xLsGU*-0FmNJ3jcqgO)axq~@I1_O&KEjFV76>|)?3yx9QOi|cmdqa3#
zC5W<!Nnn`iPm2V!cc?Ndq5=iOaj-?rcPOKd?-(l4LQRBG(QW{Mh@O|zZO>(8q{h&|
zN^Y-U(`B0yJ7sMw!H&rst0-#8upebY%erl?IQUvU7f&)+yCG)j8-r|_rb#2cjg@VD
zX8qQ(N_eA#4Oxv=U9u1vbc#u`?hYuILvGiF=sHL~lUJT-b8eIyV(ZZ~Vm&csvLPcT
zTE@!@l=5whCWGzIDX%#3@S)jgj@&M}&o(3k!F27QWTQdk{SirXe0`Npvv$JoqPCUZ
z6(+Lr=|1_eKrz2(o^=5}qm>K4vbyR6{6l3(PJXMi8qv!)v$9dzVE!P*kQpQZtTfN}
z0I^RcqDa{2;=!WJMNPmQ1)S0ifbz5yn~kgrjFHm`B!j^g@AOL2E^?R)?ZQ^aBfAmw
zNa8ohkv8G99_k4s0Gz2G6Tr2K9K!cF;Y~o#E{Pi;1mh|RXZH(X7RqtA+~LB7^wHdx
zKKV|fkv?pNj&sNWXR=A-n{TzH7YpNwzSdsLrmHR%*bx_HA&#NWv0+Eh>F#!9$CWpz
z=NxxW0pBTHkm?PSHinsv_dh9*{Hq8J0Od1gGELJ2K=%8hoq|xJQB>BOGBoDa&VNg7
z@KiyT7EWNw4oES9Bc`Z#dwtV=$Mra=8ZFN$r;%iqRbxVI7D=(Z0G)K7b*wy2YkP2;
zD?l762MLmq-yvZriMe)BO>M%0HVcDfNEQ|-Hc?VQ(>LA1SQ}?#E}YrPU?jM5lxT&t
zcu~(`^-?q&T|+tGBrO(1(fi#J!R@jcy!S-64OEXpNLL{$Ex!K%2)^nGEL?6Dpe92R
zAdF=i*9;-p#@$RCehMIv@9v<eBsESNPr`<zZ3#tN2HkV+L_up~ge$V(5ixPik)fF(
zy_0RhPZr^D7|H=eH8$B|f<Fk_p>`fF5JvamGUyC0jjk=Y2#u!sP*J|o+mt|);Ut(X
ziac2(xk^5Q$%NRY1F&k_n9qe+TbzYwTJPcARlJs`h#Cx`Zg7hOKc?s^1MrV-E>V_+
zp$NF+_Dptra-M85qVLZfBxBH|3yg4~liCSVgvpzB*%*^-OYk>#PGfftMg9~|h=Iy%
zY<LzOm6t>tMCGJkvQQ4(9H`n~Y@3BCzR`s@W5taJ87eo}n}n~u@}dC!Qz6*#=alP?
z0J>oY`8ZA(7CfTHk6_YR%WewiF{Rcm1$4*wfi=!rA;=RPY!Mu1vR2!X%1B8t^Yus@
zoS?|X>~l|RCjfin=#UGMYxz#G8O@L#Gp+YbBREp<Y%q}Js}x9&Bjq6Re5Y;fnnrFC
zG1i22>_IA`xB~uhb!zSkr>{T6DdK6p1MSViv(sB<^Y&G3Iab<mu(>Ld=#mX0?E=a(
z-wJDEmBE+f1u7qnpf_`5!-L@*_#124LSh%VOo>SYv}Wo|i+4`jV!LiKc}!smJ`xl5
zPO-g#O}05oWwWzyg}`6U*LLMOp!oVMwlxSDj`mO%e;&xcO~7zM8cT_IvGTA<gAbpg
znw~OGl?ZVsj47#P&Q$<~sBgPAzruuvTER&<yo8IWh;Z(vi+UX0%_QLcQ`+)vcGxI^
zcXDi{XvNWNS`1@o+|m4Pr1=S^jGOvW#z(`lgnWCCYo?gXO|E{+S~kh*A)X<3w;oXY
z$9Abp1Mp@)LQ`E#K*PcM6v~AKc=uz4%{cFF>PaJWGI4$sZohMcOgI*w=HV$A=PEYa
z3QfSG!DMf^=ISzWVtC<7Y=8Jsyfioe04o@bi{AP9P|xsGrKgZ=p_Dj|%83Zs3_?Qk
zThE0%Un>S;{giZfGg%$(u(;#l22WN+Pf_m3aKFMLXNLh~_$_?5`zKW}0v*NqQkyz)
zEsz6s*Bq3)Zh2j{z~bswcBCVSNt<Ahxy?4czhu$(xJ3%d1d@MIT<3>41CJ?<AZE$f
zCq2<M4r^QH=ixjwfS4H5Y@4OAAIwtN=?`uQ;^{0M+n(vo4cl_zf0Ut?;lXPSA{WBZ
zb7c{V+&lZCT+`y}Gwtnf_(d{pA{K`O$+CU%eo|iKe`LoSX9Y6YmOQ)QqyToxX5x4W
zLGx>^MzQQ}=h;2cJICEd$L;qHRIQxwLJT`Y3rHLvl+la#x|~eImkcg@qH}rrARbf-
z;w@sJk=FPnPVjyT9$-U;FZ4{1Co4fTk2`Ed?cqrG4&<omoC5=Py8XqI{YKwuZdD?W
zKPx$|V0R$>*Hk~)K)4C<7|X4+Tjh06r?BGx07UE<?#j!Oa&PjKke#uln>!yXjCMJ2
zQ)gsG?!u9h7VrXKXdTG<rT+lwApO#ZqIS-1FT!i(Yq<eLT5X;a92TQGW4A_52H&Aj
z7oEfoK2o?FrdWgWsED*Fc;Jujp2rMaC_pz-M{ots5opn5x4rNZE;dQsEfhHU<uvhs
zvQy6_B=4N217dwHlwZo>-phsfSQc=0d?z1}m~aKcLTpA>4UfV2U2YF_&Bpd6D0VUy
z1&Z)8Ep*#AxGSA*5)<8H3y<YCN-tr;ZPyZQg^Y#VMhf8W{{Y=IgJN!y$RjxmxOrSo
z5?jjP$JpZG5HSfzY`B6gd?fm!kgc78_e|_p9C38gfAN&mBaqiyAx86MAs4tjD5M;o
z%7}!X$R17br=@+(${I{$a-^n|js?a1E!ehRQSHUeukwpwb9i<B>av<*K=xe{*_(54
zK}x}8gC6GKg(IW{d$56uR_?a*_e5^MwT=9xF$HUeY!y9Ku5oLtI;RI-;a1LWY<nV#
zMu;z-7cMsJxQ7#BQ4Q?w66b+rnFjsRTyj<l9trT2I~=A0KdCo($n2JeOprJp{{Xt+
zc~O_=h1VA4Y8J^3GBbqJ{{Y>S3xPN*w-Jz0qjDGOQkxv4-(XFyy5ihp!VK1N&DU|s
zxl6gH$W0^zlXOxuXhY62y3X)_bhpPM$!<KOU?(gucM0u*wjkuDx<O%cZz&^~2je$h
z2gNBpoIF`C<x7Rgu=*jYs0PD~ag}cqfsXF5vaHmnxFNS)c<`wE0!*fK5i#Uo*>|Md
z{3Rd<ZX}YTnp42~VP5`%*1}^fYkS!%<QK4SD0*_|;EN&zV#jf^S0AvXk<26%OhBBT
z5Tt>QN|rfx*-loFS}Yk5+k1u2jh8mbx)wQ}<AY$1r48hqs8b~LGAc4n+}l}9#<Cs}
z51pZwXv(Xvk=Zx0Dl?E4-pe{_#<jz9g@-EUn^}eydz=q&y#2LO2YXGvsF<aYo0k*y
zMp)8C6j80K*WV`u0IQ#<x<O)3!l`L-7b<#a_c#DlmK4}{BG!PqM}q5<+Ur9_0QAP@
zfUERc5r;eOt?COSU~4_b-IsPeN;+MVrPz}QV~m!IpM_mL9JNj^BG*?sHkVOXCg*}1
z*mAFGbm-~e*%L17cwX;|`1GUBeVn;`mYpNcYm2Cxv4Dpv8iq+M#m^<qJ<8o`8bs1c
z=e?Up%C3t_*-}4-U32=1mTw1>x(svD0MI&WqPjtX7*@WMrYEDe#_szqUq$I9p}x!C
z;chB4h?z~f?rTlBNBl_PT$mekJgiW{#sgIAJG5h!b<@<WGd0^o8`xP*SEs;hi`ilU
z<t)<vMh*U>VE}%jl0Ii2+C@Ldy(7>x-Aac|r4F8EGZ*D7oo_*xI%dZkc_nxsQ+0S`
zj${uq$Um9R!p2r=b^43Hk5MauKc@BxXZdMMX$5$SKgpj*br<74k3|cjp?|F}7hYMf
z{v}lEGrCD0_h0!y!okBxNZjiL_r%8GxhsP=l`N0;W#FM5Bw1E<R;5&Iz!=q2Q(IYb
z=eWD(>S*9|fZEc2fllg1vLa{2#vAgCSL?}*&3XZ)u9&<MTu0SubWKKZ;kBnHg;AwY
zweQ_v1@N`HB?~=v7XixVj(KvVPI(dSKZF6&hCR)3C*gao0dpa4EWE$)st6*bh+Tl&
zfW2y&t#o49!uR6;07Yj$INP#0tGyQ8#=$a=QDsyA0EX*;v0sVZVWnuau7Q&NX0QJM
z%|vcT*4!*FNq!?#nYKwsG+>+!t7GFKvPr=D8X^ltjnj*O3mwz_L~EGR81PS#WpQ7t
z($LbndbxHnqUX6&oH+JY853G3)aNaY#A3mDuT*NViA!XiqdacP!~Q9LHo5c3rF8u)
zjqGK93Hk+}=$#*^dX_;~Qt1G3%ZfOq&C*12((K-{rb?0;!)APUN7HHTal2b}ZJ=~}
zsOiV%Wpl_JD<MMm${8GXXk8DCbV)+W%{xUh$O&rGY1&AIpn#9lDFYZiwkq9_wT#M_
zG>b<and-P))|-_>Utx89)D;bhr#4v{x~;(Fc41tVvzsKi%S0Q8seAWVbZ%qf7tR)9
zNw&J^x_v;kwz|^CA40=7re4odB5u~$EcT~avF1w`71CF4ak(gYSSD$@i-o#Hep4^h
z8ua0=GdS1_HKT={(yLzgx<WGSttU|FB3PUN<z;23eKbX&ZBm{&Lud|s^f#z$S+wtc
z$Q%N&mG!QCmTm3fTkA#p9A4tH{*$DAz{i#2WOC<oFBFtcY=%s6@{Oa7j&SyZZ`}nW
zM0Nn&-?FvQAuoGe``9Tw%d<U}bozL6L$>pqDJQ3qwrpc+v}~-7FaQ96gOaj8Q)qSF
z;4U2gVs4R=V9;srChjDklvL4rOtD8nBz~RT;1xc*szDvwynO*&QqJb-4wGdrvn`1L
z;b+|`-dyKn>ZR1R0VCW&AG)Kcn&gewUAQqi*?6ihVy*)XwY;L~>dU<SZnCYaYfjK|
zjH0f&us>X{M;0WuI!?_aq}(uXe&`CINIA+#=5ZX|Hb<M}h1QAy%NLP!4P$mN_*SyG
z5PK@EM3O9vF`v{OcUh+hP%U7KsgK=q6c+dkBxcCm%b_Y71@4QH;jOjReM5=9Z)89P
zQETBlO>O3AQBH1g!YfE0#~I35Jqax%)H)sz*07w|t<^*JQ(R*UCD5@KL<v2X!lE|%
z7Cz(hynK^$$w-7HY{zO+Ncm5Ic}~+?G}5$OfC@gYjn8&Q+x#x3V2d09-^%aD8e1+~
z)6$aAH(wo*a!|n)KdC8b{{ShPYuLz3rIn3n?n<lI^>~bKjt5+Ka(t5E9d=Hec0o}*
za?Bdb2*Lf;-j5?3=Cz{WtS{$DKEi)>X`^bQo<QfG7YtzeT!fNmv-I^XJ40OXE>@D!
zf$aj{3(IsKr>Aq;=_LWJ?5?YNuA;1ZI(&OuYi?eyDdY9FNk?UuQB6)J*hsh?mR_l`
zOD^+cVPLwia~Ni-k<Wi51yMer9&FM8@Vw8-W|#3DD+sIf!LZHvMCoyW;Oi<kSHjsn
z@{6mDKCP}`a~f@B$>U<zCKne))7%={xyrh(wWRH3$yM5>rsp_D9vVIrP`rqVXx!u7
zPFSUuT1HSJ)MjHCT`Pj76)`>dBHt=KeYH*wbcW6FsHx;|f4JOuL;O~|8Dp)R8fUX$
zII@PasiOecDp9Ej<Jt~T&8U`XJ;exNmm!o{ZNJqdF}J^THC!=A8=T|rw+ec9wkZ3P
zWCoz;N=e`z%f2ynNUdn5t(ByZ0%a55yb*8_52oDW07OwykZy2Ql1s5V51^<lvauCz
zaIjTkGQ)dZ{30SGW%xpJR2>OfD}XjDH>g(ZlG}~`s`9y#NYk;T4>nnCLJ}l5=IU7S
za(f!lWu;U-@?4xPmXW#b7C5rTbnQQ@Fa>%(l}aOtwiXu3eAp61r2d0x<FiKYY@GSx
zjM$NX2wJ(`#*o2lDhlek8sg$|yx)ztpl~$L)FW$bEUV<KE^*uYtkBemKKEblr-HaV
zgL?&*8WNr8zJ{Vp?sJJhRV7V)u5Qq56(jWsS?w<c-U56z23KPP<z}d5X_mBA9-H?P
zkCwU5Zq~cuQ!$QlusKsWdQ82GoVu{iFGIM|B-L$<+`B3V>J5-s5>+mw`JUsr*my}o
z@((v%xT9=%qROS)+FfOz)Z73d@~$c*A(mPFNb*-*6f@d~>Q<dEP$Q^m-GHj=h0l)&
z&Yo#Aw%$~8D~UXf9<8TVO6p)4?F1;QOM}DQ;-8{JdUliHOQ=H94p);NDbTT%_6-)K
z7<M$}9ZypEO}7<7>Ua9MA9Zb~G_u={6!JkWqc)dCi*Da>B$Q1hbc}vqV5_R@VvUvu
zDhfxLpLGw7v3Y3PQ0n2J0B%u(Q7;!J>n}~UxCARGp2*?c_Xhn{q2t=yB%5WZt7#y(
ziz3?gy_Xy;tE#t4W@qJHP)g$tO7HP-sJ$15_64mqqU3p5iu20R>rb#DWpy`@#}IP8
zKSddD(e+V7SPPs6SF6$MRKlDFxD#dbr8Rtz)mgaDH(K2<Q>uFa^$5ph;`t77lcI|=
zilfwPD_KzUcL13jboT9kg@%r<q>*_Ik+k}Y*nQG}b>?Ko-rFSR+qP;dX<?D3_OikC
z#Ty$;`v5R)WuqFy3oW}VG1awxr8CdM9y*emMC5$$)=>I&kNT{G#pVO$ZF=3n)jamP
z#W<GE56b&kzxa_g(e9suP_xu#21vU4I*K-$Hr#e!Gky+Nh^1f$!CypadV?QG+q`k*
ze7~80BOe>1%YPavL+NMO(RK3XuL*{>Mv>ipcleSco|)(1ua|ntkg~b%Xt28P{9NkM
zNwm?L11ov>X-?Ny#B43NEFJ7`!q)Uos3~fgZaE9umPun*6Pqk~DreYT1t+6J8%3{W
zqpxeHW^ZNXy#drrmKea3Hp=w<HnKU|F5tZP=jO>OY)n|8A3#y*1<faC-D3LpN|HKB
z92xzWv+0z~mOcT(&3+=$(?_Mu=a%l<h0#2jX16UJIPt+dNclRp64~6-<!-+U-RM@a
z;|AemHH!-QY;nA+zKg4MJxH;|`AIpo8!afGSLhnH-94ncvcY~T>jHW?AZNYKx~|i8
z$BGt%E-k=Wj;7S(E_3B}K2&f@d1p_fJ~2m<bq0WMEkunT;z_#mtzHov?rVD$>3wh1
zl*Tv35f}4y=5x#I%3tMra%-eUC2Wq{d#HV5xf52)0&J_@f~GSqDDN$TJMvd;?UV+T
z_iq3WR;G%a$q*!c)e^F8(LpU1(R&qNG#=|MPNfdP-BCHWl!AjpC15|5#n6+)7*>bU
z9+~<oT|&XccSvdkVY2Ps>n3+x!FM9STIr?TmHjBfq|&3kmV%w20J-L00(MVhY$%=1
zRK2)SoS*!piQf7;Hf|wGVrxJttiZxqUvbJ~nV{+^wi^V^P40V2?Ja<tqIEX3Mse9@
z6{4PjgVr6^(?w_u7O+_QANRu8X$H*~?u7at64-5NK9L|ShN{wDaJDr-7|qXRnbaZ=
zl(ZX^kVDRNf%G<(ykgg0g`_x$#g<>Ebho|X*|95cM?zzbx9pcLXssO4%B-F@5(1U1
zzD`qGzzvj*_)}8)I%Bhl0`>`<_ENQl%6O^o$__~n&M`%NkrFSpRBH6DF&i}HX=m9J
zZdP|)tZ|ICGy5%%ByNs*WO8~u_g$m2jqIrfI6MVu)DM-?5?n`+sEK#=726isCW8el
ze1&1A(*WVZp)Zhd@~kwOqz@kQo|_cjXtbfgUn^5dNgEnB7J>3sGe?#}+ioCzRqRqc
zfD4HqRFXqSW%+G0N9%9dMrtY8Y`|Pqd`B5haZ!^m9B3k1w>$K-1TlM@e^!1HFdOH;
zWa81sgpHL@L{Hss)Jot1<nWx~o^jbZqTGxj$SNplZHK~z*Sa9^ZlQB>vUX}61&?Jt
zffou0!3PRpa)436yqvDvY=EB6DG2V074}Bpm7sQ9?4@P5U-nC3NR(p<Hs8WufqSGM
zbVfsq1(Ysn99d2{`BA%tjPx@gCc49wBXBOGlgEDx3ORr&>@0_i$N5C!%NP!C)nG84
zPCe-=ExVNJdx8fAV4%T!e5htBYvaO#pxAv>{g#OkH#S7G^r0F0zEN@5j#UiKa)I~V
zn_&@b-uDU#TkgLfMTGWq9exzo@S<aFWhur1SPW86%7UuoV5wSEH9+mc6a@AMp2*06
z*bpyq?1`pv3?0fW%qO~0e+e3HI8FnMpvOcN0G8wKf+6?L5!ECH8z4Qz@{C20RWIqa
zkqCNFc4U-5x}3WNSn<L~3zV(kE<YR~5IW|YeN|(ya;+<knZm1avB>V80?CGH{{W`w
z)A~?UE*-E*MiYe1Y?^d&808_1azI>7mpR^2F!HerM}-vU+hp?W=E^yXZEq;W3fdxb
zhyyoB$D3rXdvSz}Zrj|eBuS)C8^Hle94tW?2w07=`ze7RRFXl8Ly2ML$}_WoMb}D2
zuWQ*v<6+%ogJau_61v`OnAeUkWgy5{v{*BXTP8;<ti#_4CTH<eGjcA9LC6~zXo~F^
zTm`ZdAV0$T;XR{p&A!V>=ZVDj76B`7k10e%@HtNOoY8xM@`pvDAZ`1bq$9Bj!o$8-
z5;?jBqKNo5I9+Rtr8mFAX}{Sk8i=GG(}hc352$XgrE`Edz7-{FkEn1JA=r~37%I+z
z!ovJ2+gw`8&V*T@Sv<)omMtKGY!vTzH&G6A**t^DDn;Yal0CqDA>Szjg){g$vK{TY
zMH7;-47WK6!Q|mLZ)~SAr<BC#cI)EFOLq(KS6ewto<FivP|c>;PHTwZ1g8gu#EV$8
z-C)@#=3lnOtsxKjjnig4-7D;JhiM+Y@q@}_jdX(?_B`A)w(4jY4;Dj<UcjQMN#fw9
zYd}nbaCem!?hzFR@*G)0>?EV1Jq@|#A$b@V9#cv1xC?}6R!qqqZ`J*jfyDD~su{OZ
zv*j&N-I5)oWMn3mfyNhK2@S2}CKiUs3Be@z%7_7b5p?$k_9K+T$I2)S>m}P|8=Oa!
z(=WE!OerJTVc9XjTlA8e>3$8<M4;m2eN!YOkghDiC-+d)ZQFZ`sR`WNq38WLDA1Ni
zO_@jt@Ff?s$_9`)Np`n&iZD#(n>n^wi|i_y(rzBmZ_0I3u0_I1S%){j!s^Kzz~rgP
zGp7u;MhLb!?zr04Oa|k{lHA{(%2al#Xl>3wNw|ci$GT?h-~6JGvUWTZe5DySxGA`|
zAF@$!gF!>bYXtFz=GRSah$+ow`2PSY8AQ;g-amAX7vl?yN=$%O9*zaW8?F<Xu;0}L
z--{*_j`vLj+Sa|1OjiU<=;3g~!1{#?>Hh$x#}?%^+zg-HGjSKOO%_H`Iq|ulsiY4o
zEL)8EQa$f*0Jz)7Wfk+3<oXmI5|jNY2OI*F23Xy>`lTH`3JDgnPpPs{8QH`Sl<k8S
zdt7`hYa%$lbMT;X{w7I8Ih%4t{)l&ve-=)N&6c!n{s<s$J{LW#C*IdL;DrnT24?>N
zP**+jH}uHi^~$tPES-|a3mtu~AHGyI(FU-aAF)r4c|rFwH~gqI8HMk#x9P&tM#jMb
z$+%CxI8m|S+>vzc*8<8?JF&6Hut-`8;zkp91hr#Y6g2iLi91d2Vv_f7JS04PrlDO8
zzjed{kb`T4(|?rd6LcwPzlF^L{{Y&_q?>0SROXxVvofLA?vR_VwbCBzA@4^UaFE;1
zQlH&4kClaNTacXF-#7ZG%T2qbxeGJ|$q2y6O(8bt&A?rAk_rhL&al3FCXs7pJ8>a2
zk;w?83pg7eDSnBkAMm>9(UTkiISEK9gX+6+92KYzM;ilV-rT1-*E}YY-sZ^AoP-An
zeOEV&fV%?DKH$4^U3-ESXxxVh?}E^pUm3}6eygn8^K{*!{QXu)+>WzJ!>#p9k+!)G
zYnM5PkfS-|rbwKcIKKwqrn$_w%2xtM)j;9^Ir}F_lVUuAP7~<B-Em|)&TKPfJs|J`
z+5=^yB(rQ-51c2mNQn0_%_w$<+XX2y3xkve_88F<kLv+WA_cf}PtdByJcoORQ4z>C
zl1U3t)-6<S0NKXhDza<elwDMth9n3lWZV^y*Ri?!f6C!<6Nn($cNZR04k5S%u4y;n
za5!CY&9ah#V@Vg_CY+PmNrH1=5&_@#Sk^>A2H_zj5o@W7MX*x{MFGf+xx=#J?2IQ7
z;HHs|a*Y61xF7yguWKf4{nrwB2+%oD?a5qjncF<2<39^goQ35k;oz<u@ycDz{-vnO
zR7BZ#a&P4k3+-Y8rl+a4FLZ2GO|`)Q`CKxG(H2=gpoaUOV5_R?!F7ipRRvv9JRlC|
zI^>%KiU1A|^$mvy%HtJ?Jf7+nPT1RK0!rgh^6cPvL;V;w5CF)>)jDZd!TPSNojaR*
z5)^IR^Ky?y4E6UC8V*#Eo7=hsytIIcf=<@qW~^B-);`S`Q^g^1&N79MJcZAa&e}h+
zXk!zy(UUYZ4oViUBiuk95Ui2oj0BPwI_`76w@%{dWQf|vm))T9tSPC>t%6l_Qm{VF
z%C)4bV8(8svGS13(Ld#marO#oCI-qs@SO*#GqTVEeC;td?c^@ShA~!6J1-!siWtBy
zxhl&^VXmkFthl<t!z<>g40E{b3iXe}+IBIKxy-&7e}UtvOOxp4@+ZMkHhnjsA3!<7
zV6w8Q(<!6CXu0p*Ney?jLm9C6Os%Pcotxy8Io>Y4-;por9)A|um)EGFgc&x2WkpFy
zDr$YKz*hRzdn%o^ro!q@pKNhT9M;_VE0ZUY7b-0rZ6j6Fl<tC+w{4Qv)78|xwn=tE
zI|E>y{;35eH>oMv^<HP!Ux;pY`g%Dm1~6BV=J`-^sO_D;J{Gpk4^njolcGfCL|Y`_
z9P$^C^;cEbYBIQq2w}ypf}VPfMq?zeak;)q3a&QnEp3VNxPB)u+FhMI)O3L2d!&-?
zH!9MRtp_A3`dAzuaI9m2`v*5%`7q915tO+w$U~)giae9RTh5OBIjYrmR8#;Ma!10;
z^o=8BuWtUueJ%K9LS%uB+l+k|cZ1<Y{?j?~H*}2U58-tnrVL~)2G+f@sdXR1sA(tO
zWA$!$A$<|)(b7gYy}SHhDz{K=G@#2Xn#PQauSw&@FF;Xi+4HS`K?+afM$L>FAS!vO
zpGzq8{h)VV<*yj48t7?byGJfK3(UI0IvqKVGRngzW{yhX&*I}>w?jpGWv4)OOxknA
zanin~Pvsk|F1=!cZl~%9LuzV2BTnIC6c{9Yo>z>17&aGGws~C9b8rg!L#3G;saWRm
z<#b|-a80`cPU!$?{Sl?Lw=}JDk1lY#kJOcKP13q-Ky9Rnr|7TZ+8O||k!O}(i^mLo
zm9Xhh#M?&JG<*amtD{9#5p0dz3cW+s%-Gm_n{bs$wmXDUJS(cd4m9J`uvI!Cw{^$^
zmFj&jqf$}P#~cwgpbo(gT~6wX&t6*q4g$KPs->i-4wiVB0Pf%wpXn2xF-}$;`Bv?+
z7HFf4@Gh%$4y&MN@Zgj^-w8Czr&c@Fb;vv<gk>duipp_XFDV!;xP>02Rw0PxBd6IN
zxWdSFcCgrEa~kWor^kuPLS)OrB~MXmhH1+h>;kD>DR*=W>I{-@CiluJk-NEGuf<WM
zc`}=mu^b8RY@vJHFfOg5rUYDskEdfs8+FX^(D5l+=>}YE6!6yK&HdA=soe5+3j_qs
z5S^?UP@CY&Err%h!x`P2ELTz0MHwI~y6GMxCC1AS)U_;b=WYWWsd+v`qmI#Bc<x0e
zttpk{k_hMFR<YvSaNMBlH7(B}q@TKqmZ#KzE9WwE$nHmP$4I-Qq-=x|Zm#KJWK0Cu
z0I6x}<B6ZD<RJAedut1K{Q%){WKw!Yj7yzgREh?cwfPG)HP$wL(nuQ6do1>=s=8u8
zeg2A;XGr|qgmHLRxfbG*H&y*$#zpDVl5uOCEY)VYB*eMT=jBm6kO^^j(FHVw;1U;R
z9}64@ibdhncf0ixx%D8o2I`WT#^}IHg@Ii!9T<D&E|Z%ARi2pFdVrN%6IwFvd@D^d
z&UnrhF|m<-4jQ7Aoz_IdAMp6>qLqXb*emo=Dj<38>>w)0Ab=558<XJ$QueW?#^=H!
zl@+|@10lB`bX{2_n~oKH#@AR3hF<qKLd-9~2$up!2zfh;-C%%BGJGO5w{56t`BBUh
zX`QlL-v~9Wi6v@}VCbsAA!`}WpDS|dAcm9kHFCBn#%|-v@t&X7jT~dsZREBI7Xcqx
zU0bO8s%Cq@;9m=o<57R8v4TdMT<Y3qJjJHNym9J1Q`6Q~RZV#$IqW!94Hj@0vNn#Y
zI0z%$Q*jz!NYqk9^3C&0?F0FWtkvd-$+99`JDVsSSv1jZB!;LXb>GkKj~6B+Vm=yo
zxZDB)inWqOlHzi$Af6bR{Z8*>6>BD{1>0;ct?{Z4^gBeUbEj(>a96JMr95t=50TAo
zJMz44iYL=Z9&Qcpw>k$=!%YzNoc9sk#|Yq-JZ;%2$LQB}1aXKRv-H~}uQt?Ym9jfw
zuqU$6>RSAoo4qz0MmrAbqOP5?TW(hum%?(e#qsQ^pk$AnIoBrr%G%IDQ7l2N8%4V+
zO*Wo3&d^9X9oMDw?F?>(j&*?fRq?SY$9)MYwq&K!p2vdbIOn>tqor#Z?igCFZIsYP
zNU#>=dCs@5Kl3kwoLP;<{HkVf#I%M_?2oHVMY|eXe*t1<Yn?90#fOz?T~#$p$t2}F
zO`>#;1hkNQt{7aMvYe4!Pek_{xEG(5VFekA?|1+X<zN0<3QBV%&I}e<-G5VkOwNiD
zTM+*0{{SDPJbuFKHA-lYrq>6%;HvYe?>P#e0m;sk2Jv#6<Kh;}VO-E|MS_+sNrl0n
z;by0m=ZmI7`FB{|BZC#uxTl?uA5?WbEjDxQZdOu)sK&v&vMt)QhueD(3N9|mm-X{P
z8?lyIJxE?s@03`pbH{>*oNhOFbYQ953U2mUbgXR^3?$nt(P<prmKH0{G?`lq!;S0;
z*y$B-m7>kC`Ae50mV|EEXFMD3R&QK^k+hdtY9)5aL!5H4Jw-dEl(o*YZ^BnlMLikH
z%7(H-w5G#RE1O{Q0v@OVA>zxaWes*pYP1$y(ZgaK?4PQ+q$Io!0;kjF--UfaAG8p;
zazac+{g*UhtzacbTTvLe8M2Hu#BxAFS2?h=B$RMs;O&hmUVy5}c_Ae<VV2HSeO95h
z_5>m*YD0$ZO7yXz;GG7}+cN%D4xwRiu4<$vJ6PFJY8%PU7eaPdqLQ@OkZg?U>01<_
zxc5L;4}Fx{NVA2IoKsXzP_xps&0L6p;|SK)iH)2`((4~YTy1A^uBc*u4sN{X;-@P@
zaiZwS8%4#5P)ReaZtD+(B}@Gll3iedZF5|14g%i-NDdFM$I5s4M^RN4GZqSs^*hc7
z)lCH9jJu9kG@{UwMa0^qk&Esl<wX{=>O1(4B~eyYdW4IVD`XAL){Yl0!xcvEi&10T
z03(&F(xnncEJ?!htrl0lc8%6;*QDrgwJUy$)$#H1L&a=ebbtxE%4!GLd|7C<*>RPT
z)aJWQio0c6qK2km%C9+E4I@-+agHzKtX8El{LROeX`~q>u<W=zj7nXJC9`bZQdvJi
z7Whw&c^=?g^ZTmGNSqiig*=i7TXKK8^Jj@JfY;G`Pb*s6mk+w7>RPsbS^nYmRnuy3
zxea&sRQkK+o+lSM#Sb3?=9>}5k2~t=nE9P<ZdNXLT3fA$QpQ1c<&CO7{xH6-3ZRk|
z8@_<lWT%<7b*xvo^!~jg>BDy(EWU2(ilH2>UZ<dHj%ylNY(5v8<l&2VL%{S6YER8T
z?@`zz%JDzM8fas5n+48ty$YvPd*V4Z@Vw`(B=s2~w{)I7c*{i`ba}j(c^@iD8DAX0
zw2_q+NBgJi%94$@kPg>go9K%@d+_5{osMGzj&0q0uS{xE5W@K}^<O!3Tm2%#-FkkT
ztv)EgF5=6=@*?9qi9RR2>HR|-Fj&YiJghI`CsT@uWMdzUtcx}0NG-gNx~bNx{bn1I
zRdHp>Hj^ui$Lb`RoJr)8tU7hy^$i!cRegB(oT;=~!zUNUSA4&TX*x%%>F)mkq#5k6
zABi<JLMJvNK<-w<Nv)6apj;b;m+QjWp(nS(h8&BPB0SFxu5|KLxXR}{DtbtU%aDuI
zsrJ;kfnZJ%dTlP|5JlIZ<w(kkI{56;siYQhTJ2twY-HNYEjvGmN6HD<OC14)(u)PZ
z)2ZzU9}6AQ@i*0N{I5c$V?{XgWoYyvo7Wl|*9&E49f?oXYPIfN;biI^XB#DKD3)1m
z5eC@`j=lSz&vb01?%)+)Qqy~oQU=HhbVDID4+=<{ZaG*5zMSyT0==e?I@av7bb-wy
z7Ao^k-C_O|=8@Bbvc&$JsI&G`{{Strp?R^r{{XU*I@_^spRjjPGWWnm01HLM(InVj
znk?i-qnL_<gpI?^)Vh#9kJSb$D(H{>MmSpiAYGu0m5$Sx_f=!c^nR4m-y>RF4Uv~Z
ze2P7eG*VOzp{FWpK9&+nA0WcnQP9H#LC>(aWG<<xMNYyZ7dG&?GUwr?*&LbN^nvN9
zsVHLr00`l6pVW1kYbuD{U8q#yr*D<2(lmnD!=!G0RIy-`pE-#PkcVJUK<8MLNQY?1
zR&zkeS$ryr%8zjXu9k|!G_pMs#?}J5dWOcr0su(vR8kT_xl(xVvg-_+*dC=<Bc6K&
zNn0l9&GUt2T*7!%_3a^!<u*KOFGXB9nEiaWc>}TKQ5yqwcdiV$-wKTIy(ldl^OnZA
zWgVsu;s6j=N9jZf0%jqv(mqw>99*hBFM)1V<v1sVk|_?upvby;HUr9v5pH~Nq;>Ka
zG`l+Dg#_NoZFJcG09A@}$hJ~Y?Tt3Qmji^2?7IM4i!9JCg*GFPqK(|Ak}PagZ$3Mq
zf-HRbQiE${M9x%}`XXdJINOAdb&`wi@|bY$Q9?0E#|c}DBqcegDOgbZ*>K6iQ)}~O
z!pMw;?3m+%o=z+i9l{7QI18v`z0}tLC}eQnJfa}@`BIaQg#<(&=2IJTg#;RBd%wz-
zpC;-TfxP8Q0RWHkixn`yal#s-`-DydZQVmT7w#^nTQ3(#6}P{1Qwgv`gJmORwiN*>
z6OwF)mB)H`lLbKeJ?9rjgiMw<lHr9ZHy5^0@f9`h7HAEQZweZ-W`!$FkoAA2$WfC4
zkmks$R{+s;E3I%x*&9!{Z)D9-8z*T5VLIhCgk3z5j#51im^DZxrojugP1rXGs;8E=
z<CGDUl8kIg2hxHWVy6u~(A2Iao&q2fYZLn<kRm&bBqWaM2?Hs+yyYg!5Y`*E#aBJ7
zy@5v7JORy>Y_$ysDwxqZv>Qoa2MC+@Rn*gh+$X+bEp=xbBginju{<Q*&B_VW0)JBB
zCPj)@19C_y<F)>Z8A-SoNG2cwd;BIoOSo8f;bj(QD<s<BFm9aC;M0B+8!_%Iq-?Bn
zPE(U@jcD?0q~n64C8HrR(hv}8$B8rCe1q_s(|&kE`lMlVWo`0GDkijv_65PVI5|uc
zH~NBqsM0JvEYlt{K=Qo$yb^4f=ZpKAMbp?fOi#k;8bT3>)1HDMBhj}CV&9R3Go%cN
z6NJyrahoP^A)xlSwDX1Du;$1YRGW9QkMkneu>~u}G;+{;<OGs2@S0vOGOOP+&PNI(
zQy{sqO&m<B&WlaJ{SuiOU;|Z1tT)Ih&aMCqeUiK_vHt+bjR#2P?I!Auxx~ML_EXDS
z>^2;#`6^iBXIvD^6GYx*&SbY%`g_fSrem3WI4df77{(89PUB#XM7u48&TVx5*0Dh{
zrGdBJmDN%9dXs}Lvc`fOE-Vgt%8tZ4BI+krH-JH1`PLi~3fvfuabX_Pcv5X)ZV-mD
zJ6hIV`MAeCaGQ%K$pq{K*`)mwcG%weQAJl9U%KMfQW~h7E=mq2`6%uZl0NDu)J1F*
zFso(HD{*G#m|TY!@Pc%JOM6``l|Z+WLJUd_mbxi3N>&~!8GcCmqbVhCY^snQd~w+s
zPA$l}^W`%V!exElNH|O<w<(Tr-(tGr_608zs%Jkx34-b5gxj<m-EJfNh<hABQZ?2Y
z1L%h`H_1urupE$=gJXP%AiR<dlS{iOOziRn(@f3IQBVWQiAl<9oJTfLI$_8dQ95uq
z!etU~A_zD0gx5R+kSv3BL$8M$rn;g0-8zXklENJJ-up^#s?OY@A2t3GWTxUJ>@-N;
z#>xq$BoxL2+>(*_7btX5B*~~;441X-;T!5SoBEC)R2H2h8sZP`jB}dfaxPXSJq17-
z?E4&4b$C2?T~1g#k@iDYOwjuSgc`B&&WD4LZj|`FvWI0ucH}3vRyz5zn}O7`5)*zr
zB=LNxpCymB#X$Mo)A4jvK=Ox2&JKI0w*X`tD#KXegThbGU$$0w+X~K+YkMBa*8<u8
z>ZkLBgJ&k1$6K4F_?boI#JDmMi>8-@j32tH6^}XLbE@CT${!00^3iF(2hYMy-MA{H
z)lN9bQJSd-7e95D7Ax}6ZsT*|FuV3uCaPQE$qiJtvUuVo{G`iL_T@!(gMxnQyYnx%
z`Ca*k@pQ`_3I0N5ka!$BD~p~pV190^J!uamD3#z~*>8+1$VHfOw;ZH0foxq?{$ck?
z`G*t1LE<<02s!iO#{os_0)JJ|j-0!-teYFbmm<lO5+?H(kkm#%8?A)9i@!{bb<Y<<
zLdc%njHPuu23q$u5>j>+&G-E%dgr@>I80!fhuJ0myrC-}IV3oX{HN?oq0E(_kZz`H
znnx<HbeG6ZWU^l)30y3!b2M6C7)*0)tHknlzwVsciEr+)_)Ea5&V#Mst~b6&LVji3
zmf;|)9ns()l?C^<LQYR8LsY_fNM`<%lvD(HK7(y@Yb7J#6bPB%{-U^5y{EDIqrg>^
zI^FvwpD0Gwl1<otEV$J)`2}taf0+em#u5^5aufnv+RjZgJ8u_TfUh$26T7l@>-Z=W
zKafK2%v*xD0DPgB7s^`#5GJL-sRe6n1Eas*%Wz>?Q8@?W_grn^K<bD|9^%rM)(3~R
z-VmTXsF;Rh+_<oVixfMZagcthKT^Wmzq)Q9SwhQ5?3zg3WGR{8V3irDaW}v2w*Y*b
z4H<Gn$+{2M@)rt=a<>zFfmg>iU3^~XUtAEFWFsT)j}UVWzm(EQ0>q&GcXNO2yYoaG
z-s>oV%rkic*G+YgHVALcU$-9#O-oP5)iny_NaJ9Kc^%W8D06vHla-!@?U2gh*-cF)
zoH7({u{jpXRsz#-8bU@t6kI_j0l3PPKjPsBN?KcxK~sk2;lvcS3J76n!LoU43w-=2
zLtZUw6s6C#wqX3Cg?a_4jhn6t6yeC4r;sugYo_<u6zD01=l2P0;xS|=tz&!PJWr3*
zwu5XSgV?0D4bS&c3B|2^d?`fDA!9i)1&Q#u{Zbdl+xsT&84W8^HzC<0%0q&fTtbYz
z+XmNLKx~xQ;~^m<?w~Uf$+}NeUy<`<L3U0^%1e#H#X=<q0m-g?vvhO{VHX@O4{wwq
zl<{+p>84IT5C+3H4BxU{&F~OLTiBEPuJzB8`y*%@E9v2o=EY3tq+q>?`>hQ%94(J@
zgaE5Gn#y?ESrBRLNL(D%(930J;!TOlmN?pb+$!@aFWifQTm)xy2_V))2*3(CS+HF5
z**UX|7PJqlibrlYIV+t;Rw_(uS-saI=!o=*76!@|KHS(@Ov;9V*(>FG3siGyU3`&s
zG;jtRpYE91!8py-j&<-|aH$t2P3?+YN!l<z6G3Rod~Mz=(Ql%7rVZ`_?1FRxA6IR`
z3MV<zlh4su$3i8~ZpzM&N@%lfVtx`h%1=Xbqc+%H1%O6T#_;yz3u8^w!SQZ=hsC*4
z{{W)4D9eOmz<5@M8rv6@l{7XC_XP&8T^nN~cpm{vtqI_QM@9r~1Dh<2Zgi7gSse4^
zlxJ<w=_Rt~LpP}P4>#d@mrU2l*qYW2pmMywNHH<PBK_9$LaPC-0eT)Lw9YRgE?paz
zYH~t13zvUoRj5`})js~I4Nw`(qQ$|X6+=zxk+fWSE2kvmL?a0@8Yo=p006j?$ye->
z9X^=LF%2Wi8fQVL!@cBg0eSaU^&{$D=vg5EcwQcS`{N$ZLmn+`pRM}BYLe=B9z#X)
z3iFw&B$7?f+<v847JA2fzq%5pFw>g_%N%WNtA3DG6t8#yD>x`#`#Ivx@~gC|BViV8
z$nvxi?va7dAP)h0IAE&IX{UN3j+O=sk#pG>6n?XSYd{=eAu1$mEYMY^k0WAk>jLB5
z%IU|ZN>-6;qR~2)?UQH)dT&g19=oxW^rf+~))-!IO<Mz89W0<NuS#n4zN1_m90zqc
z@N(})r&fA~iTU{%>eW;iy!RnVsZ=-*;yAzl)55KbU!#VQJ<^UmtiG$&an;p&P&g5L
z8x>jQihNMY3^!BMtEF?PsqGjz+y@^;jn}$*P#rZvbdEXP<HFkM^)!r#O7{mlzEww6
z>lD&J=7+Yxa-)?(zhI=<g41<5v?;``h)cBaO_!qd@8dqHW<mK_;f!F0i<RUZL#$D?
z<*krC{yZvJb^icK*NwTqW#h}qc;!)g4;Fo!(w%<YN+zF6XOib-Y-u&P<z>W;UlC~i
zV_yxnys&eEwDg~g)ijLs%&xfpXD?3=myT;_RHm8r%$l<=VIaSNqkT&YcR1yIxkdQZ
z3@y9d`J_GURFi%+>Qz9;MN4Dl$*1MvheK`leGRQvLdabCC2JZ7B(EInUa8$s>U}mx
z%In*B;bj@EYu!U5O>I-l4t6xyE7~d=I3qjU9{YAz!6ln=bcoL)U&KG5-%%w<nzm;g
z-`rQOX?n#haJ7tZz+MqusERzX+eeGpKS=8WBoUcGH|$rWrH)I2A;x#e_f1P(XocGy
z*?I1_TRmM%iO54ktqQ1s-OtLNGa1Pt7y!jUI={H%V3Z}1Y=WLQ-zw&WZL$zPCK3Cm
zes(r;>se9x36uW-9ir|x0uzgv1~RCftHR3y_WtTOYfzpZKXi{QSnC@stDXQhuv9hE
z?Y`bhk5Ja3+D7nx>oKZp(8fvL+<dNFt`D|SIOHFwPy9D-b=RA9y<?+cXwB8_PPEyH
z_u*qYva%VCnr;Ura^+E!PK;1#*^-{3M?75Ed?U2lkOi^zRW*_|qZYCb9Y{p~0B%b2
zb3r{LvaH!nQD}cvg3fA{WzHZw2uU?b9@}Ne0{2StTuI7=JZjrCVvu|u?B8;k?6WR=
zDCr#5uv<6on_E!br_GgQlIYd28tIzTYvoryK<8j5)NXsOe5S<-Cxp;nW7QMVG~X!Z
z5CzZKMFd2g1uMW{veKr^(Z)wO*l@0NKzD*drDcg2$XEIx_kvSFP*J6&jF{9lOvXU^
zqG{wFnD_{J-Eo6-?d+l|>KTJ#tK^R0-<zu{i|)ZfKe;32Yc&-0k&NM1Ou!sT%DSz<
zDz0&J%3)dokYgMu9@}2X*S7xvL_Dm=luiDM%78*0fS04EjGUoEcDpD5ztI@nZu_kR
zTsB#qmS;(kpn^@6^mPC>%p9o6><CJS77LQ0qkEq)7B*c!xz{-=Z8!knPm~jE47{eN
zbg{Plb_vxm8;!gKMI}^1Ew}(7Yb%)d7Ba;5vR$A?Ern_Dvh5b!<M6KO=zwM3&{Zyz
zQxq-_c^K?fl}@<FL|GVU7Uf-J{X~>qmDSA#cV5i{`zpGbHj)@m)k{5Cd&s`xqbz9~
zis7c6vC<0Ct0atulB}oH+Z=g#S;=H{V(jP2t)8Y`*Dkp$N-As)7HTPVg36%qFPs~#
z-iOq$Eoqip2KK)T#^R}U`6|kmwr1h3C0Y~Uw1D7xj<?i?sO%2Mi>&iQUgAjSIa&HS
zC3)QYlzeqXqy^7DQ<llNzeTMzD0}m4_*SfBbkXh&$Os)KZ&KZdbe%z|$4^dUVH>QB
zV?#z1$}Xg@nxcP9zuMl)f^saTnrBE$o!`m=rS2tl!lH}E=wz~6f(jk=4QaLRp{jH3
zi;Jq+OT)$QaGI>rMuv@|dlETTaZ$!vvwCe)*|d09Os*|&DpOC<&eW_Xc$pA3HbL$M
z*x^A_Q7pa69yiDj2Ffimh`D2cYGb8s!F#)^$?9Cz*c20_ndjO{RR+M(sHUojJO<@#
zdVZu3KjnF@oFv{ba<zJV&yG9px0N@It&^i)saLcxjl%X>I`{gnCi&+mTK!4K0Nj)x
z<|Kc6T_eXQv65spk%7l`T;TS;;Hzga5DT1vsSWG~6|u&<9R%sMO^Lv~-DoKFW*aw;
z3mVXOV51->02KTbnV&}Cx~yTg87jL{td@4V)*s~oK*O{-#T76izSiMVI23lt{{Uq>
z;d7+PB&%IEEsX}{4;W#7e4}HPtnGU%MV5oIX`k(~rLS<@Z<KXiQ$RKc=&7pZ-ExU$
zR@Xb+P4bsdlWX}=R03R23AEzJy3b;?YP7n7;?|F%*=Z1y4&$6G7K-540=JrdTNy|<
zIC)d56boKq5s-VT2T0iYKV@OA>TG$ldmhU(S5RK-lVGCLU}eoL-l?##9#xBA1*2fx
z;<K7;;5*#w1*g&~;VuIEkCi10bcssQ7y3n9gLxKj!V<QUYG})gO}<y8=@3)8kjpu1
z8U`*_FRt}%J;2gZNZA~JQ5*%^C}YPT>=8|{Zl8E`t+MoOGEKC=cnizAZcrZ5O5ajd
ze*gh-h0hGXwH1okokLY-n-H>9^9MAAY19=q7A0nCCfw6<smQBEMSI7uoU45jq&IDd
zxmnFdOUsL^9R^U@8c4OgttH895=oo7XH6t~i?FM;ikCF(Y0nB+>upXN4V6^SY?EEi
zy5q=_dO+xwfsd8<b~1~vjj_`cY>||-4}vkd#9Nd;w_g#3!HRHyu{UR%^<(!);n-bb
zYesGY+4TwD=N~0xD_V2)Uqg*t5Rb7msl;-NlgjiR15z769v7Ik#j;#2E`v0rv;tQ?
zY<z<kv(a5z1ZL*`7B{LYcWxKTxrws69G=TRuR!um)Ujhpm3<iLb0PYv=s*$=s_CNJ
zAqbiZcNqa)a#|vdpH521;|C>aqO2qf3oNFS8<@e21#1k18y_pnoD-1zO+6Iuz0Y)9
z<hnC#s+~3W19nxp%yt66ri3Yt2<*@5Acr90kg`xgI99r(U>ln%N4N<y%IfV<^Hz<%
zhf}&BFMKJrnt#kdNgqX>(W?Ya0{;NIv#Zog;j?(|xjrWuXy@W$wW<InxE<8`T{9VG
zkP#Y#%&+5uq|;b;f<@O;w-Bg+>$FAD5*ut`dG@IRj$@47dhV*w`eFlnFEi>WTq+!P
z_f3hkJflcXo|Lvmt=$yQd>d|fSbYW~>H}*njVUdH*0vXHR)~8mHRE7zR$NABsM<4?
zq1H>Ea6kMCw?l^2?Jok??xy=5^k_PFqiQt>!E0_g;ZLpp8`VWl=ZMY6fW4pazMhZr
zaRM90aJ?z|E}v5coeNw@@SBagLUgS7Qn#n->7;XA6YM#{>M8?!5WcwT{{X}KN#cBh
z27zx2!@7s31qQ6>V_`Yu1Tx}qRwQQR%rhvq=GXfp>0z<?S2F2xfpXFZ(JV9$AIfgI
zWq!`wPJm2jZ)>O}XW3mojlsEXkTnpI{HYT<yFd&Uc2P|SZ-o$H+%So24&D)LLVZ2H
z;bc{8WzDv1qtjb=1)!y%5`bI<zEZg**p1Qv>1`X;s176Nh3Wcya8T1X;4I}M>GbGt
zX6~{ceO^kJY-u}5QIy=Cj#%S!doQ&uUv=3Z?trA*G@GVy`;}EQ+#@c&RR*J}Rz&@*
zd1xLI#}d2tbWaLVq<Zd<DB^2uSWm*ZbxduK1X*~Nk+0W>fxqgt)Vh^av3s4_G}M=8
zEPPvgG@6}oB!KX#-2Lyp&?aZO{^N8+PPp=sS>KNuf(dQ0-^yeDS4J=Lp5b+i#h@v`
zBaA9dTs5(~Zg8*V9IA~<AXrH%kXsgVJo8)JT<d>zNJFo})$1|B3yYi;6rP36j#pG<
za!FZV?ywdp{Vk`}3ATickd4#BOrQ%Uu_>Bu9i)N%mHjg$up}UQeim(OiNe)G3>yHr
z{nE*y<7HjTQU~OKttF&mkF==83xD%<7e&<C0c?W&6t8$V{{Vz(q-Jd3qID>^Hy24r
zeryoD<sp*UC;K8rI0TD?rj#B_e{^&XZoveN=IgycP54tflmpHZHkcd^{H4&&Y=}tT
zIP#v^1^FdPD1jEZ@}9~@3liYAn7o-Essnrdlzy-|Cf^97PantCK{YrT1!U2kvNJP5
z7E0OLIdDV1o<|>PP5h*mIa-meg}$M_Kur~KgZiw6eH^D3DkDKsUCBrF4<?HPR?B0`
z=G3&C-?AQ>f!6`g7e@^@*@ugvQ8Sx;k-Bgj&nS6j_hC-`IsX9H{gZ#v<#EH1)q>dA
z<pSAKK5z#=vSHI_Xh_-#oy(DQYax<vb_$Xih$GymZj&RfZf=<UHf9TgN7)<n3ny((
zGT@=8s%g#t0A&+s=K|%yBeeP6E(raQq!l)XI;aE6c&h&Zxeom*t9C!ao(&qTpVgD)
zI;3e%LYkZA_fh)WjyXrOL7u|z&%jf&Kz`rXlx+*ifkPk%oTomegOZ4sMU{fr9|a2i
zCQIAY0HEvGc{X?E*bg{E)z&cg3R9xE5KGVOoHR}6CB-eHHo!kH(r}83rLADfnfe=;
zF49oaX|j)KB{v{!d97#|Hc-1#0~?YJ7HJM%Mbe&@mB#+N{+B^foSGw>P;16qm?{~_
zJ=DMYT2ON<ifp<Zk$>(w=+Xx!!l^1+*5u(#YZ@{Nq^W{vPTx|>Aq_*%wnO$x;*7Z$
z{{Wf?f}iU*xeAgh8mC(FI{lRAO06T?BkYG5hU8DEPTPK=^;I&+(s>BCXw}BS&T$@W
zmAVAS^%vzjNddOVsby<g05?;a8b>^$>3VYJ?vd8|t6F}Sr+63Ke(A3I6RynRb1%q9
z9?(JE{{Y}xxjI^fqk=xA4gUbA=$QOC-{hd>_G3Tl*>|che2W#Ok3pt?02Md>nS%cS
zq<xCpGNU;h(2<n#`1WDJXkF6q8(F2lbsU{C-{mg-(Mf{J0``Xfv2OQK$uxMoz*-U0
zF^1X2$~ih>n`t&bZs;ow{{Uuj)iD16TU0NojQ;>IR}*yAHtT{-`x3f7orD{02k&&;
zfm<lQGRyLw+Q#4qXXR*)flM%1n=Xk=(RQ?c)<MiXQBOfHsWZM&u5XL}%6eTiMK0!$
zRgFH+Q)A-<eGud|6gAFlboVC;yYrA=8@`rXxiq?2;>#L7$Qe3r6YgkgYhqGnNY=&$
zhVR*N)M6a5_8s=EES)~!Y`_oMJ}o9#!6qiU;@N5(pV5?JWgV+h{{Tyxeu<9MsmZvx
z`z=(OOho?x5|O9Q5Otb87-zN(hu|Udv>%N#IBQr=0a3oGrQ1tgf1<LJPHRaKgZBxH
zqi}m}8cqBo^0549ubM{znBDsz<dvb`_CNMo;TR1Uj1lrUQOi$GaOSiV<RSAjd`QWP
znp^EJEk7X@6-_qJY=PfGjh{w|&Lx&2{gh)$iH-NPTg{U^fZ#xDshS8f5EnAGo!_QF
zjE6_2lOCPa{{ZMPj0Sy?Sxn#nC24Np@9dcBkOl8`a~7TGvceKT_+04W0?wv!Km9mC
z<TnrOr8Uuu0#m;`7dCh7tmUSrf9POo@Irk(2L2;y3p{~PD;rl4{%c)G*_>K-l0vqU
zgs@oBj1Q{jQD8Vjw2_fypCHN!`zd9e!}T!zR7R{E3xc$fY1_?%0s4ez`Z#=hT}c`6
zZIs-_aWU<xEf(~PzCwK@;LVm1^$Sw{5HMU*y`$hHr_-N&MUM9ia$w`4q)Nf=+D*I#
zG!;y-{u_b$R<ctNcK%hQd?2KzwZM$D{T911S0!|QsRr$`W3@O#xi?ES5qsTc-3aYD
z#lrCs^JTfv$poE35(n`JKSd0hlu_9FpoDE6nMU@5AkWHi>FRk+n;`py7Et_lRvkt&
zo&Nw!6ppWE>^PKVUrxTAyR63#g<JVXwfjs!rc=I!X`x-I#yNM{H~mSRi<LVlX$^#o
zEIw1ll?(1+dn}J80vNRcC+Gx)J7j#HrI#vbC}gK+=>#h(I;tydsizHa@HtB66$>ck
z6M#>m^Y%hZQ7cZ<6o3!=R^AtBQeZj5{{YfYl7=U+xsHwPKN(81F}@?u-&p<|xP3zA
zRn=eE)|;(_njA8MODv%sH5ePCd2fWucDohEjQkZfWbKw4e1$LZAHa9jUB{zU#t3VJ
zf|e>t;TL=jaQY!BF_SaU3YN-tyB{GG$?6(?&1qMWQq#QI?AYVrC}q+E<lNU1M}$;`
zXbK9lc?5kB)$?81Ckn~%$pg0fV#6FEr)(0tY>XddIZ={DQ|g07i>#ebS04rH!TN0z
zo9+Y-)=)n|f=7P`eY~dmEHu#HUMu23`>rxD=JyFC>B#^tW6#k*-3quLYo15JLy&Ch
zsiFW}8zCQ44`<uO)r<5h-%sAsexm6Hh;3;p3HfjS5mIPZO_j~9V{k}57ac+Yi;MUu
z*L37W?rd^1;DrnNVnBB`&L3N*<iVh3YB3XLxF@=);kOoWJ_?ZNP+_n3JLDy9f<|MW
z<Hhc?Y}yApiErwRkB}2irou46_C|lFRK&s^5g>R@jyhXxk{dtes9O$-)2JS7n(aXL
zZ|to<(^&kqg5L@!=}|QMqHrEsieP1L`k1*JNIxMXwL-!!(2f59PlU;4I1~Q>aI%&?
zGjZBuW4?%iOZou+08`FK?4%X<7id;zLy$B$z-)iIL!pC!91qG~L2Am!YHn!vG~37v
zo2Y^?N7Bm9Jt|0DXF?v|rIc^eqTWG?@%>wHw<AykwF7PxU+M>TSm3Q2qX!$e(|5qa
zNi=zyFX=o1@o=(`8V9D-t$_E0Sk+5NxDE;k=!iIP>=!<pX}g+ivzE<7?A90$x;HfZ
zWkWWj6WmK(g!t*8fAfLxlA}muthg;B;bk*%vLRN&m-DcJXEcz3evvFBmWdDDO-&O)
z^qySP{{V1B<YC~boYzwKlF2_e2^f1%-AHu!3CkKnWSS*3!r`U92q=7v90oeAfLpRp
z&cJzdPr{B)pOKk{VtxvU=ySUcV0X~n9)Cu02{kb|dq@Z2MEZi$a6w%Tl45q(hqwD8
znWn~D@3V*ZTbm65okRm-&Q~{4fyU<qc~-G#w9jqYOAqc7AJb91V#I#Sa|4Z)&D0?|
z!9QCkn%KDj6*GEoVJBt6ob>E&X6=N0j3e@WgMnV^$jz=3n_U&~@7)*vfwh)o+3?_p
zIvk?+hj9M@u%q%B!i4<uFl-1;{M=;b!@?4MA7TFh-C^)kMw&;vcsBW2NrA*O)NO|a
zFw{4Vr9~AxnCsm9sRcZ4!Ep!VtftLKLsY_h-@ysZm=TKu;Uje7=UuP<>%Sp890+ax
zR^-gm9A|q?#s2_x8|n!+;QXnZ6F>pcynKR)Wj!>l0zgNbg`Ai)R+_@zMbqM|YlZe3
zD^a0AD7<bi^OVQvVkY5^A1iY*hy$u4@_zV8Dj9rbPx%ttf-VA2%D_#W&#kbBFtkM4
zn5=Hp<52-Px>G{|{Und6OqWcLXX+olky0B%i6M3au)FwVV?QWUrOZ$8<Z%1lHT0D%
z#^d%|nW+T4w0BJsHw`Kw45hx{Zkp<8c?bI~%nm3cb3gnEE(y3LKxyhNaO<X#GdTz9
z0zB*qBpMrWd!#YDb}e-i879!}+~rLGlYNcQyA9AxJDNXP3SU-6oED#|=0IEl2lrA6
zN0JF+i1-Luxg<05QVv>v*+^^L4neXc)0Vp7-1f3Io+zeZY>_d;x)y4(hN`WOZSvJs
zB<ysA-q~9!ofe9A+(zaf?5S${WET@0fOxvx!$l{lo3+X}PWGE!S-+=hqc^c|9s(L|
zJ@Njw5L0pm0*c2GZWD!LulkgYp=oz-*+}XEYXA`B3fT*5B-}-gR|>PX<dm<Xa2UQ5
zzb@-ov->T`ZkZ3}-Ewynj;nW-F{EKRjD(J&Xcz<qxtgpE)$a!)$pvullxfq!K2&eg
z?g`tUg}I925Ba<PlVY9gy7+QywDQx*UHMrUFbX$d9r=e_B&0Pbn<d!hix!fUHKf|s
zKSiyYgcT&<@DhGw;HQ{cZEoq`mijHoH$=16Pa`(D<Tv40)IFE8N&Bc|o$kO(3@?!7
zb8(_?v4E4pd~b74bW>=~&}@*?kZeL^%sMAulBUI!9+__mz>+ev*xicv6OdG3o)Iv@
zWp%6-ttO25b7F%^J7PCQAd$leh-3rx60a&WBF27#4~0`b8=`U$$r*Gil4lCg(`Gab
zWl0rdLA%|;7xL~siga{uF8Eb)Nf@}Jtq&t@nmm<#Nv%-QFf@PEP2%3s^;vjm2^P*#
z^tv>T7->>j{ULN}q3S4H0iEo>^fv$~wO+KMf(J4t8Kt%wFwy@2m7ji&@o)hl3oeo`
zmJ)xm=}vN8g;8CsYjyghgv@p`fX48vgpO$Lw2^48BH@T??Ip}<_K{@D4F{4dwEFFm
zT#zm0YBc?OV;ac4&g`+qjzcg3x60Ra)|6gY-Jeuq<yv5u6lwHI+2?q4xw+wN;jIwU
zZX_^Uy3bM2#ivK=$VV3f>Wg0L7s&qrLIY;-p_3%PiUNYW3+lakS+_+K&At{6dZO8j
zr6%|8w3=-r>m&q%Z_1lq>B!`zFJNeqgZEd5hSWKNS>t?6qxDv`mT0h5^H)Ac8{sml
zneoc#+|z=iZ8O~N3Plo@k}P!k!5hIR>a1t#HboI*E>FU#iiPe0bee03y@Ib9CD@jm
z3x`^KuLZ=P@D;r-r!jA|n|WFKZ9T!+2Flhr9@bc3E?kk514y1~`APjm{neh0t!i-q
zBHY%51r-aQATDSl!CRdJL=`cD*uXylY&c~gN=YJ`r>HfVS+VlHjQ(N{N_L&pCY7bz
zi^w^;zt^;=DCu3iwXW<I8PGaOi$(2z%bO~kXHj5`tk6|;-E-OLzzc2NP->k)s#Uay
z%<$951rZjM=MD~j7fqx%k8mTxM+wWeGic74q%N@}-4RW2bAYXxp}o!oG@@IgmW;Hi
z<ig^#3tfUmA@ugJWcNziN6L66=ap$qrn_(Hx0G~Lj%|kAeHSk*iP9GJqOy}qVB`y{
zx;8^g7$(Go&q>S%;R!1xk=6v+N?7w`eUp-Jvhode%(EkQ#`ghOx2XhCSZ*a|X{cm*
z7P`5l(nFhh1;@(vJRch(*D4XU5}#kzwJOkA04#5llB=|;sp#ePCws1Pweo4OHJeJK
z)uE=1j^HnPJ}hFbFs!$xi#mS1ij)ShKOODLv8DV(GFUUzKV{{0(?{zN+j6e@ZXa3g
z<13mt<vCX(?WG$%40U~E&AUXF`XKANqf%}|9$KzCe@JAFU=0@`Tk1V7!xrs;U*UGY
z3OsJkU!P~2)b*u&ZXwKg3cjbW>lg?Cg{sy%P&kqrN7-R|lc$X^acfQ2Ec|Xh%fl*{
zq8iV{D(8Y4;y!MxVCp*R>8|-6K`Sq)#$l9#57Aw8WFn$wi(=|{e1DQ@4>_nr)JrCz
zB@e3+amH3=s;;s}kn&BJvuOG(ZqeR047a#hkNqs!DqKr%?(xc}pN1G8WN`Tj+2?Uk
z)m6UMIaYMND>IrLSns;^Ei0v?V?&H~SB%oBso?iCTz0bg%>H7J@h+t)Jsuxbpv@4=
z4m>Jas#zd+epj<=?WT+!!GM2t=KA!JNl~?yx594^$(~tLD;CV?e9aq15;3lE_Yz99
zWjh?}SvmBfj>uk{id!1c18GUgA7s-AYwg&p8D7>i+AW1$G@G4+-z7=Ep_D>nvs-4A
z$sl=l;tqII&}`$9tr<_fx3Znkr6dr%I^|wzOd}(*Y*d4J;aXBQIKU0H)fCeTdkToS
zh0YdlDPp~^!j7TNBFcqsz^WWK8zG1!Tz~?WVndI6q-!4k0FSE1=&Y^=#Nkv<Mfe~q
z>exsGkf>)CdSojY8f|=CMCRR0Q*1sH01kFxR?Yx&w5m8ZRTU1q)-Yb4;!TeV`jFZ&
zVcBQ&@$R=PO+?lPi;$8@FbG)ZoT(Vs3=Apv#4~a9O%ldV2uq`Oa1uBGUTxtyf!nMT
zy+)Ic6NHRzMT$u@Yx)$IjNL;l@?ZmmubXi;z)_R&f0dMyF!)^I?mVJdEx%K+f3gnd
z-PBS_K(Z348iQ&o1HG}gJ<6|<mvzr6&6K*<30~(O27IMdhGS!j?h5ltqu*>Ba)Z%n
zgpz>&04sl`X}~}|IP>Pps}qvZCdy|+95H}7vIWgPrZ6tFdbJkD7i<^osOlKzFq>IV
z;c@H=NPD#g(bMf|8<iDZT(whfb?w+)GNJF0_HikL_(Li(oiMgJ%_L-@r3!N)cLhaI
z)3Cb9qbA0Vz~yKm4EO`jWR+7ExZMcq*Eao^Qo7LE4u%ju+@oQPTbrsOUf^&=(bRP^
zy#0PwY1Y8fWvPq-*$XLXz~m`x;>(gkud0^M+uU-a#@V={X0*t2bX`3#896{xN^A%U
zXVkvdO~hRmur;hVM9owi9k*w~si74WE)0y7q@(G2nWGMHale$y3ztH+kwv`8CzWld
z>C@B;vNt>E7Mnrnd1R?!k(UJUy_=-J58z}BbddsW#g$>=N?nkaUD7^!tkJ8O&BiAS
z3@RC6c#wwzELYZDL(!DXrEw7k<HGWa?u~2fo>>{S)be<(e-YM7?DAH`Sk1&FiNG5#
zNYwg7v{{jrlGZdSD4a`zi^V7_4>ZM~si%%T(l}gpP}XWDXKjpaZO}19=QuXRsohL%
zYpof|LE><#V|-mq$(-;F$sQCm)DCm6Vs25dru12I6>5s(R0BJXZ-gYy#!(d}#@&z=
z4*-9JQFaGaC5{ShGsf!^d!cINCC*(+;mJHEqHNGn&*_kSD+g+F7`B2{6f(DfQ33mf
zu9ct@%TioPIVvIyhrU#0qV`17HM@W$50xg3Eg>U}i`h#RM9>mrxGKV$2EO5<<fEbK
z`ia@NMo{A~M7c$FQdDa?jPZI;tB^<iEj9=i9nZPst9?^Lo|&c2X&+@!=$ylwsLe{o
zO&8iMjBDGKwW6GQIPkphOn7X76P2ohy{x7HJAjTnb+%F|5%m>7-D~owq?g!kQ+1l(
zQe*DN!UNXa(yXExb`MtTzse?pPff!pDK|aX?udp7HiKfbl?JT372eIE>LW9p>+U!B
zK|=()vezSGrI3s5Ds3h;P_CWLz;XT56%Tva`mT%=Qj>sxWU|pn8hwY42uF-qc&3bY
zu);~d7FlZO$S(4>`qd=BIBX$fH9gFc!N7&<VVqoO<D6P$OPgo#w7oJLy`!?tyDnF~
zHw?2()-aKDxjF*u^avdTApyi*+$t@0&uQA*t;b9BbxmX}bC_&L?ya?N!`T^5=Xzvg
z!sCuaq;yk~JOZtSvhkH`pwl`@0oqT|T6HFZ`bytSwBGq%llWKAtkeW@OxxeJmsH)y
zL^^b3sC25CA_0*Tap50L(^`y<{{ZrL4-4sS2k`caC|ErKf#GN=dM1W451`-KdGb?C
zx{aSV=-nS);5SC#w3PiJRvDPh{)^}uew(F?SVYnGME?MyQ-S&$`zDH$>@<<{Hlxus
zvfpe@A7xJO!<|9zCu_fD^?A_gk1T3W^jbmx0Jh)RQkWjkm?(b^s@rYB<oL3+9RW~d
z%N|$JBTA)j3~%hY+H@RPBx!?!K5KvB?9YB<b;`2S{{RkTYenKG?7jE>I+!2O-`Pys
zT6Pc85$48N(csnH0U&_hD}9%d{vmXO=$!ZM##h-ogm8$QHj6I@{Av{9o>PJFgfdAn
zoE2>F9SW2Q2spCSwwQWi=d#aG&KWz1<8~F4nt^P5-FmQ+qlQalT9gd2x~rsM6<{}z
zQ*}K^zU^s0DV;yQTE>zwbt%Ybt39Le{z}F~z`=24>-{}jGa_rJX!<WU=sQJA7<lZr
zQB}qx0^xB#CUJT@78td%*Qhm9H8F}X1;=ca=M~*Q`MQ@(`0h#W7RA+2U$SGWp&VqP
zKO-c&G;qN^7+Lydmi+)K`FeSb1Z*F&-qlpG*R_>RT#a?W0ddbH+d5$gqY0>J?PEx`
zR$oz|*y3!xKBgAP2q9+mtvc;-4GNg1*I=AiqXKD0?i1vvvoT_isEP5&T1Ar_@Zn+?
zT4|7Oh_tAk>I^IC>jf+vd#t-fqTi6)l8vj-=Bu+>(_`?2pqV*jQCl(fI)!CjK@A6J
zIahj261Fy%2VdoDbRLdmZ4Z^1=Z;l{c9~C1%LcaLMp98!gvFIMWh4jEH}RF2)&oP0
zyREHcYz=bAYfWHtkc9SjI%pF}b3~zSbmwk}Sz>hX-%wcmEtZjeg5DEkmVpWgn{!Wf
zH5K0L9I0IcqyX(DAE!|kkmA+LEXfIzEMkcuraNzC(nqzY94ltAtdE6XStD+8v@%$@
zayhcLTbrsqY&+9+jg|Dy?iD7pn2A?}j+T!)*SBvcaa2wY^Od02oBTudREOt<*A9+p
z_CaTZ`iiyDZ|V%H^YE;6gJ}Rx$;Y#EqTECk)Ka($ZnC7&<OU{-D|U7&Ea;3wBbEFI
z6yqb$^A!v>BHXEMkA)`7D5JL@IY>#d$z6`iyQQ{Ll@XF}`ikOR#mZ5X)86;`CbC>r
zk+{2p<gG3S!No4nMnX;s7H%T$lGu5&b4&jKtLT(i{nLOQyKuF!lu{5E<2btK88de$
zUcn(gLe^?TKg73`@8a6x!ALn4%3EBFSq8(wP{tVteE3T%qzt%E4I`T_n%hvbd}syI
z${oo4kubhppzh@k@$ScDL?Z3&@|wlqhRH1U{e9D8s+G6781AHzsu0kMV#*`kTQ}7@
zD(Nr!LLKezY^98S(>kGIgZ}_MQX7k1K{ahbZLSlV%ze{jiwP4Q!7xKtQ@aHdO;uBC
zWA^0^S!18<iKfdy@S4!S887DN2IZh1gx1$p2M)nWv|j1EJ`m(G#)+fUsxlpNM|C5$
zN$qie*$fzOds%gdbU6p&OnjBKF37*p4r-?kB-{^$F45xZ82}yv9LD&OG<Amo#Hq%h
z8Jv^!Ks2;FjHyTt7q%AU2aPb7YRo^V8+{aKQ-mMTNJG7YxWb9Sp|}dFnJGeo{{Yq^
z4*et#qMi+20_&I9Dl)+0ZGfhRou`ByASgCo%c#KS-LngyD!!_xbM7T-h|{wQCsVTd
zD5=Gn;b@dLmSOx^8*qE6TNa+daVr5rHU<KjG%N(!2G>Sd+AO1*otO@39hB_UsiQdq
z3V_7hgML)4jBU-VwNM`P%@Z}6AS`YBCdsT(9ya}g&unQIvgWa%-~`q$23t+5MSp3q
zPLE$?ZT)JU%xNT8C?<?;;2`KOCG4F>#{xHm44S_8UvMJonbD2e3P_-5j(%22dj%KN
z+O%P|GJx-@K0R@Pmi0kDRhKX~kJ%%lXzg^$y$Qvdw)F!6vz`c24xy*MUH4f56MSCZ
zDMW0&?2FNq4T0C`o&3NkXV<A5&AzKb%RVUf_d?Y|3w@<8V{oHMQK{3pq=}n!6nce;
zw8Nh(H0C*`#FZ>Dxc4aWH)f%_tFM=|{M{+kOU6h)b)EdXh`M*8c-%ljklY{9p>10T
z%bL{TR~rq>+CceP_@Ews>QBo!++6*N4MiJ^evKqr<Z+NL2u6;fr7W=`{w%Sgkb{!%
zqLLb8&Hn(pJdu_r%}4spJB`{0?xL5dDZ{oCl|%Vp2Pj&Ip3`t{f|6mDCXu3(TN{0a
zrv6eguBM^45VVDqe6j=je`HlQrBxUEZX@cNgldcDQ_T0@(EXGW(9BKDMWA;IymbwG
zPTj3?j!k;1OpsgjDDX@dBI%T}ZL^wxWajCNk=HIEQb(-S+WYa_3%}MY2^T-IJP<e8
zql-pp9g3Xk6z*-D(fcg1*6T>aiet6iM}Xsw=<x>4H~KUzKG0Mqjj%iy6K|EB{{UUo
zZ+}(R?vdKQpzGcE@Rh_nH3mp51^%}RYGzQpSnMRMW3?Kx+Z!lFb!2AZ_d|%(=-O3j
z^v}p>Km95=Achu_)*Jm6W(|6>F?Tcn04VByq>vAMclw2zqfw`#eK8<Crv7ZK11MbF
zSRatGQS0%!o4pVUll^oS?btr3Q#C(EjnL9G-J?EJ4D|7vIGil#)z1a4{nL)FZ-(FM
z5ui9o&<#S7$7`NGicemMi~6yH^0Oc6>?ZD}X}4=AWz;F9=9Gc;M~ep*YFr|D1+Qa=
z!A+K)85%>QA7zjg6xX{1jQf=<H7S_yZ11q(U2ZJY*?9dLoyT-?S>GW*bh(=${VyG?
ztJ~Bvuv$hJ52BTwO&9Y<P;s!XNSx4J$9zp6WcF#6%Nhatpx>_3zbAP6CXH?oJ+hE~
zQgCQ{VN%dYZXREb%D!zbCcHR{=eScdTazF;t_O>z$*M8N@<;m=c)A7I8??xr-ZAi@
z8hmVaZOxHlzM1U@)GhcSG*v)N$qu(UvRY#(g3SZs0I|f6s*S9ULGEqOd@FzTEhq;1
z@sJUewLLQ_07w{rWKywRqbT|)P0J05>=RhZno;bOk$)?4XnJ06{{Wj{cfmu=py+SD
z%J2UGuIadX2gv@6)g^nF>ptq%3dkh@daVck<s_XuLIE*VG2`XPH|Uh?cIQqkI|n3K
z>4nbMLG6+@`-6e{6)aUS180`!&Q)llq-eM1ZTC{eM@CJZQq%WO#rr1FX3xnyZvGwq
zsXYo{;$tk&^pqIV^tT+<SojaJnmrp%HrrhB^m;sO7BXhW21q|uS6ipi%HUi8K3Y|~
z^f(=TnxF1eZt3>g#<{K@Zif~gMHG}?n}?w{*r}kJcwcEDYl5>H00dsR5#YHI4vQOG
zx7KTi{{T|WP*Wj>dRMmZj5WvQ5&3FaSW5+o@xqQx1{d*EN72_w{{W}uX#N(aTlFbY
z`wK%PqH}V`5IlmUjkOVg>ow!#T}a(JswRehd5`hgJ-Tf}$NvD8I3FO~CgXhzZ4ov`
z5osvd^>1X+1tZPeHhn@Nx*ciEb+Mm^V5U^)y1-|&wcjmpD{*Mnm^`#}j%}LeJL&;L
zKTD;z`(PjYO_Xn<*I|=%l;PkNJag2G3F)4}<Yi}c6wn;B5U?Gyk?=*(?bD<62JMgf
zD=FY@L&<E#xANN%oBoe5v*W4Senrq3k;O$!4T-V(BVp62ABSzZLVjAggxs;;BNtM!
zl^d{L!}8mNQ)J$W<>{I!MaTo>1Pt9XPZmIR{MlGH^Q|7qfj_cjm0G-9G&<jKm>qz}
zrA-O;PV0Exf9$4hBjWvSY=h;hcWSjkww9JD4}MxuQ|m#lv*@Rcd1tsG*vd^4#%cI`
zA*btbr2Mrbhq0|baH;Aws#m(tmv8?7QwS@fsdVlC0H&yb{BE_;;%;TQ(<vU%ZMVYa
z>Cwhc({bSe6LpQZ6wQ&oTJd!F<gFj7o}wdu>^51%Dr}t4Qn>ruwZq6vsMD#-E$PPb
z@S~PpLzYI@{BVbTePm+OP>rX!x)j(Ps2Zn5qB-=XjmN>|0PP%tL^XRz?B#AX2A*2>
zd;*yIx_4#m9Omt^+*!FMQ<y91NgwXF>u^#ZMdtI<+1^&7nwo~PI|l|IAg0u4a=E|3
zk&+HA%2AUujHZFvY@<8^QIJu!xg<Dz6t#L~Ojq4X<8JL$@>EF&wfmX%3APJ<i}<wq
zNt<HlG@q1{bo-8Al)K<6NOcL=E*wbsD7sy4Mz{d?H2j1qqbFfAXtgo7++BbBf&yJS
zsi*Wtet1^U>r%K_kng%j>XEwQM%(0sRhyG4;f{6y*HgP4!9+3gfo8BDf{l*87dzWy
zegcqJKn<M@{>wIv$(8a)Q1B0<x9*x*D;u<zkD*sFR#J90_)7U;mx9A|L2S=mz?-}i
z@{~Q{_h|%=3hG)Ip3*=+*o9p^8(2-a_%=#ECJyGz`<9L02v<bS#7#ibe1T<T(jsX9
zpSqA$4oh2agi{sSLnQ?>o_*3pegcMFB5WFZ#=Q0pZI+Zt44L%6?U0!EMg|&<&}hrL
zp1L3RDZ_`BIVg0N!`~acIbJ$;#_gq{!@5^Gf=hagb5E0-Ey!LhrvCt{Cvj|V1CMS}
z30x1p0yFkkf}WA!n5J$%Y@O&E07G6oTE%WaNfi-K8RG}*WL!?&VA)*Xx-In7t{&)i
zpCK|j5qrk-W5v<XZirt?Gqb(24=M-Hl5-iq!nBS#BXGNJ0y-&JF!tX3po3;sY6)9=
zZnv9Z4<!`*^YFJ}l+rgLw(z)7Q@C6-Wn{&2Fh(hxjgB8g-IHGqzrkC{G}uq_kJ$%N
zq(<%<3O7c(GSRX^Ea>m@6r!3pix$17=&rxhj8DGeJ_u5X%RgAS?}e=gt(0R<E*{bk
zgXJr9w-c6}_*w|zr*=zhiDfGV%Unl=m^p0BjV8j_H}VlM=;YfCKSiQ6=Wik3RF>LF
z^uPm~Af#%trY$tEW+$JUVI5DW$6@Walx$T@VHPBO6iX`McPt644mGmAT_!ToYoCIl
z8c<_}g}ys0xaN#-@9vfIwa4_V_5|q9&qq@meT4%lsfhmo5<k6`q28Oj*!@to6y?J0
zb6k<eibh6v^Ogi#KPiv&sv1FPCf*VCG}~ND;3RwmG;vc0euqb%$Wj}Xl~T~e9(|ek
zQHnPCSB|BOjm(>I@IrKSp}24#RQ(FsNBI~2paHs31A(z-KAbHibnyTN+kB}TNg25Z
z_wKN)&BaK^9E&NAn;e4z*Z5iiNgp5!roNKg4&9c$fTB7iPH(nLAEIaa1l+OU{9Rr(
zg}742^4t-G)*YE?^lF9@On3Sy4xI6m5zoTf7shRz{G|dS+Yr;9Ey@}LY{NfJ2M%HV
zloIKU{+liA&{I5I#y%{Ao|Y~C*4PAW9E?kJ*8_VWx|8w;%a+6PQ9FPEN&cSSC|!i}
zmg!Co{UoF5bkYV}kMO58(Qdgv-8K4?0I<c<@`){yNed%wyP-`s^MF9IWR;=B_X&=#
z79bR?WfnSk7{;6P^+36xKLZK!)EAC!qV;dtWF3~eGa6(C$M;*!9ynbX7`>OA&`Mb0
zcVTI?y;YF6FUQqGJ_nI@LU3|5b#TU7cGzE)M^&Y;ytuac;UU-H0{A~tqJF;#7T!K=
zpAH;&)`J{vA_;Wf-kpNz^x=OBIkni_PSg7Z0oHCUbNi>C7B?9(?vj=W&T>Mvr;0mn
zHUo>SjC#;%%ed^8PNKVP90Pu<onhUH@fy09#bX;RenMq68yxGq>ax*mE&W@riT?mz
zek^PUV7p<JK@IW!8u0`TY5gF1RQi+*kegb{j$WaX*(dCTe!MsP+;8+u^Em}$qS~KK
zX7J{Pq|*dcaES|Au)|*?i{ph9`sDMAdX@=ZNhMJa3+&PL9<=G)<~8<j3q2EolH}Z|
zV{G*V5DS8^i%Y6=F2*>Yq7cD3Z6Hc<MaGY*HU@_7va_2~iO{$?!2R;G5$M{fKG>c6
zDNc*4fpZLmcL8?6W`e3YpTyr_+LTaDQs=hWDhObWxl_89b~uN|;Cqs*>fbyMwrsiN
zr46)nMaEi1oKZ9Y0wItw!sLLnqfwQ;?vwpqVRWA>9YEAaO%=hoQpp?)wn14&>eUB?
zj?^c=C+v~rZ${$1n;I#gWS4Ob0P?joolgxNFl8$S`+lNVlMO;{P1D(3Q2qh3KO;(o
za7O1;)nu-ezG+Fh?o<@-g@=~k>arrDsEb&SszX;&&O%E_)V&^q4OC&E3lrrM$tmx;
zSsS~>*POFbsshb6vSam1zHW?Wy#tCpJM++6Yb}rLn#ziI9mVYhd3n|=I}&^(eyyon
z8?EvRr}Fe_NcC3K(*y01zd25IT{D082gQo=XtjFBJKXY*hfth>xx}9rQJVgR(daW)
zK;m{d6p+gW?p_uX^R-s?msvqBqgV;|e#l2&hEYuQI(o`hH}$s)X*Fn?!UT=|*Ok)N
zY7)N8+;7+`dR;qPs<zl=1IY`o5}W=goR&EDX*Dfvwjr(rES{^VzCu8C?yo62D_p4~
zbZ!^;D)&wNEw7Y=D_!)m>R5BnL|$AlJiUyW@7@6`Pty}j%7!$wixugVzlG0<pqQLb
z(MMU)RWt+Cij~`k!m9A{V_cB0%7nDdKSq9*z2sZvYbz@0y*<0yPt|!V8`QD;BY?G|
z0|iVe`l?ZJ8T*5D@_E{&5md2XX6m)nj%mD%<GEga*6*Q?2bm^gY&@f4(E6UI+UGf!
z_$X?>!#zT@m(;px3FhTZ;?F-+Q|84VXNK#pj;5%H8f|r_{65pB5;fkDAe)jx^g3_C
zV-&!?BVcm39XZg^(Z<#YK)1r}@q9;(+>SinQktlsT^=pESqH*O8hAsuIA1&~ey5`U
z07#)O7-=1so78nAk;$?%w0XZP&-~6gW&R_0@%uMb6%_RB#lC@Lx|3TCYqr0R*Hv<B
zE|r%rCgaMW)oMLm+l|GS#{U3=K6f+HgG)%J>J4J1rbjh~z$yk888^Mem0?!jc{Ub7
zZ7zQn{{WTjc-Z(VNUdluP9^mqTMF>$=1?ru4u?(rU~IRVJphmb;n{V~>WMbfJpR8*
zk)WNoR5Q~#vu&|n$*bwHm|bS}<$3<4LK#(Uqm{|dnP}YtXw(JH7Yjrwc13#tEtK6F
z21Wy&!kbZ=<gvUiT(gsvAuZWQRVAj{(SV4cxg&CGsfm*19ZO2)o7?KTak?uQwi44|
zFo&FOzEtwvjmi#37aSX_sTSizCNSrJ$|@-A+jmjN7{3Kh;^xLv0*bv{wXFGBda^xC
zEA3sx+&1clb{mqN2*|$UE1V6klneoG6Mz}82-pCsm`KR7si+zM0F`-C&C!xBZOW*t
z8+Z#@nbeLgBG^{ZO8)>%5^|{^b(|~_@yh2|C2_D&W94(7gLHKSPL;y<w`2t@PJ8kS
z*YwQ+ne73*pyH?#mlQgON_>D4ESXh61e*sde;$-$fHX4Z-W6P$9P?FR5I%}a9OW*E
zMrLZ4M=r~U)f4`P20&Y?EdkAn?ru|^r4c2Z+^)sq{hOJEIxBV)w2KZ^4xvgSdxG>H
zp?rFEF(hSq?OjoxqTpG#T)s-;swMF&dlyfk^$o~V)YCP9+mNJ!sj<hkqv}!@nQxmf
zJ0Hm@@1wECJVLs9CjMo&AY?C6qN&s9=v!+^AshwdP}DXDVcA+;FIS?aq%&1aFKi3t
zdst;rrf_7A%e`i`j%(^C05O8#a00{XI_KtHvMX&%t?Ct8(J@mrwj2KFNV;~nZss-L
zV6^eddq_t(#8Bv3E?f)Ggf&x~?l7$3&?=%E<!gWe1*pLzZqVF$TvNj1*wK;!r+5y@
zzsh|?z_5iFrF#X=N{U9foTCVoUD;n(mlCRK2?bhKf-jt^x3SJPBMYSkvL>6mC%U`R
z!Epn!u7;G}<SV@{3vdYeODCWp`3P)Q=L)Pt>dkV0Wnom{8*AUPj*K)ATtEn8gR?Qe
zmn~sEkmL2(t17u!u(mOOl}Rh4GYi}cs!%B2^gSzPnW3!)=aucc28~WB7-qG|;4c&W
zKAU9Buq5^i-8yJbQe$I{o8T_&T3R`BS*z)-8W&90HZU4E7G8%%1W-UQ1{Ft5(KaZV
zallr!?<|PhgwlS6iYhvSM$LFxWknW?0~lWB0(`3o_e)qyk9BbBaOiFDf?6|n&ob9&
z<J{mF7oK%ykY!=BEC<5(9ZyVS$vZ{XJ73e`*x+nUl;w>zv7+6dJZhBhqMG{&QByd|
zZ0i8GJz=IsSmG=!79J+D7r40hUVQ2fj=XW?Ur<97Yz4<CeNoJQ8UV5lmEeu6y}XqL
zRbyJy?zvKOl$q1TM6RvDAaJTG-)<4L6Z(Lb=l&2gMCSu=sD-kkt;Y6DrVexYQq{!v
zpM>o;GWXa6WmVA`FxV~{2ZT!;T07YnNkZvGnA@Her5{ezN=LA%%1Id%@nqc@1X4Z2
z+E%Mi==azcG@r7*qUkFU>~Z=9E_C`Ijg|c$qzApOlE(e4y=O(~_+3mrgCoMH>HeRR
zCot?S0c|2Lf&j(?ds@MDV$B-a3E_8UC#!S{e@L`6XMnudT<PaU87yJP!uNM+?x=Be
zttdLqnH7g<hRymU$kW{#IM15J6-;v*u;Yv=DkQ3GR%~a-3+R^g1Qxl4w?7Iw{{Ro6
zehfg5qKdcZveEMd%&d}YnBDs#>FFxVZRtAy07dkKe}@#H-_dXEi-Yj?nWz1x+vu*b
z+7pvLc+&J5$=(Tp!v6pZVW#wyh9Kw0Z}eW<LD7`Zk^C`_g=-g2Q?LQBE_vXSEewes
zBTdpTbAS;$=L*`JqbxHY_FlgZj|)%e3U=wRkL3w}#*z!lndMa7A8}z9_C=0}4i@zD
z@E55^M-zXPDSarKEnt!OtSc%!Q(F8zW1w*{cJRDc@eiYo347Sg1@<<h9B+-o94{jL
zNYU9*6o51w8!LGDr3rQnl8lk^HAOj&Qq#y=kHY#EPpCu)2i$_{jTQ9uZuZ;UwO@pE
zPa1?o1A@Eq$MraqrhPZidNn&}qj#n_S6xG<(~39lX#FJ*(oZqa#@p}|y+>9507)Rf
zW#>F}c1Biw$@s9yDYZcDp`&(B-Fi3Rp07a4Sj>~g+Y1qO=AVpk%QZusIOS7*7*$IZ
zY+$&Ih1ZF-1D_}Iw0*m!>a>zX-$;jJkgNrBeixZ^ePfL*cks00uN<jLWn&Xf`O)P^
zC2$wY%}J<OeypKpuX*9hQpne#)GX7xQWxYX<kW|ilyzH)xq6C9)BS(l6*keFDAYSq
z9#k@FX2fn;qgXBakkeM=i<FL19YW1Cnx@`dhkmbr=2>|vi6`BKAFp$lAmv?+@t0b*
zu0#&Aua7Ihe;0KrDhuNT+mgL!QI)0>?p`<ek{WlB&Qsx%l!eI}N19SJ2{w~sb#Tg9
zogK+kl#sq!oDv1rvXY&#({6BHoMgH@_MMrXMxHp`?H$$cMQOgY?K^oYt5iSr7Pc<7
zJqGqh=96owWF8&t^qm%zK?81b6_eh3IRi;6OdtngIrBIAmokaf$eHgWx{S_7Hz;2t
zPjw6AXC$oQeVH(q&D^;SG^e%HE|q{G<*SXq%oJw?iYYQjPFu)A)ymmLh!<7bhNT>2
z*}*}jRQ_(LH;_~vlx-z!eA+9k9CkC5kn~MU-W)*##h0h_u9pyrj(Y+6tux@HhA;Np
zg_QW7eoXDX9&yv%D(G6!=J2%9X>_#A-0&_w6q?Sl1sh#r*4cT-Q}y#Bd!mGwzvF~{
zM)ZjAoclI<wx<O&Zfgi10b+GMMb#1z)5%%3YgL+yiFqNXvb3RykPEU?<BPx8>c@wQ
zv1bIr>*SS?*5P*d0o<*{Kx<>L1B|TgWNnsxq<38@Br}spsp;J^Y32X}_Fkc&=nia6
zyK{smM``ddHSTU#pi#>Vae&YU7Z!ZU=^V4mBvwJ9v7i?;W3rNJSfXv(+^d4%@!0`b
z!(zEyc@gB_Wesb{xC)M?(ifZF%I>tWuOZ5+sz~f|jNs!7M|KS$2fXl2m3F6=6=Nft
z*;H!JA%|*@i<WbhGpR_$bpu)pzN<9+m3yzseMezX+0Qr&-o~jB%PV>ilxCdcyj#i>
z(s%(Er-CK{Gh#(sHyRs{rY?BlUdM*^vZ2ty^xKcBzldVWQrXcR6SCJCQnvXWlyQOw
z8B$$I=(=JP#uA^>mkD<GDMHxJ6Hn})Zz-hO$odtD@s%6Ex$G{U^TJ@<Pth$J#b!@E
z)XW*mV@K|uFOU%mIo1I&-yEk{-5~>ojBxo+7)%6x(zu=i7BU~WWj0F|SaO;-9Hnr@
z&<h4F$|5`gj40h~_fH&IHHgN_^O0hpZSQ+oOCh+jjFWtDiKtU$%sk;EZ-pZxBrGja
zG(_-6WcU7?sMtuyWUq1CfD+ii?-?f8Q$hu>hjWQ>v9cnci=t@uP8vL>o8KHKT{Y(T
z1t`f0xZd6p*p!0S%6KEXV==a{L%zkzceoqf4JbRW!d2MUp<`e!u_%U%3?U;Yb@@az
zl0W4ZVb1`LP;&SM6m4#8@}iNABH=VyDG@~(C$b_K#ev1pguD}FByVvbUcqTuq7`wv
z*Emd(mpD0G(P7R~ka9votYM1w&k8z*V*sKXgxQ*1z*_bOSG}hSMvrOlgsx++!f+nk
zV1-olLQ2S;`*>Y!@}66NDO$|l$l4VQEhD-faBY064Wo-+vL2`~w%ims8KSw*w_|kp
zq!&$lNIa#7oVO{&=%0GxNE{NAz3fwl>u|BGKx~v`cTNZ4FSqD}V<a)g<BTZgwX9U-
zzjQrYY{Otsv7A9mSm$&7)X*?<bR~`cQB;7G&!8o+kU6s8E~knT_S`2nox_l)bX_7S
z+B{iI#v2P0aFDdN?M-#Xkg>RuWPa<iIZ=n(7qyatPbpZ*5?`F5X0dUx7DNCK!WyBL
zam}uR?9%9k@sfBSWa#3s{UI;{(O~N-;&I!wy6NnVD<gbC!o@=Bak}6m4tw`exxp01
z;+Q)j4Y?xe#eiD@P1@J8Y0rdtF?b>oU^q``X$JzyZSXLazy1ZBn+k#&VqrXgWS)o@
z$|1hx#fH~IlMluZ>9iXVESXUqhCHGkIkJXhVRS5NR7Te@fDN(bI0%XTBkYAPZsJHO
z(b&8YcvL5*!d%9S0F|HukOvZ$&hTue+bF3bMmUagoDId)P2K_FIBxDN5ZG-FBwNCa
zmjiA}albZ9aU+6?Y#JQN7=KerdsxRd;N?YdcnQrra2DjjNPD6LXCU@a3V82uG4Q9|
zaq^T83v**|L}Cyu0zpk2gDn?R2D<#&J7Mlta$_jO4oVh-cDc>^6g5LCVZeRB@)euD
z5Va3*ZcYBEskAKc$FLDJmmZ@HyoD<O;6NY0Um4H16w_iZm91%h3VX6DG*0+~*c4Jz
zS-r?aF{DSECG{)=OF^<;O%+(vK!Pw1NeM#;$a}}!qCG|v`fNgZbSB_f{{Up%!0{kb
zB<IzV-~B~289PfS?ulq&X|N;vrj|4e8=vrxF@7|N3#IQP&)s+N2NFDe)a{Jeo>Q7E
zEas9H=EL#Efr*ri$m8`~9UwOnJ*VNwkKyt`8C>=>i|)EAMBX%rJ$isG`H5}f>047#
z{{ZKnK816cj9D{fjlzCH{AiF=)Q|n={ms+cS5{4hOOzyGC~isag^aPFgD#>n%9mfB
zZlirpqSKm({fb6{G84nyVlRKHUPky(&(7Cd{r4v`P}E!cY8(gu08vjZX<;rMyC_2%
zP7m&ik~hLibuC8U{!sS)97={wUs{OWnuMd`>BW{8LDYlYGH6L+pr&<JyBM*n+y{`H
zdaF^B+c9hY%9-aGvWzqmaEpo~Mf6&<uXg*EpMs}$w^+bKUR{4Gnvy&Wlv`PJzpa&y
zHo~2+RSX#HJ_?c^rKpHl7k%=B5su*@g{1H<eir>e@G{7CJIVKpcHuAnp>@5Ex6~@3
z3jzHi>Oja(>R|egR%#;rOgY;8oVv&CnC*7%1d9>ygEY{bw4dE^qie_OYRSa`;A|}F
z@w@%V<8c1~xuFYDJp=OCSsT2y4f%EqaFg=wIkJ984-*Q9Q1l4&svbT!D@s18s)pO8
z4<Gjntox~3d*3Oald-`CAJAWlX5yQwVyQNK5qy#nKkGCvZH+q*-pkM14UO^$?h2Kj
zt4<|9b-z%2ayJrJ>CbLyW6yvP6Vz!(CYTS9v&@=N%R|5VRHAkkSceB6C}{;^k!;GX
zDZi#N&y-9$l><+*eZNJNnlmXU)FDD?roGzmR;a&W;UsS2)#+OAbi0Sub!@s#TQ4+m
z6Wa?4)=b`RQ-fcAPwth$2aEbIokymZ64r*d{?nDiPt#B6sRRE2s45WGXD0pfm?N9{
zW_QsV{><S1jU03kwEG^{k0Hp0Lj!+a)9~Q3CMuvwY?=D5GU^S+`;OeB#8#SJ8wOD6
zQlEHe`eAgMH5<R!se3+-SnthO17hNw%Idb;-r@8sa2IB){VB|F24=i@a7PU?mC*)?
zT1~%|)>zN=D!YENZR8~X08*^DAfMd_1{7-~(nCK?uW!((C8Morvnm9G!@|qITd#=V
zy!>5DA5_#d0V`hLwbD2-lV$s1loRVy2V0WEYbgyiF<~LnHP-Gf6+?QJ(#BfQ!tVLC
zl$4suxDrKS@s+93tp&M-huYBp0Dx?xmF#<L_C1#J5e=`RmDg)SPs*2kZ*S{w?yyoT
zTS-kZAWANKT}s^w8Ac_y)TY)`vgEeI<SMzRs)gh>R{%K+B;P@_Tppj9jRrYf;eOc(
z@o94p)Wd)KU1duiuU{4e$sSRZ{YOwN980apM~e~fR$arT$!i&3Zx0t!jW$7#PB)MH
zO^T*(RLIlrWxmPds-1t*FXw``{(#a&vD5Y&xsPc3l_O~2b_?0`I4ZI(t}Vvr0sF3h
zRKp{E!G!tRjRT7=;?p2^>3IjXZm0hMNO^66Yl6%_sGxAWOPlm6Hgy$4U3jY8Ex;(G
z%|^AlQ=5WhA471P{+9clvVATrvr+YpY*yW8+qxz`w`;K^7Cu2)r}Pdl?6{XrsBT>g
zBp(Ll4EhM2cF4y^{{Yl1gdJZA$u0qNx~iGu+(W*lYG6r(f2A}30BQLjDb1s)ZLZe1
z1NT+(btMtb8}v~-sGH1kn|8X&#^TF&K=N$p+~1y3eo4;Z<LSbtcT$^;*0<Fs{-kL)
z{{Sfe0O%CaZtXfz`bOby+^Cxam~A6S9qrjwo~UTRyMF73P{$@qfm)2Lxnxj*`p7;A
zPisG=`;`gS;&J4C)Na;eXt=ofx)f?=iOnv<huuTyKKBpf%Ax-NU(MR`ZP=y%0MrDV
zI>*hH;=@JpYk?)e6${~~f9o4h(NaHN@J@SOK>cy#*yMds;vJW6(;;=sBm>2qqjsA1
zaQ;43K-OA#Bp-zFt;*gWZS_ZsGiAh7&KA4TQNrLdE~rkrZSDZ1ZoQn7bXsDX2SfqL
zA#f4#y5Chn{{X0M#m&?I0M{XVeZt=>aRajT&@uTgA7u=br}<7kRZ!L-{Y;SG#ndj=
zUJcs&p~TxQ#Wa^ZaHDh&ZY*!%SN{O5%eNMB`APn|K=&};$VQpA8sb1A<utgKoc`!1
zYY>s{Z};U!?Mf2cTa~!5>^wMu;Xl;>0JN%uUm3r+1>c=-{{WmTaWb>cjHmjS8A<Mg
zFFb#A_=&!IDbcwgt;W~FZs18zWNvePttaIpqb)Zr?1sU}LQXA}*EY}DDJ^SmRD17)
z)MUwGdyX!Mgh=nxa#M8bXHOvGm9fz@R+ft}xSxda#O2VEl`|^%C1~8>L9&3g`>}QD
zQuM^Hi+0R?5Hx)yEVW^!gaS~WHwCl>ki}BcO*6fr$kC)#hTJmW3)?ztphS#m^t1F@
zS^5MvoPi5YJXt|w$jq`kK4qGcSbtk=eu?z-Qb}tJFJ9^{i}VYPtnZO^QKfX~GY@6~
zMPry;tjE!4vb+mMPuW_trzP2P(RJy1eu)cX!vID%MD+)?fDfY7(LPM^eM3leH@Lu5
zr%svjZEH&REmuINYi%F}$F-GpCrd>6w+3SP!br+)RY6l{l*ge|7F@Lc$aysRVURV=
zAYZs&K+|-jZG;mL&&F0mta^GXc;6ss4sL9^;|kj;S~EQ>N+p$%wU;Ks%hYsD2APa&
z=4)^Ayqb!-qfL2qYy_=8PW4o;m>Su!f6@x~d`$33MI+452{zg6x))2*)mv<1Y42sD
zXGT#NwwPOwg_Y?}v7`)RL)r(`Z)iG-ibf67Fcb0@bn-&9aH#KRpY^9g(J~jx$UrOS
z&bFfzm9L9n8L(eY{vq{-lS4rN09K)!$iqfSUoLfqs_j!!l5oPt6YT|j_n+lso8cF;
z((xfBzeZ+eZ69PCPUj-(+;3~4THLQSJ4d7!O3mC0s}@o;GVVc8$|J)@QO0{WbB<47
zp(gB`8x1IXt!#N$+E$kwg}Av?RMMFx4FrX=(d+chItIF~UC*{7Zd|=j78vW4*~gjB
z(IlD-ViNM+JE}U$0LHkG03FrkS5gXw?TRL`otxoM>J`Dk+m7OU1wSHK-|;pjKV@U#
zU?$?pzn2m?G+-orh4&>-MIiMB@!+l;bfvSQw?)>6(`=ZBI?i`0{!Wx>i`y7P^nCQ~
z4Ro?GqvZ0fb^fi==-_lTrL#;$y}SkVFv;WL#d7TP<?>EiJkwgxn@v+}Uj308W|UoH
zwEQVuQzoNYW|)EA!-b)uo|Xu=SP};-$IIm7O|r>JXsMq_*vs4O6>NHFsjCox3A(k{
z^{-)MBmi-BA4WV)sWWlC-Q7QhS?0B(vQmUB^q<52g{5<2d*Ti!`hxZi7o#ZSjib?T
z?5a8<dKyYd%=0ih-OAk3^%j{J4HL#~{{V9OR-=tn5#_Jh+?h28OVT#qz;EoXsd{>q
zqy4Zx$Vx7up_GlXv+Pyn9-#z{1+p~#*CtGv3*&||AM`p<KieO&7OSVJB^EIc*<Z4D
zkTMdwSjRR{`KR`Dd@yLqf9XmfZ|Jx7OaB0->0882{g#HJvIy_F?H_ejSFX^+33TiO
z>Z-EjWTlH51!jd#&LauW(x7W{&{bZc*7{97?^Mf=kh1!};)a<JA(OO`<b_1?KFR)z
zqg7Q!Ov{@!1vBZPX*XzIU9EmA)7<)Uw>^Pa&1dl{S=#2ZQa<YHO)kmy^o_UTuDMM5
zH&ev$Y`i+AL+X-A{nVPrQ9iZh@;tbGRTTPzONlN9>z^e)&WJ^q44jaXcQauxDvSL^
zfLuHGLsV-qM#AU1_U(1&=fxJR>&B^;Z);t+_W40E@%q-ih1O?K>PaMdjw7@ml<g+9
z?v<{4u1_nDFlg&?Pe-9?k~SjOG+k~q2~4eN+yGu-1yO8mb?@*Nlc)75q#`}rTi_Kr
zs$}ZT{-F5162|+SusuM~%97$PwM>*cA)Z3a>;C}6k#WD|S~1aIPb9J(pzR&3tf^?d
zKr9I;T|NTmg5tDvk=cNDLQx(NNER(Mro@4dD2XYU#$W;RRf8k;@D+ZcFl)<8t=Tfs
zXwg|%!1q{Z=!X=>;9A96!A@m$#f{aJdV3lHc1n24kn*mI7-)&*sr7V$u#;{FD?-Y4
zhThl;r&)LrxC;y>wj!e?SxvnAMZ&ACqS`-7(K=X%w&0%y2dEg@%af9;83`zvS=bnJ
z&tRk604i$Nht5djvJOH?Ikq@dPRY>9sczd2>Y||Tcik5`al#T-<0-(%m_613A4bcY
zlml?!Rh<>KjQv(J*>6J@;?TWApmgTE#w~YYd3_Z?GqN_DFJJsJnlD~EyCGZ0j9b|p
z$)1&`=na*v4`|~m&X=T^CEOzxRvHaNbI#T_$K`Ic>P8sBA$I9>ay_1PThpzHzSiUD
zs_JxT+S1|x!u35;g6$*$W#^q-$>54lOj^U0ob+UmDf~jBgYwT74shXlq<UlA@>a8~
zwSARtf=BLoDz2Kc17b@>`z|D-DO);IX%y4Y%Ny)6qLw$XcLi!<WK~jt#^2>GqoP03
zE+WAhVpV8mH|)UFJ<fQsOo%>7njGSD<r%BMDdsH!SHSlPgO49Y%NJ7E@1xa!541?C
zBW#ZVh3T}~9UCFDTGDNk*?C7qYVU?HBzR*R-E1m4-ineC(IK7o!&n!4@*x<Us~;lE
zTGJ_`g~aXJJFhM387ZGv=|^h=%Acz`%Td%?V`uOp@D5fi)Kor0?ztzDxN>GwXG}3P
zTh@9^j@aQ<Jlv4nlteH|AqB*eQEk(oZQDwnq)|YmbtkEp1laVzP8zR2Dq8Chj-aOA
zK-=HKJdn*45ovbGZWQL2#T|oewzT?Ca|POm)O4#xY{e&$S(Gfm*FSGPydaof_keF}
ztyKC;-0~Y4KV<4&pO<~z8^2{(=86_jEA;vkJ8;{TB}R?4yWGXF(X^-20_Vm?II?wK
zmswctvBX1fV~)z-EGU;2nGZnH2;^Y^FK_7P#>p65cwS@E`b_jTcc$V;!q#ZB*0!ak
zz<>_{JUo>WGsND{c+sbfLM%e<UaBz>$l+r2y;^p{)`mF`tk>7g8EkBDB^TvIy#Zr%
zTvFCXYK@#ZR<mmK&_(Z+pnX@J($i|E-R=abU!dxBPQ22--WH#cB&i_B8!k1@tE7pJ
z40u09fYrK+N{I<*Bz6l|7e_hA_?JIaOnn;za3ddEDYueg<42F{Ew8S)WKID29I6x2
zmGurTa4i?&%jlSTMw}6N$Lx%UrYW0m;Sbp&!A{v&$)!m7(wm`c2)QKvkstofrjsrX
z`?Y-|7J*E`e@VZxk=j)-AMJ%m!5OxE+TX*1&*XR9DO>n-NdEw7*7`4@&X)l{peO$T
zrNg)M1l%GXO!=m(@X^l((Vy8nPW&=^9ydnfK8xuu^tylO1#@)x8~ly^lW<fc+2eX&
zLNX970Kd^*(e#rUZPDlGy(m(`-Wn2^7&Bm{@g&AlG1Q$s69tT8=&k5<I9lL+G5ag9
z#ty+q$2GhKr3A+04-T6P8-0N|(MNyM5e9rFdcc&h$3bnejHHNvDk3POZ}O<UU^}FA
z_`y_YP?NBB3O5#C^n^2~?{ypM09!~K3*69nNM>(@1F8Y;qjbdZR{0_xEV4BKcuDzz
z%B}Sel+!J{pxLOgbx2Vfqjg^-zDh>Q4|FbrLC&cvDJqW_Lpk{64=kg~PIfYY`l_om
z+^knr)WYUJaSHoUm-ucYI9_$tu+`PI?2Nbqo(`BA(dAuzTT1$;M*t6Tb&Zyn@S2^0
z;zB$j4@ONa+uqWCt6|dmLDPV+wh_rT#DsQw#*t9QQ?xYpQR>q+NL(Cw3q3_x=Cm{t
zFs7QPb8=K0MbvMj&Hn%qbnnc@{f)U<E{xKjO{juedGNhcRDqQww2PqV^tj@7_OJpz
z6GtjY-vg61T|ZbLrf6}t6{EG50d3)A2$tJ!Kpa^|vO;i4`l(7*RbpnX`nz0k<pZ@s
zPwH9m6uWXy?zyd!{m|1Jj}rOXk?!E2ms7C8RSypW<e{W5cj-k6<dJDEu5V&c&ehyc
zDymrBe3SG@*q%-TR?_rqY_tCWQ*k*d&D5NDy04B45M7d_e0xSXP@3hTqUe2Ypzloc
zb?3cT1l5uo@U~Saw<tH#2b-3HRq<m`5^l@}ouTcMbD3uL!ZT2eMGnTdfo>Me(Kglr
z3qF+`huku{RGpD&dOWLBiOzqur5)4NGgG{KO5H!FX`F6AO>a-Y!|ebcD9Uy!fh88W
z{{T-W*zBctuIGO}lppC~ryP7P{{T<6ET?Rz5^wb<k%M&C*Gxxr=qLx(OC=jaa1`Y^
zbQKhe>8oV5i;y)Hk0UNW3c^}95<mjTcWJIXgpIFbrSwtCWtsUWC2Kk|nX$^(IAgjN
zlS~)6W&X<E804mmZL@H>^5scV3&km;(RAHP2q0)AaI5vsrHVM+XN!GS3a?SA18A1W
z7e^&gyplP}Q2n;aKM}36E~wY0u6v_njfv%DW2AJl+_aPBYTczbk_YUhrPIK60Ltov
zj24QlR95NKzK{fqE2tl_oFgIAKp&>*wG?h^2?MfKJ&#_Bjas-dgl-mD=<7@BJcLHR
z*R{o@s=5~c02CADT{}eFHhLC;Sn(Lmz80%bt1fU3SnUXV8<nP@VJ;S2QpB6GSun26
zRV0mb2XzjkGg%ob8f&sF_*MF>#lV0{(P=t4BZlRoi&m>9LISVe2+EUEjoXW^swJp+
zcF-(-7h+MAYL3nvP*k!T*$+_*Ws5EfN@%2$-be14TzxP=BI%)qFzE})nLTGsY_C2Q
zb2O&6HoCs4B)sKB*9(j;gsBS3DYWuUgGwh$(p~C;T1VAi(?HkQkP+f0L^}i@Mo61R
zqK-Cz>?>hS9kKf=Xs31T*I^$|Gy9bpNu#C^v`+Y~fSTBxZ~~l22p0u9Ihfz&{>d#e
zoMgHp^d2*8COO+NY@>}#WxuB=c^b($?v~7(_6ffDOnidl2$xda<0=^`9nFo9u-y^w
zxxN#c=GzJ>A(5j2F{R@qVPjZWAw9g`lpm;CrH)JTwFNSBViGuEHLeFYO6Pp7Lnb#o
z^0;{LnY-McJS;Hr%4~+fC$`I^VJ*T?*e$_z!klsBCYD(^5C?QvjgZT6k-}?6Fa49B
zYud)eIz9?FqX-4K7*e#@WF$Cml^dnc3jvag5(qcClW4LYC*1f`7h{y8CPMhGZWNIV
zVKvVn`S708e&4cS4mVLf?relxl`t1j&6imrR6aL{DNAsmg}LDokldmx?1{lZ{!T7b
z?sil!a3>1{WM;$#Ht)I{JH^!Ob}~j*W*l#}${BsVl*F`!1MOpSnk3l=s4}FCi-Mrq
zHzMhp2XKsm9?4iNZ((&KTnHByN#}&Zecm#Vs@XeQEr1Z!WP^_CMnC02R_)&i8;C2O
z`|=dgwC%Y=IG^r|fZc#!HsMnAMw?@R!ca20#oQ%p32!J^+(x(#LK><vTjdns?gf-H
zgXILw;#amWc3osd6z70ix%BRExJ`~38V%f4m5^he(#%@<PGhm01cdQ-E@^2t2P*{*
zb4O!^)&Ou4*xQ8DaoGkGad1$~97WXNi;O5|81}fJQh|#z#gw%699rcH^F8+R2MSte
zOnGgBFQ6x~#yJRS0Dzt*cs4fS3%$VD*>?P-YRVHm&UBZzD~TlCM%TLc3P#9JASLK{
z?BdWz%5-hE6GMV<`k=$2U<Z^XTTSlOK7XkXDInu3BqLxBGF*btdnu_NO9(Bp;^Vt5
zQove8t^Jif2uScSqjN44_8W7R8=4v|a#EB;b^vgb+v3W2;ty@X&($^b<R2kqz|hPt
z0CKtQv9UHv)`B_VU=C<)xd5(lAaWONy{?+}+WES{v5$3!WIUID79~pdIGh}KP|a{M
zZS+}oA4E@q<B(D^7aJYD*BPC-ZI<5`PmZEMdmO4OBYO&kqiDud))wqk5V)6I^WjWQ
z?R1Qyp>~VmG?Lq62}t(xnr<*q8i(Dky}$_!Z8>gKZa=@38(sk*5)s)pwn?_mHb@)r
zxsM!zKIz-DY$dXZ4fOMisT$W}>zeL(QpVx%ve;9h7zj_kc*=MJ$p{;8iy3T%;D7Rf
ztzab_`;2x%RbJP@`mC1CCrGYzZfUr2x59e~xW5WQ4~s5n$n2_?h+43?BMxBq*>mD>
z{$PGmF{5a4Bp-z0<HKB3%S4N5?vrMFT}ipbSdda1gTlxsSb(@+?3JS6+}JK6+#B6%
zH4SUA;W$X^`AsK27c;tGP_iA(;0&nkdnv3Bb-{w&u8L&jf$e*XST5UzJDYEmmc5F5
z0*MyXmLIy9wIOCeHwi3$Bw!n0-8f#^%3ZD<l8`{i{g&izB5ttZAR{9dPiO>j`=tyV
zge-LthTQG@psHJQlyjPFY&b#Gexr2pWakpPRx~=-%41uUOofg)7f9AeYlngLRBqAB
z$7IyIz7eb*LV^g*u!&%>$l*#%?8c6;;HHtvaXG?iwXlAuT@`T>+z=8ugPSMgAKi7X
zQRE|nA`AfJ**N`pO5vNX?1N_Dh~7VRoR9n|G5t%n-14=Vz>IwtTKT$u(i3bzOqh)c
z-;3QSEh5JW;x`Zrcu3|wx42rxNetRM70$iwd!^b+>l+KLVWF1<@%t{gy{}>thK??{
zfqW)2iQUd_nni))=|CC23hNuKVl;%|cO8?nWQRB?CK?-ZJg&(Jah1ue+(wg<ZS_c6
z3A2E=n<XT9NppLxVz{G(5xAQX!j4*dag^e7kd(g7$xNFkC?FXc_B;89_fc-S8^AwM
zi;>{)N8Lj3=WyGjY>cB!h0sLfa0SnG&5B6LG05PSM#*q?eZqWics8;m=#i6EGywN8
z!@b5-%&U0)CByER*)T5Fk@At-NI&HoObxV8`PZBWe(D)s=M0ibQ8xf3KSWZa40Z2p
zq}yzV8>s;ac?gV<jgWvhF|PUUm7<-)EiK3Hnp<Ie;cx_DC61yvMG5^9{gWLA(Q#{h
z6q`l7CE7<0Hva$!SX4-h1@KpGH{_`Veq5Bb*A^i)n~5KMt^ub7w^D63x$K(ej^LqU
zw1xmaKuA~s$LypHKToRWjQx?bak4CoU3Sn<buEX2yJ#cmwS`28HyHl_E4E{~Qf%ip
zNo*cU9D~IXmYXQt*CIP(DWq;UM#01$?gsZM?Rn)$STBTyfR(J=C~e0l33<pRA#PKf
zeD_+yk=DhomgHP#DL}AF8+02RiWo)mLQ#$icHHGA+$`7}MQpAH#N8{N*LJb^OxieH
zTYfCFkUlg#dU>;peyhDQau3->V!5P&%GPcSbK-E#ieq;Jl2gl{{YKssGIF;gDA4%i
zb3w5;PZJB|<w2f1Cg(P{!Zsc#F|TRmFYw))<p;R^67M|xAz<PXVh%WeDZYcesC`!t
zDScOYM%n_2o7A+~DP4CofRj$85=b``Z&2zI>NQStM%eFh;WtVxiS066=Y+6vZ~8eM
z(S4?AW$Xkp{{UpVj+q-6a4&Ai+A88>4Q<#DZf>1a=S<sL*HxQUNfL^8vlCMRWR7YP
z&DwL7sISw_i-52_)^@Rht|HmGf@RaP*FYPmXu|exiKC_z>~p|#$n3mdrlNe+L9M<I
zW%OU+UWw|(5qLeXb?A7?QqnoII%T~shb?u3Vga4372ciFFw?jf#tXhe-RblY)6;;~
z4m>8kto1UlC`Y78H(MK_=}^NPKw!VoT2H3>k=tlXrpm^E09Hn3?7CMJy$qW?@2NU+
z7q!li{_D*(vrDGT=EgEG02p4$)pC!^yxn-tu}}HUNVTAwyDQK0B`V_%&B}-AGD}k6
z=L@x7e-*K8V@Ss~R=qKy$LKe6cnaRTP7y`yVEUnl#gdQg#8Yg+R7BQ4bjH{H)t-+=
zW_U5gTF)oCvZc_ydaqJZyFK_?-78F|reGut1zdhBZ<LrhNxd1$+G7<Xh-nrauRGTw
z71bsdjoHokUaQq|uv0iR_UydTk(n#VAExW2Mk&#CCq{0oreJJEzMb5AEH1mF)KJLh
zM$>Ed3+PH+C`$$#+Se+BsCskOW7x=nxUn|jQh4v76!){hsrB0GIY1J*q#g><QT3jt
z*sb}kgUICv*L^cCn=79iN$+)q{KLbxJfD^4W#-ow%Peq~=+^4m<Lcxte6E^Da_1YW
zYKffiNy$RfxVs&@C(P?NoUTubFzC8eLRwz+D{0NL5>pUgbX7!*V{&isl2Uyks2Rbm
zAOe)gLvdnI?|FOgf3QvsC-mFwnkhcSX?i%iLhFY(eF`d>lDOTsC%Gu?7fy9cngedO
zx_?NQ#vCqh*>%Gdq_j#>NXNtK7K|INbP_z<X(#Bn!=-&E0N@4H)|JtsS2f}yPtgf@
zl9rJ-l8-f|(k6Jjm__~<RB3ZW-NA$}ccAET=!Y19`zlVR>Db_pZo&H?{0<9!nmG>~
zV5|qzX??z^*tDw2SRLuR?!6PIx@I}1Z?@!~<Av#3H$+1CM(F!^RF8qlTVl&5=^r?q
zKDGn?+wK!*sG0_l`+_{Lq_sYUfH3WhAF}fvw&@na*A_CwE==E#Ykq@`-)E22O+8e$
zW$sGRbk3EkZfoFc+I*`{k?Ft8>YEF92D>Zh9*pS71w3vrv|t_=q2YMkS0iPgqsQr}
zdXP8UB%mJGD7du#rX+5bU+%t&hoxy6(P%=My*Elf_FBCjU)jvD{{TmTQXZ+Iv5C(%
z@=CkYe-L`7PjF<kZ*ds7%Jx_E?I3UaP5qU9S4+{o*YsKYEacv-9}eur(ta!J+dy>#
z!TYH7FT~EObY#IqMmZ~O7faE%h@1N<k55u;x2DpTzp=hE#dSWj>#D~R+pr%6V!EGR
z>sVOn<eFkT+kn25e@xNb{{RW2?5R3~rYK!X@MC8lIa#e~g=0QPtm|!A?{jCXmv@cI
zx^Aecll4sZ9`|z5{w;K*T6Uo<)XgD;la2!N=?QD>LAvF6B$?41Q8dS>CC+j6T+L!>
zo&y|7D=cK}uDWThlC_(>{{UnZ<tIUKNgIBj(QEZG(_>@ZXe#;!xzx_J_gffSf5NI5
zq-1yi73x)beH2h-t>cy1@ueNI6!~cQn_6{Nn_Vp>NOL5O*2uOMHC<bz1a7+YfByhj
zYD!qTiM3R=1;cBA{{Sn>?!4yPI+SRVGn=bzER!JGs^AwY_d<yJpxXr`-75=pY;<}@
z)KiAo-D`9mCRo5O!h@q=g|W5L5HPk(bQ=H`3&+Xia-Ab%a%>R9=CHJ7SJhBHXWqvP
zNe`vn8&5{bG8=@yDopQ;480zmvAG3V(b5+<HpHtsx?tA^i+z-|>}+kg!Ceb#!6sMg
zA(YS)-pdcDRk`)0&hwSF*GBk=SZex5zG6YPRJne_#XBwZ%|bS?G@p0XUQ<dWXe6wq
z1tEo?y6Wpskc<+ji~23+cx)!vSRSp^%pkFj1Ip0#4zmRvAr}SKunWh!hg6!jwZ+b}
zLBI*(xjI5ONV=x3E_UtTa+#>t?)J2jPs*pEkd_Z}EJ9pw&DESlvMuA65J^MLJ4vt#
zTJj<si-lSrx#^-LiOAiO5cLhPD6xhMAu7+brm<)R&a?1QbdsI{Rni+fg)9<~;F!hj
z45hMz$pv}`Me0)1$Q%jySX}~{vk+WL^e&v!zfLUQDPCodVfgu;<M?S-Wsp7Y<aaCB
zblSL^5Xj+t>(ko2dRrPxz_-fOQgzFmLt5((s<b@FIME6C@=W$xs;Hd9ki7o@uO^4`
zl3l=IR6DF5=2^FKSnjOXD=Q;&K|Cqt^I;W8(ZeU%<G+bAfvHINvg_i@Ii<F~SsG5@
z4`sTj(jQw`T_bmAm3O7|yJ7*wpV@MMkk-rmVBIGWWNc}V-Q1Obsd{avH}^P<1hm>=
zr#{B*`XfaHq#vgXPt2bk46v&_vslw+mZk4=c`CWOQ}_Ox52E$SbTKQf>D>JhG+iKG
zHyH1Kg~+l_TOW*8k1(OrUI1w>1Hw95J&nHA=`!?`k&H6mWH<hnk<PJ<{lcg2#Hg;1
zEUTb&uDEHk>Ma^+ABHbokE96#@&5p2Wv6s|i?J1l(KHrDGie@gq;&0?3));&*ZK)_
zc7|K*y-Jg%<B5Xp%CMyA=!1bQ1MIg6&6|>2JZaq`_vh1a`zdL9UPukL6ZT%`7KH`B
zNd1$Ypwo^R72$$bPE$vcQRs38Wr())wAC)Rrbs^v)v5Ft1G2?$Nu|@q2ec2ev+<)s
ze2nrsK7s%X#bNYT5%feXxA61yUa$FRS}Yn94Lp7V5%E$B$a$Q784)7!iz_-VjHhLf
zrV08j(_)NvQ^wfBe~y?rS&(l^QwIM4wm)SpKTT7y*oZA-oZEI$dW{DKI>eZ+Koq(>
zENz2Ak=kT8%R(s4^MszTw<?jwkgiro7M}xulqtnLE#aX=>C+8J2)J7^VFoDsGz8Mf
z$6$taRr{!&R0b}JRBI3Rfq)VRHuws-)ek8@I0pqy>}1OqxB!Qcf`xTm#!89RAoooe
zfwUS6N7W&C<dg%damrz+`CEyT4U$g^7fJGlH3Q0NlpgCOYX~wXI#XmhnZ8nbfSzoP
z1eD0+?dHj>EZcHab4teWQrU?d@}n}_x)xfNfyx}!0(nM_WrwOtYo6oX3faeUlupy$
z$t36~Ah|&_r?FAKpj!xeCLEHc(_^NQHuHXRluMpaPncOo>B1`-Kyz%dbmGa5oLN^o
zeDb1wPzkt#%LymHbr<GHJgW0j3H?eZ&trQc(qSy0RO8)3>B&{jsm+v;JiE%2<rs|=
z*(F2n2sTyH!pFPxgk?qSg@_XD;VPPH(NB$$eo$NVg$%F({J+^-0MHaO2Bqh0b&iVo
z<FUPxPVa56ghQGX62?filX0?%Bo5Y#<R=h&1op>d@!PT-P#n@BF`Qf{#};@}i(11e
zNXAW)xS@H!M?2DMY)B<UTe#q1DRTkxRE%q!6rCVjlOg=OPwF>OOA7$N!k%|*78yhT
z01`vS5sH18(E*8<xyns|3=1jU9>J76vi|@pN_qx}rE^*JLrEi^Yz=~u%_Q9NqAku7
zD5M4;iuqDDoRPp!gaOVGB3PQ+5-@|EbT0<LB!q&Xa}SIKV(A$nvvL<YCING0zFO=*
z8!8+KDWMTmW8G$^Fn8rWrh&zx9hdqhx--}!!%K~Z0+7?YZTl(DB8ch@mFFB>DXD49
z&H$#=G0ovir`0wWg5ko9rzW&I#J!gkx)^(ISPJTm5sU=bC&knaV>ZVf@ySqC>n@SL
z<6+<^M;=)_WiAoutg3=Kd+h@Xx~f+>wg&$IWL;$brNy~Hxc9J3@CG>wxnPy@U>kWx
zQZv(SoTV~t94H?B#=tD`G=}*T?2@8!V`~JIE_0p<xJBvIO_<%*{gul!_+n-3qbYIG
zlfHqeatA1in2Cq<@)tGjWR?LR0|VP*WYO9KNb|jKN}73&))I!K>FL<u=Q7LG<I@`>
zuV5EdY4OC&Hsv?S)1<*9jCP$(=xq+gmGu+Y!F%OZ>hE+HA(r~888zp`^4-g_9whQc
z(Z!oIZjJo4fHKWFRnp2{Z*`v2^?^}qyPuVJ3&YuQ-E+J@8`(@yRbaY+8y$ZNm9RC_
zl0v<$VJ)((Ee&}kS07_dXpzN{LvhWPb5*JV&d9%IX{k&^XEwsdYPBveIV+`XheVQ2
zNwFy#GeOB!MtdLCZ=#L$CxCfI#ca_tQfxy6B^rs8ixrl1?kE2MluZoeI3V^i(XgR$
za0HO8Y0t&VqSBsR0R5HiIkQESC!@C(&|3;|w`9hAe#zaGi=;95Jf@d894ATt0N70K
zwTj6ZE5X7clVa`$=w=b$3E{xm8xh2j^29~Tf=z^Ar9KlJ(1Ug!13eIOmC=T_!@rc7
z;5l(GKg>DC6A8qC?qNO?9V?D)j_9J(d%GbzKTCs!tXczPhWF3Hm`i|(d~p`wxAsCl
z44V`zHp%0VTL%79<fs9I7ecl&-ZHwz*;&wSq0gG*g(OdI+^879PJ1ax00pf9ocA#K
zzhwBxwSp2ySn|1(SX(Hx6vK;~w<u{{A0aSQZf%G6O||iUP)H-1?{&dXbI2A=V{9zB
z!xrp~0Wo7G#>E!a*dbs9=eja5NXiU&hz*KlhR1QrmteuVjqSP3lF;@wvT)Gb{Hd->
zPd89BhCAg;>R5PM#Txb#-45p1oT<yMRAk=R$|G42Im(%~zhuvC@Ig|5&@cVg3p&7y
zT|qA0q+;q<1LZ*@2^rxSvMd<5Zy^y*NXi(7hwzGrwXm7=Xdr;$&ndu*sGVyr2i<gq
zXdrCvEQG7I?57zPP*yVbC?qs`2iP2oh8r^n{{Sc;%R7~0PT}c*bBiW#M7n1WX-dPJ
zr#;NI?xXbp9Nj9}n>pg{7*JHR+Naz$+!YMu?BLlI*^?{fbd45k+$^Gwd9Fj8mUrho
zadi|x?((e`bI-D12{|Q7#{8)E-p1+8555XvQ(;VL+kCDd=HmBB6w)?35T$KPP8`hq
zC2Vv=#)52lOCws$-w9nICi_%!`<r9JU6mU18&3grdmKHZH&DHVWP((XJTb!sXV9^G
zCXxb0#xSG&yT(rlrcTn{bMm?G4`CP|B_}3yDA+q#08X<oJT46)z@NJ9xkNo2b^-u7
zQZ_I}!iDT0Uik`GW(^q^T7<oi5xCymq2~rS5?Ts1ld{*nydd=g3$J^jVe|<3S(~=X
zdRNBq8U}o-`EPzyluoh9y_3F)do3RgvNQBU$s5{o6T`^^-kB@q+illVwpA(`2^knj
zUh$idn9awLZ@O{tRvq*soE~oBl;+ylB_VHdb<JrPPKZj-@NM#%;*?z>7v%;W(8A)N
zn0rmGiMB4IoDHQ59U`h&+T(j9iH-*b%6VCS3WNs-V=B?;jH9x~ow5Ov57iQHZV+_t
z+6C;0Y1}_i<xWp!7em4LNL<y#yKV7-%8T4`LR+!;=vNzqVxu7aQW5eJ8~qaq;yI1E
zvU@BD%409*l>NEq_e#b@tpJ{ERIQHg!+}t+e5bS#!9)^vOd3ZeI{3BJEqj`8b7Z1I
zd0B=og_8dOy05DTJcMhV+bDX5+=Z86lLUe{zqnHVT3hlI@yBKYIZk8V4<xGD&ASn?
zIJ5%NK8YL!t^JWsm^Li61oyShxHw45LRN8L!cYk1aB%MKJ0-C;+7gwquXC?!T}0_@
zY(kg=V}Gh^fN{COOsEe-Sop~T{{Uqu4R%}4_)xkwlfe3^>Erg^+$_P!P|<uiBy(;r
z**Wky_fR@1Tae<iF#8)^Wgz-}lvkC!;Hj8=g_|`BEJq8lE|iPiHSK+`o)Bzwg}X6x
zWzMsOgN3e#bDg&>%H~UA0Rqb=W{JZ{7%PDzfSAXz$2)?NtPbJ-0J_!`#+RF0pM*Pr
zB$C_?$cOtuHV5P=TJYRko>N3w^a&t^$1Jf;Wjro8e$jM9kA&ZFx60;26W#52x^{CV
zvGB#|57Y=#g2FC%P{|Q*w)X>^rE772>=d5PsG>r~pVCxCrKgLfH|&3Op~v};C@U#U
zW^R{`Q-E#qNKXtG_PkrcL>5Fiw<!-cJgK(ZC7}H<yI?IObKz#qWERTg^3iqMd!m>~
z&F}D(e{}FM#upGRVge|eLNt(`C2%~I8$cWr^ect;fAE-AiEhKo6J%>_2yMO-K`V(K
zE|k<E0EEE7d?#Eu9$J*#9&VT<ZfAS0+C14g)*{xqNt41B4kB$L=dx)QIR!k251*oA
zp8og3)@K?RLQLk#*S{$<-zkM?X(<3UTt{+jkP8&XIWj?UVlbo$B(<}IQxZrK(U&_H
zO4wW-?JgfgR5lL5`l(t5?muO@Q6~UNBB=)FYp$UTcs}M3t(*o5RymflfJI1yiz`5B
z9#6_?wUwldrEv`|XeYI-hNz@y8<_i#3Dl5{01NH-N*qTvBj}!Db4Ec-DXc0Zfn&dx
z-$c6_MT5U}&9>Vg?2*lFv2X{%TOA=xPXn<Z1u?+h#|l8w2ehV;NXYJ%#z>4<_s<DH
z7Q%Mh-?Bo_lXNU~5e|9fA^MvqSd6Z>b*$9J-N0EXe;7_8{{TyOO|Y^$GeVa(*V+_g
zCj%+LpEq5%g0;{nX}asD9&N(wV!-mXn~%`LbIMzc4Z|s11-J>Np=+?w*yA5mg4rA-
zBkGpty1?Rh_eg#c-u;&oj_VqPvPQJv_ezuw-?G*f8x!GhCg-|R2hlhNfshcfltyHp
z61Rl$V(Z@tcH`=mu<;@s=bs4=7a=^i93(mHQA{Zf!fE<)oJZT?CO-YvusEH24la`y
z@R#?$gyt|f+#L8u#b}JMeUe-2g)`!C?UcaR52Ds$H#XxVDZkjMU4AT62)1p7tXdf1
z`=qh*oxr#WE%KR26+@e#OC!CJy5B`1(45aV`Y%bN)1|LtcQ?{!X0#(;p}`w0=G^yP
zQ1Q}7lh0?IX_{=in%$<}Y_#y{7N^`J4t2YX1)-<Yp^V}-*nA=?!Sp)|4pYk#j6j=m
zJj+{%vF?r7_*pGN5M(wMD{<7+&wWFSLEGhH>)0c{GQ8N@f3ei6iynxGetChz`G8+k
z{u{=|QpaIz1@gB=OaB1l2*@}EeMk6lE$P{AEEloj{{RDzH}X9)EX0DS7J2fHfD;l6
zP`gF#bnmfHl+$c>N+xRNwmX*#EX{p!rv=2=Dp_^mQ1417ZtS6xGGDK-b+G=b)LlGo
zjy&CE^okQDS#yQ+-C4+YHt+uF+IyethQ!<+ND5Gja<{fC{j_X!sN$!AqXgMWTGIAh
z+h{`4Ik3VVCGTZht?LpPoX7^>lsug43~lx@S{q%cM@Zv$hMyi(G3&w2!LV4`$5c&F
zTwGpB<wsjl`8Wx2wTE@fgU@_<PeUj>(0^F#>|{^7htX2>gQV0dLz>fKRvTQ@<*co-
zaV!V-UXS>9wUNZui(p+oFD2!bqoKo8dR~vGx6*C%@Tb&t*o-IGKV(LmBO`=mI<~GY
zhU70rWTmn)iR8U|pu<s3AT1dlIA1vRMvM7PMf*Y9b8%($Z&XMoYudql5q09-ZKIbx
z^EeTFt{nLkouTonJhma}uv-Xu-fw>B{YpPY#i6+Jfny8ZYh12g`#MudjgmQ|b?j6|
zSH4W(D`>RY9^38x&{g#QiP|noJX05ykEUx#;Y=LT@EWUGBZEi);Y~(fWE+r%C(78>
zqtrhSXk(g27Z0u%vT2%hO{N4eUe?0#&VZ}gBL^QV)8*<qdTK3(QE)pI?BkSS4V-dK
z$gruSr}bK0w7G0LVvd}|F4p49#cDdj7uIcS@1DzLpmm&Z(u=%t=PN@jK;q9=tTgb`
zkzg>q=cyw#lMu`_8>lL}y|oQ4e1Wln+^m08b&HHHWiv}z@ySUk$F>y{ZPQGpf}jHC
zovYI{nyPaXLrAa-<=rc*Cyr6L5YT&`R_9CWm$IB~d$_{OI%=4%G|z3+s_EGSoaeL)
zFAw}y>PkrWMFWQ8i``Rocj7f?<=+$q#l%|6$8~L5yHKt&PWKW|7hJh>a?&~>A8htd
z!pS0%cF6l(&bhk!3q{l^VW(}J(T^+SPLkKA)0j52xcD8GmQKFbEoMaUJ__oFRHCAh
z87<lMGqu`b{{XnrZ<Pd{Nl4%Q=8wAhQlqYVh2p|Dj{@i!y1S{L!(0c*vR-fK)_q|w
zRM9t@hJNTNdcRK`)HC;ACQsB|RW0o2xA#F!s&!PK`?8PSZgToFqw9IP*G^~t^M7<5
zM_=i{f4tj$SIIL^)e;O%C-*`=4y2Hq$tgbsq0WCn)t^{Y{v~N_xHB{NS-znBPtzX*
zn%aoTx0Ul-w636kFPNXYhEAT=-}=nw_d(8KPAQsS#Gb5!QFGeI0y|lGT<3f47NGQ&
zqapV)PuWcuMplvsr0b7`7b<qjMc+m+wBL`qvC-x<(>2z>TKay6s3+eOuj1BLl${47
zn}}Sc{z6Py%8O2u{7ZvFq-<ne!@qQPsrb(7n2Q+V+;?)$&G>s#=AU7=g<jvoy0<^{
zI?11t%eH7h%k_S}F1J!-kdvFL27`Z<>M?#9)Q~@dRPp{9&wKhr1fM(+ZW2iIstRqy
zToSaJZ8VK7A&2%`?Gy0v&2TSefaeQMP0>SWWN{Jy0CkizXN^(^7GX5Xiiozgp#8a8
zN;-<4PjLi&R>Mx{wn71PcX!A}RCLLXGD`p+7nJ0i(jE$otp!tzqtt#c-D>EoL!;W;
zDoON{9E1j2D#C(_Qov2X2{`V{ytJs6rl?;BDj(0apr=++J>JFwP|{FH#v9)L7XJV<
z(llS#7N=jiq!VDX(&})=?Agx$00{kFmO#P<?6dCC=bCGfZS+>hE87d2fK&Bg;f(zh
z6KhY6gf!jA_&Ro9Obw+-dT5X3=gP92P_I4oVfCuYs=K!Cv03A%OX^+CIbNwZPR7A^
zH$MtEv<5s}#sE}?Xs4kiJ7=HMQaUz^i-4q_rLaUrvb7q<p2%238*6e_ak^=qTmnM3
zG{%c&ezHlb9!;z+nF}7$HwCqir@)JL%YBtjp+V_5j~@su(Ygb&siw@m$I1?-?gqtJ
zM@cNMA&e*NivIvbsd(M#kgVjrn#{zkAl)(`TK@n!SJir4v4eQe?5f*MC#)J<aeoPv
ztX(rx(ovVaynWZE&^$v-HjCk5dMb>UG@N`dN`i=(01fQ9a^rJlvCfK#DrJ&z(s6t%
z{Tds9T&o2Iss=l)e@{>{%>|%*DaI-~D=9XIuoky$Y$Zne2_`vV%GuFrP?iE(5v<eT
zX%=WJqZ}bF&UrSBO$Ldzz?kfQirKnsfB@Lmp^!wumXES`@W*A*@IkVC*_e+;k?!|4
z-(-9`Ar1XFS0U{jHA*MP3p_D>Agq)DMWRO6UCjk(DD>D^(RPp72^9QTWgSm5%4LCl
z2=a?P1TOwj`zRZxLJk@VKY1zb2g0myq$9`(%|0Rgqv)oNo;Gj*QonIgyK--f=p4oL
z*?*Mg289*=sSAoL6$71ywnl)I%HCCLobKfybBf$e$g~v=9n$`FpmM70^W}G>{{WPD
zn#&j0j>*59zjO;AaOFzajuE45BviPb>Q>Yna)xYpPOuA7Hp!n*Pjt~LgpuVY@DC^$
zB*=Rd!uNSlhlS2~STs4#aqgHmUn(a}Vw2aoz0hGumBgOvHw$-A$x-r$bwMV`8iF2A
z0H{ld$#Q~8oCV4bT9@uCDjJz!=^Sthjq?zBL9%CCDmkV$<zP@t>PRVqpq}cz?{kgP
zw|6L5c!!#TKbbN0WN=Ce?l!`U-cAC+pvP4@_&7~9WwyJJj|2=Ls!W7?ZjrF0TOC%$
z+lf*#snX|i%K<2s`Bs$EhA?kGWR0{kiY#P#@}u=O_d}V(vy_gzxmihviU}15%5apP
zP$TtN3#p@HfVnBG6oT07a-p6;IZQGJ@GgX?-yuDe+{REP6M{-(=4kGPa4kc<&nCbd
zqsS^KG1G(HMCl9oD0riJKICK&xZ2G_lM02A?lw)ial$-O?im0D&4sb>F1In(ARk5U
zJ`r%n7&DTbf3kJj1<jP^lPwt06r_|pf%1rv!1ho*!^#OHGh=cGB{kVd=i7jhpu3y|
zSdLZE#@-WO##G`l*j%Wlf!w&+3$kuagE;2R7fRTPH*vy}&1kS(-OhD@SW!R?2X0D&
zMoS^^)nfxAXuGmg<ZB(kT=L7s>~$L{>>0(<{$fk*V6w1%Chpi!x+X`(lcyPM9RrB(
z?tdw=$`~vx6q8EOEHY41w7A{HH#KyPL=_W0Lt(-i<PRv(5O)DP(ql#Kl~jqgS2(-D
zPlh)+*##2zU2uyWpRy8-nMsjUZDVW*B?9fvax!>`B#a@BIYKZ=56Z=lb8~wp%_EL3
zN_Jc@lVLWxWe9_lA&wH`dw%M37S^r~*tp1Fi>%NTn6Y|oH*vBj^AHwUp$s5%lKKUs
zJgK}YU5uvD9Z+NMlqaIw;TmG{o9O*fP*La(O_4G-fq;?B9fF@>3TR;tIZX6`RLL8y
zhLsniBai6*%UMsSM({4*?u?I2r*9#@b;Fm*P-RpbMj_OWBOwnY0hs}8^(bkgX|ZkA
zcB5%=00n$mRzxI|MSK;LLC5c9GxcfQ+gSZ<l(D4nqH_)G0%>83^kp_pNi5Sza!6V|
zIwQ0fI?9Vrj0XbcqotmfIKA>TeOC^6ap<%qWt<fhurwJS6k3L@L+Oyl-{ny1m6Y$l
zr2WMBR8=xaM(xfYb-aHcleTP=eIYuYv9j*kY`pVVkcT@zD^IFO;s{vnYUC4}h4i@L
z#~zO^adMT1^z~^oG;aOM^o<$qd;;gP@l6(?%&iS47hbQ@)f=K{bC;9lDwUo19mb2=
zwvDAxRl94Bd#mYeS@u*~i+@*T&j+%TMFz20)-;lAvATs|e1tV!^$o@HRz`9BLvmMQ
zIhiA-?RCv0oRm8}B4HT03o{M^=H1bh3<co^_Yh5jl8RC#0Te5AZ1jd%gCBKu03cmb
z=n{v9hZU!W5LhgsKF+*SrDSa5l>2$*IK~C;6HShCqS4Z(hWAY(-G}U*Zz&yQXwBH&
z*|D;Fep3fFvU__3S&14jn)ce`gy3!2HSWK3pt3Aob}pT4CW{W(L_w}DvCj#iw^Ho{
zWg{DNj3R~@=IsK>q0ajKl<#l1jHpSrE!}Ge6gAR2z)fp`<viiMWkma)1(5@YWN(Vu
zAtaj|ED8m&lif(x7K?&L5J?Ktp<e~hDUPKnOQdgg&8c=l2=N7xIfcE7SlZ%l0wuG?
zY#h?8DIZAS1%X<C-E;!hcOyPieLId-#Kw@Y*nq30V;ykUW8n>^WbBF<+TQ54I9k`?
z3Ftkd?SJ-B86{(^1<EwW<b&LPP_nt#!6<Poq~sLV%<ac>O4Kr)65N+?6yrUQ)khSu
zsSK?H1qOr2dj<1l&SP$w>WhP5yVVycG{TtAPT3_c>o*B~Kuwo9!u(&t16`4s90?v%
zUnToy$?uVuw$!K6BOIngq``(<h=GFt04fKDwb<^Zfy6t6WHb>uXS%^5W=)f~*yp-%
zc07eUD`Y{W8(%3Wkl0<J5OxuM>M2^sH=M0wC7?+h)4;dFnjvP3XR?pcH@_-ahSADy
z$vUycrsEtWaK1>jk8q!xUy_*fi&<e=8=YZbqLswPLVJ%rlrp>9WMkMp74rw~=HYY=
zad)^~ERP$F!kPjJ1yvDagGjn?1mImfFxcBGuHbOg&4P#eG6wfe^xoSN4itiC00H4U
z)CG=fvw!TRW28bPb?t(dcip1cDeY@6G6&U1P{2kF)*gYsFhL^tOB8{`-;^xOa3r-Y
z7;t@xZ$f(yY;NVbQULahi=>UuYi(>PTOq#~QfFj38MxSaNPH*Z#HQFRjUp!(TEwIT
zi+4^oxdm`-z_K<a3epp58@}Kv7{Cf-&E#&fA*w4TjzH_}H&3N${$N6uM!aM^AF69)
zn0}^%Wc{O^>4XOGe`L9}iBYnm#?EO@YrzUkv}8!#x5>#%wYkcQ*UI7?d)Z*Q5?Q=m
zb%4RK3MPZx-8>r<!Z`|Yn^`r*szBz3a0+Y0cEG>N3^$>G_PUN^jPO&zYfl#mlf8}>
z@Q1T0Fm{;B%Ux@BO4uWDxN?GKw$}%`iKMjL5<Z1lbV^RyWMCEtu<(>LgM(nBf$sF}
zy7x~T>=fiyD3!lr5<hLNdnSXDER#Hg-6?NGZx+b1ZugUr2vRt18M2MhyRl48M67d9
zEjJ1Kg~_$h-tm<yPA{9F&1jc%EqfK$@Kj{q1#@<e<zyp7j&TD&wUROHIk+DMaA_jo
zl-I{`a+|XxO?Dh$l?^}^86fyk7~BpCQOzN5>bd)%ld+o#vzr(@lwPCQ?0{3^0LVZ$
zza`OwY$X@HjmT9<=WAk3CF01n(Cuy7G7%M99S{~DWHpZ<SSgl{hX$MSp4;D)*14y>
zkA)*z2<P@$jGo0~h`ok;CEnA0?78?&2Hn!`&t-=f_(XDB_DlM0wdt3*H(X0bMl7%z
zvR26@vtqfDVB*R!O@O_^ZNcnOV$g?qb;?$5CdqdkVJ-;3{>xb7<J)n+kA!;}3z_^W
z!%u=0c)+@2k8o^Ky_m6eJcJRpIV^>e29MVXVDd7D6H41{aUXRr=VT*m$@xN>H8G+%
z+(>QgJFfJPXB#Dr;FEPIw>KH`jgF8z_p}RGpyxhXtjmVngd?F7UuoeySd&F#rD1i6
zvV3G0dtML4lGRc@uFEg-g=|)LfBY(XIenIqhnDuo%9IBHE)Z1UjvhiWuOw%cDIIv(
z$KweH(K|O>U3&rB;VLZ1@B5{{%5{bF-EnRcSgj5BTa>MmM(4lEV~6gP5*BDt##3t$
zKFN19{3Zi`<x1OJ@`V_A#jH)fscsTAfbnakdk-j}HZ-&@+l%>3_XBWJ2a%h75$FTU
zan09l=d$L%+@E}XR<O|t82}Z>$3Ime0{A&mmY#04fJ@u5P(p5RguT`o3QwCRzWstx
zduGdt#|r{PWDd!sTd=}=_|IhCdG47pD32aj1oF^(u8a;Wjf05MU~Zc74+kGAV;CP*
z9Fd+Z3dxHgIb7ytr-dAKGd0%-cg2*mw`t1?h9}4Bd#p3vI#zS!Z3PWLTlkDDQ^iwG
z@rU!}K_erPzS7&35Tzrx+$K>(9N0}mL##tVzi@|`I5y$$1wJTTEO!y|x^2O}>wQs3
z!~$7=PT)nmguC4D)XRK;m5v<S`zH%t$NZtt>tj8<*o1_U{MbYWG0g=r)W`X4Z>nBH
z@gpBRCx>GRo{<;jAh{M6TI^_{_di^v9qtk|k;oxAq#k%e$4Eeb`A*u~B(OO0md5%1
z$XHZPEH=ReChg8balNo|yEe+!4kTm?SXf)i;v9Z{>EO2a#r{HT!6(`guu#pX`L2+L
z+z$!n<b;HLB4weZ1Kl@ivCsbi3B(JVF1N_Hb&wdr-61$n&CV=-JS4|tz(a9m#2aKM
z+k}K%+k~M=X#Lj!K)sUY);umZw?9R!WP|}dt_P9XFx!xRtFiV$u+b|+Pj$tlAJu#)
z#zm4e*yECvJq|mC*Bo+_dHSVvfZ+WW0M1H6F@bci?f(D?FMEN?);ih7{twY`CA<ry
zAcK3P&yS)uD@c>pJX+~QtvrB2h}y{rX$27+NzTW1;W5#)kO3+n-YiZR2e=R~!otzd
zVF2Yre~<2`E+>(79?yix$$g&trcypfhPAdIMR7ip9B}WE*FF(CQvhYh_Es{$C5YVP
z!uHf@Qalbw^X*1a9Hp_d0NacOTKO9MNZ{`+94$9d(S|j_gX0S!1tZMFJo|3Br)kkx
z^<`GN)|i|a%jVoKJ=dTi#GZUFUDY9lw56>VHqIBC^&D;Wiv@+s^K#mj&Y1L8^q27K
z8c4;)SJPjHwQclc7Z$KzG0?bENDc9I>z{{u`<NKZ-obbHnLQlYqi53e61C9`gq6){
zW-_w9JFGTXnhUdKpfyZ$ISZ+xXvp;~4Amvgx!d3>S{*o3KRozbddVX<1yj_=6JNNl
zEU;H%$u<KOB-6+Pt{ShXC?kP@hTNcFsA02PjH{{==?2?iD`A3B(UPvf>&f)?i<96g
zw&}A^CEsw;au%9cBaB>&l#w;O+QBAFF_X4Ye`a!R6|8OA!NyINH>&7%wb#fUiuD@V
zndugQI9_enHB5*+xPn)e<am6Zi{ohXLqh3wAsa`xb&0a|9+IN`qzrNG%FFb<D4Ks&
z;^dqy^fFVy2yWnPI9=FqM-DZ}NzJ#QioId*u!h_ZDw+EG<aud+FXdMC4y4csV)Ol5
zSe28I$C2<CpOZYNlZtePiq_9fsnnn`A9nYj*<*U9)5cuqSSkoL>X)}`0Us_^`sT4e
zrL?)koUZuG9AlwUc4a!Tu|<8R=IWP93^NBD<u6cFx><;Gu1W@qeX;|7Jg6_(+0fRF
zqkYi^uv-Wk-8f1wYn2QdtZZXh{ND>x($s>wP+r~5Cxz7r$D~G5;*7g=M{FL$bMT{X
zk1HksFxh)7dNeJH`x<TVg8u+UhFY5jgKyb7j9jS;9FB}Gp9N$92!osQ6!jveVYW$L
zMXlj)EA+T&X&mbSZR3UKy4IuU$o4ZQvKcZ$4u*<y+9B8=<DZpxpi<OTyb||YwpLD>
zt<%bVS9jv;ang10Mq1NrDXg(h*kqj=?K49&Fc*^R`6;@WOhy_@fF$@T?@iQUY+#Zu
zM+!|!zBfg<+SbB#<ifN;DOu<4>9(4H#<sz0bY7B-!(z*ecL+*4*xy<PEpl$RT4te7
z1Os!MYh_msY*ggUH0;3jM@v)13y-D&0_)6Oq&7`g(Trc+YlZ5+h+Rhp$3+v`<8I3r
z(c5Y@VJq!@*ZMALc^KzC6j5=Bt?53BWYI=US2oT#TPQjPoUnfhzp}sSF$-zgU@v8<
zib%tAWbe<#2T6*tIV(K)bR{tV0NQWtnI}Y3+Yq<*UWqkCO>gq5>2(Nq7K7iLqW=IR
ziTf4cXvam+w9e)+`yxN|B`|OMP5qYAj-od-6Kf)$RRC}50WMEI30q|&fb+-nB|mtY
z2mb&{Sh^OJpZ1&kExW4Yd#utF)bm6Qt``FQq+F>L{{S6PkBgxxEts2s7EV16NIy&<
ze67<aU>&TZo~kyC4563uNg<<xj1;{UOh5L=?4XyVX;|C(WA<Abn)sSc&C05-)Y=+I
zb=L%Z*<@wDG>n|xJqus@S{jL>(W#q)(e?^D-AU3*X8Be+OPt^w@&HBTlh{5a`yKv;
z41@Fl7c-}6%fCn;C0R*W*0Rj)-3KP5;BmrL<Ud1dB=P7pwjaZ4W3)PL)(mM)W~qx8
zDPygCn7$Nco^8?ur)xyC+C?*YYky==p{8dH0Ywz#HuuVFs<X*LbDBacVLpT`7qAMi
zP;^G%07`V#E^r`T$ateN$;I-e4sv7hX%&vs#PVNf?1}#XP7IF0pnaB(mW(nxkS>+b
zHurE=nwJ^}6FUZ#ad6byy&SoxYcu49s;7;v;9w~w^w`n~1uh>NP1`9LrP=1S{XR}y
z+o-8DHn5Uf2bHz2doFgi>WZ=QIF__q;dZ=IOGutdU=O5)p2h%e-3wI|Q82jV_Et=V
z*4#lKR4nweO&|fdQ+OsMVu}+?`k6mY5f9T`BCugAL#Ju};qCgX8md;u4%V{oAx+|x
zOGYW4LDV{AvPfHFZvit&(3-#;;bZc>DV;klOy)@eu{<j%`eHUma^A?f$toT6d5vu&
zVu*m-{gzgzNt&{!V_0o`uVd8o2S3;u?NRAnIUI6kHB51mR*Bh;>7I&fgG-^gKMPdu
zi-nLK(E*POf1+veLlCnE!k<)+_(h;B;gU>sNbs$DrC}Skvpy`cGW4Uw{@C(QHeT&j
zq`G-YEydFz>BjE4jDE|v4h)O3a+FUs>5T$N3rTPGTUvT2Yz^2+TAE&;U;u_#D_VUS
zjTmLh=uq7=b4bFSCB*LAm20F^`c4Gm%UJCoI1RuA`1Hmz`9iAk;>4C_1q9A54GpkG
zvD-z;nY3Z5MnKVkF0BkOi78}kfHm?Q0u=GmV>c+6*Z|>5IaNw1o3LR?e#%JbyaY^d
zZP5%UHj$ES8Y&@skce$Pf+dzqxwo)Wc}GwqWMFnqCdtL^0>hOHfjK2;<ZR9qbEHuh
z6WKdx@}9ud?o<T=ARJ15+;F7a(3<H0?uRh(BlNGzk~l()%bX{AwjALeM&eG^M$wxl
zNh=$Ghmuzu1Ut)*)dwKZU#to2p4k8xKt>NGO~6{fPU(pqlx9zr89kQ}P~<X0obq_W
zZtmo!5<pCIu!kgSB{JKKBy;YCd+b*St;p0$=UastaVxIhIZ9l>E=m>}A(We3rm)<u
zmEp$0F^;m<WKAO*w<sB!&`Cr-Omd)b-fl`%FgxFjD2>TQ7{>`(zzywm)(T`%Lg!-2
zaY|INNXGMI{{UU5041=b4rzWAFNb2VGsYY8gq8lGy{v~bQ3t1v6cWbF;TH2@We(i?
ziX5!ez|AmsY$iIFZz{|=jcu@?o>qNUvvvm@S>YEPLf0ij>ogAuj;MEKn?oeR$YA2g
zd1V1YWR>Rw2@DcE=K(8`NaAc(%nDNL_D_PHtj|7Fj@my+Q*5Hf3|qT^qLGYXyNC)}
ziG4Pktj4#fy`X^op<5n4Vq}tmeA=o;AJz#)L0c2>3s;b8`t;CAhZFLwI$x+{sd!_Y
zZjMY`L5nvh(dxdf#tMn=?t;^%GC~|t1UbgQ61h21)oBa3l-C<%sT)rz7dQb&D??6l
zP;)}LeGy&GKG0Jh%MWoy!5ojbV5OQkVrATJQz;@%vZdGT6XGA#>t!;gUC#E4B!!Ym
zYc|8lD>q>*8Br8%uo*+hWt`!*A1Y|#WMc2h9#nM|ZD6pni?qX`8&1ZHyyY@U8qsE<
zjZ~7Itsit%JObO~Iq;~h_AZeeex!#18yFFby4O+3G;xan6?I*4zSiXlD6pm*S5_Jb
z1S+X!e6IGKC?5Ab?vVYH*!|dU0xAd=DZ6{zu5NPV`!o)6p?mGZWeBD#lO!${vSGR7
zDkr@C7cyW71v_*t6A0XUC+*rYk+o4Vx7;qFnxsGU-6EZgl^r9Ra8T}zr1lBm-;~!B
z_6i%dp*8kS1YXG;%kqdpq|O3ZnPYOC>jHA577gVa6Jz6$F}Y22rQ8g8P4?V`p`z$m
zXy%RIE1WIaImc>ioC+2iWNtP{Cv!haY=i^K=-Ii*I$<7b>HxD`LWTN`Uml^dAk*W7
zJdlg<p(sK2hgLxOrj*`C5`~q;w?`O=93kh3k!vQ870_LSHdNr^O~ul(p6>T6N-739
zp);CV7mIxWG`x#jpOlVck2hD2)7a5)5Oc&MBqVMuDlHYjTacitk%5F+7a?uF>aMY`
zc_FI!Fu6+5nKCG?l^Tnh;&=-)tH-^r0A*{=p7)!(kAyWwk-4VfdrB0j;Fe_B=CK0>
zU?eX{=^C(NXu77X&_(xv4}KK7TPCG=Yej|Eo#pthO3~5d=Sl4JR>;?|XY8vrA$FS^
zVKYyfN5%oUPp)wh=EA{wDiVv?=t`eP2dM5I;d5n_m7{T5o}-fQH(7}d$pgyji#Zx1
zX!l$qqG=<PFh1jiZ7FT8Qvrx#Je25IJwOf-FML8ia)$K)lHnTzMyEk(7B~7WWD>co
z0c3i1Ti9aDTL1-@vggY7c41m35^hgx1BWPb2;i=YM+0o6vd$kw<|N4*w5N%2oF>RY
z`9w-+fZF`017UEZEIYCHPTD~npy<hpU5lg!{nBmi@}z4B?3Y7WoQ&|BbJ<8hw{;N$
z`9uS+j#9LMka1*yXN1NjIc_kZe$jh7Dbf?dir00&vRWF27b5(mEf>v{n}8f985@so
zRyB`nZZqLBKzZz>ZLM;c^M3hR0rW!VmlfWhkfaynr34HkWax-ToY_d$TQ^Pw906pd
zruPWhMMN^RlgYQ$Bw@hZID)z4f<^3~3wM1HPe5rlNq5@UQAxNEMtq_}EoIJVwnE97
z$LNMBv+iyYP_mjscQhfM*8c$bR{`LyLHO+!Uy!Ac`)&15RO!ubTI->=IAl153+w7w
z@6;@THwJ{MhDf-%`Y0mxL#|kCjE=O*M)rbK=2*xWL=?~~80-=XS2dtn8ppz0o>w{u
z-qU2ZGLc&1-sM2|km3TeG$p{3!e{z%zdZR&m>E_cZ)=i^rghH(=)<DQTeu7;B&B^d
z+~$$;i;0xdV&t3!D=Y?3pP6l!3XtNHi)Fc{8cq$6(wh|M<ObOZB?HL1n@uwDsu;)S
z*TQ)1Y@v%y@T3O76LnOMdAeZ@InFGcLGp(ri+rgWCGlf$g)v*PuZtJuK{E?mn<Bt-
zfo^VxsAPZ<$VCCY6_UNJCgDB@MqOZY;XTo`;EOJXlr`6B7xJBH2+7*(WE<H`*IZo3
z&&rLFhKz+g8*Xk^Y&0>z9@bs6+rdQ=%W$Ec!Kd5dDX4+NkfNLP8*--(xyeZ2OL39@
zRw-pfra_F5mX22!k&7dp9_!tz2&qAq_aososweCzkGNAeDmd5~i-L(`E<TD)otTLB
z;`}DOUxC7Wt#_LtoaeNbpWOt;oeg-&vgW?nDZrD;=C<cNB1Pzxjt1FK);P7evXn*c
zP}Q;Q&nbZ9%IRMqz5yRpwC`~z1TLJm<PbuADPcATDg6<BlQd^MDFemDni2+rFy+OD
z*h<jplQ6K05n{N2b9*S`Yq;e~1~M#CRTNYv-}{qX*8`h<mpFLEly5HVaG5f4LY^#`
z{oRgI9|Wf{jw1b*GDLphdAg2Vf;*zN_AM!oU@br41jgdP1BVV5vQ{=C?A$5;04*NV
zwB;jd$Z#Nws;!Zdrb`rHWIG>KJ3!{?7|_cM8+KCeVX@h7qMVCC=waga7fj?4-9F4G
z4j}xfq_ypIqu8Vjl-_vcc~Q7>L(kBzyN4-&J<jc5xuhJ}fD~rt<GNkh<cuLedL^?-
zu>I4EdxaYvk>N<wV|((5EPEVUar;?J*>Q5vh7wp<fSg^A2s9K)DU5?*Vo)_3UE}Cf
z&wn8gAr}a%LF|?w;TN^RIj)d6ZjSium6W^LcE4#UL={XpAca)ygC=9)*=ZST`AFEH
zep>DnbNZWX_WjW8__+EhwPj<_Td9X2g$v?qZ=8<_80Ue99C=*pmu@_vvC<fB4X{!Z
zkM5oB36H@!L?<+#-Enu6*2pj{k-!ox>tnKG5;WjlJU9m1ZPWlcqTqs%mtTavnu)+~
zJSXivh$vv<Im&Y!d0C)QG2+Bsb;pmbk~56EDZ!@vTp&6cLtVl9BrF}mk*ycb0!J|1
z?KoP)NN=J5vs{!h;@P<=GA;<ZdtOH$-3uCqxV!^)lqAn^b{txM5zcunw{#5R<ekFl
z;!b@7nu><v;lsgPCt?2pau5Fig+(h}d)ObMV0P1D2>PnhIPKVJ*z0;h*7;IL$8frq
zP+RWUN7E>#>~I5NA55uBM@#|kSA5w@=-PivoAgZEV_;A&gzs~byB5mp8<duH?UjRL
zg|Ctd>oE2s<uLQ*AvPFTS|l;}eZpyD$1J$=o4(*&B@g#u%La!=`wNUGi8Jm1f}#T$
zO2cJ^qFc0qac>Kp#+KgdFzfTmQ0^`QU{S%1JmDt8{G<>QgNM-|b;${Aailn3%4O_S
zh1`_WZ-SW<8GDodQvCwp+nd=hwBsuU33l4X={yUkZ6^Z7G>mYv3B&*{Mm(ll`by#m
z9xvG;2jyWzb6w#zt{@A76Tv(M+2D&Nk4EjC>SpHlT<0|K>lBV>i+xm5G>>pOSs^AQ
zj*{e9IjB=4MfQAFx5DY4BW`S?6&~PS{nZjVX35?u-Il)IFNCb#!-pTQDhIkZi<W-H
zHGl_QlDK>)M>8y2Bk&$U3OceJ+yiSU<9op56!|2J(*fbY`3Q`dC9T7XP)Ii->R&)O
zU5^eP6HIc95ri1=9LX#!aHMR4!s6qy9^@Q^=KS3wiB%w*2LpFo>Y8D`K)=yPd*t^{
z7yeR0N1~|+SOK;2xD4e#CkG*Qz7VmJ63w?G_DDu}PPP|qAYX(mG&0?n3xmnJeVkqT
zf%_zL2p6$N!BjL}-d7fj4#hc!{EiaYq<o^-2s3lv!s0XZQx*$g*)hy<`C7q5M#ujE
zDWqQZvX#T?m;mjBY}7Q|9ul9hN;n<T8*^?Ev0WX<IY>p#?r@gZu@+smz~61cAfX8P
zP22JUc)kAsxm-R_84;U;MhfBOJlOMZx<W8)v4-(`SgyG6y1<NfNO6=b%?q~q;P+i(
zaFW(-k3Ut!+ZjYDGoCUBg~to7Ja$~xhdRR-N;QdN^+-+zGN&}o0`~{#qcKR_?YhZ<
zv4mTc(e$!;zi?MLG=+g<J`+jJte!`NmOQ2xv7-0F?cesL{^>oa*b(pgR=WsrZt#BV
zPf4gUNbk5?#n;YSZmU?$Lt~ua1FXG!rE5#+L2<dTUd}1Gt2_zCBHySU3{Ex+&g=C8
z%Et#CtqWh&70nSlbNeqL>g_<fX9maszhxZL<Fb%eTx%Np9Mc2@x!vrubHeFdWqwIf
z=*{&{!Sl+ymL@Woi)DFvWo*1vBO_WpH(YYH9Tia{CSys*m7lL?@oYP-hd^nLsgbTA
z71iQfdMA>SJzu9Pp4K$5o))T~RFR_31yuCrkLg6yVo%DtnuN8O#uukA)f~NpR_X+@
z;n`J^SIFmC#Ql`jl+I~3C^kj6F0foOadO#3(PO1dOrR5Bwc2!z3>$l|K7C|#?#qBz
zS{||{aBk}X<ytu-(lu9R)y(x<eo)hmjkWBX7NZkm%iH^^9e-Vd29xT5KC7EInU5Zu
zGEIrp8oV?#?)PPQr&jCVn$!sOJ-5mu@dvCUA?%Jo=W)vOMom3z{-fMTC2`Bll(!P<
zG`4yso7B-jz{o*1?iHL}K_sUyIqbatot~V2-c^MRrMD#Ad45-umR`dgR<vogJwQF5
ztDeD7Iw35Z-E5xxrpZ!mY=Dv(g@LvHS1tuK`7z!mkVB$mZN2OQ%=HypY*`T6K<4V=
zzO(pcjpyNHwSxCu?;w0HN)mE3an{V$d&{44Zf=2d+|%tgMb)?$9_T3#!tIGhiS+3Y
zt_dXPy7f+o)M;rV5>!pJ0mqf(krD_a1z1NtL)sg?)>?e3qUfBl^6d64Q?8(pww{pt
zcq-dM)}R#rtj`;W?z~Eg&SZhWXX>?jEbeof=iS}{j9bGOTW{IEA4j3;+KcO$SqR$0
z%ZcS-HOfo5-jMo|w6vy4*Z~_yU=wTT+Ssl|hsyI_Y4ZJ<(+o)?&LxfUJmB)JG-{cc
z;CLv?x>h<<wV<V^rP@Z|FX448wy4h)nq4ndd~pLKj~G*G8tjjZw)<MDV1fHVvSn0G
zEw*fgrO8pFiYS_&Sdo+6r|7O3u2st&pEkz#vd2_S9XYumyTDPhs(D69Xettf-j_g@
zBv|X!?R(rB;^$wLFGf{*Re-qnx~6qJlekzFYopT11H-nSRbw78q$IKZ9@n621V+}h
zfEJoPS&WZ!<R7~6{X0;S1`l`H8vSYHd!L2o=J7Jkj|Eyi3sBd6LR%ZL@Kt~MnQQLj
ze~YYiTAcFYHkBxJ)-H9)T^PJ6#v)EOY~t5sHfvpfx*?jy&%Q;6h*UiHR}@rJJPVSk
z{uWo*B57Hw7aK6$T2NGyK`u90`dUqv#mcj#+|I<2@R}Y3mq@2HX`+<5qUA+a>oB;I
zg{6`}E=SouR!cwX!+a}8!IRTL=M+*`O!qkLHwvP!*N|<Er2MU6pbo{8*`<U0pf2oQ
z1Yy}JX1<I)Jp|kLI1+BIXz6D*83W;I<I>pP!}e1$k*weVt1lJ|PHdokAq~kS_*L~(
zuiQghpM|t#6JOfssI<6`EFZFq@v+0OTW6iYLsH}VO_k1{rcGgXkhW22(6{*lDmrEX
zV9<<Vi_#lrRhnzVZtH~;s0)t;Yi5Ow2X&Qvj)*$K#Z_X*KR~vMHtDwj0d!?1oY;si
z3dxU*By`dCvVZaMtxz1~MCLWEun0M#bDeZ~nV$+NXN|Wv3w#*O$$=Kg1)6LV9ZMtm
zI8utZ$*@z3mhHmN<A<Q8*<CK5ju7tCS~zO9eM3(Oc`5-mSxyq@JX-9mcAnBWxKE2q
zX>h=@EXqma3V3D!T$CMFk&xPbF{~cY0aJ}Bm$?d7*2KY*3W|MB=FAJ8P~`e5ogj!P
zV_~@h%1NS#4Xps68B+NUO^4M@3*6&tl9&8s!OVhsCOYH<IHY48dn;KS8s67JNxA$k
zjChhlIWwYoV6#GGtTLZ*zrsNq&o@sEb-q<&1cYsj6!Eu^oY>+Agwn|g=E>}h-PIdl
zpoSR076DHinm7n%$6;bpl0fj6iVcOAH6bF{Lbcy@ASb$HEe<WYN+U=Ok19quUh7x~
zHXxDFo);NFQM#Z7tZF5WFy2a(I0ONlUzNh30hG3CEFCEw@R{o8lmVQ(h2E(^)L4l?
z9HzRUpoE6rQ<^s%m7Akggb7LVoaswKi*RV{gs7=&d!fk<#4yZn%0o5#s?k!{a8vzJ
zYm{u%8S7;sn;AhmTkxZFhl|~7HBn$H1@Kc{I6xP=$%adJLd`{xoOw!WK2>L{@{`ri
zD{?m)Eg3d)RK{Q$sl@j0l!m19y9p$$Wunx`9C=9hT~vy&4X<@8YF_*_VM)0zhe>-S
znbthrN9x&eiO$QeRBmAhg!brK9%duDh4Yi0$&wo(-5>`klLLrft9}x-<qF9K$Au`7
zw&iX{qDMTW^=;im;$534o?bZ^LCqVB3H5xGj+Y28RF3P6w?~j@EI-Lh>RARR1HIHz
zRa=4(axr2aIVCam4Q?(KOqFgt6ctTF{{WWcsI_dYSJ9v~4Du8c)E0~?sxv#y$Tmm1
z5=Xe&>DGhsuz7173Ce@>GQHU05c+1^o>N&1gRx+TB9X+2poz}?M#!ed#`Bd7LugMY
z!CJ>rNR$?i08ZWB>J8cOxH}g@#-eT3365~J(qyEOj@gvFk~WI%T0j_91E}g;8smI$
zwmQ?C&_OE)uRb!@ZaH1vJyFA-Y{Khxmw6Xf9S2lhTpAB0Q0v8|@7aNMKSIdisK;Z=
zlICRLrhOOFjP)RG$l+*UrUQno??_1#DB52jy_L;QtsG*}xO}f0EN0%0*wJcfqHK4O
z!Bp26gU_dBSw6Js9ks5yo|5xe$l?K9yk{3>QdBk4J-BVuPKtR+y}<ca?QJ_7d>@n@
zbzDpa)>p@tZS4WU0e)UM&E1lcN!r1HhL*6%@)>ebG_;0KbcVrpDK?2T4C&>W+gQ@3
zhJnxbN`A`0u)_;|w*LT?6tzr=q}?Q@{RJx+DOni60S{9Bjr~dq^)g&TP_tDxX)fg_
zDcEToUik^lf|JvYt-Zl2rlPdmi148N%%}A@l|>myR?-ctEe_=l+K|&=Q1Us??o?iz
zk0#5ZB5jsJrsI^YkPc1Iku-$)9ksSWnF~=k7`h#j?ssyN(|oSu3TDBuUd3eVvlG*`
zt|I8zAz^L#RgH7nZUP`rD@HG5kNOBi%>#j8fSLPA7fDe(uH=xSxjdB7(X3G}Qb{?r
zh1YEWt|7eI$*c_#2_1Ws$Ik97r7g-$pZ2A53W?Fk<zYn`l#8Bws{OAR0HgHdGhO-(
zys1wo5t6XC&=S&ap=}Gxt$ZsZR^~F!V7<G91e%DA*LNQZQJzLSQADxm+r{s6@AT%v
zZ-AjaOe1dC;@$FspIM%AZ+83yB=T6vK(+K^+mtOsA!x;wQ|jsu1pRJ<nx>$V3-+x|
zg*1z49UgLrmCOR@C|vGb;!o8p-U?+CHa1C`$9!Emy0c*!I8iyRamY`LOKm~Jeu&Bu
zTWm#<u7|&<1&cr^Ni{c3e!#0C)2<D_rH?2&x)Dur?H@p|;zJze_DeQdBnoCHl2Z(z
zAEI+ZORP$B-~=0Rz1T)E=<??`F2roj?w(9;2M9?ZaL71Nm%24eu_z*V80(<jNE-X&
z_EX0=cXcD3xtAANnl?uq#sO=90v}MXYvXXe$`e$T%xPJ=y61vJiCnobLPtb1NdxO{
z^&})JLm!oAJxg8<&QMZW#^bu+%a4Q6(~f+BT-@L$jqMg`MF@rbpOoVe+iNJ<O8_o^
za#2(<I!9Y2bdg-GFG^`fpo6rL-3dyOlCo_M2e5)~Wv!)o^z526lN4a>uup-T1z
zWjkkN6(P<SJ;LUI61d#pE^W_*N~SM<QWBIDqx7s6F{eF~uW-7+WplBVSd9wT0mw>T
zJK+s0oK6aBTz;QKC=F0U-rFd52jczGkVpWWq!De+))kKy11`GY@J<l*4=g<WRB=mp
zbNeE;1pdQ$YKq0aQ-j9akVaD;{{a600wbm?h&H-wTEOeyAx7hs%y-JbY%RG7j%RRF
zp~%Mx<*q41dLi53<s+jxxl)+iEJ-0pDcgmZs9-x>E{cf8c_9XFQ%F6J2m~UjvEJZ>
z*g?1*lmHv|M8GW2KV(<XQYR%LEw)nRjx3^=83>`+j~8{)ZB1r*IZw{qITpa5p{@t)
zg_XC)5idAH$PLaATQeHQ+l3=d!5x%L+z;t0QSuFuqao~Rwh2n<CT|YM%2o@DE`5Q@
z#&JxK^R*c7^hHNpMXu5ZlraOsa2FN<8yDiT-k({3HqWw>ddfP65J1YHbS*rD#=~#Y
z;y&rGM5Tl#s){F)SU|tZ4q8{RV(I7995~@V8jE4)?v&hU4)V8#xpA6M?6lcjG4K|H
za1sMgzQ=9Wu&Fdvwx|!*3rc&cSV!srtA|n1&fGL1XVD|J=3FhYT)7qAt^3_8CHYgk
zN_1_$@}YGrw{xGBxf+=EO!1bI63I~K3lf@XCk*Uu;SEsP8G;K?O)$G2>pYC9;)wHq
z?yF;a+xm$pxauq{QEVNA$s2<XQ(E%X6qN+F!}q#i5;?aW)<blIqI+B{S3Ea8$_a)>
z{-AB;D3s@s^+tinp8(h{dxKkhs05igNhF@bbOy3V)Uv@x>c-$mHYi=e!zxN<H*p2u
zRCv%is|aM7$wbEc3=w4j5#J65$^Oy7NhEaRm)S9v<BO<dvy+-qy{#tqN|g;KWNi$+
zxK071AmuVf;^5^obF7)7clJ&R$8{A|$OQIIjpp7Ib%fgp2SAdxHv%tjs$?-V5<y8L
zFMAcxF~HjQPKh<K{^5{Hnm<st$Ve^4lh{j5g2AF#fgQL~?{9?@Wp)Bh!NlDF4wr9k
zQ17@nDo#f!gcJV&lqfbscV8n5n)hD?KEz(jfWPvEnU$tX9IoyGNl<q(;|9qr-vu&a
z?WV@aF3Q@VTfQ@J;d`etpoaomf1(;^I0JPQZyT~mD(X5pr1o90(Yd!K#HGcohlGcQ
z`>s(1fDB&BQZI~01k)Juo*QAwO)bd*)=F8T7XmxsGv~5<!@=hYGV1^cx5{E|9cz<f
zLQpPpS2Th-OP`A@204*Djl(wVoEYFNMih}u8)0k!iH-4)G78C)Xbd#@vR$X@iKuAU
z3r19JHWni5SkOckvB*$P%N$`HV0$6z8<CFadn(c=fRMrRrEA@BoBdQ#f$58Kp1?`v
zStF6Xom%2qYg-60v?D6V@WB1hmLnj9lI*lP9Bpn*lWZ+;<hBGJK}>KW<Yg&DIqf4C
zP&)qrboP=nV!GGtiVGld?`tFi{%)uAn&WNON%?nQo1<VD%kT};i7Sk5W4K&-;VUvj
zNg(#RKy92KDaEG#R|feA*vSuwHNf1dcHH}2l@kEqDMLv-p<_^?(llowG0q_O1v_)H
ze0-)jo!KQ|s~#Lk!?2nTasoi&FL0a)Az{vNAaaCwYsvR*MmfgW$W`@QZ-Hd-A(7~0
zu|1h-xcDj{U%TAQsL!a=x;K&VxwUgO-uCWQIUixr06+i$ie=luvJxqqC>CgGL^QZ}
z!i<ibT@r32`TC~2CyOUEf-P%(7h|!yQsTtT*S}=%M4Vkl!?&?gwor0SmS$*Uppx60
zXMGBV>~KEjk@iK04};+{cb%3F$Am3_8LheO6232O@R80WdzvngmktUh*};#%%8)hI
z=IN}J;@8cS+cOEva*d0zrMbvTKqKh6uWkPTSMHqV;E`grj36H!ms=SY`Au`22MGj#
zix5^Yqz^evb4Bx&C$x@N5#x_2^eZ7PHo+q)HxTPtOhzy+n0qXkqgp}ol$_zozyL<?
z?3egtkhP56krLyRl#U|()P^%_HRJD;$1&iL;dQJQHskJ>@07z}>l`H)0{8yu&1X30
zvSfsT<vj7ihCqT6TOgE-l7+*c?+rgxQ`l^CVxVI!C5ghMPF#XMorGP!-=apw@NnRM
zp%CbMxBD(*9u9NyWmA&Iv^X0UAFc3~OOax1re`1);dJ{z!5>A3h&Iq2?ZHwuSGT>_
zU6&lC0jGm>t(A&aI84`mrUIHn3+~Zx0VS=3yFy0FsE9!g$XqXE>$#^6C*tdY@)EXD
zDix<5S7QGFE1PdNN(OLlkf@;c{g)HuCBK!{zHYIECB9O&z<#9HXO8KFSmyUx0g_mo
z;|qm{!a*j`013iIo?1SsiLnW9-7pdTMN74g$UkKp+UsDfwqdTw7EN?_;N@}L1&BYg
zPf#A^Zj3a>LT!#kxJq8|Z+*cild*5z6e~ny9n+fYUgW3VGtLLmHTwa<DA)xA5HOnH
z4XwxgrtSpZ>DkEz0O;#l#U;Sz<gU2~{#O?Rk`ow1VtcM|xbl=Ab^9d6?ZOr{4RcMg
zl+p^4_~*K7k7P_T___YcL#>_{9G)x}SQE-oNd-f|7jP-!rQO1VYUC)vKCCYu;4YeB
zh4}{9;33=qCjoHW1%XHX0ogODoG-P&g$u3;Z-l<1?P64JB%GqJ*tF5a-6yx<C?m2<
z{{Y;W)NHlgJ~~RW@X!E05t?67GL|6MJT}1{)wIoQ50Y2=yj^(LP*qhnrQxy`uwM(N
zK4$7CpDz`~TQ~hz)|C4TTPEY;>&~jRX=|!?I}Im=Pbro8Cvoyrv@po&TVQW>Hzy~y
z1sYmL=clFiw1Imb7K&T?ChD7|Xq<ME-|VznlwO@PfaP<|8?zf<C>3G9E7d;>n$3~i
z4p)>*OC#&ITY|kapd4w#2_y_IpBjG~*({NA==uXhjz2}DSm6_>M!^{(%O|C4?1~`P
zxL<_*L#SF~JEQ~6)ie2;(6PWSr7UsY=Ibl0>y-5Ea4!Il9hG-e^$Uv}BXaWHb5xn{
zaeS_Gk6^sTlO&$BbSx2$*{syMls<bk#E$79>zZ9PmweltJ1;V-s+r6rIDzn}s^oj0
zv|Qa*F`D*iLM-+g-^Ir~dUWKE1eKQ8y85!FGrD7Q@~|xuWHcQ7E);bVy5{Ei7)Y>V
zi?^_-eFe*@&0A4-xyI+Z)M)RHID?<c&CqEwhXb_ytsNGdD;f-k+wzV_7O4k=eU_2S
z>k+phS<%uxzyJ-^eIwz5*6qr&hgA)2nBAkzxm+1z{{V_Qam6hXnjM!eHu&<QFgeF)
z!j4TsNhGisJ?@R6YvdyYsU;=ZR-z3p3t1U)$ypAfX&c%BBK?=6%R>2Mv1$4$YR;UN
zXIwD4>bUZ|*(t?Vk0+^yP1mv?^6z(L>6JYzC?xuL`XS-zXP4X4H~KF4X0$=Xz(Yj)
z?jpe%9W;Oqv68(ihoZ~v>M(xF=AWXPT0ew-!ACcn9DS6AK1Y*MQb-?n3k9aq3s@VA
zeU{E{jN0G!$O<_6PC)IUqy%y0S>vNhJbNqS)tOHXngg6XAS!hVs<#jWnm&tJPto8T
zmf!5Gpy^fti0*vZ72#X6e6+NA^iWLaS&^4Go>k_Lpwvw8=?2^UExiv-F@%2(=jgPW
zE`)b9mH-uH;=0hEDU#E=S<YY{nKtsfROv@HJM06>^_p5rN@(mrE<oySWR2R^0)C27
z@pf)>cnyC`$l1-9P0E&wrX(&GX#>TVuRB9zuP%E(vO1GNg`gdS_Fb{@)l(+s&oHFv
zgJ3;B?5ttwt)mhD0A=Zo(_oFiqy(m#5G}M6>jpF{oSElCryNJ=KeCbznBMSAcOh@g
z48H>3MJzBd8{sz?FGfw#l%eUpt;>J1uy0PZb_A_uJZ%l^i;4z5!og>f5dw>5LZ3im
zNWizzS<~rpuvoQe<DqT1OrDr9U@1Q;Hb2J7XsBXo$Wz5j5I3++oQTOJq0LL2>o<jX
z%`_yVLGeVvz*82s*cL)S_gGy@ALTbBEfcYW!jL(jc0xL1YYUYF-7}5>30_1VC4;4C
z9NjZ`JmFWF9^ce*qmr(|$XIB+rj>(}V2U-dv{(`KSjlw>1{&qjRLuK(kKICW=Eqt!
z=Dsn@lyYk9Xd$^-(C3kD#GfgyHW?|SiYWohVfC7nvl0Q?)H^3F$v?UQ^$iBYC3JFc
zc2yEfpgr~;YF_RR6HKx=*k9_R4`|0FE2i4iTQVi}90%${%<@kvH&1htk&-dTC2q`1
z6AkWEyS9v!&HmgbmjW`Uk_vr|7sPv{al=<e!}67dw--`+jRUYv98rqU9Geg}**Q_V
z_sLE(G@eJ*G14&q05DHT0%V23q>+W*t9ZI|W{tTeZ5S#D@tzSO+Xb33fE7&wz^4kf
zTlFoVQw*_jyNM~+1B4If8+!t$fyP6Q5wsFp=ajpGWbJbqbzJ(ruG&!Kj9Hfp;W@4y
z)nh7w#nj@UZCcD3B!DO#DJKdSN?vhv=5dv|8i`usJEw^da!a=tOcM|4Ta_Av%-Boo
zSSq<{*ujDnVz6>n<QgpBId>eUw3063tA%54&62vcpcA<Z1u*A0UkihQ!;Td!`kO(p
zDgmmrXL1fkqfNb`wh7U+JmleKTdg#IHh!wdOw`*W#mbEGIE<2JjtXE$!j#gG+kjM5
zRq!>VbHX9oj3u}sanHz|XsX7F>hk#5c7;hZW_zwq6{e-AL~bq>6;`6bfK+hj%PH*^
zc;ccG*NE^+Q&itLR8!ZINf#(b*F11ntevBkqf_~&fqmcIAghl2tf8%t=W#!Djj5R7
z8wDESQrBM2?3=g~<x$Yc@<DOJyr*<xKP7X|D@=6~IVIcA3J2BzYzVrKRh_MA7ze_n
zlA!Lr?o+}}Kzc6!05&-!DCDmfwbdMzF1ILiGu&@;Wl$Hwy_d;WbT!f9?h6#@9oVPA
zQ1I|Cg*nBuCVEsAQ9Yw-il(9_w36VmRQiM1!IDZzswbb95Ih8&S{~79S*S1)8<YvF
zE;lGAvF#ThbpxMcVpCD9w{2(#l=!RKU2EY{Iqq|;(0<9TZ9`k_1R(l1vtLhD7TcEu
z+N!9neZgbnePK5B3Mwe)f9iQE9~_(PrmLdTN|57VaJh~y%7zL@V)rV-2m^Uf@yqOL
z1$OIUFvBCxRe=$-UkbZXuVgGX3rbEXXyQ$hG6uKxl`L>YdypMvmKwCPRP7hF)`w1%
zmJP?1vB}G2IH>47yIS9903>sX9n(vJ;W%Vire;DLoP^xnNH(r6U^y!wjm?rAC3DAR
z8{W~~Z3^8SPE+GIBI*+0auZ!EW8|e`IhJt%nO9R!3l8Utg;6bRkM^?X=&JQWQ05Zn
zZ5Hy8LAE26ARejKVHax%y7T>7q{trP?5k~J2gxx4?mkMamrs$+H_G(z<Kq*LCQD{3
zRRzvCQRp+8YOwFqo>roxM=#-p2mXZS$OswwCYCnDQ}%i{OzQjT+BXtxugB&pe1@!V
zNYi>255L`d6$L~sj0+3da8Dl>v#JxcM@L3kVs1_OR!w+_a)YU^YeBV;jC|Ekvl?uo
z)s-w|thlhbLl|b9+}s3x4xO|ING^U+Zw!s8G=|w*Pf6+X$|T9@x00c%t7Chrn!5MA
z?T^ZJYz?Bqs<aFHkS0gWd)W-ux!(Ct*>tsSXSJP^aW#^?fr96hB#e?n#hQtv-7|xn
z5%WW6uWKZ3yElCq=~?OC>IS%z#u3#_Yn)V3!aD_2)mWRcB5v*)Nkj@soG#e@>eol3
zW1Q09GPG`nik=(D_`m^8=caBAm^mVnBkmSXV?&NgFJGyKNjB4qi`wB<!xcl#n9{SF
zXvtG7;%sdexK4kiZbBL@HmSpN!<1DN@<vVWKI$tPlm10HHRvb!H^(W>*l~-hSNguD
z39=#wKR)7{;cM8peuJitGB`p=zyT@2z+}7kDmTo)F_Nhm*RwvzZ09<`6BIW&x`mPp
z-A>8&j0BVA=w%!1Dk>(tX5VyuE|(EL;1xO4Ums!jO5Iwi*$xBfxTdp9NUDqxtA|OY
zXuGzjOHW4&O`O28f9kbmzwRNbYicAO`AV1gd7HN()Z)5DwyjkS$c*0J6%>KbKUE8A
z2!2s8PR9@~3iPq@#TsWk<0(6$2S9nTO4f#>Uiiy#WDLaI*d|j`0)&v+r2tqVTGvSa
zFr;%gJKR&)Ht}R>A)WdpWJhhRn<PBAk!9Q6+1N~x<-*&N)4c)dY>m$hcGYjCRkAx0
z0;7?ma+V`yrH7iPCo0-ClWNiWL^jJcs?6z$AxRb7GNY?#4ZWA6;P~;xtsI_4M=dg(
zyJNDXWm|7+i>NB{P$j{><>}p=we(!Nb{3Qr#gFcSbeHe@6tR-yd;OC15Qw9(xG1V{
zcy)>zHxbH|I9s2hJ7BGnSJG3yGEKg#2d~q$k0Ldu)astrkRQUz>NN%A-AY!6RLuO_
z_u}Orr%=f-7`@a_v6x|RdN)dvswV7?_wQxq`FRv0Z0Ygi$<ddSOp$~1l>?~cZY;g7
zo1m&H+6j!?;aJoD7<+E`^YRyy{(KSK@ckYK4GY~U8%WQE=v^mI6*OaU&6c}W=s4)(
zE^J^BIkL_g8ENG#z6Wb3hm#!Yq6LY^Y_y(MJZ)+UNLq3fl<c*y$|GPcT^|~ud9=!x
zus7<E0F9cS=K&At7V~?gsxJvy9g-<aY?-$=K(Av`IQFt}7))^ctP&^Z9g;Kw&na9J
zcUXKT10GL>z>+RWOg`l!M+rg1h3qdLZhNkZp2qhXQaBL1b&e7L06=lE{{WXDV5nai
zX~|QGyBB@ZKF=3JVl+ZoaeOF?4`m~bxXrM+jyLkLiDJOHx{%CTG1*0TAN(lfeVRul
zV-h-{-V+}3;c^g;bIHPdd-jVW=qPsQ6Tk{aw2)7Q9@BArDdLO{=osN^i&&|cL9w-y
z3j=fAIfp9@iMt!9rQtmAnImpFOd18<ZWQb{Z`np;&Hn)5J(mNJ7GM`>IXAkE;?5w2
zFJqf1C3U}<V?B+#Zfu<0rr1$1f_YOlpzv^uW<<;lAta0s7P{tJ%5&TR!ALm>h>MG-
zvjkr$OUcMc0VJDpn0TRGZt6E${3LN8<srE!BQzw9?{qua@QEbxWX-N|BFU2{D3G<j
z-s^*YP7y4OZMjjsg8u;B8zkZ^PMMiwfgTZ&*Ur|B%_MvjBx1)Za0P|`0CXJ997rj(
zkx0@Xxu@kYm`MF$K+{ehOs=)lOmH~evb2N7QgT*lMWD##g1~QXJe23fPa{3sOHXx8
zQ4sY=?R6MzjTn2sbjm1A(P-)#NB*3BN{U?@arOd&WYf2Yl6<Q=EoNw18uo4-{!^&0
zV%tT0noQBV0Wr}}5dA0jS_kXYuV&Z82iaFuY827~W{jn1Dn)UYU_VX4T*Gj8GTBo}
zJb1t%OHLtu&wrG9GXo+k_)t|IY;F$<&Pp~u`$f>R=?{J*bH)7SYXMjpE1S8!(!ggA
z%TLO_rO@g<8wY=6uF>a=5>5WfioJ=+qN$D@$0~O1upN+f9;{Niq#xNZRJztJu}b58
z7L4ey-p2m`HHuGMXWXmI#o0Jb4`>+U${Y;yGQdr9gLS~0=en<Kp6s4f?UA4ipQ<hZ
z`E7=^#}^5eM3A6t!uJliP}NLH8%ka!K19hRHf};#2(`IPxpy}L$ck9*3AMs5Iu<gv
zH@^vcr3^PKwvaH8s~j9WCfpwONEva$iOnr`7Dz_ILk+OFgTV*(L+>r%;VWt%Y~J7D
zH3;O#Il-qZuz9kAM;CX#QWAJU#4150rs_FEgDgT=%Zo-%Kf0fBEwh<)scf&JsIb1~
z*-;oBxM5l{2Ah)74{RtL&9Yl@{gvW!&AviY#P-;p5s|o#RD3iWf|Z8@<xWVn7(-mb
zE<)!9g%<+%1t#HO9ebss+=&Dw{{W!nLoFnr5J6H0S>D$t3W=NE>rkzM2;SS=9v2MY
ziz8oF*G5Cw+mXr<^Ea0;{8?Z&IimK#x_;lEqGKk6j5v>~dt`3hI2C}!8?A?*x<cm+
zoTmph$A!Yyw+jyxBOT4|nIR<J{nVfjBFY&B&Bk(sdn)RJ*=I0ZWj(Q*;F~5w2FoAa
zNYRj5Y^@%SH>NVQA53n|kV4kvkE%Mg&oPbMeN}siHsa|X%fhI52K<7hz#pdn07N@n
zdwrDgy7)LLS{-a%tlPm&bYq_$6uYo{sNG^MU=MYMX_0f^?zjsa9($!ATalE~F?(GX
zv1m|8Cm{a-l^llo1O)bhyBNQe`6Fp0plb#_mjnL*-P6oOSc19HkOkHqF$Q}lw3EO{
z8by<cuvm1_#E@@f;Op|xLQEXpAOq+;tT6jA+?y_JV%&rDOb5V94||n`p&Sm|+WrtV
z1QVPUVB&0V-2+ftyCG5paxDQr2aEj@Mp{n^(gqhC*!-rkru~Yqqm$TuFpS#P2%k(2
z97+lhM<U3$$O9jB868k#tZ%_cP5U2|`=2SU8%K1MTaeBVE3MqFx$fJ9+qUZsV%&^^
zmCtb&B-thJ;W!as2)fiQp_cP(q`q>c+Rrvk+C~Oevslra3t4e!&M#%wx4~VXluS3<
z-Ep|#$xE5Rx9qrvk?lEH79f0p0lOX3gMoF6LT1-+lYzloK}?ds_aP|U0k%_G{{ST~
ze}#a@8<wOtzEse{Wo??_e+#6hk-6GRVQnHf;}34zi-FvxNdv|}xJves`mPFY_p|i9
z!3}|to#V({*&p=*N@sEXO>4f^P2C9w;Iyqm+alZ??iU+<JT4Z!g6oeTbjV@30VVHy
zVLx#Oz~jPD<`PSqI7C(rAOvy`{3b&P-*bRevoZ%9KV!VzbWzM5{5e|T@|iQ5b?jr}
z&#;U9C1H_+CjS6cE8Ow=;<)k?1K3F$oZo^jo-E~*b}Js;)-3&#Dnw<wnn_Z(ZU_MV
z3LdHL`2{zzlA;$j{{RIb4i>h2C$ZOUw<lPTm6wVc>N%s_)xuUgy^3)b7Pr|=Oweu|
z&_@b%P>XAZK)O&!b%;cW7zNr3d|0F~yZK0W!d8kV58PpQ-Ad@52fdE_CYal7I>-%V
zcOc~9I`}-<F4tSiWxU*ctzjHU7xK80MY%{p#f{ezTHN6aG8*nlN#BLT+-^cogvcF=
z4T-U`UG53J`TL}C01FgsR)vwp)*X`zZ^-bL_|3k{yN>9ABdi8jID$Ja=Y-r7V}t;9
z&|CVlqI(^DDT_hEMzEXvtc{A(1tH_M5{U@-L^+Seh5m{+GydBwWfmZmcU)fEbJ;P`
zixh%0i!5RH?wlQ)l-po<N*X}No))mH6u2$~rr6kK$q&}+Fs8?DB{#B6+x(>&;cGG1
z$6&adjHDyyDGoc|<zP_z+ZVVikJ{;-!CWqTqJTTK?VqYol$Y#CU4F=dgy7iWb%)RF
zlw_o`)+w{<8n;Ltxz3T~{>u|rrOP|Z-WQ-xM^6|ek-Pk=`6GlIy4>)*f0}-VP*1ZN
z4^KJvI~9!&PkL_zv%iI?gt5Q|FnC3<!wyLfcYvBX@_QCgf*YgJHl7=n*!fWEvNX6x
z&vE!g56snJmyL(IDw9kMHx1nG<g2eLPqUs_m!h9d(l@`<k(L&^(b6^=MzoV*ZpkN%
zK+F$tRMk}yx#f)x$>z&E*=MMsR3f`C<<~<8rx4GQf~eJ{b8{hcyaW{m1oZ?Rqy=|R
zqc%3(?aF`o64=!fDX7g;IVH|>M_{QZrg_P2{uiLTL=wN+%z05w)5CA+%A`5{3hC(c
z3Yu3Ng4+Z$blv8`rt8wA>3JUemf00W(xe=+!{J&nn?h+Gb4jA_wWB{$7K2UcvTb%?
z{4MnlO|~*Ux$$M9({vVqF3_cu7DiD?BhTr2WvyoKPl4Ssw?=bVSQu^eUbJ+GVvJtS
zJ`gkL;#XX-9|{riCnh(@j~+TS`|vOJMAK+9z24^i7puq9%qHc7_C`ga#KG=mm!l6A
zC9*Fo^m&aZPD<x~ivz$~Z7-+X#)9b9(w|I;zsMDYG^}9#H&V;vC#Z%qe$1sdgb2%U
zh&nVZ7+@<<=yzZXBoyp#IZcbiOR!HVkDEghoJC>g$@Kj;0sjDR?`5=#29PiSL;%}B
zB)>-k0O55k5KE#w+w9BHbn`9?nlP=KrPIdC1_I?~c7&~N;g!vo!pD*9tTQ;2H5zPg
zKcs%j2I*0g`Ye2{1dV7mwbDl(<AAM?1Tm_L7ISjhOx-djXKInOENT5AUkYz+%0o+h
z+Y0nf%E+l$1{e`6gRls;LP4+yh~WTaAkYf`0L!@G-A4FY-{s1+dqu1iLJ&@JQQ{i_
zh7wK7Y>C(-ZS9m$j1Fv&wWpM>A+ojXl1E?^=F*eSRg)te**LT8jc5&(E~huZO4wWn
z3e(dK8BB1wz`_nFHU|W6-D{O;OdAmQ9H?W6o)nIZG+dmhPZhD$s5sR`#`aaU+KU}_
zux>vJIbw8%*Eag6!9v#Lq+TR$*nU<3TO`KsA7vy|);Bm-Y^EL)gf<*5jYU!uZ?GoB
z8r+*FMHcc0Wh{{ra;1PaF>;nyBp!+2qiGkie3YyJ;3kTz3p8OvQC8y88l<tvZb+=v
zTG+w2DvCoRoo2Lw<z3FtQN+02M97#A0axR64n<s4Z+2V}ERWN`7e_wa1rgfZn-YqJ
z8<m|DX4{GyvF!kcpSpETMVo7%qN|o?ImX#pEt<z0IoT>fCedMpFnfxQNp|MwuoiHe
z<fN!4X(s?Gv0fMn$wSpw%_D3v@TSwT)dW=3kao1&DBU~XVoJ>iJ<kqtxmWr`t!sBZ
z)*mQIv<(-Gix&Y#_`^zuT~;PG%__R1QgolC1g6Z|K~*(PjMysawHJ0!NasrHo2Igr
z&Lov(8th9R+Sy$0RL!Y*<fgKaxA{`KB0DFf5nWb5uq3AbasBR-)8N@J<%|CSNJ`>`
zwm0*yz7qa&Q-G$2Pc9<iS<z_Cb%m7V_@UzLuA`DyybF@G8ao_7E*Mf$Xwk;pHAz+-
zPZ8T;Wz6!GQ5RBlal&#gvUSoEAq>JIwyeF@d(Y7Z=d=RjfUO04U}NBOfV+yFl_K`K
zr=Gc?#jW5dW36$0o8P*2=?U94bn=5>5i&ijisXQ^l=ZHRTpawVMMRSybIrc1o8@hk
z;i5|Vz#Mj*ApZb7=V7;9QyX7^Mf{|tq}=W<JgRfhIE%f{wh3JCREz?wpr>O-Y?61z
z(Pp#~kxosG#V*R189}io$*wZESQKZcyxfGl8ZfO)LbTJ!;+_7U_XTAPV2~`2jwUo+
z!~mr{jy)MGC<dHb+qfn<&x`buEUzkLfCKIdqJ6SB*jOP6N?oD2q%1YFG-bs)T~442
z2M`iL0CFMJv0C=IRB&HH+bU$Msg>5;Q{sj1H*qARjVnRE+ajssiZOQ(m99M@miqzx
znb<Ifl7>QUm7<BzIC3nXcn1U}a*$}w!=}2|a#>((eXOqKmJxwvTUhAbdlX|SKFrdf
zAygv37hLUDeY;}-CKj-hgyylQ01j1tHQN&3q6f`1uH5oTNLcfos>%o%a7a@+CWhIq
zM!tYiIwuoik<54o&9b`?0m#Z8sh~9Qm<?G)Ads7IrHVIj0s5(Buzl>glQ25LW@Lis
z;c+9nwx^~R8-l8Wq_^~rRgD~zNOOh9l})`Df<%>2UAAbol|=NfFR;4NY$PU#TGMjS
zgcQnfiB&~F{1QIu$k4DiASuDy!b1FIABnfv=_CdD2A5q;91+GW22|U^X>d8RtW_A`
zNEjGRadt}W-w8JocuX20pLMWus;g+^sJOYZx;Y#!umgm=L(!h4(gbhaw?8W4nw+t!
zazF#RjnbbBQb25Y7B;y~Ckhr9IH_G=+?yc9b4ZQvBf5>!9?7!H8&5Y-ZjxL?!hXvL
z@)J5jIW|yBSsY-S?kYxUv&wHHwuLivsF*$8;;@{G_Ek?iw#L#2$~GD&KQg=OiHev+
z-onToPf`#xhFFwi6(^udRD;7{fw;C6UZZM)TGNG5HlaL(o1da<YUd8&b>qQXXEd_e
zEA+VXa7u<vBv|cl_D0fF?|q3@v6hyPC3U2Zc4X$!$7ZOTq<gGca<(sxr0@`R62l3-
z#nDD+si)IDA-dK?Y<q0bY=qQxxS(mZiB!+(D;tAklZ<4Bgq%%%Eh8OgO7N~}JqSQ7
z0^_>#c)E?n*4#p|i>R6!KZv+;;-qy$C7YU>-L2#*dd)?~?P<AHuvJM|0l5JZB5MWR
zljN>mCCDu_?z_FC>ZXm6#henNo>Tf*6hOFstCZj9%Dt1wT>K0L51`O)N>5mX$tFCZ
zQYw@SDmSt|;3+FBq4e#%U&7DNJAgSqWG?9*{F7xj2KLP51hiT@K`XtSCkwR;44WEM
zGu6GK;^~@nXgDI`Dw$&**)3#}PU%0~mG1hLn3q<29c=!|(Q0pyV?T79TP@2PG;x@>
zX2a^P^rumRE=Sd2#L~Qjaso0cm&VcVE1rHNruNDFu}?_fR8~;O5zB6~T9r&wJnglW
zER|9?@>3lv`MFfZ<8bz8mMk&NVuo1*MVf3-a@0wDA<N`>@5<@o*p6}Z9M^9BNnBbu
zC<80Nwp4zj{!wc{jFs%M4zaMZSG~YsgcLG3qMKtK(m1l8A|R4SZm}wQcMEw!)HL4d
zkh$Zr31|*!mNPpTC`l&+9h09S+hPh0@V-N3oGdZRL!TgVPmQA2xl2!{z1Ae6{Rrc4
zxP-47_Gh2yY;ssw0zyfp0AANkbda}~g#@xj=KEYOnMNo_HZod^Wi~375pYnoF}$B?
zJg$bGPHcWv6jKA3T$LB$By(;ge`Lo-cG#u{kbENa4p-P;Bg*D-QbUoIDcS|rixHxF
za(1Yy&$OpT?!h`%0y`Dzc<)CBWwMI10P?D)Bxc0fU)3-YKvk2(8VM?|B?_Zudp8n@
zgphbqxxgGE=v%qM;8|`)swHW2S-HSiD*a1SjwY7hD$cq$7>JA&i`6J=WSo-M0FqOe
zNHmhRHm0s>mz|d(NBMW#bb~7ML87&q_A5<KN@MBE+mE8$AFwGW(SfK8WkXIab?g5C
zh8l$gP{ryH4{*F^sG)T{*AC#TE|AtA8`=Yo7nSFD{{TE`ot`|@8TH1MuW8MU0k`*7
zr(K~j;mr%@{V!8|@d6|v9BZlovt@O>U3jnYZ|v^*;(A|FYIO6p!LMq@RYeoYEw)yE
zTDr#^%KLb_eLYL>XF12}S56NN;`S`FCLZcmwA?NccCv}J7q!t4yg7O?b=e28j)MKJ
zqI?3!2;xTD<wE?eD5(KDDy4?bP`Q@Hm8_AAACx5Q0C1q;MWc`b*HN7Erh7ABnC9Cl
zRTomQX)tZTOaq_trJC2ZlSP2fD2-x9EEJ6Zrf(Pc;W>_P3mV0DYky@Mg_QSgu2d5f
z+Sd9dHHb*Hth-~oCa{6dQ4KBT=-IsxZL!LlH?sT$uPhzKkj{0TkKJy>q{7QuMiBC_
z6P^<crq;Oz{gh6T<oqCN9zYpNHraGdE;c0<4LeEAkwUpp5hH~>B;xr~%Ssx45VAZ*
z>s#S93uLcwy{x&U3ttFw@Z-voCtEzB#)?8ogq-0plW)4<>mELdk`e(OmPHtsa6Rsx
zGBOkm5*GusqT?Py($Jla1Lv|5c9Kdt<Hit@?FT3(H4sA59o(WrafJg-vI?1@*(rdB
zupa5fgo`d=0B|mselSuot&I$D@Kf4G+a{R_7Dx?($rMXNUeUV+G`EEETXe@*kP`v1
zvKu!6Lg`*Iq?alOUiJ$L$(bX|NYBxAiOOVT+l45_lO#&mpxXnGoK44s&<%o9<NKs#
zBFLoxxb9GTY~6fWNl*>>Ar1wI&HN&PAlSg-_X%FXz)yvsw&wo;vUH6Nw$hc1l4uYM
z8>a#-ke#;nOR$ax6D9`~Ln}cXT?pvGJSze*kfD28->+oJl9UiAj@SgJ?tFH!vU7;|
zQA$brC$cX@(AG&2+%I%odb@?Mw0)IW-QjRyCf4J+Eh8&tq8)9nU}<Z9p%E6P46QA3
zu~|07V|<0%<Yx}Q-6dbJ@UKReN+>E^UA?zKO`?G7w!|vfHAhB3eeA4Z)#7_?ytnGN
zUW~yiw1>5%h80&fpEFOjq<xl@>S4{ea~*EQHXTAD;v|Z~+^n4fzRbI6s&{^i_)ZL}
z9KhrBTS_m;PDO-eSiXvwx7yKfgw9O~rq4B+e@_pI?03;e`KVm$7g(+3W|IV@;18%&
zm3=bj66OZqvI=dC)fG{_g`UTQbVL;niv^<HiZFEbLn8;$C*%Yq)Uv~NxsLslHh{0O
zpPX&TBkYjWvzuK2=N3J|z=QLJ&2YWJ2vk`7<XJLyxxdqO#lVY$by#F@7UfG6jw0iZ
z>u?9jVKQFUQD@3;sN={@GFu@sh&huq@Ela2f<Zuu&g`i~_u(sx9y3TdG+Yo@7Z5m6
z)4Vu~r^;GEH&UaclA>5Az1n*vFKKsU<q1q5wZws*6TvsgDv2D^m9f)EEtYLfYvVS}
zl#UHC=aj~^oRAW>S_?;5U)$X$@jD!Rr&td5PG-{Yak2yUL|XmVuu?U*9N4Kud=TrT
zcyJ%4=Eyk)h@AmB%7R$jGJAGJZY>2w=|hf6)@K_Bb6bB2@iZJK?F8X)hU3BbD7Gq#
zByE6F2Mbt^R7{D$`%XSntl`MG93--_h^}b23JLcNgJnKI;HYMHKyc+0#+uPBHt`s}
z@`z)_`AG)fOl>LQyN$@YvS%2TTZ}^(KsZ~FN<O8bu={X<aVFWhN?9!n5ojP;O5KO~
zkKGOky~t7m0Kq@94FsGw!4^$%1GZAL+~3uZn)W}jx>CuFc6d#4W7zS)DURQ3tdO!L
zj2}~*SSd@KZ~!3)9{vHh%5z@fhh%w0p*BuSFkI3TCN0}`yB&gHm(9|;P2^k)SpteI
zU~{j^f2!+Qz!czH#=;j_q+#Oz3L$9d<Y_jrPb?+3vWdeWjC`kVaQ<W(_GHC2w{W?n
zn^=p4zNedgQaaYSSbJg-aeMc&0-)K)Cih0a4JZnNcc+OQj2+Sz8@-nY%5x;AdB)}y
zDQGS1Qw2L*@6rkQRil&GbTE>@Sn%(KFpRWh5QV0N%*cC!DmkBPI9z<GNi(AziU=dJ
z<CNjExUxsu_&2&z$&uRFzwVj<z5;&>hz8v7gBc8STge0;gy0AAxPAFaw2Y)BhXJG?
z-C<sbI1RaKX!t9?`dws%Jm$d`Wd6=}4sy5=Y$O1bgcI_B=Qsr$gKx<NNo->O07TQm
zAQ^Xz-s#P8cQ{<o(BWaim<XSOc9n%hCmFU9f~61_4`a6|-5iX#ExIX;#pL{{qn>!j
zwnE|I*$8}tf}eMD{nqSSCUstaiB8k>O?<Sn3>~MzQ5=8rneD&1t5A(ljtwUFDZ5W>
zf~2!8lVX@#bAxnKFoypCMc65FEPl(J?Ee63qhYbOQO$7DN9?2-;NRs(ASZ-DCILK-
z9N4Bp{m#s;XUcTVak&<;Oo5kogYumtlPFMhgE3SS@KOqjfa^&JaPk6Vl-DC^{fcyA
zR&YtTl=O~P>61rL$5;?W{y0skEkC5G0o(wQg8u*kML(u6){%tNI(9Sx+<nsR#uFGy
zcsWSUm@(%39F(mjWPfChJ-JKHRGDN**$<nk88dJ0Z`}?}uvZd;9*}b-Vg74<Qz~s>
zaDq1et0fLSjnFXrX90D{!AZQ`I5=A?P&PE${3Q4W;W*m(OeFmhn#H&v-KnE#;DET_
z?3!>BXeSo;OfB-AasohjOod}h4e`Q}tPVEHW1R08_)5u|+j0s1%L>||&WPUN{giHv
z_q~V8pL<=wP8lg}pn_PBh1V_r0F+r6&68gnNX81*VhG7S{!)@g3vYCmvyHo9C@u%e
z-py2mb489UQ+5M#6rt@lYujVxCdLu%a$r#lfW5h0Y<Vf~h1Ude<wjaT$SVTuPp!VI
zyyEMKBb-@r7`aA+(1oD$`y^-sju&Ly3tV!PyY96C2pS2pQywpsz>9!Xw;Ts0Zj8uw
zCYbGVRQDE1WY#PGf%e-U-66hF1-ZygEp5&+m=?kLAufCb_cR|ENw6(w){jA!npfuc
zDPqy3liXWj%HBt!HM~c2=E*83M0ah4`~}YOMjagSlV&NpL&4hL?2o0;cyq<pik6+b
zfGxkmy`t0F_T9h%<b^&QgDDv(^tTK#mI%l+xrne~A7!<Ih5=yM!9G#3P&UHM$ySCa
zFGQr<JpK9+alDr|?3gqd!4`-Qvh*5_J*~MdL;g?>!po`-1YNT!Nu>ydgMVO+i%Tvy
zaL3BO^aF4jlt*E5tfLkSWmH;gI1K?x-7+!A1gjRc#Nb#WV}zatd!tc8+bSESL=E-@
zAk*V-@&$JtE6KI8q<t>N=Oq@=wor;zFyX3JlEHwiUrzTPEE8Ew(c0*7L9jM8&Nj*>
zC<VAg$4}*|W<q|0vUHLb>=Z`U=E;s1Cf(8I0m)JAXgnopv>PFYoz5WI$e{>e_Y~7O
zVD^OzrE||IR9I~fkd6USwWD%#TYn`zk)H~Q2*<*nL!2xZMHx25f-We{@ZY*FR0M%r
z2^n@%%Up0U5x$c`ifEj8!k;ER0KJU|DtG_@SSCI@9H`$e+zu0`p;`~SZ<WrGgXLA4
zhZD(N>Nwym!jWg{HtEJux0PJL^Vp&zjmMM}LP+TeH?mFVl_O#&B{j_erxg*Gmm6IZ
z1TJw2AceOC;apI}*9!oJQLGE{<PH>1VQRaXu|~^WT~pRd&`23eXelsfc_|6Xjn5@0
zILaoXLm>f1UR}w;YmJi$7ec5s5gW!W_C?0<21>0j3>UhE^(Oq`W~{~7m6yg>I%WZq
z6)S4KaGWYHp2>LqnYJG!x8sD?oyR8#BRC33<^$m#k%Mpo9$|8!eROTO2Ixs^cN<>7
zq}_~7E3;vh73`QK2kM&V;_1^c=e(h%mfhD)AhH$4<!7*@KWTZpxJY7P7qGfONN<JP
zuiD6(h~;m#!B@`P^UAdJWt3T<g!uH!d!9)tD8(#vu6|2w6py1MVXE*`297Ke{#~a8
z0JWo2Gp(R=j~GV9K;SY-R>CGT04bwu0QVHhpmAk0s4>AQ8A31mRlJX3z~MsYhKqzb
zBXD4?q+@=nXkcaXpptvL3DHgRwTF!c`Z0#!1q6^X-zi%*E~A=ufO3V0iy$pyT%6gM
z(QI7<Q#mAt;YApGjq-z#coz{>F|GhBtvb2}4|{+s9$4Yrr!-4@T>k1agP75c8`tYJ
z(MS4$`Yi6Xtu||hT~r3R@<}PKr*pYN7$Tjpw;~7BUB%@=G_p)c7zmHcd#z<FX??jN
zbW#_CWjxIcBxID>Jx$lLwRJOYpHD})-DxEI0)s$NwpR?IqYrLe<ZtDg#@g2^Cq!KA
z1eF!g)Yy;$_gk{Dj0Ut@2zVgd@QiC)ZbIB+>?txCB*%m+o-dM%dm2tuW&lnGP|^#C
zBkBk?0^ek@IKO~VETNJ|ev${3VNIq6GUaDA_6`MOeL!w-qnbzB*FU<ltBtV>oGQs@
zgLSZ%^<m-#A$8Al<fa1hQPH$WZUUR~v4M90pOO`zN@DYX6_gD2UEHV)kVD-^E~yIz
zfm+a1S7fyT*ET{ql4iuH<kcE@7f`!UbBV=}vACi_WE{BJIgXY11b~P9%UpfV1K|-B
zOF+fGs5vAaDUz7n(UNcVLd(udgHhC-5U?3l53i_uvMd%-zKqgE$qm0Mcp12h1xF1@
zzq!{((`pWB0gOLXY#*tAOH6QFQSni=%8s6{qE5ssohnI50pQ!pS;?dxC@ATGw(7RK
zPit<pW}+rXw73)DSJb_-I`&ahn`0=WCqA0_9cGMtDQR>gd%Rg_eWS1ow*_$VMSL1m
zF>(Sakw(wb6otu!_C8h{p-&i0Aui!$g~L787-4BCHXEl0i~JSag_4+V#oH1Y8k5!V
zusRphO2~p?mo`sqmKiBrs5UF3vrz8Ct(7~cj@G&gs<I|t+@$4Ta!4XJ2c9`oeo>%Z
z#Zt1qM?TTCpQ5y+bn>_OfVC{9*Fx!$Rk%Xav8uiQ0GpiqTHrjDe%K-zdAe~huzNrX
zYcpMo#>#3fG?xcV;_roZ6i~#$W{e@9Qxtb3g<o5$umT!Yqdf}aMV&=laf53r*>yGt
z5pb$ylB%iRz(Bg5lTC9@=^RN~oQ<RtHDr&BhJ$aasHtI*`O3eJfzQAO$+GE08^5yj
zJbX$D&RnzQqMDY7NNfesuhSSKxwp|+Qno0VK(P5$+Rb}oVcPIM>!HaJQ6X(CZFPmz
zl1d>ex|>vizp3D#s!6pfd0%bFDF%YwRV1XfmjlYK)IE$lkGS)4iZ!rP!?;@Z!pL<7
zsWj7Bq=2)3Kuhee*D6N$2A=AIdZP#~bBR}mo}be7YGxjCR$o_@l1gKMV~eG2prk`p
ztrh}7vUZQHJ@riwc_RE0hJ!_QK`(K_ihVrOOy5ryDp?e$csggU=o*_H18ha?uNe2s
zo&v#iP%mqDy6ezsgBuvPh3C_6XJTrFY-}G@&V*YDvOEKVk@Z_zKnd1`Zpda~ZvhPZ
zo>Z=#(mKg@U*&824Fh_6&k5|N0k<|zv2SZ8zDJA>6AIBBtg*8|T*_v=d-A1=+-~kv
z!M5NO9R}<MO)eMYgpuj7Mt!YTaj>7%ap5?IwDN#Kpwo-TkFuTGU72!InOw+ke3Z$x
zLnC&vqy#xT(Ud`Dfw7wbbswj2ZWPUNdAqKpAX|j?3Ih;dvR_G{TFPl0LBC|MJ%!^a
zFc7wrdA`)ysQ~4_*=eYmOk?*sxB8^0f}PI61x4mb)efM{sHNMG2?@on;54lXr-h@n
z)J~?1-))hOM9kww5rCY#l)(uuunOW@W5XMDVWjBN%JAp5!7g0T#;t)y^ifBr%JzPe
znEEMVb;}Kxq|@oN@I~*n?5Q==O2BQjt_**WQ=KGL;n9$iXGYDfX(d%vvc7j6fHZ#U
z>TgZb8yqJC3tNH-UXp4`$!%!K&8F90@0$MrWi2!hWrLhaS|`)Gq1I@yPX7Q#b+;SY
zBgq){JYv~b6iu)sT{=ypfQ*uq#BGHip}1u<XJ{N+0wfZb(+<c_sE=X5%4|;V>klY7
z2Z_-};8ebuaPm@$h{e02;Cw_};Y;M9_*gR{Aoop~#iN9Krl$bdg-@u~!Z>ypca5LX
z&6gk11h2KpDx$h)NaD!BKSd>7bao&(WiE_kl6}U`H(i{$GoGmppwa53_q-53iq<VS
z!C*lvOQ(kVAZ-cLz#ov%nM$-OiA@wu+qKOfbTxe(Z)tE~S1zZq;YU#)w;^QOV>FCq
zRB}M#W4IwxYPywsSX=5FEsmiBU2s4j3puIKHSKm4?~*y%Y3TD^a;{k=JIb-?IE&<9
z7rJi0r)+s3D-Mp2W1D{~&Cc9<I<ai@eHNUy27ovU%hN3xLuu75WG&+%PbFpDiv_@^
zIWw)rP^GuQPHO<j<qp|L)jUo+s#^yeCl~Idid}~HLArbJnd-UAJ2IqOws1wRqz<~K
zjzha7{S}2Xi-#*lL6Z6<aYM^*Dp_z4(p;Vs)swOpG!ul!Moq#Yv6mhZ42W&uDN7&G
zSmbD>k|z$z633Bp738d793bV4UjZdiWs=I%8MUsJtRP%l=%<;E90H-S9NA_%keMdM
zNF&@ca+QE_bs&9*30pH@@<duVL&)OZ=*eZc`9evMP8LjL^fixjjf#6&eBUZK#f`^5
z;S(M}Bf>3;$ehwUWGINUf-T?-+Qmd{=UoJ1HoS~>PmZO`;1ZNDb6}8Ic3Yq|VFIb|
z843wu^-aerc>OZpB{|-~fQxU?sR4>fMn+c#xt0e37TTS@*96zSj~66eZH9(1?cjri
z?aU|5(@0_Cl#Giv2fAd}us1~Pu*gmiH&EQR<lRPRXgh8P!p&G>{=#3BH0&<nI7-_a
z6rQ2Z5K4+RsER1a7d)wfvrm-h*dE)HZ=!jKTKufq5ioJQ=IP)+!9PUOS{-i4h^CI#
zAqL8fZ-NS4xF0G<$q^R-1r7UzEUJ1M_7lQrWq`fYob;Qo+@=(Uabbd>H@YHF0J?|W
zZZNV0m_#60VNGUV{{V!_VhFMFmDwiFy}lMi821Jd*)ZDJDm%Cwt}eOd20U~{QVGaI
zIj084;S(#p*Z?T^I2$a2`v|6(v<u$Ke_5_=i%{&_++3$!pd~1hp+&m|+q@gDO4|nJ
z$-u@Fenxz#rD*P_abO5(oqP@vMEeGK8?uva#|Ft<0d`TaQxh0-ZEro(EfAL28)G9M
z3P!NpSRx$@nhrkcv4BYj3pPG9H)-IG$*zgEI7JAYMhLLV=f-W2lFRY3wpd2%sP;D_
zIY+u5f)WTl*C~{QmM}epWMB7AYvpcjf9|Yfr)eGvSt&tj*h0=?EMSbPV{Bauf%4od
z3SDA0kQ`n<s=T*jh$9Jo7Dz9!Wo~QO&&RZAV6Ug2iQ9jbIjRA}^tc6<G>s0p7C#9K
zY8Y<GTs|(cYRSvTl19z7@a<@M+MItWP{Wow{p_(Owz4tqYhFG@teqCK>6<<&7<`3J
z`XJ)hWxk`K)6Vkv-(%fX$<xmS*nY}LHK_O4N=Ly~befQm;mmRQHc3rAht`br-7!=8
z*ynu^Gw7P6O$Cp2ui<(To$X+Er?^|OLrqhDW4F{M0{;L;9-fy_-?hLSc?s1N^^G=l
zF+U+|H$wA<*p#r-xz4*@GubaKjMj`B<zoT$8s;C6k~)@=?06^Yy#lLDilQx&K+}Fr
zl?8W8z%J%TWAL3x`xcYwl&q+8K)KJtS5&&(lZ3PAk7M@4=^B2hc{Gh#qxf!YgTWbF
zlzoPzx-9g$Jy_kk;{H*MV}Zd6r%Z04Pj=5r^Zx+TkgVf#oy>1<)FRqK?)G(bhB(8v
z@`Ux;PZmUKggO!K{ncw);gOWInP|zR8YQ{7DO&p+<a{8+fw(Qn@QQ0l0p3S+jx<s;
z*h~e_a19D)7qD5^L(><BZebw(5kH)jn31e|d|4|)DcC#B`3eVHcZFg3sySNV_%=G-
ziU@`q*sO=Mqh{f7e#&UrKnf^`ZNprrWPkt&<pwfLb48BQES%<x-?HyfrKZNkH+8}V
z6BzMff9!^m<nk@@iGJ+b#R)g+0nM^8>=JqpiMNOyxB4j?$Qe-6HQt+cxP8>$#0KTN
zf~q*>*p)`nb8vz-C$cWA-aag=$+*Ev%EsuIXc!?T&~0OD_Ds3*kQ4VqV+2It(PE`*
zntrHI{w@=@Uc_Mrn8}m5q>F-wkl5JSJ9!v4@|fee-r%g21m+l=Y~lMA&WvYiy_8b4
zTpL+1Io~O}G9}tT$l-7T*dV5|VmZ&%E1Vo}a6ZXsq)8f5dq}Yae5SGAvf^=m7NAI5
zG-Mnu0NVV8%oxqTboP?mG@=D)L1Mc7(}RZZb1(Ex0wOsrJ}k4L?1lCqo(ckSl2wd=
zZMbp*Z`F_8G)ZM3F0i_i2{N4cNo~t{@S50&b~#q`abC*^9t&(jQZM7|p^1-cd?{La
z!BJ;cK8G7#_9;Pc1SW%iKe}5E{nC^aG+P9H(@R}`>wqVVSu2?KkJ5g~4#wQx$LyL~
z(nzrdAtv7;cc^iEtQ{Qo5#XjZ&KLxRCgwZ2X&t#ta3_lufkL(5Te@&Dk!uiqs13(&
z-78!P$RMm5B{7?l(kz(!xAioX<~Ux;Q5kb?7O`G|+F2n3^pd2KneDdH96kz1Q=V=2
z39Wpw*aA^9OhVT*@Ig-!$ivP4slur6;0W%y#s`~=w5%I`$cv8s-R`6kgZkPC_`y-g
zcAGZDF5C#p#;YZ?PT}RJ{@}R6;lXRXSwoB3{{RWyyZu%Jh}Vk~cG)t(WE8LCo2EMC
zCIg7(lifAkTe{|F8@8n_aIqr(2+Gtc(U2Qrn=3)!uD(tPDj834gvdz|zA!RZF^z4m
z5cA0>Jck7(6x+ySn{Slq9Qhbcq9EAVsbXW!1)udo$r-)dfR&GXIl5$-&g#Q#+xyvM
zB~v3A2E?bfra(OXLW*fx@JpBvgxfN&L`@d9Zd0y4RAJb-$HIGE;RcGuj?MY~mkb+!
zb-<1W3VTlh%mfb!3!$K!gty^52#*A}>bukMK~rUHZV4$bjEkr3aKQ;Jga#3DwUXFk
z_+4Ob0?ZUQ=(yh4O?zYxxJkH?k!6g~@;oLx+LSo<Af(;oECx3CNF9{oT6pDl(`#~>
z3ee5Ro)VLOS_<nC$Vr>t-@3q~wlJOuE4|>|u3T=EasL1d8if-)8xRzpptgIV$OMCs
zknYF^_gjgr4kg=(2MNr1ZzAd~<+!&A+n9N})Elx=_7ZTLwS-{UrW<n7n{q60iZv4Z
z$LVrw-rzmMDZ9_gQt&{y&6X9ThSSQH%_7(+XV{!4Lf{=@e(N-5{>h9?JY(pX=qv~Y
zb?!dt+lV6RU4>I2a|k>Y8Eubni{Ep?YprY9YYhVeK*71}yVSM~(z`dXHu*^5kzsVm
z4HHIM=HG&q!x%qR15VR^$e<YDENq9d0Nw~bQhkw*h!P6#LH-k1DEi8xjyABhjknQL
zRcS7i;kI6p9*jSy_e0ic@x;<d7gTN*dFjaW+HDuoJBZ3Xly0@S0bA5<W9@5|6^Y8c
zV-~s<^0Bm3t!=w}m1aFCqxRUJC?*}JCdyVlypwcZD6?B4s1A8JL;hLr<yaTDvTKMr
zOYvifZLl`df!gIbQe51Rsw7IrpD7<JoIVhf`U;EoMA#VI3w){JV=gQZ&USL|vU6qH
zcq$JDNjtKfqLFJ)6I?j3PN?)_W^AiJIPfgh1dn{q_q!KVSR}oO<cVdFNhPE6*-s1r
zi@To)W;wBoH<ctcHvL667PO5?hPDQ@COkE#%7xXABEtbhBqX86Y{?>b_qq~5UBIwX
z5?#r{VK}m)O(1bZ4vpQEkidCy!hOeeBxd|@sSr4ih9G$15XeDE84Um>eD)Yj-3!GM
z?2WvoYsU?+KuJ}f)SDep^K_MAsx6w}1<H<D2LS{5k@BN;PH}{Ejl`Z&e3FEgFmja2
zNlbH!CgP54O)l_?g^{#&K^Ze-t&{4qH5N=QJSjJ|qq3|Mp2@D2#PYSXaYc*g7PZBc
zE}f&gu6(XN(*ub(C|G!^EuyPvJgXRMTo^2Ng`H%9oTnPoVAZV3D881d&IjCtk;A#l
zt2J&nvA|4yONLxf4I<3Bx49}gDp=eLDr%iWXs|a`(rOYDfKUqJXkS)4VIyZ2z10L&
z5<J|Z<8*}(X_gbz++hZ1&pA;%n`EfL8<w!>HaSVhWJ?@C$_66qafK(S;D|I7UtyA>
zl45(|MqjxO_vXOdple8yNt|#LO>=>{I8nXfgM|;O^P5;9(XAFNmfV|tQ_P@@l~n18
zz$Hw{1--`!1E9CQ{9q;$07JTQVPzDxZD=;iYoj2*Z=3$=NZiJp<f>QH%6K+I$zED=
z@=$UOqhC)nc(DklOA}jnI4oT@q~blFy6N>9EtlO!O|g|4X{%!{!4?Q<bqK}7Ncyal
z+Jv_@B}Ce(91YyE#{HSiBU1fFHe|U(bx?5Ag_nG$<Xn^el1DMz0P?7y#rYAcZDD`S
z(`Tq~X(X!pDJ}vcSl=UW!sV7%7FjgW8|vB(%aVVnM$Y#rc_<_~$WTj4W9H>rIU5nW
z4R)qa2ke~Mmr3;V;Z?FDzu_Ajc8>vPCS(~F+g-|i>;nq3*8tcln*G)TDOV=O<ftY}
zxZ8j(R0g*G(A3FdBZl0j(@{+KUDp{@O%rlquv8D!<6@+JSnQHIELhs=M^NJnIiPZ2
zPONS022wh?_OJ;msoNW|$W3cn+?!o8X_?82$tHR56{QPF194SGVAFBRLtNn8I><}<
zGHkw{SR!SK7w~|Vq>QuxfMmq`oZ?f1jE4$N673G8gCUYxUtxP)T0>6q%aeo+6p_L1
zBw;OPw7@pTZhQqN$SI~4TGqP6-5E|8K(Grc?LtStb@6mWdbEsfnsQK<Iknh%Bx~Vg
z0m%x=7-RIVZNkD+YEu`2_myaMr?xGlCdv!O$$f?7M4eBytUFJ}7CEmXQ)O>kJhf!*
zeTRU7mX^)AA*-hr2}Nv_=Y12wSjgHg;dGTcn*$Av%By?_aTiiHh>>&0%B*0;2B@i$
zR~LU}4*vi*DDTL*#=*E#N2VJml$1b|Y^`jj__9a6!#P&0(w^r7wAmjPj5dNoM>NXu
zW@aGwKR62J2Sy_T*C^AZ0C8Z5hfHe*Tl=EYk_=+gDJP~g8-^41QAeeca@_o_Lune(
z!g!|xvN1{{alXv#I!ML9Ay`uB(MOU2D$~&yTw}Ln))f>&)-jd<1t+bvS-4ISCG@Y^
zC0NTteOD5=yr~2r9um2L94$d1+~S@ZQ`;VRPk6=>NwDY@<b!1qxhh!*Y04g2nAyo$
zKd_G=t|0PBPztuYg)3YgfqSeDNeEq(p64fsi8)T+6kzUf!Zrso9ga?G4Zg}6twI(H
zH<eo^p*)9dOmV+-ITLa%WqeWH&Tv3asKyPMl>=z%ss`yEMtD{fI!tXhaNK@U+hAp5
z=c<_6HV_YWEiRcXuDs4C;b|L76Br0+7Ew(!ad1LvMnrUU5W)wvVG|>wiI&_IO;)DX
z1MVNXtCLWccWsCglU8e@>Z-CfU)&X4PO49`JCd0eomEgbN==HgqS51wT(;-s6##N5
z+}i4=W7-k4dRYf_r*ZjO2Gccz4FD#;V@JBk=>xD>Y1+|&!YUX6<RNM+p@<Q2ggrj2
zB$zdq`lg2EMxRE7n<9?(S<a!>411cx$12XEcL)h~Ft9yAB$G_$G>|-n=%u5L_Cct1
zA%Ztp-QE^vvr(<CmhX9MFMttsR9=|hA-~lG0XS%|T9ADaNj#9Y+sON>`8BB_ejadn
zB~PimM8^{BtZj8reC4b?^JLCRbR`=n^*|8d7rNc}R5g0NMADa+=e3YjbagW};2V7r
z@aZybE^|&1;@GK`b()P#m~-83`A|Vuw2Ssm)x>oBh6z+tR)KH|l${htx;<z|7SiCW
zYIRo4FaX~xEiF^rY#h1?OI`^*)a309k74LZ_XeIUy&9dv(HZQ#i=ZkE+5@?=^=cwr
z09^A$pvkX)gpXi69HiRou47&0Ed-JX8Ty=Xl6e}@W`w(gTb!Y#W8^qWIv&@?N4V$0
zW9;wJqV)E1a;2sHK$O5Ir-s7iOzo|0(w8(g=vk(@<tc|gLJkn~$m4t`wbvNJX^g(>
z7#n5skb*c<xuv+WVQ4qXbwF*48^AdzhRVxipv*2mr9~uifnmbbYYUo4`xHIM{Wl4b
z#&2?o5f?YY4Fxh0Jj@t*{nUc4P(M*ozB1Cev5zTuqc%VDl5=v1r>=FtCkQD31vDSB
zE+`hwB@J{J9-$Ui{{Z@iikd%Z7g$TU@JjDV$2lvHFNYkRva2T^jUJ`cvd?zKdlj9n
zte$5Q=aZEqVRf%$$!T55RL9~&64Djqa(e`hSGm^8GMS|1+=U*-vw)iUT-*hE)gf%O
zhM+@Z+$En^khHa}RRTx5l9ES|1%i~Y#k*w|Mzo2aQ7o^!u&0RJTIdMwU2=+R?Z8VZ
zMmh?%Hl`x%ggarEb++6qia^JaxGU-nHkzWq0dk=%@JnS9W@3VXO7C_)s@1w2Ww+kn
zm8NG%mw@IxwMcqeSlOAM`>qLRf_;^ZKSmQ!(wQCu@AO&v%^mVM?IeZi^K{tVcSwHa
z4L*p-hi|H`KP4`V@g{iwp`uhXEhfp@H~kcY)gAIzpz2hyGVONNmDQ<Z_ie|~dOkOs
zZkf%S$JUElU3!it4bN!$qT<$R>M<LEzk<BKR;Q7!$tK(`({(pd`$=A$WSPS#xSpj^
zSlHt)I00p~uB@k}aTmD?il<$gqCJ-&eN`<>Sv!xYdGf6K(6+*>I@mf=8h^5hok{Do
zf__z1Mwv|P++71TD<M9|eUhhM%~l_%)V8JHRDVxFwm^P+Ec9)Aqyyz^`hEx5q=g*a
zSxjis(u+m`Hd3Db(;{IF2+DX``);!H<t1lYg9l@+Yo`-_5j7CR&MkByBa5bttPV6N
zaPXTfyG8;+>wQxm_FE@};6q`lk<xLCt9p6t0<46`$hJ`+iwh}^nxe$Y9F>3*bPR7G
z<f0*%0hGzmjR!G<l;?N>MI6A46)S900TFs-$2=u;0?3vDWUXOw^0P)-E2O7kxwchx
zR2xqg9hQsG1-U`hz%r#Ml#I;tuEUih4&k4&b!<dl!3`T;958uOqUqQ}<HvG^kan^)
zp~bmPba~3b0@`;e0C2aITSGvyhEbdhpu(9J<He8Bb`#peyCWl%{eyOGm8`@C)=eZ?
zPb@=kwF>4ruHng$ESd)Z@J|TSG+S&?OmkWRBPkr_xbTJS4mNd34{_RucyoAD*o>&;
z&Il;jQqZtF&Q$Fp_Z*>^Lruw3i`wAeqhaC^=@}bqkgGKfHgoTZ{{Z}=#IiG!^js?3
za6-#WR}B<F^;E{v0!NfxC1`#)D5)cLNFv;%r_o;Had1<&Wa*-4<vV%hJ=4F0kD!_n
zYZLTPu$H)o-|mr=Op@DyHp=4HkCiMhX51Aibau_Iu<AgpC%-CAJLPl0KIW8`J?ybg
zS{mYSWTNDR)0f<(W2|sdXdH(YG@Yc`D5V5}>Hri{8`;VN_lIDS@_;16-9$jc{{Uo;
zf<{{ILdR1xf0&=DA(awJY)|f$ShO|G+h9sU-1fI*=QQ6U$v_s*DT0V30^pn|!&qJV
z^WjY^Ly5|S)7;z;g_-tCu#s_pl%hOd>!W7hvX!J;C>4qr8)5WIw0XKyx4BH+lu@KM
zMglElGp^B*$}HIb0Ob!m6B4ju;^z(#u+31&!&{Na2p2E{q>6omo;#*weU=}akhF)z
z_d~FkI_fu6hc}aS=ud>B#n4k+>v>)39!N;QNV;%lGJ`r38+(r{jky6kXkD9H*Gk9j
z5I#cFf<lbW;0PB^nWX1w1wmpR!AwcLl7qZtWj&;{*c(|kF>st);ZNCR(Ij#kSb$R;
zFLIj99#WD>S(Hss$Fvm$v5w#=-ErAO>m1*N@nj^E27D2?XZt8kKGy>i+&<{C4g917
z<Ls!WbITM)L0hR)i$^=Q_$a9Qin8I8z{jE7;s+K(zF4<$pOkLNxKU)yU4-1k=BeAN
zv^#d|1x3B3*A`PS#^x4n1fJ;95~OIUwbrx{A9Qq8rl4}i6^t;l*B1qKri|T_kW(cQ
zB^UH;pA1hodn|l}@jzVLvm@nYDD^!~o!;3!MuEXs8h=;M3EM0TBjh0BWZ7;h3manG
zr4W~kNeogCqLL1-(q&*3G?xDWxrc;9H7yEpdTO1nJ)A6+LcrT8bqy|xMiBU29sCuY
ztI@p|A3{fMUV!$tMvbnHM*J0DS5C%Y#(v03Ep$93_IdoYHH`PiAaDsEsMgc438^<V
zz5>^pb_od$AYZ~Z8Y+34V;oQTAq4qphFa*u(`$5YJ6s(LyWA(gRE5%eUdIBpHT^lK
z$lIDA*LiBs)%5i~<LSs7ZqCAPDGSIM)e*?UwAiSGu8iK-3D40bjl$QzmX+V>^E$xF
z=AV$ZhfVq%Dw=t)`l(`>xFO%N8f`AUjk^SLkFHQIeDJ!{(>;WDM~Y=*m9ERk<&F3b
z&yOl*G~1P*g02xDE^%la0<7SuV};u&{n9v4@ylV>AlVI2=HBI{NF{TIG7$1i$2@}V
zr7Dic=Dmi~%EG`qSx(mgMVx|(@fdA!f2wpw#{??HXyudGMQzJ3a6+y(>=AVi0xKJj
zlrVc-FU|Ntsx1j<j``0Cz=Cd_wY=P?1~;2u=$6W)nZqW)B^f#X$qOxF5{uy70MP3k
zl^c&ZP8+X+5<DL328j0_7Y(P8h0Yz4+zb#fi!}&X$7Q6Cs9ot0F=O;8*J(IN>>P3M
zlsyTx!PZJzK<<%}cD{a8ppM`o7Q|!P&;em7Nn^m;>wQxkd;?+SAs-wpDLIZomJmnP
zMsIQmu}ls-adhq1z0cJF(-H0)Z*YQ_oLLt9gJFaO?IGaVJOs-0P9$)!Ke~Kx&$*zc
z#__NVkGhezBwvE9=-_K%k%)^fIUz8C;HhC`MnCreJ@BG?IV^BLLZdFuoP7(k76moU
zBf<J5X?VTH6L*4pr7VO$3!5u}<#F)4Yb-4B^g~0YDR$v!Sp3?`7d4%Wf}7KDx!ZLc
zfW3|uHkkv+wYKKzMaK@Y><V+E2L(s5!yXaS7p6(M<B$mMS76{YjO8OkzNtVZ*+8NY
z+vuLh9FTbOxtne7UFo!of<nQ2BojOgv=A2=B7KX7)d^$3xFr1(3yA$eVK|SKqmV&N
zu(t-uNgRZL=G=rvLRfKi)^+ewixbU~WEG4!XEqCnZSioVfsdHkjk)lWNMwkgQMOoH
zA~zlg`AsLW1bq$@&m1O@E!i73n8RWRblt_L1g9HY39c65GGa*%FLA*E-%z5Mu;S&Z
zbM#Qll2JtDfhW684&m^Ul2RR?J=Bi_i>5L+k!FBL!gS7ApwC;tzm+r+#z<~1Rb+wf
zb@sWo_)|kGxHcg=Ioftx214P;wY+yg)<h$Du{KVMLCCvQRW3YWkCeekV<X(#f}GZd
zn-=}lw39~0e-WF$h=zVvTsA=0cy<ytS|Ej?*=vRVQi$XTm(n`k&>TFBsQoDzZ*r8f
z8UX_%2|%_7bu(J`HsH0##}-X+czC>L>)B0}M0=b$H~OW$hXG8`$71_W$W3%7Hn-UU
zxe$Ps$!uC|P1hXu0c)|4jtMLX$jW<83hvw`8i-vGI2cj6k8c@7i+3pqu);PgRu0jA
zMURw^1Oc?EoEJA`tncoPh|vfqxb6ESwlCRC=!LG=eUmmgasdgDw$RVy#lBJ#l;Uw@
zmgN&z!arovE&6+>k&mV>y7tAEOcXGaYc4h^#0%TXZqR@5vp`OS$;e1ct-@WrfD-=z
zWr8$}SuL^u04uo(Zfuxj#<*vd(YM`y9(YJ@1^)nKxv{!i1z4>B_pws7k0Qas!3yi%
z;|rNlD-Fep-HWsuBX}1rx<b%<*+&+n*8aBH5gkn|qWgvZLPvhhV6ryG+@=sdQLc&?
z<*xmdQb6v-1tF{z!#E3pAYiAuH#G2>d|u@`Vh?Q37VZLnu6}=XJ}-|cE<7LEGG;$O
zX4D~TITu;oTU22rH{9<5Q$Bi$a9l<EC$>F}yM}y~SVlLq%x$7M2{)Ef8W43lh;OnM
zU*%0u$I5fU9n|5OATEUj{fWt<7SA*N&aeoGpCRJ^096qT02lB$P5jNy*uk=TOGsBD
z!Z%}-l1go6-zYy{V{S?sO5lG@?eL`WCiYQeEWJ@4UT%B@$4?{pvqyw2JBzY=j4KLg
zNzK0HJaHjjMm9E+mlX5u`l5Xh8+9A4*nQOmuw#4WNgo#`!{tRhn@yNEJNzNGO)I_5
zxbb@+_t0!9^%2~Lo7pjrT^t*D<wzsj-EJY|J|lil*-X*dp+MILq9K`}4iV5Tk}?-N
zCjm9k+l1#-f!##;_i%+@Msi{nv>TIt%4mm-A%VH$E1xj}*RnkV+X<FX+%(+$plT;|
zt#tO1@|Dm6E`the0J-kIN|l(&Do3zK&+MR=chlhxgJi-|<M5ux1S129u;EJEv}GCv
zgf!ojk~kjtLl?W39C%1v=iqR#c1m6e!Ariv<k?3X4~wPr&F<o}0V`fjtQ3Mby8$*5
z*78M^&Z&$G3?&7!FUyYPt}J5)Ep-gltr!JB$(<?1!1A)#{JzO$xjzYwWzEh4kT=Ft
zgB&wtQU@Ue0Bw{rMhMAM5cL_1lbfSJusI=)_!lXxr4Bc6MY=G<e*P4ZGUDXnWMUX8
znhzETpG~`L6621^L)t#5J(z|{ecuW2QpPe{f2xyswn}TNTHH64ts#d>*0fon1uff>
zr;>Y%k}u?;pCdWF(zax9-0t{FK(-Vvm+5bW&s=wKSuuymz;beise2=B%f<XA)m7P~
z17%k<#lYPD<tva^_D<@NxY-dK{kJN*78g5pk<GP$?vm^+XpU)~<7NVu7~VzPjDi*%
zk)MS-#6Vbn$kCH2>Ngv;w?Z06IoBtJbt4;Vjual7jqV6pqerkxctb+zgFwzvQbzW$
zfCxjfo#o)a0VHFw+t4SXWq-6`OZgYHT#GBJXc`(U2kf0V0{|^GFG8lhnVD%{yMm>o
zqH~><bSYf-ZX&@b41oD7e#sh>VLDct#xOYKm2(vnHiK)b%39VmfJ(AvsRLV=0rgxN
z9NfAs6sV4-m;t~6QrE=N?X4D86}q!!1+ffyRiZ;7Je621pFn(2Ghq!N@>67MkF~h@
zN40|n)<aYq6JWYvn(UmI5QH%2C*cuK?d3EBVr+iOC$d)?+QB^5v?A=gfW^0QvWi;R
zgZ8z+1y(;XBX)v7QZkjmSlq5?V3pfto=Db<7HSLz!zpFe0A|?6e4xcOvC5J<P~%{(
z;E^Qk9$93S`@59KGC<wVX}^VYPfHsudlI^)HW7uCMr_SZ>bcgj2_lW$yCqyp121$t
zVrhMitQ8bRa?mtvdx)?$M757-@Q$XAFfD|WnD&;7T^IB!*;^=ct}aufq$FI7BI)B{
zcqLc@#xsBr;;3t76twPc8Z4O|JH@b7*)h4o_Dy@3&}<M%8)b26V=i!`61<x<6hwf^
z`wWFFbhiC1z7nz2NF#fLMbj!Kb+S>>(MbHeA4My4*8c!DO38<TPYH26U0J~kq-ZV{
z2&kyyVIJG5!)!1S9YGMqPTPxtWLpGH77YjGMYY8y*CcVVl1P|I8+!|<8i8wF4YAza
zD2$c3ppuzKDFnjmGZ_JQra(rFOX`a*GK9eyTw*>JHIMaz?^GuGCxV<J{>vK22?BE*
z9C7zd^wJU|IVdppSX06t5>!Um!T{=xfw%;fQK;)R65KS{cu3^^3(<G^h?+<xMLk??
zZVJprEo9HQzEzbq9L~(oANfOO<c_MH@?UMw(F6HfnV;Uu;EHN?+}M%L&{dkuFtmmi
z<FG~7v0R%UPeNlCk=FB-G?jGp&9EZ>09Bf**C(CZVg%p9>RL+Lvw2)YO55};mQ{Mm
zaoZKi`XQQYYK|@kl8&U)A%ucO&&slatZB1AA4RyJ?UmHJRqW}UNmg{!F)&y#VGz>L
zE>v^ZM!;-xwWJDcow2o|)&X&IV{O8vsMUx#8BsF6S+QaQo5@2^MyaShjUW|B`ijbz
z*`dT9>gF0oOzX*&VGSe^k85~BF8d2J^!ik?+0!_mg>6eg99#g8+R(dmS`Ell=uu%{
z2*}KAZQMersnlSBq?Ze-9Y<e#iDXwNz)I!xYOc*qZEP*LX;jryO+CbS%BG=pWmChX
zBsS|$rZOl%-a$RkrW-{=G)l^Yd0az&6`q}>vXI<?b#wXZb~4u&LQPgAB(z~ZCrnAL
z0&0#M3rB^Kt!!=F_x`1SsZ|DUCxEfK#cYy?h5`Xzk0r$9uh^y4D_uO^n?Ma|?4mA?
zD2v=|0J%=4rw(y0wfvwuf*OfoF~AQNx*M$w+V*04%cxvrbQIYq2tJghl4+XxZb?1S
zt?60cR_SC8c5lMd=(<0k0Syhe!hCqz+a)P-REvEonh4`*a34hmy<1HTC9NQRJE`3h
zn!*7pgITAL+>>$PQf>MKQZZWO&YD+P5D#^lt8=42b*I*y96*c(m#cR76~`yC=wxzS
zT;V;EZg969kep)bXic6i-5|*xkI+->b93K?>-tqmbWQPP;@uM07qr`z?79SYr(u7D
zB!Zb_>Cc53o%gd_$|do%w}jTh&~9yHgOIemk+~5awxl7s+K>_jmP*V;GYP-`6QGQu
zpn=l%x-9AS8$Ge4ZZYkLvZ|r`MXrTo9QR#YOQcoEZ?edW9S)$n?r+&FvcfB~Q?jx+
z2pp*mn%f1V{{TRr)4i>QRb8ja2_w2l=8U>yacHNRo85HAw2R-BG|h8el)^4@RhIe#
z9LJC>xVLv?(O_3TOj)>C)H1*m**Hwrw1p53aa>~0D6k|W$a%taagvlW+$3v@d!iCk
zObv<UMEC%8)UnFqJFa;)N&v<{Ilp2iur|w{_KpZlcH&fSY3_^Ay^l3Pfe$TfpTSLh
zA;*-hr(n+~vPUu0Y-?QS19aCAMeoXy>>wKpA*5^WmA1m7y_2w6sa=%>Mc1>gj1i5O
zxVc4tVE3S7&mm7w7UP$appaSD1u2|H+uqnn;F$KySR-p%J^ujRT4{QR<>VJ~$;VwI
z<qZzySVM9HiCo!WzKTXo`#ma$sp4cp<P;98)v^#oZ3D&1#>YD&778kj@{eg;Z^Xvk
z(RjKq#=TW3JEQ~XnNeRnthVc{(;GByzE9O#>F#^TX=zr3BNfmbnO~?!QuBVww9?A=
zTGv~@^w-T0vpH4O8g#U>mpVKIIpa>OD$HeOgCx<C=JKd&I(RlqAN(&(nr+N2Y$P9|
zrLLorN8f1+zYcX&naz_Oy_pE~NLt%me#<S@RIjJq=^U?CgG@UvvwcUQzG*#?mlB#Y
zY1?3)IM$Kn+HEy`T}xsPIV;e#Kf|f2p%P5|ocTxe?@3ifD`oU<ev5ym!KlF)XobK5
z;YTN!lhYO$Q|$9yN1>lVcefyCgf5;<G@>%Yk1N%yDC??5*T-Ods^)Zyq?6Pwu{l$I
zcB)LOz>~O{`dB2HptXu~MOMM>X&*(k(=-uJVDc=i<)NjHJGcXd<ar;ESpNWy&fIw0
z(>$i8mc8yj!*L0XrK@Q7L~gwbuBL_;5a8T-0Rbg;nDby;bqs%+n(iaZ!&3HRg)K|D
zjHgAVPb0m;%T)TBALT!?D^E1CzRRco0JxNvqCxmcKFsAdg&<|XDJnGiAidgfy&9F2
zLNUesD*bAjo><+m4iJasCf?Nn_^Eq5=0~-cxv@=b%|E5r`=sg}D!tR6%Esq?5@{Vf
ztq=^bxqA@uAt>FPt{i1dI-Xk`s~BXs!WijQG~@WJaQh~<K^v@aw0xA_jPd&|BDwl0
zgTq3tZCgP7K|?KeY|?pMDrtz~%STIf6o+yW8iMX@rVibdMY<rCm`Hd`6hXPLMq`xX
zZV+)yDoqs?BWDO1XCYq817CZNP&3gmjxM1nG+sFuOsO-HK=6u$ZUW(R>4OPN9F1YI
zNznIW<ggrN4J?*-iz1yoPxiLOMCR@{vQfPd?;IXftt}v2-9<fsvLADf0&oS$#_hOK
zjf0btqHAO##Mq_S<J{o{f=u$)0k<|xcG1XCInHVE^io9a)&!z}M(`YP2vRcOC(9c^
z_K*<Ik<E4rDvii|uRE=4E^9#w5c20;#>#dJi-IhO$^C^>lE5&IWkG9jKV@3!OIvf>
zgx}5<;^<guGS$^W-sb-5y1X&X+|UL5Cc3L|$Wc0AZV1O@0OLp<rNHxL#Jbnqj--kS
zO`hv3D72bMS#bNKWXcA}>x|t_ACch^Tc!xEV|~C?#jb0)Sx9Z5m$-76IkJm$fVJ+F
zIXa+nCT+{PPV~WdDkiw^8B#Tc@8-a*KytC>7{)gRBN)b7*-^<%;V0_CVQZRgxhX{S
z688<cHoAoENwz_5P1D&MznEDlQ5%Cp!g!CIg!e^j9k)@O+zW%@WX$`}_pr2FaGPt4
zrpRB#@SC{c60u11KWG^_3E)EFGi4K9a4q*p54!1+5=7F*!TL?mvjRp1)S=EKWk)le
zakO_?8_+C_es10qL}0f#@{9ExFl?fnlFlq{oP+FyKnt)@5yWqBP`7Y>iOM!2Yz5G4
zcm&2Cz&If|$}kHoqHD-)lZ$~CIVnq|ad6}(G`A`<x9*gXJ0&UTR}e_TiTigPa=J&B
zym$JfGO(Q6?3>XUC1)1<c}#KdbtImdXxLBPLTzO~XGA(VuJ?Q=8*zS828-V5+imiQ
zP}c*t`A|5E9>|9r6$^myiYCa3v%XT?k#G{0_aSk;lLC_%O~)8P&cI%6j3ax5JllOv
zER0<e$q*}8*rMr0+nWT^z(wv9@V4>XxBI7V$RoC5;^~BAD2Cy@rNQlMrQ|&WHKVo^
zfus6I?4I@l1+JupxBC>y*cw3Zr-}J37q==u%NCDhg{apw4$2uETaHx|Vl@^=4Mlw`
zgQA$@<sTnXS2dta&A@j+i3Pr?-q$xa!p+}iP+p5R^(02ZMt<QHL9c0sQYLAR{1%m;
zd@;D4%nAq6v#=o|P_sO8XQ9znP}B=Ss5IZRjg%UVGq#(xvNy|ey!FvJgqFF&-N8u?
zr(XlMwx&ybxjTw$Oq+|3Xw=m1ga-k_D^K(*7z>`j<(PK8RV;fY4S2VHQd3p6t_~&4
z`D&jAm~PgMqqGU7_c7NUt&}ZZfjMs37~(vTs;GK~uAV?)tlr-aT8bX6e2fj1tv*T3
z)i|mV%4o*d^z^099*85zRg!f4%|5{9eb=b}0I1T`w=~Ul`?UvEO-Uv8?rHCIt!OFV
zXP8S%t5K7-Lhzvz)jHx>^YmVd>PW`shq2@33sI$0NX$kWPbH}k{EQoaG+YBW093!3
ztcKT(&I6k*lv*r&b_pcWqiabQ1vep9%z@PejoBvVfAs|T>H!|dHQz$6s`TGTT(OQG
zEUBurxFnY0o{{I;Y_}vbv`)#d{NK8sIh%l0JE&)j-U_e(0E;Q1+LR>vjg8@IOnBrk
zy+)k<k{5zJs(7_0v}~G{-&U17H7XZl*7V)s;?_foDzc)(aJ{add$*Cw36E=r=1A9%
zgLICS!{jXDKgffCxV6GZMs0f_#buAW>UgSH@&IxUEIilP^3n~wCXi193P#8eBn833
z)=RO}ksDj?9h8BfeN(PD32kihjfYG?EsOoqY(5joZ!TrLr(w+nt{?K0C?43zN-S`t
zA>aHcoZORZeBEmpYng&UK}rdAuXJ08vG-j-=QD7*u}vEzJs}+%fZ;Wv%y;uOScuD`
zyKN&#<*G8)hk!=g`3lJ6Y-Cd%q!D!+9nFaa7U;lb_O#!+7h%5w$r)^6RP#RPcn-&O
z;@#P>vG9gyBZ5<doH4;uqoEQxnXo_nC}fO-kfjn4$+$}Aw70{SVN7IBdw-hWP^J>@
z8(hFg!h|@B+QcNgd;o<Rra8=O&$i%pO_CR|T!KPTAqSh;In$dEK)1@u!EA(I$+D4+
zd#`4aJg#i4Bit;EhG<$pN8A)f<v?y|2F0XVF~EgrCa04D>?gQzvPo$oIk9ie(4hRE
zWmt2Y!AM<kasft7Ojz58HO=_t2<EouHoC(nWNy#GLVJOP;=`QZ=u$Wkh*b>T+RL|C
z@{qML&2Zq~;Tr=a+-?XqK0#BmvZ;c_``h8!LGN(ne#z{8{2@TUu(4B5CMAHd`C<P6
zgy9V|xn%bEb8>?_Tyt=e!q){F6a5m&2o5c4fjz94V|BBXfD8QjPY!UkoqvRO8v7fv
z?L$u)2Lkp*`ndNp=iv=2&wl8{Nde0n#m%qfB{A8YwD-RXNhCiu_)7t7g#Q47pJy&Y
zPgfZMz<gajjD_S`pdYFo(X=|k?LI+I$j0E|{{VL>(>a=^OxjcYudyAJ6GZmp<xLCz
zZEx8}Qu1AU<sF2818juhZa;LQ=eSbF*1Y6cj_We98p$M#-H#zo%IN_9APyfPG0-37
zaCgFu@wf{(DKfD`rj@cj?7L5pogGa>Kc9H;LVz%|;V3Td5NNUvZCq|?6Tm*LPiv`U
zv!k4}kL5VJ02|<y#h~8f324kc<bqmDT$))KX~l{ehi`LWq!JtQv4*<f`ARdAl-Qe&
z>yMC>qGJfp%44nu2~u&}DW}09V_3_Pi=-|j+p>NR69~R6ieMcTfjBAu005|g+Hsqy
z1dP5~TmJwEiqXy)$WgvAYqymy9BkJMu5(;0OA%H~5c$p$5-f;&Th9o0w$3Az=oU8Q
zfAX9hEPIsPgKyn)a7D%bh|nx^e^wIM5p>qLWL$yrxL)3V=rFB~ckGilvT+CI_U^cw
z8w0`?5un=#DO-?`+qf&X?Kd1PVQP+%q;ZuQW^fd(ak%(S1*BvkW(y=&wp3;pTH~K6
zw+54NkhHCA6b92P4VvOUsEDg3W*uYjl(cv9m|ELl+vtm@*r5WXKlKX)*OnIzsvW;&
z!s8hzB#byWIZ0#kmvO#uyVOKu?MJc-d=GonTYX1wci9Tr0e0t`lBR6p%CYgJw%O%N
zBJ@5+3wuHqphm%W5a%f*k<R4X;XvlK&dyI@7ep|%+a~4&_++Sgu(MRHq!Bj*aYx4q
zwcJBTg(IT?dq>@LQb?ZJO8QA9Khocn=;$MlAY7wlk*y>W6l|5QKGSuyZHWv4t|r+;
z`i*09a-wsdLEB&gV<QFExhQRzAWG>idx7!YBZG@=fD*BxtxbK2=j@GFMq4AZK>a(4
z;6Iq*akG0U++6d@QHecKz#np>l2O3PJ<@E(GE<{~yPvww%z@tbUgZxZOV}(pR#HL(
za1f@2?{RS$K2~Vf4+O7yyNR-}fD>;YDbP?fSe%jjDO}Lgv@8zA2WYU#P{`ANDn_2%
z1>2i`ZnX?`I~?b6V5X75t+3@au5rM^;?NJ0un0>>CnTo&CFdg_DA?fu2RSlgf0b%6
z2#Kt~0_qpC_qQryN&2a2+R*HbpxLUx+f3(X#^{LXh&Olak7;8?iONZ2U>IET%Uu*v
z1CgwZTZA1%hlY&yM9Sv9#W032ZZ=hmZERN>1Pzq?jlfKMWO=hx@=1K04-2DzjuX%b
zBcV4AdAUTkCbxw1C7YEIlIN9-69{W_Wh;mS0SMWHQkkv^I12`jmG&gvLMj+A4tywT
z9_L}W2ni|#WPy|1p=P4gI5^y=gK_j!uvR_Ju;E!lE!&*@EqXF0knI<`3QCc4w<*;R
zF1T~BtEP}#wlGi1o0AzUCz7~^@<N1G2ONI)Lz-!2!QmYR0AoGE<tH(?kV!m`$7Imw
zUiT#&DT(d&O>H<1__`>-H=0AWjUXvmOD(f|t9n>iFxG`@MW?atyMQY<7^^kejH#uV
z0z*mpQPJtLNc+8~>Q|#TM~%bugs#$|j9%9(o?b*y$}O1B$OcDX6ef~FZq|~v6H&%5
zfRZ|BEqf2DMdd_)jhOdS)QkaTBoy+0IU#AP;)FDjZ@Q+bo;DH%iB-jsPoZTVC~u(9
z5;7>muaZ=LzV7!?{$Z_k{4Sc&E7*VKS+{$v0;-+uGZ7naY+Xw=OXU_WvwQ^)sT^*;
z3HU)J>@Btx3thBd0duzQP(G{LEPl!nE#G^r-ps5y&-Pex+@U34Hz<feb92Iuq_>XA
zjKJh@V8JL+Rd<}+1tnj&S*SSSCQG>E!b&xkbk8!J17pguhAdgF&y)=Y)(|@_E|ep6
ztOCd^u5B!x!B9<3LCX*9wnCmF+}SbIaJ&&=WI$rs3x_O7_BQ_E_F9U%IG7GvKI*CP
zL%5JGwW9&X7}nvxRTR(Lz{)aa*_Z)TS4vrX6gevmHi?79{m1rFI<7dyfzQICHI6PJ
zo19bF$=#P+EaaJzqVctNZN-8fddmZqTk6SsHK+DS=Dqxrl(sbz$y)amkjm#f7f^@^
zaOD?G4Tu3UU}&ABhUAq5l_Piv^GfG8xE4Y`O_k2Yz*+Wa#fZwbN8FR}nEKfyKG1F0
zBB}I_?<&Tgh6w)vmgq6oKeDct8i`Klf&x48a=yTu0IWc09?(Bz(r{2HponRx<6s2k
z6xPPx0)#l-bDU3duxOp7p+DM1(14JXxz_NoNzTipyE~!o?<sx6tYCm!<#y(PcnEtt
z_DCA_j7(e#aC1~mW4W?+(y&Q4H^N(wx`yN~-=0<hI3wtm;~XeGM%$FhDjEg~4VeX!
z&@ODFe9dolUoA_x7s_Kq@{edKIT^HrB&z@%gau7i@Y|E{r4()?I#=VubDv92EC46v
zZpCvegcTDT*tC49TSo+TGe392ZFZ@(q((l$Qq56aR{gOtz#io-{R?(qKDv&TwqR<k
zt=G;&3Q8`Ytf{e;$2_Z8`c;gM?zuliANFhXjKk`yDxG0)3Nn*Ll3}`HP5h%O>7${3
z1&BszwUM|D&L4G?My5qgq(>Ew(T{~=6fJ9P1(Tmq5Er;AzOz(hO*Xa>az;wSWwUuG
zM^(oWKJ2XhcC|c*Y<IFs2Fp8xq;<hk=Y0;B*?RiN$?ae+`Y6R6RL=KZp&zEQC|C=d
za*YlS%RnDQYQO~+mromaN_RWuAc8i#+AI-{7xJTUYen3*6DLDiW?(5qn_F^F6;<#+
z2`(2|{X<_aagGv6J%Zf@vqM>^vJid2P}gfSyW1Vlg#{Ef70%r$AS<eUHl8+Rpp<E_
zCTCe4ZCmd0S`TGuL8dW)7dGd~S25E@IA~KgA;1WwMsyDZO=E1(6v3w0<xL!EWR@sf
zcMy#jg|U&BVMA9{94sSny06vsxS<3Gg_(V2U3|X4=Cc0)y3u>kveGSUs>G$j_gURa
z;iqWHR_vvfk&BG^K-JT|?-<9?cEwrF^i|TZuzRwLY;1omRy3Mpqyrd5f2N4qO|rTp
z8X+cBia3LJ2*4;w*x1d0vbL#dj9FF4(<Af3s$|FmcXq{=f2m&BATA+li&+$RakBG{
zzSZMsbZkEfGRZ{^1#H0UwT_yp!>}r;?lweA{707_>4q!)7YWk31{~xm=|$ye`ATB!
z5&At7rl@EQxg`q=dOZ{H`kACL<nfj2RE4aCpkZUWBSw-sW;nF*i-odnJdJ4V0upF3
zj)FwzZ_y7eL;RaAb=!~boeW{_yOPz7(AejYn^>Y-Et)TNJXG<4@R?ERv8g1O(P*&I
z>tc>TUTyNUu<JAph+MUK)Rj#RASGkpCz~#5`2PSS?4q9&dp5nNUd_sM9YaVSEY*R1
z!BSJnwb#m3;YZsu%FXp}RMWO2W|Dpa%jz9N>pcGe3BYzXLq2$fc_CI+O4qyEo*pDc
zd0Hi^uXD$-mMBKgGoNBH<vKRsHsvW6{ULPmQB;IYwi5-&xhd|j`9QjI&nfUoWaO<u
zY$c>$>X_*b?_}~oVujanvNQz9<fyg>DkD*DQ4XapA1F$SQU$jl?F^}l{-qNgVy1$%
zvST4tI)oQooT8~>+C|c<F>M@;E%KnME+Xv-V=Vw&rF4w9Yb_>aur{(=@>Gouz$wO2
z*&uf8cS@;@?Gh3#l*a~<!gy#+ej9YukgsKRRE}XJUg@w@yt>XMbzVwr5eGWteGrnd
zkvrtvFoT(|lHfS}qn#C*gb{3_LIZGu4`kGI;yXK%j`j8n451p?Huy;Bq~wyenTJh0
z?s2t%9ueAoLx2J1=m^{+KHz_4D<*7*Ye60?7dAwTM$HTrFn2BctIZ(My3TW&vCz@(
z7rDB7W2k}N$s7XX$&OO#lv+JTlBS$DXtIvK^3P`HZC-y#T~is%t|b>PqfsL*ysk<3
za&K&;UdyK%Cb)n>C~AnIko#H{H9bY8ypn$E+McSNgK=;xx5n_)cgQo0y`XuZF*f!9
zDzjHY%8(~>dE>foRdqEa5V?#Xxp|F#t2Ff{UF2sOU3sy_QR8B9qv#D2Q_-6fMcA#M
zs%asYX=3@9bp-I>PT~Im=_ust+RzC6)2;PhME?LADRm%xiF!VS)cT7{rv%-LFRK0^
z(9?tIhLhlBc)Ys%=QoyjyXxi5ucwe?i>hP%LjM4~fb+jd^eT_U=SeYSbno$dDdOu1
z>Y45iXg*h)eqx+D`-kkOi&kR?wc^Up@i;)dnIm&uS^2N$IaM-K)CU)_&i&ST+S9?i
zUew?9%7<RhRfmBHX(3;b-?H`9HL?3dgX0R@MXjh09;Cnpl7_v~5xvN!)iT1)x6r4b
zhmESCerbK4ucg((_JH}>^K!2#{{SH2chtsy>%=3ge<D|Y=$2|#Odi?ZKI@nN0IG}j
zH~A0f_j(rSq2qj!IQd!{W21<@zLmbq=BRaQ#=7F6_wSTzdV^BgVNmcs3J>v<U&V^^
zC)w>iQ6`XKb)6pz$oh(Cn>jGMA5~i>rByfkwGudeR3=8d^%C!@>BHg6A8a2g8%<R^
z<*_(gN-B8Xz~_)p)n^)754Qys1yqg3<6+@+{B$3ak)ZTi(}g2Nt`&7Xa3BX1OJ)wh
zRE(^YqwFWWlkJ5IE>xoS<v52MZQ&0u1S#A_xkJq0P-X+2px_iE;4XFVluWMoV(L4R
zROcHj2{b_3eU7;|Q?r6Lr!lwXNwXGElxVt=U{f$VlsIjPu;CpuP4SfkZ3V}0&C=Zr
zM#mHF09`yp^PAxEro3z$lxC(ee{$AgfrE9N2iZvISa`5eK6uBuM*7C^27al4$f~zC
z`$`@*z2@$^n7lp2@(;>$NDi<GlQj$xi`=QBXf75fDoT2H%6t!^BmF)>-D@!ciLdsD
zC}g5`>>H^if<`{UG)nm11FnUbV`*e)z`c_sh4!*3vyv_a)86c4T?WDj6ml^9BE5G+
z+iv~RIfS<eI;OmGR_r|nip|4o-Ef-d;FMfAT=-S(Xg$i8X=uUvq6#`%Yda1lF|fQF
zT%`|v{sQ9X7Y76NMGE#HY@$JNfRCpwHtbVqo(;E)qs%c#%e9~%s%r%T)DRD~*Fwro
z?s-K`OCz1_Cdwzo@O{GeKq|=FJHP_u4#<dRE;#{204Cd1g@Csl*((?|js#c$g{dK~
zz~v6&_MdBy?wh^NHzwr@Xed{>li@Yk$>BV;&N#|zn)}$aqKC7ia}R4LhP3B^n;b-v
zcuv|vWGfox*~&)xV0*{xR8J%yqG36|_E;;S)0hti$O+}OgI$F*q&nn+ppZ0-1o3A)
zmd3Qa+T!S#+~6`4F`EuJL`Lh28zRPqleZ%0Dclb!t>c~)gbRICnbjVI4rv5h$r{%e
zU843)aZZj<-_mk{q%v0B-r!VH#sS6br;>R$+_wJ!L^RXyaQ2Xz$v(%mp2U{&a+lm=
z7V?|5!z3hYW#ZiqV@Wwuh8tTpQ8C8$xKfw=AkfOrdq5m0T)~{Dx#Z)u)JEj;m<(yS
z`Yz{`uRcOS$HHMoxt!P`rfY#N+KO=`<qst8j^GeSg0f=EplkUVL_}`P6Z9%GQ5(No
z06tQ&?Q^}N!95(w>?%8LvE^}P#euqHf2B#c9Hbrp07D(^=e`q!n?-`>MC;resNT}o
zT;9pht=bjSv>$V9qNtUQ05qn(qWq}d%Zq}lh>37-W0b5U8;jv4!Z4M&Hbf|%H{RQn
zp`e8WaNbnWfI#OeQb$B)y^%`6V|7_PLBy7;sabX#WTBfJHX--D`>hv2$dg4(amdFD
zg<(p~&9MqWO&gzJ>>{J3YgvbTkeq>v2o2P%EyzD)vD3Z3?Y+asQDu(<i-5VVwn|=Y
z7x>`Bh4t{A(bPN<;HxOL-C7$7BZ_h1!zd8&azGzM>)2lRO7b&58ZV;By+cJW{{WTg
z?up&p!(}1VbmxoHRXv~fyj@efYk|8$7HA@o*BC#tDp7r*AB!c?p@&d=O^FU42%%IZ
zXaSc$2J0v2O2c^NASbqJmN*-XcL|z{>5-R@DEc&27Lk^7Ncx3QRZ1Q=Gb4+q!K~CV
zyJd(xCrhkSJO;Wm8TwfT7wB4Rv<3Mqk91`Gq<)?@-MgBuXtf<R$854}`Q$5BLr*(5
z)6_#C{+B07la`EE`gFIj404KHK2ev_vF-V7*4|23*xSuS;qt_>vW>#g${O$Kdu*A|
zoSO7`-}-es-)~Mx9sdAfE1jikQ4(qDOWHd)U3xL0rI21&SbkcdmrZP5>S;+I(&Kfs
zfaH16HL(&ZsapR4mK!FCWBoy|VemrR%o(`;Zip8D08<cEG#Xrhep%&@Jck9GsCBbB
z4MTzCl{;n!`Lp3!oiVZh04N~%LrbQ#l6^7_lJi5ZOQI7y+U_nC(bNJtvyhX}NXFfg
zJ+}LxC7P-if9*^@MT%uo56IDW>D&pk%I3}saxAIguLOZCPmk-Bq^8p%tAVo8&AQ`+
zvW$I=9L<7>#jaAaRybcjLb|6;tEX|_6SnyS2w+IXf*et0m6JFE4XjXdkKzCn<>jrp
z!X54f;N3cn3oMC~ZhJu5NVkJ!BsH>wwZ*Ojvzz|_DUJ=WzZUF~tOfqp54cZ9G?-|X
zCoqy6({9`(rL)<4g&V!G`{C`&N*HZ92FK?LZ4`qnTF^gG$CQPjU;70FZkRIR;ox>D
z{<*)smQyQdIJA-ovf>&>2tNubTnv|Q1vK1R$*6e9lWDc=ka6WVer<bwQilP`R*K$+
zk$w^YO~EQg*!LMpZ1H4JtY8EV3VR9p32c0>x7h$Ajf;MMQ<)^uW+`3)@KP4oB*8uw
z2=`4R&$-`wSw>n(#|c~y)g`TNKr1vl(9#Gb@$!(8c}^D~-#-h89PmQJSj%LaBpjRl
zlgPS8hTg>CV-XMux@c(Zr`QebLSvdoD+Mw#%Y7F!p6W|qfpmqWU;h9LSQ-#>d*Cj<
zcwKKj(@4iCpfTs;ggn;gizztm%7$}~DX5&lrgPXy1eD53g46F7x$vZyoA&yrQ;7I;
zY^agPm6Ntuq;RvYrE41R2kM8Ck**hGvE*SsD5qe)=N9~g=;dLJX4czaAwe;KziWYM
z3DCLV5?V*mMN{r|?Vk$_k=~PBF2^+GaBQp`6%$3iK8i-oAiy{Jpvy#aWphSCnUx^6
z&gBoi#FK-5QeyuAq>q%16pLsudJ+%QwEQMX8$tHE>K3%vScLqLK^!HbibG2~kh!eS
zJg2t<AGd_-5>}y;v70V1khMu~?2z+tm5zw)Mi*{%^TKuS<#oKE!Z&xqPmq+_{{TdS
z#{mNzLSu)@ko+VzHdr(<pxfm%f>fJt`d#%&?#;!~ur@H@<AkB^0|fobQ)^g@B-+E0
zoJNqosI{Ei{S+^;B#V!QA!xTLu0=9@Msa@SH~#><C%g+A8?FN4=-3F!Bb2wjkA=={
z_$iimb(;z#2IHKh809km0BqSVZ(vXyaU%TintLv@td`$I5;K>hiMYtJ=MZ@dyJTf0
zuHM}ELW8C+x3?Y=lXH8feHUa46{rF~g&T#eLV4tirkfFan<9-u1Lqc9aegwp2I(_?
z5ur!hl2bO1>Hf)W^JKe+!qq`Y`rYKSFLj4uWR0k~vjx6YTV{N|=bfX;D5xZ8wU6Jj
z^(%WkGR8MJj&h!4*gc}|`f!6~Twv`4xSr|msTQ+xPi3uo7h$ZH!+g&q{Zus-Z*a4H
ztw2jx9A@&!FW4sjYk0ZCP^81r&Mt8-E+M{3d{b>9vA1#Zg_@>6=XkK}mI|g43tCX*
zx<RJP7{roTxRdY^EDewKIafZlu}8Vi4e&dZ6uO`;yN$o?zER|AGy*{5X5e{BOF+T7
z@~ES(e1Ln4M}%xr++3BLF+8rhOBUa$LzkDk0DzP^;8<7$IR=8B_B4CQ`XpsTIQ@dH
zo7Ho&eu_w0ux@d($+I+zR!G-n*d7#&cH?dWu8v1Lj0Gr|wArfyzKbA7>1rNfV`iwC
zIRhmjl*nw+_gc}CVi0fSCvET8cS~T#+}XtoQ8llhvfPsjO$IgWYf`oC+zP05ORvq;
zu*oa<77HfK%Qwy~WYF!yI6<|pCdVWxP1%<pvc@O1_~XiCvh5z;RAymob7c$PcVwW_
zF*7E0@@`Z8&&eoZBX?t!DS2~j(_n=o4VqCM!*Wo@M>yP@q@BRKVvGROlgi6x99~Zf
zScq$G<Ms%5I>QOkG0w}*JSU@FgxJ5}E_7kPRN*690B;^r2i?{J=~^-nM{{rzJ(g|B
zL^K{<j~HC|#jhtG61gNAY^;^V*8o^~Kur;Gz`u28Qd_#feF9_@?~(V~eu+~<fK$?z
z`=9#+Tw9B_v=wC*oLoKU=mIvAO$|5OWRl8}xZg!%Xq@(4!AB(sXX#+Sm8TT!jhX$`
zeO!=6Zs#>}<nrR36^16tx_UP>-N=tktr-a&TNAHm3j`$fUZvX8v@VQK<W?lt7E1XV
zMVZQAXg_o#=8h~9nA)xP4Y^d}khWPzD<LO0D#n9Tg|^)AJ{D$gQQ%tOs2dc_H#Z6y
zFuD5~N{!?7*c!_-C@PJ4fux)Lf}o~}qz1h1aw+tY2HnIGr~VvYY;TZ?v#2GN#74&e
zg?6zp7kSzc)zU`Cor3=WMO`ag_xs)UPP|NMXx}W088u0&2^)^oGu<PO39{-Kh3o>d
z5H+KWt41+~kd3)^0^RLp$sr9quP)l$1a(82J*~CSGZ52^xf`&gE2eBL_q#t-D629!
z?e~2YGQjyBT_e858$$$bW&*;DY?2%zshH<v;Y`R_JOoS(0Oy3-4KgQ6Ssj`%5U-y3
zCdi7iELzO`s@JfO)NYNTT4SV`Io57hScdL)6ts|Iac&U~h&taLk!UKwTO;l*b#*~m
zEKKIgvVY;50hHFv@oTA>zea_+tk=ml`lip+6S1T;8!Bc<3A@R+gp-Fz-)n9WtLVhC
zYn2kowa#^}r;kxK%By7~hrEMiu56BW)(m+{l?`Q+t0b2Lx*l3XF}#oV_X=8AYyoxA
zUzc;hH?T_847Ne1>Co>MX!@(jbeN<78-B`;t5Izvf;fivd@EfaRC}AcP(qSzlyOu`
zQKH8iF4h9Gx{W)caTdbXRO(^z?P$8EmM>aD=>R$57^z*bC=|5OO(__#`BxN_?TlUA
zsT&hoFf5eci>qA@qJjgNW!svEB#!w>yBw`yNF<O_f)Jjil8JBJp<xWWY?xfzq08@t
zw>HAoY9uAM?38UPA;MBh)@mgrE+ltRUkU7L4bW(FNbUl5=7hp5E}OY)HxhQZUn`v}
zJ6Q_n+q!~UhOiQYX5t)XYKlshj!0CsHLmPXp0u(%Yc5LG2GTEOt!TqgvQ|6Ff(l9H
z{Z|O+sUV1MkcSjM*u4IM<C=Lmx+)r3q|42M=_@Iq2WV)rs;<}C&|1UxLCGODUk1}b
zmm87g4O^?h69{1oEc)uor&)p4Qq$=*6Z@reie0l>C#u%uk;SoYB=}NLQtB0MyYAMX
zD$7aH;*5e?3cmsvA^=zvX(3x>G<r-?Hu9UFl|4Lk(D2Zvncl7Kdm$%{pnIK<s#kO}
zE-5Qu7{~03n!YbchUD30W2>iy_S`vIEg`h^ExU*}T$0Hsx+z}FZ&lADn&*ZP2g1S2
zuGPa(TO3b0@K?F&dPOYJ`<M@vPfyZXd*<F)({;XGnVx;7>UxD+K=htIs@^IIr5Bp!
z>(L<T`U+@<*xD?HtfQulro?@db4bY;ai+xAWMx=WLmW&1G$N{-8(wyW5M$mf1&5V*
zyFhDVwoi3{M#Sqj<yK2Pbj&22s*3Gt?z<wnDDtCKnkwB&o}H%d$oW~FPpG#zvKzVH
z0<V^uw!Pls;1#Zy)9jAUdvc14dt$j)MJZ){bMEq5)7UFrJ4bAGE*CxSv`|n-8$b;T
zV+%mxJtfes-(b|x1^^l?5wXTCl^Ymv07b(Wl%o*1Sl9%i?PG511lrl+fu|zjWVMZS
z0$CfbPXHj@2mP1YmaP;FHgH)w{c57A<~S}%?xBj7t5K5j7j3@_L8fStK+xxavQ72|
z{)%c1CR&$=)DrKizow*um7EKOJkrGjY}*TXRW&t*?k#1?&Q+vk8|)^krH=N16jacO
zo(|O%Y`EO>ltfh`JTw5ha8A1;mMxbQbd3zTvqBG3bTKr5a)h5&b6K`KlCyf&r8r@8
zjjw*|vE@&rm*Z%YQmT!PCC&gW&Y{#)a5%NEX(PhJ^^Uu!x_7oW7PVxds-8)=PbqOH
zxl?&q>OW_p>pf0g6NGLyJ__^wVxoG<%ialAl(wkCv!v0PE=WPAKFpd%A8Uv5pV=sB
zCxx}tG-x4dKHJ*rx}QjOM8T~DsY*0aGKLy=%J9~-oA_RV(49K>y^oSU`M6fyE79!4
zlC%%1^a=_pYDmK)Xch@AA(Fnsbjo<?p=(1$z)zk`8x9vl=G{6{-GtdAL#IFzlH!&f
z&EO{PCQcEMZMCg`DD-Z{fW5%q3L4nn;b1O2D;PsUNm@BPC1FU<HjU<8&IZcHow3Bt
zuH{KnD_MXpeu!X0@=D229>tZ+d#o{K1A)!COHlU5l57%FRI$dxguvL+AH#_W8o&+Q
za*3Rcm<p<6JKjJ9CR-Jj0%)TaHcsBhHx^Z~Qp)_j*hL808*O}`(8-OEZgql|COx9z
zzp`~c((!SHWE~i0ED%}?Wox8x_PKYc8{A!WQw)#xT@GpA!6juR3MX|_kF;eqrO$W4
zOARc9Tr{T3x)XbFgV4yI@-BD>vS_7jZabVxhy6*wZ6t*DJj-Kzptfg7NsC%63JLzB
zuWS$Uikb)B_fY`$+*t`k(VY-(EE!B~NEW-2)Un3)RpyeV(p*36QArHheMu;I<Rq+`
zDB4S&(f3vG(ba7mUvIjGuScq=7j&coESri4Dr0BWD4Iwz0#uaM^zv9R{{VGYCr#~j
z%kn&_Y4oE`Zs(gM;x{t!l~LQunx1G~azd`9fxVoIiZ;f1unB0^y%WzPE$nJ+b6KR8
zr8O`yosbn(@snnt`UF$EA5kvn5CxGG4Q=juRc)yba2DkqOy^iS#@`E;YwYTeMdU8p
z+l-;>DvNPon@vzZOR$fJPmZf3fpsTLbXG$?Zsbv^C4@Dqz-TeFTsrHUr+R1f+#sSA
zCXC%@<_w#~!1z#4SvZ8ValeqYPo`lOEwT=6Di^xu$&zcKzE=A@=ToApsF1vu8|Q^h
zQKr_9Xas$iuMIw#fCmPYJw}xb)(vR2{3hk95x!lXH#U=0a^m2HlTI=IyOry@hKCba
zadNVnmW3nUb~pQ`jGNLG#ddl9RXf@a(`z7G`Gy=gmA`LH)Jp3g?51x+wrhzhT^R3R
zF1vB~*=4kjY?*PVwt2*p&41KW>EAayiu4&j4e8(db(t7`VFV$k{5P&(y*9H+FT>d8
zs=p66(GT)5KV~h{$kEAC!BX&Ya<1!oBd95fd+B4DpVbV3-`kWNT4a$r(?s?=!-bMO
zQ-|_HDaKtf)b$UzwaT@oGQWnCbqy^L1RE_41aU<WJ8o3xH55`2a$s<_Kt0VP>Zfa5
zdnu=TORy5Pz*!__-p6sFt!=DSf!6JWtrtk}*5$;7MC_A8m~J^zF}S(H1=Ue7+i+9C
zFQ`4G5l~}n2bIO-3?_!U*0Ee7b?~!8CP@?A91Yc#1jgVJs~E$;7P6iq=I}4$DsDeT
z6u!+I1Z};-bLF-bBsDTL0d!<CK2C0elUic5pFvJ}H%xt;({#H{uVoPqzrte>x<1RB
z8NLD`k(18~P{I~7VDZF9YpI(bl^_HJ#}YyfS*?w9QI%g)7-R0#Yk}-}P|F#2KiNuH
z?4&0}Y@314bqltRaIFO>C3M<*UKIE=SL9DcOo6X&w1gX>kQ>;5u4JTaM&U8++$;uG
zK|m0(*7*rRkUING2<W0C^)8j|ZNO>`&}dp&q-fzBDx5}2scf#!0-hNf;c{+#Aodjy
zmp!++vWkC2#AGJP6JPww15D=}94w4>=0<RCE~OO_IBn1Dp!5j&DO*hPNg$(0$dEbY
zSORQ@st+c`rwFzOMh(T(6Un&V+$>;BwZJ(P-Go}$PIki9lH2{1u5=qkg^Fgth$M&u
zjub8yHva&Gd21ZoG^h+Dte9wtuX6y~Wbs!Z;8{dkLHZ?YcN9`J1jkz-<eMplK#+iY
zpq$&^;We!V+}UQ6H3z;e*#SaCjc~h7lEE{YKrXvgo}VlgFW7B?`z5A<$gg;h`Gtv4
zxtnqVzp12zx7YysDoXNWlVg8myoOXQ9l<1oNql$6K|?gx{TB&cQqubt=epZ7k{uys
z{f=D5y~D~LXEd9$31gA$7X+tFTe4XplJ?r5kQmLjq8U{1b7DKDPf*fsTDHgKq7Pl5
z<$$Q9bS^d`#Vg$#oo0dxhDJEM0^u<xta*;aSw11gETi`{ghWK_xv@>?F(d$6Dcs;;
zMjmfu_}V0X&}@;S*R32wha%xN%?9LI6d5Z8uvAk!vzQ0U37c$z&a?c5&2xDzA8?R9
z&LE5@2gL4fi&hU}-~ntVIN!Qi06(OisCgogWse~v(N)m$?EI-3>{yJUTIpMf0Q#aB
zMS%+iSm*7xAF_q!!~krjac#a-Z)L^9fkhg|H10Mj<&NYiKq1D;Xx`!FV2mJ+e{?e=
zY?3>0z(+avZHPj-!LG0frcPZD$wt>?I3;B>qX3eW%6AZ0N1J6l$#5-y*;3ifO2;vT
z3*zZ_I1UmATHVvbn`;!d#u{WGe5l<iwng%#e$&E&K-*h#c%pKU*S&<?;HCoJ#B+rk
z`L)7l*9xf<vTPpftb14}T3ijnlsG#DXQ9@_$nTXa9_#XMm_W7<3Glczz?|EJA44Kz
zBf}02zEBkt?RHvE&?`sH8=LNLI6+RxP3%DUNT@PkLZP66xQip9oz9E`?l@J%MqEX$
zZs?k3v<ws`kl2`WBsS*h<c+qs_d~Iui`{ld1lzKe9YGBO!|Ij9WR4UKC(qeD8}>dD
zv|2Vu*Mt86g#Q3ZkG9e-p&3hN_I6T~c1Y-+(~)%CgYE$+e2oDk+~*s(0#>lC_CIV6
z7dLB{8ff3f(mW`*?6_Qav0C4wJZNN^bXO!dX}@IO%gr8Poy|X6smtB~HzcPu_#lMe
zB#@8Ci$c@tn#DVIws9jzWji{8R-0ARZyzmC5FPNE_<;uJ9uxex+0Q=?K8spSXH1sm
z&U{C}axO}mX&d}Ho8LLY%F9U`+j|Tk<ce6Gc0Is&OsYpbusE8h%_a7=%#oKvy^)vh
z3>@}ZrqswVUf_NTA}X4IF4@UG3Tl!>xUZu}PS`hEUGbkP-kO%0c46#)pDQCxs?{)$
zQG!rBqCeFsUhBFi#_uh-K_(-MW|n;x83xv!g#O4mx<;MsCPs%}`GyJ#pIg{NTU=g0
zq2XK7>#hJda|k@&AyE>Qloh=i?Z5Q3S?tLI8iP;Obh&oEp6tIYKk&9<wkeIwUv?X%
z{NC1(*ZrK*w3VtfWlW}JV11hK4f_$oWn~2=TrLJ3uI%RG#T_&d)jxZp4R@B|5lcu|
zY$OhEhba6{(Px=1&p553ucVdDiem6PIlQ4@o}+jZ(jTi2{4Z9i(y3|(z9I?kGJ-uj
z6CHS**L)FTs}&@PxuX*tW>(w+4}uhDb0j;1ng@F=tMrz}33N^$BPeIlu${IJ9uFz)
zgZ&w{$+d;daCQ3vhkVhvkt0if%Ii_kY2{&X-4XKKEY(d0qe%Y%;Z?F&hw{8+C3G^C
z1pw3f9Bh75+UK*s2rJGTcSmF8r8DymZXO;2%^{SFDC$^UXST=43D1$G)@iu;Rf2f!
zhlJqs%Ulo97XbW}SvJR!&z0L-n_MdR=a+S^rxQrtT9Lt)S&%^n*h(DX^-wmT9FdhL
zs={%>LYgYFCQ1p%3E{%yvVc3mPmggI05~O~(?o=h;1H18wa3*r?Pb?KZh*+^k=-Wy
z^ZO)q`-K~b;1tHPYus~W(tN0H;r8VrbB1oRK;=OVBzRn0)5uVXGwut7t-f89t|N0y
zn`<4Gy59wH4sRe3qHCH)1=FrT!NShMbBjp*KeB6F;m8DhuD)(=yK}H|Y_YmHIy1{i
zDGXbOwc!5%WQ5#{*)h#N6Cq@CnC6lR&&nQf?%)+Y$sQClIDzKLkts5|X$S=sMEKkQ
zJf=w4+%D?^S4R_CL1sRQ&P<ywX{o8?W%oKW@TYAZQ(NqGQjZ<gEOWXuXA-Pv>rMc7
zZz;PX$%tz&>Ox~aM+iyU$2#ES<XKy?t*&LBE-k^z2D9?-Y1-1m+Qk8)0qJ{9ieZWE
z7q!Ahxx!7LpNyhd2^l%?vvg7*zHpp4JSk*l@&;5OZ8^b0>~*2x_T`|d8s?tldA?L_
zaX+gm@oYZ{Sw%#RXeY4>%AS%Zvf<wElq_`Zk(X<Q{4O!i5%!lgErp<|boW~Av#f)X
zna#c0N7YRoWlVP51AtREQHD%R#}BST)G}=qkB!5Sqi`zdvX)WpH@||bt60d+*0>af
zRWLs1%Hl#&-pVp8F@J)XRyz122}AC3qc;7Lj~5G2EOD_Ix@q5Yw64vtcuAY`jRlG&
za31D@K9@_rH*t2Rhgf9tk-?<c+USbWA-%9c9#mvFVK&`?TpaH>SQNx0-xw>qTLC-u
zcu3|t*BMw13>dZ!5(iu5bNBZNrzYg(W@Lwrt`;DL+Xo<~jxv_{{{X@jLm^J)n-I7;
zy~TocuG@l;jB%B^1Bt+Ln&2##Zhg1CmjZ3&6bcwyY^L7Fl_Q;VoD~@z?wkT!#yq4x
z-cz%Ggwt#CkYllXrjeVBCHwp&v9;C(2zb9_mv_Q*xEV>cz7bnC&#IY7E$U3`li5ls
zT_DIUXz-s5LL<Is8D#9<!8%!;CS-VHM_|1e#YG+*ow6oVhMPAjwN4Q*f%=pG05S#|
zLr0$FEKFp^;9oqW*g7d69I{Geu_pYU%6KX2AKZ`oin<i-xWG>^*j>WNsL`yb8haXd
zIF~!gPZ5a500kK{z&m3EpD7x^8@bjc6+mpLt7MJ`Z#~ISLrU=L*q19=9>R9CXUdi~
zhPLe)MN--@Brp~o&%W;p%8s1ML2)2+Zzw6|4Rx<_rKhjh2Xo*k&9~6WQFRqN0LTD*
zA?qIuV{O2<WnWdQP3hUEX*>?<u+%;7+~P};D9Xpta3x?HteL;maJByGyViH#!kQxE
zZb!i7RUu1givZ<IwY=d~8H{;$J`)XGkM^|f3zIHPt<+27glgGkG?BBPaqt%kkkB^^
z9|2c4)OHvyPbb3TPbG*hIZN^9aSte2J!YvKV1nzrz*X$4mZn=Y3m)nzsahl=!s>V;
zEyHkAV8bXoo3mue7pS1<TN41kxyoZLv4)QUMGPc1{nATjX7@h}u;;LmJ6ha(f5}mq
z9PFV*-2KkK!ju!w0cK=}ml8R$hF6x3Y!sx8w>%)GCC>Ot<w4>RPb+WDhmweN_Zwpv
z?n<qVuXC&~_EvQ8S-$RkA=qk&kF;Q1p5;Vu`iQ!+*uc|qa)F!|64rp5u7x2oSm%`g
z08rxp0J3O+@=B4B04`8XhJ<9Bhzi1#Gz-}Y6EkoMC9c_!Hy;ZciC*ouaX?hnxy~RJ
zJmK<;o1VZZS*J+nZguV1B&cPfkdR$+ZdIKaxfsHV9X;fL1&5S-X<W#*w+6`_F_ACk
zDXE!x9?*Ot>UHQMY4qA0dszoP1DxXLl1hChlH2Zhxm?o2DZR1Ok^-vLbqc&NdQ9-E
zrG}<QT1S#Q{H=r<NO-Vqkt0Wmg5+g1JXj}f8ReByG0{@U)?uUt4Mb0E`C6*zqJ^f`
zx~2vf%5n~QT}n|)M5(f-8aZWl=L2MPT70M4#_b+e?F>-ZTm)3YCNps$0J-vJu7`{)
ztEAJ|)?LEqz0g{#BaM#QM;(zB`m`}LwXVO>X6vh^s*=EMZ^D|%IX;STNPKm>9cG=@
zQcG1)FaVnm0SiqTFTmv*_`^k)M$!_Mf;pgmqm(q6cOer|BNzzDDhT6rkI1*ei<U>x
zPBC4EQN58cTioQe6)$nv#*%yhthBu^)*+x?>r<ul#5TEQ&vfyOpJGZ&(SdC=?*Q#3
zNHpmKNi8>Co&JLaWAp_Cx_vZwEeWVzN0`4)ozBY*kr7bL&<4vdLK=Jy$ZJ!dr_;5U
z+7onZZ1dOC%E9_bNgG{%akA5E0-77#v{_~<Dj4}r&(ad9TN#o$fV6;zFfejADPoYE
zB3jtmE^<{+jexz|M$i-BYos0%<qX_h;y#Inv5|`aJ`<)XDWnd`u=y$pX_^7Cxld%z
zlO&OKD<dcLf>JpksMtL{G+^#_Ps%8k?X`dbJ+$w?1#zOC`28UHTH9I~V+5K&2G-b;
znH*9$-K{Ft4K<9*y~Pk9@Bm2DETWNL1Ws@2B%ca*hq=2!AbcWy9P#x^A_uY*GNQ0h
z$9s`;<f0;hvG5U&Vqsw;<r)py5wO8Z8*_Bw87P>d09>O$ut$Ob0W)dtje9S^!e2-M
zlql9$IBhmfJQ9qSEyXlbtwUHJ-77ny#W3Wh5Hu}7uxq6UvM4|bUqPU9g$BX1ZWBpA
zVvO|L!tY6!&6cBBBQA4mC+;9AUSeSEP<0hCjtD`cSotQmB@Zo70>KL{KykBjQ=p@o
zbGgH7Q2zixbD^)QbB%(CM?A*OX*X8z(8CzcN}qfXw!+s5YwTAx%9u2FJl<zmb7f-{
zH6<%<8r*q7*Xr@a4TxF2M_-ah7R9;8;Ria>7QLEXLsf<lLtFyRR_iX6#gUtzf~rJS
z)z7=h1H!t|v_`SuykF{v7W*<|DD>*;=Uv6X6=?@eHX*uJl6&20wDC_(5WrAsb<UFv
zX#<2BOQ52iwD42mtQb-@siO%S1hTl2pZ=aji;aS4r|c5nMTI20nhny-=970lS4&eJ
zGf3T#s5L&IYi`!M=fFX<jFF|PuZ9M47H?G7;w~*~?tCg5iFF-7kkaNb_wJ|Cx_$CY
z*Gsv_<xW$s!j<V0LoD?&ZeS}%rfPFgvhF-~D&Irt!?0O^4>nfPbj3NumL+me$j9_L
zgEI4VMP%;u;ugPkYo=DzwVT}QpOtY#($s8r?Tt&SQNc?Q5d}4xE$I!z>;g*aiA{`_
z9s*;5aJ!yRJDkUo^I(J2b(rC4XmAJWyQ379v?E_Z)efhN-0KoNtp2gD!wXATMg9;~
zGuG-3Er#K$7`l2=;UvMw>Qy$y12fiYGUDxND)&m!gKYQY`6%r^h8P$<pxIe4fB*nt
zGD!n$Wj!k*05zZ@8o~5Ue4q=a$1d}P9H=TbP6jZLGUYe{w&g)pSrh=>z+1USz!W_=
z#ocSFty@`&nTOm0&uhI*$boAfN$dj4nQJvU_er=g_DOB@8luxu)vBxJG1K2~ltz!D
zJ<bx(cR2D&FGHe=AU8BC^E6P!iv(+lyBkYS9XkL5)=+9%gix@J-(_E@>SVaGH(ge`
zo}!`K-*fdrw=RvOIn&EoEt*Je)vYBDv}5jtqowq+@~tDPV_E=Cp-5LUDQLTQLb{pz
ztQv5vMOzDiJR%!aNWtzQZf-t>YRWlj+{PCctZ!7*hKDrRE!MTEQieD%f_@j9>&%j>
zS2(bSs$$6I#gd}~twd&Xh#xCGEhCug*=_3R$Z;H?<kFuY_OSlTrKRYbv}d%}n54H0
zM@e2<&8;>nCUpGQ2VwgKEA+{!&79YM%UudZRXKm^H%DkvF|q?-NGh9BE{JeP$~UH?
zo}y8;hbdc3Zkg&j9Y}m&1#DR2F@;gnlum*n>T_jy=Z3XOq`D}Gq1?hRlv@i+azd?=
zR}*I8Lg^#`-N`l^vd!;-r?D%WQ5oO?^i<*Ra3=UsdhU(ZZhoa}3N(zE5qqd=YZ}(z
z-Bias&dI`T?j%{p*GpRs&`akM8~(~S&#+kx*9P~%QJFz_zH*!heME)%B%g)Ut_*P`
z8zLcruV^H5%8sd##@vt)lu`<n=sFphErt<)l!dJ>HvQIaIh`5Y%ar%l)=1l4!@}1<
z@3P`%FdHz7d?4j*jrS_KD`kvZB&S6sMDDj_w%F<^BFT>pHo7hnWU#%JV1_~ZxlR&F
z%(R;$CcvVZZ7#@#$pHrqbOu{*YN@N9X^CljhsD%%v|u}V$x%tNjaHGVcBMxYStE|h
zj=NE0&mpbF)Ki#aWsQj*6@K99324G@8?kPK7&rTo5IxbKqJjs8v?3zf?D<uQk_r_~
z+wMpn*PH+pGD0?z6b^r;aCi$e1)$j?2fr!@2C!nv56rpPx*{!vd(zN<v5{4V9D+dj
zMgDVe+8UW^dtYcs=SP2PXRr-7ak&Uuw)n~=(y%nB9z)%H{Swf?Y;=uwFcgoRwYgHt
z0~%dq4NRx{R+O|A0m5HZ);RKscjVa}oc8Yes*+yp0CV9BG%^!#^Y<!JZIy~HSjY?R
z+gP93UTN)NU}#w?7R$H*Nm>diofAdUG^=KJ=+VKZ8GtPoRxoLGQIFx3mHz<LlhWal
zxcw5huB#%q{WFOAFEch-0M0-$zs1y1Xxm1%N=-?*7P5ign`pC|F0(Rq?Q4a<F8=`8
z3olwve8S>S!kWvK`ZB*}ilMXLdydp2>TF2g{naaV%|}pmnNC{M-5m`ayEn~(epgO4
zHm*oKmq>iIOb6X3_gx)NcANaDA4DW}9m0@O`b^7$yfL{jN@^<3o~*do<o8e$8;Ki5
z(_187rHL0F3L+=NV_?@6?)bheVy&J}k>s}N5QsZ~)!v!6i=rJf2Ms89%-o+V(o~Vd
zDO(#L0jOupT5#(o&ppW=K2>!^L)vUI5HVr-v!8H3R4rR6s#|GeZTza)Ygz%^(hrm@
zm1W2M%%JJ^XtuVAXVV!Qx5fH=T|oZ;QZZ&UsF|rt8^C>tR*+ReJa-^nd0t)^$7vpy
zjg`wxs$^5h`<rDK9W$CPNkmHPA8Sp%ih2ja=YJQA^1R2Imq&jGRu3FRVW5-rPc#!$
z0@lR*j|+F9f1|aa$XI@>RYr6@gV`U&g5;l{$4LylcKx0xdSa>W+*ssoCW}!Bw!`}`
zTGURSBPKZ8_E^1VQ}kR!H00aBQkUd1)}m5AB!0?xw8`!ILRZjC(}?f%Pa53ug83=P
z3K7;cu}TE6KlW3H<g+)p8h$KSu)1v`s(S$$3c@avu7C9aei2#^Tj?$$?QQ;WwbcDp
zroJ#*<|*X-mV2ng5%J;enVJrbn+8k$)r-1V#~CdaMpyNH98D#zY5FYnZ{h`sV;WD;
zD1VXV<aUcJIHHE?8eK#O;Bu>r3k{r`S=JA!9_YwJ)7JiOKs%DXZyzpN{mxnAkNra!
zLU=vOvD5U%%NTKYD4BF~w#><0iy~xRHi{>o3M)93V^^hBMUxY(tLLePl<ky&epB*G
zu~L47kos-8RrA$`y94_vov1-Mvkm+u^rL^cv>@6IGz{9Q2?J>exMg$NFjQWf1Fd9D
zJDAjUKz4}cguk32odemPRj_Mh7zsr+&QeMrL&qf<>1T5sL2840<iE9PCZLJJ<)Y{b
zshbP^qyGSv7O1pcm0pY8=E<&W*?qT0$xzmk+i-=Fa_-0vWGr<?@wVk1Oz8nT$0#<=
zTI<@#i0i>NcptLH4fNVZLP;cSP00z7%q4Bx<s|Tzvi|_`m6;K~c%RFxkh%gn7DGt`
z14%cyLpt0v-7;ojw_}}Vk!33(i*4P?9+jfT<q}xmPcK=zGT87VYfjP!-48sDwVRYY
zfz3B*O^Q={I_RWsgqC+-ElV7s64>IB$&=Hyj`nbx&@GAxBb3&)rNsA0*D;39@`{C#
zzueRqZ$wOm#^Z!Wm_IKw-0}s&o*jUDlvDa|+ykxhg@G1KtcAn%s@kX1%T!2kB~;4N
z9&F+h8NYYxC*>L&RigeD#M6zXM<}Ot%a|^z<9yM$5bLAjt&j9fz;3q@UV-I=-tmis
z*Tp{4?@Wv<NG7Fr167S9VQ?+M7Fp<9G6cxia6&@z<C`rup-mpr-MBs0dZLxBmeJoO
z6(r35#zshRC(0;EPU3lLiL|vKS-JYAx(UF%k&*Hfb_+VJ#t3r=Au+OWp>%ml!((EN
zXf}eH@J*A5EjMYg_)xG5qN9>6yI$P+O3NytBdC-C?!VP^(z)W~TFG9>i#?7PP&Ag3
zE`VZ)+<%E;7ZYQ~RDiU&-L_mqE<2`=LN~G3_KSpvlVq>97dF=a0Lq)}yd|PH3-T_b
za~gOh5(8cEnD+LtK%pMz2Khcy!4}A|Nwfa|u$#2s!XnVN2g*V=<P@M0kmR5c+ZC+C
zY<a!ZFJUh5rIYTVj2FC(-(*mk9*Bt`<FX;8j*J6>p^^zVTzN_u@X@$fr+pmjvTJw=
zrMdbfjJPL@5s+?`1)+|{3W8RHatfYdU`t(eBgrR~NV07aI^&X+fuvlxG^9Db+L+eg
zAzcz^nXLrlpQ>GeTe4(ZnC=w**MK-m*kXvwb6{?g&Ig4nqO(a3x{NsZLhO4O_rBOR
z_)t0T;S}+9<RP5UZ_m{QMrdOQKd5q1aJ7yWy^q2c#CO5+rfYBpN6HdILC{vmH!UE9
zfP1o-9Vhh?JQVi4oF3l_OzMlWLNSg~wZw80S$hnwB!W^h(IgISxUx<&g%NjR3T@nf
zPbg5%R7?rI?wz~p6d;z2{{Up*>-~OKpvGjaJ+E}F7x1G5U?~9{-6>S;=Z6joYYT}N
z1L~yQ9l^)S>{`XYb&SQ`@pa4v*A`7^Z#S_-)4VhQ;0@A&wva5B9GfAgBpU|;K8n@i
zH{Rn2D!OJCk`0w&&U}p(uWTe)(b)e0Q%YlDjJx<X1L*7|k%g`*2DSU{9s90?v~fPm
z2-_$b&&VoJac4AJ=!JmD&;~{Of{AH$@}|y=X$>uD{!p4*xAeKq`YCO5kdf^jkWy%Q
zV~ZIbMN~u>=5R(wt=BgaZGDhMt^<RVjcu@dD#s_;%`YB4i@I%kBmU%Wi1`ZElUSy3
z7kgX}&Q?Qcaq^Mzi;E6Zazth0o`VH^FaH2)U_b3~vLTv@2G3($Jg+qlnm^Mc$KL8_
z^$OUCEtI&ADXlV33rC|mwik{-LrTadAlzTESje@xg}qqs^i~vF^Z?oS1HlN<HwKH@
zp#Ws=`l`yB3TfO!o3NfSaF3+b^vMR-xc=zqbov_Mx|+GIKhjD@jGHrOK|6Ou=-xbC
z168Mp-?CUO{{V2vTI!7>P=FUk1f$~x0W6cV6;#e7V<9asV<u)~>G*0GT*fy40QUa?
z;Zjv-l`u=St#e1gTh<yv>w&S!)ey$^^4I*7XxxuGbQLjvmm7}G9HnISaf``L96#+V
zXEvD`_YKG6kc6L3X~P;q4owbc8C6Rmv%{l5_XOhDZMm|K-CERX1;CcIt|eB#M4Nd9
zjsXr#*F-zW{U-kabmq$B$uzlPce8tbR7NVMV4dGwCT$HIjR&%^;Crm#JgFHxF6E_%
z>u{=fObwjU6U)n6xV7I<gN#{KnWEXxZLuR<JSbhXs>W0^w3a>zvXE3bH_7-%fxckt
z3t+Cbzy#R&@`Dv55D2oBv$okkL>xz15jD$B6NbVv+^E|lPY3Fqa8G2dGO4C_q|sv2
zwJ2<$THuAlu}iqzf`hV=iWDDiMUo$d&VD#dzjBs_V!OuyG`qFZmtN!hrWEN2*skLE
zC~4izhEW{-6ce-_=E(F)TLdp@HgN$;#+()r@In@51AKka6i~k4vD|#BBby^8KCkn!
zr|1-sv4mZ?@}?5ZEGCRU<npIrrjei!=-hv0wm=<)?ENoM&m){{_WsDpDBRI_-UvT*
zH0*P5@IglQI!S^$?aM9`nNcfj4V<1^apf~@#|36GO%q2{%X@(bx}A=SP76u_%`1l=
zDI7<O*2@D64?o#P=)gYL5<XOMNbm=|{nX8n^5OSGp~f}Ru-p@l6!BNg&ufkT2)gD5
zxZ%KkR~XH~us<ONlMRHnt{49RyB)FH1uvxxjrK^=JRB4g+SB@hOxxYAH%r88B$hK9
z&%1BYMCV-RDSwH7b<e`<f_Pbsn8SbNxlJ}xH)Xl8`BAx;!9g+E9?{t}3n!M?_f77a
z#i2dGVRqr%e#?d~o5p{#CKT=Re(A0jYU7jHC9{Qq&c+vIE%GnI<9lAnY&Ib$Hc60s
zr#9gHr0zwH(G3Z>_X$qYGtHM+gU!4y`hC*$YC>!l7F^+M2H1q{!-Ls%g{%+mwTFnn
z2+t`+?r(*`uI-CucH?Z_V=-@w9#Z>Hf3j#TIpHQOuo$myF>9!ZHvv48@{@4~fQ^HQ
z-uVF|ns4Dg?Id<TB|W=%z0pkC2Oy99q&@F&raMXh0LtSSJos1%kYJybpTF*;dq`ch
z`B=x*wUu#3+X4Xd<x<qvmpcUCvVvQgb~WYl6WFPsrE3l40n&CC;d)NnJT$11n6}~b
zl6*8PdU*?m=?h_uadLr<5g6TTyRvKPq?SPW+-x{+Wt(fGRhJE}hSq>we_Ol#6mwJ;
zWzIiz5OY}DMlMI}6h!)tBYnq|6J~0HjPZ_0`XOqnUvKGeV4Oo*EWvZ+s9zZ6=I-nf
zdooldJB*I-0x9(X0UTp{kAxmu?QiUhrE4P_oPFK`H2(nf21NRPUm?$ck&wx>mbYVk
zs~Ddh?pbr#SxojcjnWaG8WBb*q>O=Klia8S4ajJ@?p3_ahz-sb9fGZ^s)?q+d;k#8
zXjtRh$+_}~CCvmdTj#n7wJmL~Eq)W7SmG=jlfp7-pd?OWbIsoC51v$!un%Z&{!~!3
zpL~aLDo4seu(MLt4wz&v0?ih>S*2@QY;)xc8O6(!OV~ZqKj;v41w)H*xbmfeqWg{q
z$_&(QcNQI&I;4UvVt=y9(V24JaQ#+ql@zUItS$FI#ZXO)j^q84<f&^$P13nAq&vWB
zE}odU0^&(ku~f!n=IYj(wib?5rIDeyqIS?Z<P*YI>CuixPlS!tW8Jm3OrKbZzSia6
z;d4(mN75-6FJqfT$j$M82}oo@?{EQERBEm_Cgh&MSI;$FP6gW4qw~wqT7nL$)R<lA
z$7_5dDOz68UB$Rn6m)xD9Pe=-vd~gD(~ogCHeJwaDx^Y5zKEw_jh8q=vBA#Gt>G@I
zF(aFNpdy%mF|yam=oLl73w9<MZ0iDnbx94gLHej2Q79n(*HoZ3X(*W;gQOr|`>RI!
zEst~T(6NlKF?*i-lpTJ%Ah-mR;c{l?^%Br(_HKVS33do;LTvh#Br%h?6K+?VKU$Xe
zl3$}*gsZQtsbLMf8oAayk&k1_Q8rqKRMJHu0qx!LQc`t(o*V<F4n6F=gIK4laVOPz
z&y`(AOIlyFIqlCXDp}JN$usDRezBn-HIB*b6RLWm4X535djh<NM~bD43}JQqkS<o9
zhLPo=(i?x3=wpQ1xd^0#wViHh$vcZ$t7z-$JzGS=FWjR403z8>n<FV`EC6FI@}J^H
z<Qqd(D<cKOxy47Q)Ko~{d&@^=f{mxAY!TmW-DOd$NaFGUvOgRbKvG~5$ryjQ-2GQI
z!Q<L264KB~Je!aAL{?J>BiaSrnMRht<*_NUY%q$NFe1sa4vmsG-bZyb(vybd`72SZ
z4bA>9x0GEpJ4k!HrKO8`+y&K#<(%dV*jXMX<XLD{Oo`0|Eo?f?G%<d*kGk`@B@mDr
zex(mBTb=C=ar>#Y^b~BmgRLp4T3XA<{=usx{;RI2n7z@KgTPg?wXb<3T&UjL3jt)R
z2yOZ_^nFDpH=n3dR&^YPGT2&4SvdB_>$%@#@mANrYfs%C2+5DFo~EW#B+?V$ctM#6
zJ5g0rv9TKvN$#s0=e_n|KVXHW(YUwSXHOt)h4P6qn|#?prfKs@V&FhmaOtAfDYiO^
zMKq4hfh70|X(%ctcyooD^jZecMBW$_?T6yX(A-cBEfX1F<aBYw%vchX#z0&cZ*{0-
zJKNYN9ufxGb%6OtK{?!frji0&UnO;gkfRN`U3}qoJf*u<q+z5JW!6i%iH?<nxJJ!m
zfVT<6;Y8UQatKb|EQ2t&E1d8KN{#XWEQOLy#=$FN1iEJSvS+Vz;Y7$Ker?K;l&)#J
zkmO<QadK0;!AjEBVJVq|C1)gR5N@}0t|Sgra@8<57FD&C_U@HQ8R$M*hO*}O`=Bao
z$Ogv96D>tUts4otE{{yyL#iKtfVJ3;UqEJ}qIcRLP0>`^ZA7N?J7_B2DCw!#HinO~
z9<Ne@7Lr_rq$6#TQ&B+xy@kR`s;HqEAS~vk)QpS}*WC89&(EpX*1plP!Kb-M=Y0mK
z)Yofqu<Z^Xx(+I;y6^Uy>mKU6OVR2kkUo33m9C|N8Yl+q3k0uU$YfDeXwpgnnZ*2E
zLd`y&oz^zGwbV5|!OW*^{%om(DrcVV+!B0|L2<I`h8W96){G;Vz|IsJR1R!oay8Cl
zKT!&bX^Bj84l=pTWv=6d4Njp9EhG_jLtn35#yHK%`B}{^jYgKDzM7r5BH>YLJwnTt
zu;;J{YAPz7M29}%rCrf<wL2{LwYOYz^3~Al53?sL>#N;ixveP8GeA3oq-iI~TNY{b
z)Z)!xA1RNLILPdS@|0DiGQ{6t^qM?PU>is5tf;i`*Mb_LgHVVY4hM8}dXTl4F1aP;
zPcyD1Ry757TE{tofvq+w32P)SxhkHwQ*!~cRXtX;;c{JL@KojE<)5kyX9R42)tdu9
zi0~F;sCu%Qmv5-k_gO7xSDH{-*PEXOQo*LrTK&(xiRE7hi6}d4Nn}r=&r#}mCvjyx
z+)r?$(&;MeWfD$FN9p<$P=H+3eM1aUSTqIcsHL_+royzEXlY^|z)GHCU)saM;b5Eq
zKUCUg*$9r<;V5VYN?3VMiZ%o8DBS>y(hlW5%!pjt>Gd;36FC7?R7oX4A}z-L67xnA
zR@Ne>VI|;MVl{1kqP9a7C@0CX($@6lO>3_%;yfnPbmUZ@$T9GRUuJjc&S?59le|kg
zE+>_zrqZK{m;hl*>cdJiU<ZUPR<9klu-yD2=9fm{?2>n~oF8yh^}2+TzhrlEos{)8
z&)jYrk7kz~OaKpe(IvSJ6-7-WcG=Qot5{|MqZUf~7Bp^mZr4yxEO9o?94?5)iAkMT
zQUSH>qmFAb=QlySeDd6q0yau^wm)<2ZpozW6H9vqsni1>vv3yhx+;MtcPiSb8tF)9
zl?>AUUNQ-?M6^3rSyanQ7`%=bR64C>J5Q$2eySHtDh^+p`Aa+$;yuLO-O{^7ak$>f
zM={dPeYm=~prv4D=K+KaleQ=OW57n~Grp>E9jwoyc-YxoUq*{f)1#PJL=VlAwS5wu
zusPB+UfhL$qQKTu-xsnAs7w792DZyfB@&D*^1WM0ib{>G;`zeV^tP2vO#pV$yUMDp
zcx^%6b9HT}S23`APi_%}>^U*gvqAhecTiN+0MbBJO`cgM89Pd`_Us#t%6cLJB~;ta
z(0<A%Pa$`>qGxkO_J9yFNYF{;V_FJ|Z)L2cfxDauAdso5s^1<Mr_-vXEe?MPYQxHl
znwf-b{Wn!ks^0Q1e}w9)qbIZu$VRcduX_|yqc)3LX8QIQ`l~p!i1zPsx%#a96@QmE
z+%fW}n_ivK7BRqIx>s+Yuk5y}o+?(B?*UTJQ5>=pzT?H!9cyc9oLnCBe&s9_wGoR*
z<a+EE^j)&92>Bxk(rR!xSP&H>soeez%H~i#&lxvMCeY~?FRF#k!3g?Eqz(44+vuRv
z^yuRO?>8#umReTXmKa(s8c|?kqDMRjG=(&dCO!f=!k$5PfpiUY(NnPSO}GhL3{WrS
zp7}SZYXq%s);nrp)eDV<fcZsJx}IwpU3HTS*<B4ec`kd3oHiKEoIpiawjm9pAQeg}
zOtm06#_6pK(P!#HeX+XtMblZWzX}R^2qFNxkT^!gBmi2;c~PkX)zt04zu7XKrdE=B
zsp@2<F4_ps_D*GO6fDXyk_%b`d?k;`!ZrgQ&<R1$sZ&VfV{eqP)yCojQIkN5VJ~w_
zh;7f%CIIj_PHd62yN#4H>M^u!wUTmPhu}ji$#(@22eqNc7xIRJQ7i7jdz5^1lgP`4
zkdI>8K=Vq+UAVd!!euxaMN6m2AGyZg3K*sI-DHi>$ym?IY;U^?CP3H8XAxvoLuaXG
z*xz8L(t2*DXNMV`Yxz)~Wgf~XHcwBd3k{Yh;Sv6oQtlY*EiRX!zM3#z>z|UQsHtTu
zP1+5VUT#H}Gb(gh3w_`L-9Dd7rifkPxJFj%ERow9)Yw`o8FK3>N*vW9iKvy;kkVzX
zV^H+kODB+RXur`NSEm^qb`o>hTIjSBLAA~pNeoT{IbTC)bf?qDaS*T`5cN)TowEU2
z>iWc#)Wy3;3j<fK)Vi#k8x>bO(7YdJjr7lro58tMI*auQ3!1}VK5U7n)$1mYYhwoK
zB#NqcVZt(a1y>B?8CxYZ+M_-Gov1o(<?;Z3?p9iT4Mc9an3MHV0jNVEVA%U}i>V@!
z;N8u!UqR#LjF;+o{ze%^+XyX@qRze$l`@w3`>Ca!-c@Z|+(!j<rg1dLYAP)52hETY
z)PV1Cztui#lrz{#$OqwO!jT-6Q9rQ1(GN6{I|aG&6Y3#hX|OFSwx@hY93dx2qDY=^
zOpj~sJa|)SGTNX<O@ZL5gD`O$t_{>~o=D^pG1sxW=FF7iMX^3E&sWiC=;ns<SdtO1
z(Wu3UXbUOQI+&4--s@O-TDr>k*-yQ$7qa=x*xV$0n5W4S!ADC0;8_~ly*>v1unNgZ
zt+meEd?0J&eOqlC-Jb;|mEdbN4SJcNhCbjbX?5Cr5^Uw2i$SlQ{@1+UwpFDUNouCY
z(Q}9SOC+9+X$d~D1eYF}Ap9tQF{inQd_WWMt_Mz3M9WD`;cxp@Mx&&?l4d7?=Ex}5
zM&y|jBBPb}iZI`htRSUeXlQeX-5JxmexBQU?i}}5b+BnsM|h+gt>rUU>|RMejQG<X
zDE&nJ(KK2FvODx{`z3;_Wcaq#tI@Rx<BV<%C?wIGie_}hnRiA<#gu1GijCX9Nef**
ztqa*;&_2q8S1qUx+l!#wsK_1-MpoK5pM|pNM+pO6QsMVrUg0bfU8lX#QS~KdEPF-q
z;Z_+q?Sfd_J&#(Fgi$)dq}h0nSJ6JIxa@IjZ`l^^rLU>l!@L9GS<zCqsjYnc^OW++
z<RXHJO`~XGk+tUJtA^?KZLC7FE{dI@pf3E}VYjjoc4;jY6KT5!>)Qx6H*2g_mZ4rA
z3tFqAb=*&t*B*{(b`=wYKtwWdEp#JXEq>}UNj3#HV*3w#+qeix*k5u&bS}<L5dby9
z#Up@JshR4?05<^rf)TM;@ygNEQwIzLALW~Wb`)MVj)jsf6%K*7O%MR?0<o%rpc2l?
zv(|ehv1v%`bgVK4IlK%hB$45ku~Je;B!Q=I$|_o7#$CZL`wvAtjdPkp23VZTt6G^O
zXdq<#Al>ieVKOldG_nT(QE$tBN*`!x2H$k>cX!HWfUIPPY4VsHFP`c{4)e;9w4{LR
zUkHZDsUvHEJFJK?Hra3}NZRJQ#^55o10!z7AF@XFY9VzzPk&-mdz}lmfpEHZPX_}Y
z6mEQu7cEDyT@xA0#fA!FDW#G2zbTDt?he&7a!AYDlsYoluc3ZVbR5vRj<vFleOt#a
zx0Ms6-a&B%GHlgAg|7zTD7nvca|;N$Y8qI@{lD205s4oe_MTDHI+2RO;Qf_&8(nAI
zWfxCR8^#<i7O+us9c(k7bAb!LEew)fwzp+XQ%d$W?f(EOC~Ipe`w{}l0mRfYjK%>D
zA4J;A7HusGrX6v_0V7LFWlp9Z4UN#0Y!uNhp`|_0`jE3HI0}{Yl`M7M!WG>vqa&Ko
z(td?cQ&S|cIj)VQ+Q8Wq+(6Q1dAAMc>YN;Mn<P&c2L|aF9e;4beoNR=YoSAqQ{!<i
z+ip_<v9-m*=Exf$Cxot;@tZ-6V7-XCQxh-xthxyUfgs!^nd5E0x>fWuX|f4`X%<m}
zd9qi(9Ig*-g{^N3G*TmjvxJX0z0{%c5ti9ScIL<on>m&og~iP|Ot*!=6ex7;SsE>H
zQ-d4;H@(zm{0}MZd)wUDBS3b9b;ltF_BcG2<K-MBH#?dw@SqMCCmBq%PENtwQ1;=-
z(Ij%j(Qpr&s9YF%0VCtKLM@Wx^iS#I363oo<fb*w0A+E{Cg@R}h~N*<pyg}Bj?t83
zkHT)y`<q!(B1+2r^0)Q2<Fa+yTg8eg(XbP^5)(ZLoIi%|-8y1y91;gAR=a>oM?&@s
zkSvkEI7RGYP1xk57&jJ58V_uw40n7W^lGusdrW5SKV<=jdw+)`3Gk+SO}|#_s94sx
z5bK9|Nn=nnt(~N9ZN>RTLha4VNF%~suebp29u&`J1DwzeyDZpL6C|Z`TkUY?%9~^a
z;O!__tZlnLDqlztNIC6gCd$<l2wK(`2Ltk&Vmo;RA^qSMxRRVnVHrWDS~6pw5g0v_
z7{b%Iw&S&w;!W)$_PSk;x9Q#T5~e%Z7UmOUgYuWtZLTu8&ArET-JlC(6+(8?6K$L<
zQ>;boZj>+^Sc|7JFL${6eiAfMWD&Quth;d>sl6vO;M{l0YuW}aWr}jLJ<KQdCB6pI
zmtX{?YZ`lPBZQ+w;UmLr4p7xII>n^px-Zip<K1LENRIyVw4(tsB}H?lvDyefWZ&U9
zj#^5ZXkvfpa8R0ATb-ufS4?_5`SuYMGHl%(f!_sil14hj5V|Hkw&W?j;@1}*6xn=z
z9498*njAcgBzxQXn{a#-{fuzF+kF&Ik2VM@975|6l;%3zfI&>yNa1i{1vLq5lx(&z
zmt((_hj>wd;n{ObhDRt-tVi4&gu>ikf~GDuv#frhG0wLGDboca9xe*(C2{f-cMIh`
zh~kC7I8JP{H2(k&XSeR7z7phQBVsrvT2gfexlG_9sxR;yRe<Xn_{FQJcQ?5KXIM_|
zK=6oU(gyM#K2UVY{APlmt29}_Yv}Fg!nLBR>H5$Z+ONyK-HE_hN{DHt%(UPW{LKhw
z(gp(hdZN-ll?twfaQjE3R%lg?9;F3bGqC>v+^Xj_u^&#Vk3K=Q)-smAQ>2hO3aMD(
z{VzY^TgBFz(_6NxC@PviskT45T4M2{-K_!FX)XT%wZRt)m~i%69Dt|?RK+WYt3~Pg
z9HZ!Uy&|E(uXEsV{gWj^w97M16pbz{W5>rR3Y|I!le7SQI4el0>E~#Ymbx>31=DH;
zL_*JrvVcF7-7uR*ZmUXTK`m>C&8`p<P)TP10mo&hbdbE^<%IIm6cR$iaxCHSm7(J%
zW9QSDUHn)s55gV#TXJBYNRMHAg|hTc&I5-TQ3@C)zVBh;;2@ZEV&{iZfP3K+H~O2(
zfwh}mweh$g4i;N!w24}G!6-fgf!c24YPw+a<R?J7GcnfF7W>PhKe$CiSs=VqG3M9-
z*;aD&ycGiU(mFR^^p#bpbj?&Rxrl@PO~TH{StyqCFlV0$Svdgi1gf`E>U6{g%`k6=
zi;vwQs?=KROHSDbmXs>WM>Q7Bm8Cy$b(LIIY_>zAe{kTQ+NcNXE^qzAgeeqRtgvv!
zfk;8->Ih|QxrSy*f0ZZk0rxb7$s6Rc-LGWBVp95+83~)(<AGz{8W)(ag^m}te5q+^
zNI0<y5cdmRr2P@Jl3BpHmkV1XJ)uleG~8r-<x3bC4q<8X5fQpK8~TO51Bd*lxMur)
z<0*)ALSkqaX#n{M3b|jwAgd<^xwbY{RgKzgG8UoY$N?5hxL=gpTalI9fBXwHQ8C5L
zBwP@F7X~rh5Sg@g!AZBhvV%h_M7v9Py5YDGPxed&?au6YvUrf=+jNYgb~rqPbu3c2
z1C<Utr5)^UlyyYzmv8`p5(^w0kA)jH_fFc|a<v+VT-yYu5!j2T2ApLhu7g7n8-kD&
z=L5+JhW)aI1W^9~p<TI$;YLr8m!3-0YS6C@IZbF5{X^g`0Osclw)=TlD?)8J{^<$x
zgy7@#N_Mzgg@VY(9h19oO6M}&ukxCA4hgcxYS6dIy6cX9QVBQ?ZhWP4m`$&1m4zHd
z#l~&nHymEa%1qwC{>iQ+SsD$GEyfB*18x#Dh0b;_bb}^#ZEK|6<O?n*f|^e$jM%${
z@|({I*e$(=dnWB2l7g(@PmsCSxUxbIZWBpADS*WQ2NIAH3gGKp5rx+m1eCz&P1*32
zJdWSpBS0YL%e|u{px6g*xVZ^;HAUrif2Ct8KAVCcL8Y*OFU*8w{S@@Edx>p;{%5$T
zWvFZ1Sr$O=d<7&j17_U4-R;8lwb|g?=&&+F6Mu#-@9HQj%7(S2^Sm^6Xym68BfYF?
zB?~ndzkJRvcYu+m###cFuBN5iSUngAgOZ;c+#9u*K1oJ?SO$RMj|qP$as0RJ6C^8R
zBbYF42XoIS!f+07xVb&ggx82*{a)kX6v(P>`<q*^vf4GUxZ`UZx#d^ZRhG$S1aP~-
zx()F&d9{#`$d^r?L6gb*m1@>Fjqi1v@~deb93tk$!A$4NQT*Q2KhdmZZ2OO;4axFU
zaZp%qc1iM{;>b8?bG#`j>Mr19JD=coLx^mMX~*>up39p`81P9Xs~IJUv2T_}kBgz1
zP$zk8P5Y;+S{JrQBmFjeMtcM!8#AA|<Ls`P3=Q`<hdBve@ENu-%0|-LV<lyL^13#W
za!-X``Dc;W7avq>-U0VCxTsv_3%)`c6driFQB{ehVn$!ImmU;vtZQAhp5t{K&YG*)
z0}EJtt6d93agZ0Zlk%?@%c4yK(nnW4i$Q2Uc|{#EvF*7A$M;*EFG{D0fWK|+<xgKN
z1uR6JxA{uUk>{+^=8WC<Ykqkuc_7&zv>p|mR-pvalVP-ZK~>cHjXs-N!EBUQMsIp5
zXQ*^ww)Rm&R9x+?@5w2(Oy27=_bH8xvcb7>TmFVoEueH!*t_2E2<Y6`3)<fbo|-o>
zZ;<4xT1fX0?h#H>14#zJ0n3Glgte8iK^`nmgxRHI8D^1nRaV!?4UK_IC|FYkt*m_V
zmbBde0EHznV?SHB6fBTEqxxI^Qy3&*z&82rnSQ+kvh9wHHuxv97Pe-K*o%}DZkgD~
zQnD+Y0_S%nHrO<X4*3sop`Mn){mQkD0uQ&I<f)kiV=nhO7L1JKT79J6@KG*=mhBB!
zpO$Ogk$;43KAzKSF)dJgF|%oIdAW}2T5SmK1<cw$i*p?e3~oT&g|3OMVaNmFWYRSm
z@f|%IY``u#E2F7%-?sJ%^-)+Iw@jp`YaAZ)j!~0x0?~D*N4dBkb$3Zl!bWf9XXDfw
z!L^^+7Y?99cRk^a`tp&&Lne#q;*2uF)>+L-v3j-^x@~T@;?0p=0|TXz=2;F3o;bAa
zhD{bU?`(14T%qK%<h#yL^%a)(Mv<hoo7`>ZD*cMWov=3UuxcHxj#pmbG%D)JXOZ69
zhNz%?jW%)nEo{jeYI6`~EE+qe)YiwhYa9xplA?DFtTqWEjz>G*;<J!AlT^%PcQ`{b
zs>HAhDJn^1Wud(O=my0!k1b%qNZCY#O<PClAfD(t%|J%mGu-d+jDt#(Zf-86Zj%-A
z0r@I!$5AulYO04~;1qQ{GPSmC^W9y=K??<}r)(@>zzMW6$FjDYO_Ec0{_5I_f(SC~
zl;&c?gyWm6oe#t{lE%Sifn@&x%?#OAIly;Z*XJZH$TV3Rfz8r>WGd%M2XvmL*0#+>
zgQ|X0KQ-Y8yM%<_D_b=N8kB~nz?2zq1uHKjgIW-<gc_1kde7~1b#J8T#-hdj)|QW^
zW7-bDicFKpk%@)168?rb{G+1M>Ygs^g}tTFp^RmqDXJi(rii)QaJ5%re2t!As?$wN
z6P;sW-C%V-sT9?YgMHjP1+)B7>bh!nnmRz&NO5t>@`xy1Q&Q@QMcm_abq-EX^*SNe
z&90BFK5z**D(#g;%>*oVnNH|{02QI65&$kRs*S5H1Ki*|DPgd7LKTkM2`L>`#*S8D
zF5;c7YL23*fPSE;Dm5E7^;jyp%K4v$T>Te5ORX7F?9fYE!s|5U4>e1Jc~v@WHBvg|
zr}kI0)E2RmB}HP${{WK<$sa)U?Ur+Q5&|+kIx=@Z-Stm=kW;rLVN~i`^iVYW!27O+
zQAF*s+E>F)EZYkpWv@3oO37Ar6Q+}7AiR^xu+mKP0O>;H^0UqnxFO*b-7><mu4gkB
zDvqKJLb3ZnEooY)p=GQ<x;l=UEyLOukB`ps9I8u4M6lyX&S<?VWV59O$K`71dSV#b
zF3?ZWU+FZg0AK*F10jrdE7gaQk*<zs7^Y^U(c2q6thJRct4+4y=HtTLRXi3R8r723
zp97>fAd92Ic^<<VMHCExzY(xo$|@RGL@xVXHmgyBorR-l0cLe>r2)n`PWOB#cp{y>
zhva64zf+2qGw%y2sC68Y%d!Gp^gu@qey1(vE^7(m>ibU6V~L^94OCDQlPh70vbNjY
z;13~N>774k2M|g5R<w+zfD4w`D@tnmYzA2U7eABb#|qLKINXGyr*%63Ycpg>bxYl2
zfTwLtWtRjYB&=bVYfaC9xp4V0$oCQD2EBwy6TLD?%B+@w(z@luqy0-Z?sgD$8jMg2
z?hDk6V%E_cW8u@;AGz)r@|jmxO-j>|g`L(qqBwy9OP(wiTC%>sQE?3pYY%kRmZE|F
z%guACBJ~V#oz6ZG`eZZLJA9Y1?5pTB(ANjZ1^$ZhwIZ4wu?rg^X>Ep^B&eaLr)KF~
z6x0<EH`^V6S=#w3Y9$-q;yfo)#aU}a#}5fpY&Ax<N#iX8a0*ISGaF6Mm6eK*QkFm+
zxC8RFnk590v>8pxs*8P!<y{6bu5b!gMthto+*rZcRq9%#RO~yR1(u|Yn_+b`vKEqD
z0?g~3OC2Ll*NxV|y3ch7Q#x0=8dnz+i-lRHX>~QTiK=emPjZ#qx;I6&7N@Cdl>nQz
zGJkdGeK`wag{ERI2PJ28dKl>#4$OrnsaH_e5fiq7^1R<BIqtEQf{WaZ%=L6lk8bu|
zQrAmQCBtNI*sm_ub&ALdB6kzw>Y|gVHK)sV#!Gu;M;!c={{UoB#ucN{>vZqUJnVNW
zZ9AtTVGohOoA+4SU2j@-hoVRPtGzc=)LuucxOoba$>cxb5o!_bny1sp11!P9uaaG)
zlgf>?^ExX$SqUtq<lFaNmyHaHKk{}%B;wwM)GAM>hYS2F8S3vXjzY4T@in>k6ai}-
zZ?s)?QzK~Ts+vDYx|#C6M%<MKz#VYZL|_)+*=G=^eU;S`x-({Em032OTU_sU=CxnC
zl!qBDe(4)p$UUwhF9tUxQqy$f*luoBfYRE=dw?HRaSdA}i0uF%>t`Tb;3Cp!3%wMY
zjRYiI1l=MJN#kp5(cMW`sMAD9Bop;Qja7sYFg%XQV`zCa&0JdCG?7`yHbB;Eu~mlw
zU_O>vIV!}G6MSEifYqy6PYEH{KL|Lk*zj%t0HS`Qs;6lrNZr@YP?}Y1HvYSXh}A1+
znquNjuYjMX>TiYHNWu_qJ1>zbsy#X#Rw%4Zt@TnrscBqn$1gjRP?B+G`$CM&=H$4G
za;friIHiw?zNpus;f~x&0BVljTu;$t8>mMZ$@<+&HCP+V*0e1e*eZQjUECuju4GW{
zjiBPo9Z#(>#>^t#QD;?#z!SLq6nP|OSxa3z<Tt=6kFJz^Ly1*yu4y+O(ek>Upi1jq
z6*EzJMJwh$;;rCiI|bfaNb;#@fDHDNbu`h);eFP>%G}Yovp~sUdn^b~bv!R_;{O1m
z%L6nc53v5~SmdjeZEVi6R_*93qeW_Ho0l|{9YpMF{{V+#eySP`Int14mBjr~wOVLo
zS7ou`HEUqCV<D+~+5vF7k&%Mn;`95ec%qro?cHTy$~S;6_kC`XtfHUUZ4}Wlw%!Nb
z4^$gDw&Foh#S2*57hPCr@xbZFt02Me!dDs%=z^0<joI|xe#r0itO6l<E6}=TEhX&@
z0gpZIwp7$wOmT-gD8@U5xdN-%;sZ;a!sZ7wadHz4Ej2UmC4-NZ>zzeeqQL`z5d+{a
z7wWqDS*s7AZ)3vensRiRSSnjCX=9{#1;w^1N``5THUw_?S?xM~%ncvi7%7-tcd1VV
z=BY8`IK}N2EYql`$U{~1{8I6R_~&c@2Ik0mold3Bv}YZaJYN-J?Y1Ud+_aDdPfkY|
zxP8yo=r72+2U_+D;2P;$mt*AxSq#>(Iqte-PAqgA4VX>-5r<8Q?cHI*8&05b9;2O<
zO;t&Wn_HVL$3~O%bu=(jzSbX7tcJ5k3`MsWS(=)uU3^@jZug(kN%|ys<lkUZNVU~9
zGgMsI?16%sQvKVL>1e87?qe<WMHnk%W!%fzGE^Qz7-fVK1@@vK*DGn90~_D5K|V^d
zNc2U#sbFEX<ghAPaYkN;jM^^Z>RR(3yb<?8R%;T^gZ@>0RIO_bh_a~_4{X=I7c%i^
zvdoPY3{lGP=?%V%LqQcRZMl9e<zr~;qXcfj@U59&0butgU!vH5pGK|;Xn`OQht&0!
zQo!#{%PRWtU$u_6-A(xkDw+%4U4N9V^5}2k=&#jvI-NkcG}slJs)lGDU;4hQQ9TK!
zBsHiCn2fC3w(4lAc2sHIOxibwx-9W~Bef2pbwnGO&At#78YABQ?Szx?mAXB7Zr0Ms
z=8ixK)+o)Aa&Rl(sMNBcJ+nLm$OUNV<*1pAeZ%pSbxBi1*fBjc%|8Jbrq;HRqA*Em
z@+?=W;laS=@+TR`vhGH_4{&h$ggclV(ry)%C1g{=1HnErfz+5r;@5oTdg-1tm6dbH
zw*LU|gn0mVQa)GQ`;fCZl6b##9D<-SM{+^?D(a93Jg3bogSbLIU`ZRSQp!W9dm)lM
z@`ah84s+p2Q6sN|*#l8Ch0TZ|N<*lJ==IW5Ok)ouc3UknuA-^FkZYZAyxN*}wzelp
zhVB<${{Z-Dp;J^t6rt^Sa0d2XPn*SUo`;E%$3-rm(^a)E4|HTU{erju07r&}fX?1L
zuV$svDPg4tYeqR)F0iH3+Z(sNfUg<m-6Oe4vk^_KY1Fd@*c%@Ud(%BZrOg{hrpx^o
znbt$6wnA6|&nitfP==7<*a~@EqqI7TX!d%UblIXm!)8Z-vl_0SrO$FhK`S!ereTK7
zaX9R%>$Q5RZen>{pYu)V$_WQ*+66Ax7#;!mS$VW-#!G1Cc^@X}^XeLo>zOc%qtwU)
z)HglXRxCN!Y!Yb;L!wsWdxzG_)s&B>hzGjle4uK2f}xRt2*(yfQ|j`|C;dUN`Cai+
zOJuFK7geZwE(2*lK#{ew&fjZ4vaqAC(aT%wIhXI0YwEODv-mG)`X*^U#!SphPdtu3
z+g(I-=KxE_75vYF*JIoJs*3uu(Poikoegb+#@0mZZ5UUyAH`q|I9SOgt214VyKb+v
zn#m(*^%<Xp)`gPUqh_4xoB(nC(K2aGiXuz%$_A5CCE=hOtG34Kh_@Ho;Zg}UB)T#>
zn`3OYX!s=v+W@WgszyZXgL0}`7gP>*hc`Sa*v8*BQ8Zh!nm_QHp;<20f#D_X^j*kJ
zOV|Z6CKtqTQg%>sN;P4zCk?p(As<X6$r(qrts=!mQ5kMpRHcggDIAnKmZ_BN0JIe9
z?M5l0+rp%(Y~Y&|l+1gLoO>udZ5LCEI&jCEeDao_AVE{Qm^HU0HW$XyTet#+=x_8r
zv}NqM0SP@b;{<?l$wt0cHaoHC8D*LGYrEk(YK3-14N;5`>u0($8rBAIIN?^y9q)9I
z*}N3A62e-RzZ+E4(w2(@V1N(f7f)+tc=ijeLnK+5TH&?UDUOANdwEsyiCXX+2nyp*
zd`AzlLfQo)wxUNw@X*usNGc7o%PXpgDWn(T%DQTJ-6qkCEoqn$!Ll3KBvIkt2%|_q
z!?L4s^v1^zx+#F@S-cPrJ(HUl2ILGVVx5g~0l`Sw0pyIMW@v3w;tk6(gJgg_mJ$jo
zKpt<|Mj(yH+lLjc1eLWf!6yFz3#F)pxCb`J%4@0K%vh*>Hy4rFXqnJMqo;c=*S6=f
z7HV?KxuhF*Qwmp+b~!^Zo)fj#u}t644y3DWL>XC&@)ek_rjk1`<L;=-iR32w5<A|;
zTj-5nV)R+mG)Zy@IqaVeGaN5|Rdh2;PVu>g&F-&gH7zmBw1Z>Mlpc^j&<wOf_r6ea
z(?}h5i;sn%l+nlw;hYiS2p<@E7D%PN1+TKQ5awaPwMy$bxhmQkXsR7%oT2OV$>Yla
zH^vnbeXw#xGmV{WSs<}as;7K!8@B|;3ugH4jEY8dNZrE(+$k72x@T+<oE%y&$SEn7
zQcRG>PFhrN+|!Z5dt?@}WX@?8Bkm9y#&5Yxn`Gr7iuq~!CEE7>wT)wByKaBF96Z?M
z*%2d+?b^wW4GppGnG>5KYmYqVlt6XB1eCzd&cGH*?`wd%%t*38eul}eDOyFrzbQ*@
zFtB8ViLG%vonhHX7+7rE5TbKk<whRx>!O8vC6Yz~XS9!$HAIo{({%ZZ+$;zoKwD>V
zbySJD4c_7{**msdV!F+^xV8JD1RJbc;Bn;!(hAuNZERlY+~Axfk&?C6E$*AV-o#mM
z$4u!%c6|0i`n!Ks{;0Ws+dxS2!){PPmHH=+X!naegkIoc<yNvtoI_mDiS*+w8zdv(
zlo|wGghycQ*fvfQ0(&7Y<`bKQtZ=qc(Llml_SibgA};G+0X3fP90HIGSdX|%L#7}O
zZbF(lh{gW^bjG&g&3Eoo97r}GAxNc!Zn?T+-)mnWs6&V&B`wRXb%H<JYu?FNUh{`q
z+$j54h0Sppy^6qSCiAlnZT^Ww=K<f{FiiH3)JXYLGDbi3uwUT@jUA9k=We)n*)+Yu
z*S<o0jTgIaqH}Y~30Y|LO37XZd?>0O#|sf+lW94+hGx3?Bz&ezV$NCymNR>%$2{>m
z!RFoyo!i5GrsKj*tt4-4zCya|XA4&J8%ZN-8huvnBe+w#2JJgtdwD{{*0r~3JSkf#
zI4VrEQ$sIfVRnz*BdyJ@e4+!G>=SRQ8bIRnVT<7eHJxF%1g>knzTgT$aeOYe;e%q0
z3Q4uD&Fzj83v-X`p3+Am=|iF?H);7=%s}Cl8OLwBDbbve0Urt{0@3<YCTg%}bH&pv
z3C<McUn#C-@)M>_q63Z-nrtkbS@4@+E<2|K7oN&SFp+khsv)>=oY#3a`MM0qosv%w
zwS(LAO?&CwFC<QBJ=&F$IB-LU%5Zxfm$Jv>gpKTeBrd0o!*oyG@KZM0!R-oZTOJEs
zN?-(jlYfGRgMka8Vqt}wZD3I*!<K%@paX<?8DmyN$fS?m46;Ul?J8z!nyoOiDqQj4
zo>E!X{{X^@Kn^c*e4)tF$3@i!v+KqgTMJ|#I4FZ8F1dxpqp-gVJrOMyu~RaC{_dX6
zX9{K8Jxk(O52(6FOHk9aw{Y?hRFw`KIG?JTdgn!v7{BfiX#<45i4Am-;4t!vq}3sF
zLuz3r{E^62Y}DA}{AzGVkZ`(M%0~+}GT)&^X$vfG=+Z#yDM&C>u)F$Pc9cnIZJQuA
z@OW8hUrQu-F2B`J6!XMw1!I8zmm7pRR+yg~G!LPpnYoR>Wmi|B({3a*0rX66r%(Xh
z4aojz&A+lH9anQ~@w?!JZpEo0lB+`9e@Je&Y^rK>g3?;}i+)1aNmog@xbBGm0A<E#
zrD+#rfh{q)BL`E{@;ms9ZSlx9Ar98pQM+iVmCYZ^BW^!+zckRvVHw&_$`+$bd#(#w
zLE`C?4bhQhcI$`7WB&kY!gF2?h;6=#>ZhkSdzjsao^Vxs`ekJ^udtSm=%&NXvKGy9
zHw)QVQ$8}`wouZ0I|w+8P9e1*x9qHG=;@?3X)bBt9HIvGq2`_K$rwGtR<Y#&01i;o
z;NYVfqmVaJ%;p~#xc!QPs*h8QlO-^m59VeHD#WrG48gXNGDn*#>Zkj#Ir52`t&9bd
z8DJx{jj%$!@k%!}?Qrr6dom)qwUUAkP80n*i;EQ9k2m)4g{D(zYF-aHQM}00#yjCJ
zs?&!9g{WmBM%bTlvRexRng}EH1i8LDrJ|{!zze0ty!{dj{{Z+?t}km@BTRJAm<I(f
zYo*3J`AKo~KxD-Qz+nFCxBmc8x<Y<ZayeKm;zj(XxCDf9Q%(G#MzILVAmt;j67C(&
zR~G0000^4KlX9Jl1>19infiMn*vNgwjmQb&CfekvuYBD+J;UV&jdm-eaNwqrZSQXh
z+rc?cE*8y-!w`E(z0+JcI4WmG*9(wA@8K}SMVtt?grMw><a2ORk{o%tOTCw~g5uV?
z_B^I$(HnujG39mpUg_np0|w*4QIqjvlq0Rd7`j5!Yu^b0Bf69w!y^kCh;Nf`DM9ah
zr|r1735Ay9B{i7qfN&CG*X)xZq}`iy;bSwMZ{Ny8^uk<!<0%OsdzKZUg#D8odnvGa
zA7vZIaF|!2xAxzK$p|*OP0s$6g-6n?Y-~F>@AGaIof8AbO`G9lsVfW5s`6USY*Xje
z>#8qLLkW$Y-gzt2c@qBsXNH!|bw;C40QBN>Z{5eTtbVf={g9tg=a-(!o|j9mn#OlH
zgW+1!Xip8fI~(T7c}b1LDk|vO0ei0U6sBjqcL4SrlrW=;n=$*`KbZDV$yQ+pZOhMf
zxmRZ5C3tg2MTzVXP|6tV$nC8MfO$zY+mE>9{{SmaPt`IC8LH$3$7ExhCET8aq=K8N
zIzVHMzTb{h#F7)Y1K=jSLqyL`owjwqQh|?@o3z~dMXJ$|cd{XQpZ@^px0NJSQcmrV
zvtv*!rjkRtM-^*N6CsFQ!K39AzS*66A*d~dxjyS;m00T8T2G<~2bUCOY>}6c(YUJl
z80Wue@7N;H2;Dr=Nn%|0cm-L|va@Kt#xT~Rv|T<1T1lKU&y{lE$22mXfvvVpvY(2f
zedrD;L|`^kcMic%6ijnHNl0r{6SgQFeqY?6s%DZwZQELrs~tKQRGF@Ej+LMfJ<1ZE
zgpwaQ`zc!>Yi%55$NGvkf}QU^qwao6oG?K<L6%uHMAVSQ413(bjHauUy3sPj=amGW
zoMP@bKU6F0T-&xWYyRqvgtlKAx5pjjn>OK6YE^EX$0URouID^%aV{kg<_5>P*#7{8
zf3Sea_kusdUF3msbJ+(|Pz<C8V0TLeLoNeN{FJttf|}ctaHWC=x!%T-eAzN8h*~|?
zx}Ca^jkp1W<YcY-uEVgXsH`_i>z@m!ltwMU@Cp^R?vPtK?xLT2{+?F9qa;7`gVYTd
zCjF6-xLb6Nzra*akVhugi<C?fJTyK-e*i3{L91o4WN#j$&$Mxc45B9+G<!m=bxiX<
z#|<5a0ToTT?%LCTCd(-riJKcY00K4`MYCYl4dSMcaT}afJ$A7pB-+cLfR<S+K~b{)
zMz+=lz$oKrCmeYyo(kFCH#yEf7DdNW<CB5m9%(I^BKDX@%#cY%7q~L^4Ic|V6>$#3
zOSAhaD>VsT&5eHE*yT%;VWf%cwLeMwS#o|AeAQCPcgpXe2yhtJ7ro!QnwUpBvz(%y
z=r5upBb?If8!Gy`i9xWs(oGFKP?I47-L9ysr-kp^5CjzNNejfTj;cWLEay2{(>iyw
zx=Y*Yqoswn-CzLZlw5Pi!(0+6Ham()nv#{$yK}e*s<t#ov4?MxtE%;A;BLknm0c#P
z=l41Nl{rNSlVR@k;l0hud{Q;Xbg#2~D&5me@EX$V_X=^RR7sh4Tf$c+`VSOORa+Iy
zB4|G-CrIK!?vJF==8@J7+TP0Mk3x<-yn=p+)SqEcD5#>9?ghZ*Tg6C6xx(kR70fg+
z#xT&P^qXu8AmULZXJnv!kGTThL`^jVA#Lq<c`E197hGZ;?2i%3m&ANoFvTVKvbS_h
zzX_%&{2{>BRC-RnZn@Es*;^Rd#e!zWcCtKCxfO+u@Q|_g$8}~SZ*;z!J{IDQ$fz*L
zdlbKylHLC5<7|Dby3wJ<8re!|r1?*dmHpMREFF?vg!WpHc2}~Q%Z)pghUNr??OTcf
z2jv`5bX2<}7*dH^yVecJHd>Lk^lS7vAg5zYgk4=fSb?pua9(gK+z;#i>z`Kl<J30z
zD?23MZYuhM76b1C?y)^r)U|anx(XJ$=LN+==>Zueq+ns}KV*(K+a57U!Je6^s;YHO
zQ=KE+Z<TFF)1j8#do3)FV+UjnO><feh)kSULo`Dcn*<H_Su%NHiM9g>8mjj^?PbaM
zP{T!6R_}kcs5#$2<dC%$*LK#MpM=QZs;D??fId~t7L!j-1DrQI<r?E0O}VhLo3Cc%
z%4jr;{{X!2vN|n3mLZmpsZ6WX;e;IUvzn(;#~s=qbKn%NX#pn9M3pqu&Gv?>T~nxH
zg{IE~?y?mcuAy4u*qU0?+@+$?>S|seGo0j)oSuVe4zJhhYMxn6*ARQ5q0_5s-W@aC
zLF~1fc7+U02WY?1S;tEhV!@#|6uUA2wLnV0wr4cm8Ih58{{UsCp`~jXX0<u2Ye=xM
zMbn2D3t%kLkZz7;JI-vSiRLHglzT)m#0!tP1vzPU=U60oA@mMymXw;4qi%RzQLZ>1
z!Dg%VIN)LT0cDZax}*YQiQC=qP~#Z%8aDd3QV_x&C}{euPO;S_xUvFX?*UMT>RO}j
z^5(Ff0>9C^agDR2Vr3Qv>!OUiQ`BAjLR!PvU0-PW6IuhMZO_WRj*18x16mTj`&w;)
zkLwWAVzIRJtiT9by+D&@n-0JzX7y?$3}^1FwEY#L&y<%R3oqNVH(Dy7rm3ra{mp4s
z^t2L20BgRg-U>~v+ScI^Da%Fdgt6m&peZmG(zv&4q;->nV5SAe*9mJSd~G41to?L)
zwPD#$6M#L+i=HfhL)4ijx39rW$9ur>m58s`YOAFzrv}9GwGea_bzGjMTb}ZJUkd*K
zPw04QS_xnl_*~gM{4iH0JaI|%j4p?vOH%P9_i=H}*1D5HjwS#Y4i<`^ONNwK0Enj%
z`k)(fxF6@RIdF#AZ}8-oCTE$TK1}T(eH2w%F@>aTHeRKr($l^%aMD!Ox(qcf;AK`m
zYm?|sG<fwkpGw(5dqFDh3P>9rnHXA%&X=czmkVK1*R)cS+l((u7m*1r$jTDz4Ujdi
zxv)!7Qxq&d;4G`_^*Etvad-<0)Ll&HInh%c&f^7ia{3efnk{pv;(@LWetxSLUsI`S
z(iX72v67(EC@Sl!gtY{adl0ueKA#*c7hu29WfykMe@1&m>GIMaBW`<=wRCi`!oUN6
zvNK~NZ(yo5T}~=?pM8@#QUzIIJxp;h<)X_ysn$NAnBj1`s+zi|QJ6Lo?YHDB8aPEG
zH#lx_7s}_9@1n^St<c>&!{>GL#nz8R(J7kIXxop31TxPwz`G5<3q?%x6hPcH4~ey)
z^Vm_KqJ@_&XezRy@JA!IZBc3!6U}hPl~h|OaW5s`2;z=di#`lCdY2P`EQXq-wWo1V
zpHSSJfUBz}mit=M&n0xE(%B7qCv>iq*b~Yo7C1KGUkbX3(gS^_{{TgCO*>m1<OtuR
zQD0Z<o8XVS>L<v-Vo5$qI;yH7FaQWvxvwBJrq~@8P>0VM7q!rJv;l*0JgHkh<)gVM
zBUv=^5Pwb9<$4Di+0B>GZM-1sDjhp+4T376thLFy5HXJSgJd4ZT2@raK-nb4>`w^j
zG^itr?;s9&T~idzZQ>Uw38^(%ns*YXC^gZPmrM^=mYSS7u@QBW)M`CqZtK}!)adn3
zkcnL2RYhi<=#z8D_e;0gPem)5$6nzNFQ(UED+vT_xhQEH8_q0`LhsQ8a=&-9VNWBS
zu-&<`CK#e)R5dSctO8zE^feT9EtS$6U+9|3dEbovm8Yg$>xSOwh-26XwB0(gP9=3c
zEX@Mt)>d>>Zawm*f;Y%)8b`{pr=@+c(u-`=K^~pBezJZM^fWDu+p?0H2ejo{Q&Qf<
zf`zrv$|!76mc&a<u!E?rb3K5PRm-4pZ?(8WH%@4Ibb$jTRS6}ZlH#uPnt1~(Y(Bk`
z$4=1eM$3HyGB9HsY(k`V7Lp#>Sx!MRT%&(B+J<^<c29LnJtwN-Uh`|+Iu?jewD6W~
z^o5G{%bGnkh5O8g=-1KvY}Z{>Q&d&C!q>OaTvJOcS~rZWtS+xW(oskS#s2CFS_$Q;
z0ymy>WJaf|HJ--g{3!HF=ZQ<pNdt@{W@oGPE|nB9G4l`|ZtGR4x`sMZ9Vl)*uOB^4
zUlTS&OGnBYT~4y7UV67!_5~wyk*Of=uMyNv_EWr&d^u!aqelrc%O%f?-CUX37xP@8
zWs~!A7MEG5#c>N|Ppan0wjRd7qauAt8=PE^r=p{be<(cit!ZgsmA=plel#a0%;}m?
za^h3qo<ShS6~%U#(e47@MOyYY8}72mDubzNnnj(D3Q3t9jlISGs*Uvm_HXu4x@xBz
z2iSd3a-i`oCZEw8L$7a?4Anuz+=SSpbMp7yNGPIl-bx#-nub%y>ptTm>drVLjh7%K
zq--$@1nSMtZKJi&=Xx85v%fsZ0k8!RF1wOFAWs}1<fW@Q$Jq@fJMWSfbOg2;CafMT
zBDMS>WvOu&w<t%E5V;mT)MBBp_S^(jb_OAA)5tyK3#)1xNJ9a6y^v8wDFDX8QSkb#
z1AI=u(N1pq9w;J4Qa6E>(a_IQ-{7|jdObJuZ)=Gy2eR4d`Z=b67MA_jG~p-Ncu6jg
zJ^uhiuYzAy-`FdiI(mrM7+6UjR+CkU_pt)Q;Q<>WVchElI(~|`eU<e_M~%gZW;h3X
zp(@(0wv~)6wa}E65YILm09j~PA&}HEH-|new0td(Ojc==Q@zF}T;QK7x;;LYNN!63
zw{olJr!W#JWdq<9Tw0K`wu|j=P17n^`AlE{FP7nW-mya*T8xg0LK(c;+*`ulR8>~8
z7d7SfBG_3CRiw1L2RUBu4v!-%b`Pgd8y#aKg}4M^9aB{cqqCgXV?3<9+MA#xFdlPo
z3RrcQKbAE4BrEbvl0@2&VR3YBu~kw_C^mJ?(X&-DL;4!q_(MwIMTxlbiY$;kj*;J>
z;@JfYD_lt2Ke8>(4b85ZB!Tv}KC3jC+&~{5-uOY(Hw2@qZZ1$265j+V$x)nAE2=;s
zfy(s{!p^iBT^w-KNJ(vmSC~m+4e(LjI5$p3_$!CW#-|!%Vr@%D)3AOc#ZyFMW49Y(
z%O%tm)jFG<d0fzZ6`0UtYa+XRe(Cy+PNLFVPBGbd>&J{`qtQ~)B$V>Ujn_?VPX_-0
z;R{6FT2pz?e+tY;BN{j5TY~myHo79G07;On<B^SJ$^=RpY~l4q!qGSA1uw*qR!bqN
ze&TRSfJGyX+R}=e86wWZgo3EGyLPIm($P09f|f`DE=)1C<K2JVO*`EG0EGa+Au_fG
z#!E{PJgC1W=GezGoAfGM{Z|K`E}5VaNXpiW3WwXW5zVY?_n92w@{PNk>la};)&nN#
zcrT!-HSCv7sXLn4Tl=jQJw+bTaM6X1^{p+ot9?C?%G<fwJ&9137_E-7Nte#AfH($$
zZz{r%P-$hoPwujH0yyumpBO3_=YMA(g_b|2Gn)2l^$A$;ZtcplGTWOVBbD#P&+dt*
zV}@PbRt?9pQ%Up~#@{MH!`qbDUeMg(E2O^)w`4^)<t@UF<gVODD4B}(iy`DT`}`@~
zN#lftgTlrkYq&`xfx?)#vWiyUwaUW+NYHP)Di;Q{`$Cpr=8{ulZsTWggI2Z$Dr8S^
zBWs^wWdrDAaRf|Jve8E%xOIxJlA2haOI}DEC`%LcUO5#Gk%lIVxH&}kn_oX=BLRD?
z?%k1*Q?!6_WR5KqQcR}~CB!%zeHR9@{?vVBTL~>y+m7NpqJlm;hDP$&3;0JtT@zVg
z(e^?zk@8u<CyF<;-*5I>k%{E2W7<Z`p2{{o>~=U!EiE8eso5Lu*8y|kFF~ymvabU+
zQOh|e7F{!58+S)<q8e6`Ko|%h>WN!ZChS~<_q~%0f=Y?8kN^$?>ZAa$i`buqv?!mF
zjn{IG)a8xAI93sY8=mW)ZU`+}(YIx3n#8pB3!3AHvEJd8B(X3P?Kka(5NNpo6v?2y
z62~mgIk`lJdaVQWp6Qfq1Qw8{G_DQY$5^2BZpXGCMj!#bzEyQpz~6bm;YCqVQxnTe
ziE4nBOl;$CDUgl&Biz?J+NFkhBf$MCYI;VNn;fE9Ovcz8{Sk6V)WMBNb{xQd*+9(Q
z?<HAF9A2i;bU*M*wwx8B%+M1|u^(iI_fyBHNX$HPi8Qem-LC|m$Xc3U4ekxo++Skx
zVRW@md%=nJx#H^nnps?1>XJgn2%N*Yjw9}@X!Q!1fDSikMbhZpU$akJPYpveWA;@Q
zI#eN~v8Lm_(}twk<Jue=?)h9LosIoll<l)|Xr-y9mLgmWu!U_zm<|MemaaKHMu6zS
zzbZPqC?wCK0Qd;0S7xuKXInYHl;J=3N6)1TlNIl75Hr#}hT9!+@QQI}Qjn~b`7Jq9
zMO5>G1A?wG$PO`N=w-8rar>jf$}EM8-X7j8LTHNd-<1<caI;-=$~G5~16pGMc}k;3
zc@qY;jmHVDw*FCV5jdOS3oLB)jgCSx1ZA-R1l$!S*KNVNU~P};?3_UY=`6P`2wdPY
zIqac(`w{j;7u~+($F;6JfQlzAgBKTYoEq)7z7N7uz|-)WURqU?(FrY#F}Rx*+aA;0
zDMd_-$!i`yQu@q!%XZxc#*K}NSwZ9x@{s$9HW&B_Tw8ouaoc;6m9p_xG>>hteyB=_
zhdfykJ;N^3Z<Gv@$=b%qEt*b-xqzFg<IRC87R($#aIr+j!fZpYbVXY@kZ+q=b3i;F
z{!*4$<R?cNy_RJX6bE(%NXIx>bM;CiaBAygH?l&pi6-ITrk>n<E^Ch45p~Y7;|Jv_
zn%L4s>`juk#F9=^9dUzV7j6UtYo-bcjy6cZH&~>Snc(1EM;UFDjgjpDwdpz?4A|zI
zX8!;oNWyJv<vG<Zb4YVRw{^@hICp7SW1LN~Wx>oX4Rb<A`%mfy{u7xfXaKU|24=>X
z*<xDj9|&5YMo$Rx*q%7rhO2;qb~_28PEsrP5uVCO<{QPu!Nrqb85s@=9jAD~R;x!N
zYRf-sm^O~wBrPCtpoqDR?__NRe!a<($FNd*Iw158T=00fO%L~8)<#cDEM$>lhI<IH
zAcBG#tZ;ZX1Ok@L=GY1?hmnN#gXfe}pg4{V0G|mS+u<j;UzCO9Sdniiip0xu(nXg(
zM>~^zB-{!8T=q>iK2e}pgbq?V;>9?ejHDK}LCRzX#t?h>Od~vUrQYWJgwk5?gl&L~
zwBG{@gFZnEh_?>9?cL5%vmLbZFJ-~*;HR*T*iPEh*)5EQZU+{!P|!`Xmu0xZOIzxc
zqNXSo!(ES++i{Vfg~I1I2FY6N^JSYi5gaUsmp4T@*u}1foz^xY=pf6XjW2JXp<E@1
zpLiqah>4Anm~cNG)H70$ZO4l$q;bvDB!rFL!*S(LAp~a#Na1@;h5n&Q?gq{`KSZ)y
zEs2td!56qo=(qWRDXexZc~1@^*}7Xgl3vK414YXo=KNm?yJlw(xE@sQelikn2aGJH
z#g-UL(Fm!kW4q(!5gxAgeyEyA=IO3Dx`>84*9fU1Qt?-!%AZ)Fc-v7EnSVJ5#=)mm
zW*GxX?$=poT?-EYgwIH{`&?Rlf~cg9Y@RDMKj||8{0hsS!P)-db7IvgkMSciw0B|L
z7IHc3VgCSbcjJqcWj4L3(^%ZNdAe$|o>-)w%Z67p5+#l8KSem6nxZ=geTu7hQ%5)r
zt)q>{`ipb>g(Ec`CPTTmiQXJB`=PWeh+Fi!X-&*+x5f&5dQCWR*zKpm!fZ8k=k(6Q
z_rfkJhVx+Y@IqxWZY^wkD4xI@`iIXdRzov?L32-zQ`s|QZJ2C)9#i5kW3KdC0(vX;
z217Jum6U>J`2!(kHBAFcl0xc7m|x=iSD_b1=Gc*Pt84W5<^;MRN066eCam+P>6)!C
zx+y(YkLn-tm6g-M?W?Ac4&|#{{WeIQ{22|ur9n|bWEPUZ{SayU9ZJ2K=G4<pZ5+%e
z`d@;QNV&MRyk%I=)699h8aEG%Ata)yrRC26cjO_p(N1;(=74!z*AQ^vigN_!(no*$
znue*;<i6-<KSv^@!F0(Q^K5{ZaPq5N9drXN+y^!(@YT7-&-R}V!fPLzECCkyN^P8>
zgt*2>!f=_l$Z-21X^xsCC;Kkl<S2}->_$_v;bo}GOm^$v2@9^&*AaXK*Be}{jmp{1
zIk`M12?(`~{>zUT%4>&vEmmvUD`aV0S{&Pgp#<_<WV@_zY?q52O%i|`+X;f*oJYdu
zyx8~hmBbT!EkjxmoL<2F6G=9=IY@3Xe1DYYl5yL@3_PfI^JUL*dq&gsO#q~^$ULPA
z7~((|ZPx+_!OC$r1LLx37a9H0NMYNY2p9S%Z)qOk`zVVI`6;2ryx|6nNZ>Dotu_`Z
zzyi>avm~u%Lf;m;;4pK_jE;U2TJv(0B$mhgDBjD1WbpB~DR6jA&;f`b-uOx`N6K@D
zxQnMo&D@m0XBJ(z8Bvy>oFa>CEG`mQgZgfQCgj0Bqk_8Z{*tG2T3um}gr1+mWk9rj
z4IY~x>1122@T_QPDdHQB({4{?LshC&zCpYAF#iBR<o#6f*FI(ea~ys=uR+V`@#wp%
z)S#voji9*%%~kahZM(jKR8>wSccl<FCf7#kF}9t+n{Prf<n5WtmW$}<!H?9be!=4T
zRkf^*$82K5`=i<=oB#oFQ%9s!7Vh-P`6;B+6*l`bzn2X=oB$u?GJ5Ys2HXMJp=f5%
zYo~B)8*BdnF$o*dH3aU!Czm^vt6d<ynKM$?9nw3V$cky-A+#}*^K30`7vbP9-7Jnd
z%GPNe8%YZQEe##X<e|22^m%(@tPZmybdNs?v&UBu-BosccV5Rnl}Aes*kWM+0Jw~*
zD!ngG4>Hubr1rWE)6*J{EuMO}H*6H{4gR7Ku)3|%*?@w1BrWc>K9>YW?qe7@H(4ob
zpq6j?X!f(n9HXb~9U|9BW7+_7%ZUit>YZ;!pWN=`a1|qK92vFl5wLO_$xHsG-M*YH
zvwyixrn&__%NZH9h0;5eIg%nS>j10do$mL{^41R5LrUpqAHzE%9nU2fDm50-)l-A-
zJ6Jn+DA@HMTG2u_x8u6b!$&lZ4kpd=O1#q|ju1AS_i<b~e8rEl(8b6o#`g=m_E1zr
z7~RfANnKA12yePec~zA)>~ptDL%cM0O@}kdx-{|e(6EEMcy0TkwK~TZmX~9|;YunU
zJ9e~fZ|tC!o;P>gO6hLVDk&c4%>MvrHu8z3idT^wcLT~WK@)%6A*~z>scEXIn;>f~
zVb99ZQRpv3^jdSd1ADxbPx@ZNzDE;uT`gN37;yHmAT=#fr0rp_9qygd=v&z{BaSzA
z9|}o<du%MwM+%NTL~lDq&ytR&sxCLlNyus@WgrIT$oefbOOyK{W12P(QmNsM91G=1
zCsD%_Hq(pzlV!=8a!>Us6up*5M~>jSzz)GX@(qYwS)o+L)E=XT3y=0oQLW7(^x|#L
zn_)#yGxRqYk!uclcE$h|eIA{@P0}2x>LznN(%tSVI(g)Ixwr$jWz`73`*tjv=@#_*
zdt3lxMmzRI$w357-107~+o_nDVT3f*^38L*`>MDmB5e~_OxB%@09jVPeV*q!_EA(!
z=R4D7+~eURqly-8sc|km3#_B;)(2TzEU((j+UUAU=hLtodyvkRh2O(sU_S5#%a3G@
z43ZBrRMtCmu5cZN(<GJ}e`v8GE#4y7z)P*!E}f)QPdSoceg|aAK9Ioj)KtpRuokrV
zPNs&YPi$a<d#yb-iU{`wZAU{40{aK-hsMTA`!Y~;^+dorPW{S0m#13S0O7~?T7rGM
zLqG|R9#M=^VQB%<Y1HrmW{aZR3|Ghrq@OuRLB>@LK>^HYvp@skcd8K9K34!xvjqC0
z*+^yxa?%GWt{*D~f<17WYHfm`b8?W!o070eOyu0AI&zt{ccv}M#u3w$(>sp?3I3Bx
z?Ts8IH6fm}te9tdpJPZ%vAz=<K>oAOVp548-s(r}ZwfOzZ(x;#Qs>*7ChmHT^MS%x
zUR-!W(TOhOZc>paf>f+6XuFiq%Nw0*1e3`ay@r?pY}^1;E^SYOw2-nAF5&`)s#++=
z>S-zx@)hVjSw|BmamXPM)|QNrx~{q=gSN`B*S+tvZd0t*W~i{1K+LFJS+x6}8a}9J
ziKXBhscH10<Gyo`3tN&Ax&)}KmS+|~(tc9Mr^z7QGr91tVWoyP*{x^^CzdFNNJmIp
zY!V6>qXNtbhdwx4k^-sJwYVS$-qH72Jy)tXxV8rw3Gk9x7eV4|bq!`HT5RAg^0K<G
zRkXaaH|}xl7J1Fobtx|Q7PR&STj?D+atoTWxdqSzs<j<J`w3`10zXdB9U%^s6Xxqv
zMWjOmN3>m8G8VD836xS5l+-#rFn~){gfKCd+R<b|X(b?O2Pv$=w~P#@wj%CRplH8@
zQ(XjN?r^#qHo@CYZWOHzizKM)bqHdNyK_Rv>%CVLMa+noxOQq;O(3Y>W}i^iqNi!Q
zg~H3~Jy9E+V~yaSg^JZR4O3Bh*}1JfyQk=yMO2Rk%_ZH+pY0*Ek!e{`Rj4?%uOJ@^
z!$RqYNJFG;&yp3^g`pNTrbgLoboywa1K~?PRf0Cd70H!aeu*3ri!=Kvsv>l4uoepO
z^Tg3%WIT?A{{X7rMdM5J4Z254@yyG_hD&WKMo~{THejs;Y^MkG54c7^VFVim-HXlS
zwuF{8o{Ie&LA{*em8GT8qG%UrC?l!EPToKP2L7sOe#pJ&;YTl<kvfV5ai`g({{T&h
zH-HopP)2Y7C@LLFrl11g;0m;cM-g%|xH9=U-kDg!C>|{y7rO6gDEO!-;R4KU{)$MR
zN^!8{u6D9jvGg#uFf7)9K8OnWV~vH*vM#E2M;SL33(P+ddabk}&1=a%2X*FoGMjuN
zt+S^TEWFh92%1m01x)Qw2i!ab=P>Kqo~JR`#|EDvXelTwW?(0NLic|e_{?}=d~QsS
zk(sx}bb2RFbp_=S@BZs~MW_iO2KU18EhdJhnxIJHaJCWa?4+i&k^lhmpC^ZwGIB(D
z!Iu4H)J&j(#AMlc{<YQe&i6Za2LKcY;#XRVhd!Q=?{^mq2cykfQBu(6IJBIT!sqe7
zALL}s&Q6ig^WuamwrH!X^&Lu0k?ss7TId}=xQEEwo=ULLsUVGwE@&lbDH_&{3ook2
z1qjjQIXSVEdV3*Y0e~W&V}XUvASi0<qk)9E!r&}kztl2F^93+2cNpxmopcnw%Wk3S
zC~4T{wC+8uv5lWl)oQmru54HEt#n--)kpIc&b{&i(Zxqg6LzowJ`_~bl`-qs4xI~W
zp=(;vaEX^JB%+-Y0QQS~p`?|JyLRqA6=MV|lPirxk;(080_eEwWs<`w83XDceU=F7
zS`a@`;dE6ZJ+X{=ExYlB378jIt;!~<FxDFkD#;|-o8bkZ$g?IP7;}g&@PL_&l1uHy
z)C{eR+%oP>Y>zJln*>~}6~wWIotrK|03~>XZ??zknAZZ)?zvINLo}}3*PW_vD)dv9
zx&^7zq^UmF?P_#%Z>MdWl8LMJX(GFc!U7#aqIX-;vplBck`cz;kyS@gAr}W6DX1x)
z_X~>@>bjRQFKY>L?wh98K1W!9(x&A5qLhmVY0)@;5x^AR^vGB*8Ok(3*EAPNb8jn~
z3&6qQDwFJLMNE`WWSg8Z;VoT!bnxwLK$~-9eN!G<1+QgaFoC3rZTC&h^u>7ojQsU)
znnx1bU&7C8futK`m8R7lPEDY-``J@Io;};8ASt|wGLgjOjEnT?CULnSC$mUwd2tu)
zRrPe#@ih8w1gbfzWSUK^c0LeUIlTqq;H{B9m7w9*Opi=_hUWHKEel2!PY#ogR+;)N
z6tHeCXjJHxUd(ozqc<Cy_g3*~G@yecG4w<_wwfEXWRBre>Kc@j9k2%<qN92z9?e}P
zCXWOof2VQ#pfx&;G!obtE~qGJ>ZXtxOPb%6c}t>4D=z0{1qUsS$}w9VqQOs9I1VDk
zXs4j1iW|pcj9CMxXw0Q>b6tOhEq!G@7$MHN?k<F)`Z9jX$F^p;fC(4HlEq6=E3Q~=
z@{&D7R7gEGS-w@w4?dH7VQQl-j-#f6IK|ir`XMXgXnAu66!T8Vea^~)8mQ{#5wwN3
z*l8d}QOi4pfzO0fG<T14no7}W+IVY2je@piGfZ|33U2J8=*G3Ir~N<z5<66-W*+Vp
zp1VRDcN_(plTKvBhX-7yac`ytB)de_8qSh4?I*p|`fj5P<Om}c`XJ)zs#9mU65-`p
z>GToPJP6xv%P6(m1Co6b)iKU)=Nl}}rCjQH2xHvq8*;Yt(lzk=oCW(V-l3#GWiGIB
z`X;u;&^CiCwekTWa2zeAFHgq!gM*6AX{>D-zRLiv>AH?M#>=0gMx>sH{a<3#bnK0n
zaC5ECDC#ygkXl5)>#cl4_-BsmKdb6;$nR;kdnSye`vjC%Mv|hUIU^ugthTuepK`}o
zsOhUFBF0WskN1nZL5@@2#Pm}~OH{{hCgB$WkdO$vCeLuQ0Y5$wF)@*}7h3jN$^c43
zBV$_4&$1d>++S$?spWZju;ctDGB%DZla-V~dSe6s0Ngo8&R~i%cQ)#@0TXu<g<V-B
z^$+yp2E|TMcc7-dlU8a+d5$;Z;39O2U(Uz`gxIR;Z878C@ZfwEIjNG5^jr|Aw6-j}
z(Y@0;H%_UH84GTET^IiV?Bh*y_Y9As%k=*MQ_B;YBqrWgvY)Ogqh+6bcu|z3GKyhP
z^o1QPTUrJ@plkYNuKf)}H?1k>#B4Vzk6zdHcgF9^Mx^A*MktycB-5LEjTT1!Wz^Bw
z$^F(5nx{}nFa1q`@Gh+>TUS&)?;$Ikq(2mkYQ0EI;@(gbHPUxBMpJ16Zs)&0DfMuA
zaauf{$TWwtq|-&qfw~?@LmznDLVWaf(@1ump(vr1js7d{r71Pi86-!#q_l|UH&wN)
z)SBP~=G^^NgwAXu+U)pQ?R!+Hk8y4Q9o2BpVoo-+T0vP=6KwhKd|2?RwYD-wZkLmM
zwBcmr)#rSqm!a$RI=4dS7rMj2Uj7`5iR0yu>^`iquX97gfKj!q{X*cCOBG}0oDxZQ
z7glk(zzyxV@-V2Fl)|?>5yO+1;7yJ%*+9W_hwcNhPIl&;58YBMq(X#olV@W6)N<0f
zppZ8M$q6Ho!oXOL;G*Nm7P!Y3T@k4w@ky1kHI5c=$W`;g(Q|A3E2@fj8@p}CI8~KH
z+-z<~Ax?0hN(C)sSGj2WA@u5p(boq9hjI~hAc2FGTRW`n-WL`~-iaqn^!}Z$eC=yv
zHa4}av;v;9cIyJX+otPgV_4{2VixyJ)T<<GeN%9}jETlarH!dXw2AUG?R|k$dST<`
zN9)s;hdIC>l_eyxIl%6_RGgX_B*=|BcUXi}EEMgy0R0h9jyC}2*+kKsa*CT^aYzSH
z)eBqc`g!^wsof-wxni}J7@l&#PtkK@Ya8vh6Db3Z%BrSL)|WM(x~>vRFT53Hs@A>%
zfptSAZB)10OyhL%n=^ub!rxNX*b{3f#XN7ob;_;uYUMY44ro(FPb^Knjnx#BMBG{|
z_Iw52i<~iHpr?{uws=LxUvFtB?8Hr{w<GSQZR53tyeSyz0QU=o_XfBR@RrOgT^ohX
zlV#bRqbPYrpMorvgbq$o;wxm)7c|`#%FAH22EuMF-AF(^va^bPgOMw$#rd)>o}fGh
zT@)>Guv$GUMP!i&dVqb<(lWUNi}DgU;HwJS2Gd7#AXS4eur~>lOwKKKJ*0!elK9~;
zV+jNMEZK#5wbT!ka1-QkAl#vy!Lk-D41AlNY*|F$=Khm(=MSk$#(T0;8ia!6o#d&E
zZ9Z(dtsRrt7Bvu<Snq<E(CFRCBel_uU?-IzrE8FJ8A^c}1XUIez3!l^&_(yePIKiL
z`gcU@w#kQ4d`I}8k>yFmbuy)fdI|Q(F4SnRf>!Mf0Q{nzBsF6AC>p8&*B7z23T=Ir
zPQYrVc&PUNpDI}DoYD_u8JMztuNX(ueqL6B9NYa+bUlxoRQ?{*7Jd+psS=xp{ZSJ|
zPA*G@{9QsA)}LS(K~a;USRibzE+)kxjnTU0*8wr4i-K)*p{~u}aD0@bRS$}|Uu~Cu
zYVYGIvD3s~cMPV6hRJ5076YPa<$tOAZWQK7x8^X1Z2O!V8b4(BxCaAk*);*OSG}wt
zv{<PB05tpB;URo)KI|0?+jsj<WVL;o##H;=y4OQ`0A0w|%El466Ljg{85jwcjMah1
zD2QN@Wi(aH-;#%^U@i9WP(G8z$RsAK3ejzNrIUAV6J?}eJNZLVxxs)J1!GS4wB79v
zY5=0TP}ZA=5EmOfTI$MCM^J40F#KT!QA8mZjr)P)D=KD0f0ra(ruJN0uz*GGx*+g5
zMMThTyj=%nQ$TKDBH&poDrSuPNpSG3BBp`hjo@dxhN_*h<)jdTl?_p3lvV9<Xm|tY
zEUp+Mkb4{m@pYFQZ(=|x@k=ajyJm3sPL6rUW`;mxKcE(<+Uj@Qy}x3rj-^l;vF{F0
zx~;_6gu?L;t)qeLE^I^WsOqS;58;cDtZD1c-%Z5)B0UyL1IHyBqfwq~BxmYln`Cqo
zJ764-3eZtneAu$d^%`B<x*#ro67y!_Rr;(vf)KBidhYP2tfiKo<?SNsrbqt(7jeMz
z<xw=m+)FmR8(S&c*z9ntTK+8Sso5a|Alm*CxKUL-Y$!Bx2~2AXubd@{RybbvODjQb
z*y28jBsHc)_B<w7gOEqUX_96e5F7_}&6v1=1&VYl6~LSk-EaU45AdGX7h7;$v^#_-
zDuiv10Xf@9wUStXogeBK0EDcpQ3UM%83ETq#RHrT@U3ToraOWMge(y~p~m;hF=Avu
zl2S+rAYBs_PGdnK!{tpBzUw;S9XO6iKxt`OPKAbm7|>mJ6rwwlcZ?|vPH9lQ=V?FL
zPVDJQ$y>fL+=JmidkwMsp_*O>9BuVV8ePrqg$JT%hLdhSLTP9M;NLyeR&}{axT27B
zIDvfOF3WZwRM6l-7f%Fm7U*TOn!|4iY(=e*oDMK}TwQU+zK8`37QOr>X=(m&KB-8%
zZ;L3TVCNvAv8W^qHsIYM7$|1%X}CEGK`}g)sgAZt*EzS%{;C<~aP496qz=YZQyT&X
zN_h4|EJ58X2)895$s1kvDda}x`<r9rD2znA*#0=WvN-Ex`3=dj@}CrvFx`ZLqmT6a
zhwPkojEkwV_|}5suaTe!jmV}{K`_m(s~AE3O}dj~NXK*vP?I<r4$c#W$jAjW0@GqI
zoTs#I7YFRHQlqcQvg2cd-`R76t-|KEOKt+;C>a!h1A%20TXi$6;oULKu{Pm4WZEJw
zB=Ea&IKSC(!;RMf)8s08C1N<A1PdhlC+xWA{{WPQroz@(D`No9WZ=<joF<T3Q=01w
z5D;Nbg$+BdGM~2x%I1)80z)BhBOTHXv`WG4vAIZDae!`-vbEnIDohd1P<jevBsr%E
zq=WEOw;k?~v=QgwW>qpUNWL(jlEj;$8~`2=&$)hhS|FJA0?~Gxr-!~fZv=R{hhs)q
z;t$nL9aPL4UK=AvVyc<PG{RteB>g}SqGeM94aP!rGSa-?W1@G#!jf41LG5!~J7*{~
zHa3$5j04H-!f*!oTw^WvoLO+(JgKv?EJ97Vx<c$&4pQFyjHDoQd!-y}opjQ2l#ce{
zCnw6o2ntQuHp*8F;WRbY7w6#=#Aj~dcKakF7P4Uu`h`UzQi>%mYrC|l+{XC*lS%Ry
zZX<(#s-lt4C?SP_8?=_5)=y;hF}m!T!0?cpjNvid;n!4BBP?h>9d@=a_Zl1rbX;9Z
z@rN{y{{RY#_~Qv3W5KdIBJrBaZFz?#Lf?zwSVOEv;qD-Og0LG%99=#+WMTHb!|#Me
z`0Hn*)7R5ZJ?1x$JQXaF(z`Lp0r23w>9fj4P3`ifi&LtL4UyLHauA_hc5NO5A7Vb^
zf}i{ck9%95Y(L>-qu1xPo&q8ragP>x4gSb%9BZRPCX+=t-4jDy-)a8<f}<Kp$Z!Y6
z@Ktj)R=bG+K5mJFTAhZ$%#e6?P-rQ%EZQqv2pBfNAyU`$?aB5V`3p@RwF`g}L|9L8
z!ZJDO<QtmiI1$2=bUL<q#JV+AIlOzZ&6F&3k>Y5>$I``mMDal|wVDrQNnNHycVJuS
zhd7N-(Uvsy)ftXoP3N=6{HA_VrVc&B$jDaJI$2;YjRPb#6!#^sX!4mfZGp)547rv*
zLWoO~Vh@yjayC<G8pnMwS4&9~n|SPg2wLc5*<LDkk{r{N_Eg4g?%VY#Ujvxy7N4>n
zrUn*V3m*1aNY)e{*Wi|$CkEVHI_j83D_w_?^+ZP{OGZV<!gkE2SR4W^Z~0t2-yP7g
z)V|)}e(C=Jnr{WUS$|`xB76BxW=|PV37Guk6!wwX;c5z*JJ?1obkYs3xJqm<l^}ab
z7s5u0CuBeiaJs|pr7?@#a8q2<;R_#Rb~ofEy`*5SecDGiU47mWqg{;!%{<vk$p|(g
z{{ShjwX#0xw)sJz@+B{0?_p%q7$b!ptS+1+aN{X>hmens!s;`2<I0%4J0}9lGh_8e
zjbudSD<myGQ;4u2a++EQz($3zhEz1*{nPFrkU&6?M=5UM!7EqLub{#Kb}|y#-VlwI
z%})Hs(P|dHk9(!lsw?KW1UI?t5f!mfP_xl&o~(z#z*1J%xsm!&xv@97?o~74bhmRu
z&HIs(yYBRn<g_{UHp2iXzrs65oKH~LVHbHhB&u0xt0W$rf5U0#$~#ZeD%lp;p6J_e
zaUA~WtNI0_)AX0=bTNS}(alhKV@>R=B-Zq}$ZV6xyZQm)c?7Mgg78wg&UwLg{{ZDJ
z6$9dwOIJJOdHzsv65N{#iR=vOEjf+506!_M>PmMTn*cnl4L_vV#F9F|adTi5cCo5P
z8T!a*>^rS1Ud)eDXH`-cZEM^0QPg$C3^$G^ndR`_%fx5ZWRUHMIitWfB@?E{S0hV_
z^jLX5P>Pc?qtZ2=vX^6=;x}9LH1YK-&vo9Y)T-w!g~i$Lz(hJBFR_<+9s4Dw(#zxl
zk%N9oM}ob9wpG$l*6I?6)=1~(;k|;sj(|YTu{Yi2Ug?@>WMQ!|+<vE?0+MQWFc!t`
zaplSQ*FZ8=Q8k9nJDqFubrsy!`x|eSqnk>G7|iuD2Dh7cDx!CK&n>5iY(s*QsBXaG
zZujn#mmb$vF^JeNAo?^R*+(dK%d9-9>^(iL$N4KoH=w-{%TVI$4`?0{H1X8WZGeXP
zNev?-9<4*Rvz)2p)#JCNP6HX;$CMY3jxO4^Z<0*|R@1&F;QNm%t?l&Rc`oOk%GRp3
zA`Z`UznR^FrK+r8aV*In%!^T70xj8RM%i9&PCO`eO+pGr?A{Cf1C>=asW4{7I5Zy|
zpy7bb^7jI7lII|ktqpb1`Kzkxq}bMw--T_X(8%%~A+Q{ho2OEjI5m-yK8r&Q8}<f(
za5zs0R>hQnYbre^2&3UrRGFUaf<8*sng%pni@66;L_d@aEhNDjDm3_-+`QZ5_eVOd
zvBpFZ-2VVkQJO~wUB}uvDmt5%hDOT^@=`dqQo!6QYGvIcob&a<K8s3p&u^&Xe*rBM
zL3N9V$yW@mf|4t+2S3S9qZEnVu!?OeC}I~D`=Ue?(K77=ca=`<Nz)Sd$zX)4)hrF2
zW)D1+Z|pW%$r~n?!qy$nWhbWt8?+F9R$5JA<n4?&j{!`|nwi=+k}rS)Sxqj36xm@^
z_IiXh!QVt2^E?p7;{Ft^jm>S}e}<0fSwl3g4lONjgo<T;J0gwjft#C`p6a@4gCyHU
z-v0pbuU(~=fH(>C`czTamV%Eq-oUYykijF_>Bir2?yhvb2$!|<8xH8Yc-s*hBelDu
znJd8gO=xZ!2!l_hh*&f@`6#9`7{!1B$PZcgx=&U9QRW^cn3aHXyVY&E!m4!60|}m^
z{H5eI7UofW5R-WFt61lEDnT~UZcyZE3X(wFo)bNB<pm?&^Uaf59d1^$aV$M%{4Vv{
zJLOk6pD8xDpVU_55a-mi{{Z+?KQcMEL2N!!7JRM9)EH`-IZbt4#t@<_<vEcx3pEpd
zXU<aoYU&{qcup}3En%Wh&0{G<_d~gvQZcp*TM00i3C2=XTT|NJF13P)<#Ue;9fb1a
zORShid?8^N*qeN!7#i05LLJh^!OhV170qu8IU0hhC9pYFwKdX44#!zREoZ24l=yVY
zn&0JcZ<3`bsd^7IfGTyWv4JTcb<{J})V}w7uCD2NULfG<PUFwfThr;(^ur7vRilj}
za+_sMKA$9w222kK*eGF+*KN<rGHIfSauqhCtw94xbbuqMi?&(0(8AJ57*$%9yA&4z
z%OS1xjCV1@OpZN*q=H)QN^s}gG@casIXw)O8)MXE?K?@ZRC>0(SuNQBaVNipYo%zU
z#2q3!EfNzY%WRJZ`(Wt7$ERvl@@|>#u{;HHr1a0GK`kWwg|>o<2tW;B7Vf8R#$RYm
zqL3~7DkyYzM{BSJYZW^fEC31ZB=8ihZ#PU~f-8&!=F_;Gq8ow2=hVj-=PL>|w829^
zr4S{>38?DvMAPpdy2Nz{RX=;8r@P<S1vfOh9<{Ses%r65G@b1Lc`GMZ)iOyo$O&+|
zp)l%tl)I;Mwx8v?(CD2zV%I!p$w4VL7U+!0TVC4|S_&sk>AzM$=eFm`T1rheI9LE}
z{>s*kf-%LDD5NcwG`%@az&Esh%F35dri1;s!1+Zz>JsvNqS(akEf@eLbc8bsDA?yY
z6e1R}T={UUs+eOgJ1XS$<dY=Zz(v6egF$<WCecJMg<Gj=uv4&|;=yv`{B8_Sl@<Bt
zB|$SivD~@VRT`GR4J2mL0J6H@RQiu}ROfTP6;&-AR-q_-&T+cCg6b$=_Fc`?Ggiy7
zgofXhq3Op%xvrJKceyH;PtZdc2?pc2M~yaC;iRZb#g}2{dOaUXsirLgHv+7kGaB3O
z053n%Ow@7Z#_DRVMz&vTPSB+MdA~+X*~_Za!VkPEs?Mc|IJK`9SnA1T+Ch=U$K?YB
z6p}xDj&VhJQlIjA8{|>w*4FE8o+8MO;(k_Ex2IjHPGy{KC0yy$n+NHz`Bv?7Sj!6q
z(~rT!4??{1W_wEMs%kJdG-Kggxv;{^Z2$zy%J^VuE^roDUaIQ&;=FLXd$<DYrsEwV
zdwXVsTi0o*<8dzyvh&?<UaHhy=-_jNX9SMwy`SnDy+CxgEhmo4Rit#?njNz%C^>C`
z%DOYUUWVF-@0#ZMxmvw9L!^WYG+*egDfDMXJ)*!O9Y|qq+~rE3e<2{HiYDH`AvH}-
z3OLQ)1&5RdwX3p~g^hSFSsCdo^_lm*&TL1rpDT2Rswb}3C)6r^Dtnf2Ph@VNM;u?o
zlicIvDYVTNo{_l#lzgp?jP{Ev#t2DCq0~~{`vYtd5=hpAb8>>Crm30xm>kymQ_D*%
zRylD;<5Bb~lVOzNS!2!t;WB916SqCLT@IraI{}bfj>(R!{M)Y_b_E2IGj=*UqT(7G
zwW`jFNNsEtLsI_$NZQva)GwXK^qV5KXQJY`M&N9yYa=fNG+Qca+TY8&Yx!LjRB|%{
z<uhpuRs|I_Y;BxuoERJ|!@@eBOMPs&+->1nvqEJwTcmIn@=%V$EiD;2-6UCU+~j2*
zp<LDrL~Zp&SF#4XV{P?BP*%`Fz{j_9(36TZc`ye)qM_s07%Ih(Q$r5-TaFZU6>&Hh
z27nbkb$0&%V0Js%1UVkLT;fY9;RRDu%T~t?z_&O?Rq70DHiRWJ-%|eo(o<4mJ1+Fv
z=^Ke1dv_?w^?=6Z_am_Gsp)B@bH(fezN6CVgG1ykxz18J(MZnpin`5is%W;s6^9q{
zvU-(9r0I>pxhv4Bn@1B4+h8oFp;1lwt<4*(cu1og>~2z^Jtm5_X5LX@${$#ws35W}
z#Q9n(ZALc40bpo8J1KuXLv7Cj{z?uhzKo>O?DJ{*e^i;q`+z-_j*-)Eh=Wi~){9cs
z;3sS`-{#0jwQa`E4IULEQCd_a)xN{%DGV5E%Ru->NfTuRJ>>n>TXhDz0FqOmHA9W#
zX}MW#hE%#Hmqmg@djO?_MWu@+pp_Lds%~TsE%*w?oXI1t!%ED^0<NAY@X!JHLct@1
zwgJF>739=_o0EH^^tdRQnHmWRqNMZ(Bn?VhVjGQxl^(NCPWO^M#`#)(MfBtr!5R1=
zRK6C5x<@ew3icHw%I!6<#UJPj$}-6?90%P}Rn-A5$i=dzq2A+QZ*&{5)pQxCwwy(m
zT%dH>=;@{2UA0+DMCU<wHu$>C)=*6?SElBc0&udlD^_fouhO<5X{-m7We-$SHM@82
z`URMx>B?rpA0&>r8TVmFGpJ}@M1JR6lvJYh2NrB<by{k+WDmL?Hq*FYXju==%Ok&r
z(mVvFzft`V!s1F_jkjnnX)0!lzN#pO);I!^f~FGP(#p_&t2Z8(tW><qH?_VALh2Oq
z!FDzIRN|Lp`8Uz3uhr?nEM&m_5cKtsJc8%n>a*HroL=DRq;sxsm8ziADGj#(RQXq;
ziCFn6X-rrb`UO`QWR)eshX<8)Q$<M&aDK>0{{Sx6U7RLgY%cmkstdm_W{}mJ)TD5`
zgMqQ~tu;xXvCWLxXTL8jvfb|_6T;G$&=hyFeLgC>*@IazU_KV}r+P`RV_j2HU4F!@
z-jxJ&z&)<BmF*s<Qr89vj^BkB89vG?T^i@~?Ho{9k7=-3ZD&o6DJ~^#ht3yQR#rYE
zwyN0jveoidmmT#Eeo`n?(C%6+XKYd6I28<9gb_b!u|m-Lj&St_&GU40^i=YJU@!2f
zqU=Y|@jEJwnla%WOd*6_%+JvSM;vscF9kDDtK7oY6Y!c=l?thr6;<)&pbM%x$2M1A
zf7w^bET&DMJmpzY!p66Bx4(j>lSMQK8|Gt&rhl>_)fEkH=f!nlO4uZrHalE)SMcfE
z;>!X1Atb{VjNXr5DVD-5xy9D5nzf~XJ%FL((<#{d*fgiqM9AChH?rq&mG)DTETerJ
z#mia>7OuLIm|(OYg;yKPjfpAk(qO7LdA-s&$&DEzDSC<``!Z6THIhfQ<lPc<jVhKc
z@<uK@s@lo)#@sYp!kdM5$G_;2+Jy7F+a}c<qN(n;uY!SPL<RO{F0Lpv>8i*q-DBG7
zkyb34>@!B`ky-DWpqu$A`tL|-vBpf3w16@Tm7Ok~JtRKqT+lvNW2+wNZya?_B>w>1
zsM?C?n%gR!qv$)#WXEyIz1DB3^zAYzo+v;r9N6aHL{l_PL_EmJoc{oVtF`SqwgA~4
z$AN603#Z1&`E8TW6~{=-M@4xH+S`lr0xl`NFk0r9Te=<@Wj7Ca4{Px5FYr{=2i^nD
z(s6OzuU#HuW8;;sxo&<G;O}kAY;2vU(Rz$M-EPHn)Y37)45}qVCNY46?)^Sd@ExuJ
z#5f)gWDGI@cDQG~)P(G55t}sf)p$yZsZf1vZ)7{-7j3NJ;H>R%23^1wo(i>PbD;r}
z0%Pp)%YF~Sg0RC-4g+1>jtV&?87&PdSwT|^?c{bUuBH-2z{ppX1j296Vh|N2j|8w-
zjzZ*`BFXwPq83$}dV_4-73&&gRFl&*FoL`|$>`46S^AoLFGlFCP(C)6Nx7tUIbK(l
ziuQH*`D;ew{U#R+mm7Ul4~$ctv9{$&1zU@MQ3K^U(}Cjag+%S-bwB4{hD1uVq@=1M
z^2fCIRV~&hg~MnB1uM1c*+FP%A5~S2RiZ9(y_WBW5&DP-DvBW`%O?OTi7F~&adDL7
z_DCdk&E{}FRH-`;`Z~8yeeHef2$>`w`wccn(wm&he|03jm~G2}R8p+~5!G9p?~DLB
z!dN3@<ZW%PnIzGdZ4FBt>>r@nXCI(%*=bLsvH5n<^JO#ico;D#3Z7cJ&_9JCvIX@u
zu5k~U-(r<>Zicv)HT2QMNNk||g<j(3;5!MdW8QZe97*z1+f3qrRqU>nEs}3~A#r`v
znn<<tWJruRCfM?r;~6I6-$ZZd9gS^6TZ;tt)b7sPsLNS<rH<DC3#<wx6-{Zqt@lP!
zYSKrBxb65T6G<e809dJ^(%$ERabxn8@%9xL=(cTiRSdMU_U=%wmN?vYNUSKjYMxeu
zBkX>*OI_3S@HXv`pZ@?!MM)>7Gg51y7%Bt#DsVy1DzaK>Vs+y<3GvS6+kMr!Svm}m
zW6Fub<CMcK)M4%?!aEI;1{>qLcwqySv0m5Z5E*_-V-Z9MKIJd~1smgYMbj8u4sL;+
z1cu~)l{*c-$_U?#r<oc8)&_^kXAJO!si$MP3T@XoDYw5XBO<O=Is<rz*-Z|l9M4Wj
zv;Gk?FgRc+3tA3ZgMwowRqB*YsB4`Wvx?8jr|QsM@kw#vZ5-%9xft%adNR9fO_ZEy
zqLMMtO;*z1U8El6T~jca!^6kXSykymR^hk%D(7kPQ{QXI0VI(~G!)ww``8FdV`GUe
z8Tz5ar6XZ=!0c4985-O+{{Sj`MHsTN*02Q&?`b=M<s8{voxlXU;v`&wb-5aWX_#Dh
z9H}J^-GTQ;0TFMskFrOWpJ*t)tQY94b=>gO!xQ%msj6D`IF^f_gpj?(z&)n-Su-?7
zSui;l3V1|r7n9rfM7#~S2uisbvc<VZ%t<s2ECqxSWE{IKw%=6=mEqTGoCjq*4`htn
zAs;0l_GH1@+c(>rBPnV?Xk)=hX(JceF#26GI9}J}fP*nSvD0P2_Hj@(w>Adj>YnIt
z;HLhAVSFr&TR5<{zbLp{xu64;17~3yUvIi>b1|fbyo1>kW)U=RU@rky8Qj+Gal*B{
zk6^p55EV4!xY?^wl!zHMJdXY)!;w+JPaqp*{^&@li(X5CvXVg1{0n^+zo2cCNvAlS
z(aE@vlr!R$gzs<cq-OS;hm|mNjTht;$*^evwZnh7Sxm}_;}?y<j|Ft6-FG($j&yb#
zdGL*oNtP6Pqe1@ws%dY65$voIH2M<<wD!JMcn!lQ_e>GGH|}QUp4KaIOdKSO+L^94
z&fFh`S1lAW?)2^DJ_@HvX3pa8l8vOMY?F^n;@(oFKy*@_HbI_#i3?<m5pBc43s^My
z2*X{T>IvuoxN|M!tmM$DDVZZv6C4Dd!QB|ispJFFm9EEheQt|SJ1=kw&sJzvF+7@A
zk@0lOX@SMAi$c&wZT3*vyRcO;snjUW$zyQ?xbB}#Ulgveb)DeysFHmdWNWhBq>CQO
z>~K7UD`l`37gI67Wv0Og7CdDZPDT4D-Yo6hCpG<&x<Ek9!kKkM63Z(^!3p$Jwfmaj
zqNyz{?i4h(7d(8YiXoA-9Ozv6J+>hwR4;5mfI;|CM<mT~wVV-B)e{Y#EpI4DSOAHt
zqqY6PA)9;s?Xr|fxLbmn_Ln8mbi{4D9y=)-2p907F}b7>l{9W?!4@bomMzVX7d}%-
zZyR&vNamLdixn9Kr^S#%Qe$n5Coo|rDn<*N1)ClzqpiwN(l7mz+bKo-U&<X6(7SsQ
zERZx`;cy@m-8ea?8<LHoj*NCTO?!Our8~CV3?_n6Rt80za-o^T6+3{v_)tg%{uLre
zBOFUlEd+K<*wXGuN*Zo9xP20|5ON4rILCT>8<T&!Z}&t<!?m``k8O|2otKKx*0df9
zTM?1MkjIV5g{QE(7BXiCI1Hr*!sKACXaw_OoJK9m!>4C8-GR77#XNfh9?m(k70vDf
zZJZC1g^MH}=-`xKgYkT*rK7f3O@bMO-x&HSgt9Xmon%uY(_I6|(k$0Eg$;*e_9%yv
z<L2rYw)Z!;-8y2lHug9DlXqLXPj>+{<KZ#|jxHygE(CoFh`Y+>xP#>y082r*PS_oj
zg##a-2#C$bY>}!chPoUJCVPXfZ}5o(TJ1l&=Qig&q_NVnARTT^k7R^fDowjdw+RR*
z7${jph~Mysb%8j)(G>B>;CN6vGVCzzDU+Z{5j;2xf^G7n4|qAqMlrGm7QMUe#gck)
zKZCURDUr(Cy^M|QExEW{*&YwH{VY_bncHwL@(|`HHN+Ev!YPjwPU%S?yOktzSlrmz
z4AO0!+scuI1I3cGi$Rhco-mMs<tVWn<#1uO_LKBeIwR3MaJESO*83F4(_4do3K0FL
z+H9qcsqOZit{*6DU64r=+1TYU-~RxGVe3Tu2MwpkWgSZ+BXccb*&F*6$@>Cz$T&>B
zu%>Xh_yFEOA;0hxX35a9WJKd3H@(IbmIUD@4<nT5lOrWG^YErD2LVLr-FpN3r->Oc
zm+V69SQCZLYll20eeGn#uVd|u8>F?z!e|y4&J>LsfcIPAt<X@;MmbJs&98Lg(l3Md
zO#;hu9YHci#BGo)k<c@+vS^j;9#pYZ#^Y%lVuv;#jS(1}+_ml>;HO6EntiTCHZd!2
z8?Jm5(-~{5_K>&84~2FsDy0qD``_xMj=D(B<~hwO64C|5h)o0o{{RR!nZ6&Q$}Mt6
zkR}1+&j{G{C?;>VR)cTS^JPP|j&49VQM#Rm<)pOuNaGf65=M?WVlT7YM~h@4<cc|2
zb~&#WSr&<-{SP+!r?RS68@29hyoJ6$p&gc$T5L{ncEZEtAm!3$Zef<^!755^W>~H3
z#3ci`!B!D!^ff1IpXs~9@Qq0e*+S-2!fiZGANLG|h8E1yTeP1AX~P;=TnkHnw?NBJ
zO!*C%0sjEE3s}5L14ib*-qHurHa4}cvjvFl<zGupC<kM~_;P`i%r3mq?Z0q{lvlPk
zID4ZPQOikA?=AW(<E4kUbW*k72b3hbe5`i_d|4GBwPic>w_9{i1a?C{mZCRUkD*s$
z8JKOfk>n)~xGf_80R2G_ltk1=?KumDMTLlSex+PV97KD8X;7LtpN5b@JcX?RN=OBj
zPj3zce5qMp3A2U1%1JcMpt*!0Uq>J&?OKy4vdMN#>Dc}ahsr|c-`aa2WTlfJ2RH1Z
zbagRgw&US$EM=V*1>)SMlY3<X*<J=g1$VCCF0xENB4Ow1Pr^rbzbGM8Ks<#bYIB|}
zv$52ZCpq$vUe_2*Z1IttC$-Hy8?9j2fSctgb`scs_zG_;Qed`@C$ea@!f|P~6H7>1
zs64FZu)Bnwo4ka#ASZA6M}CFb^i?jK4&fzJj^o2^lB~rAqXo<m#(45qX)wrM9OnN3
z5b=E3S=T<6jw1P`6HIt*_+Eu7Jd4><$f=+k>MYid-O7q;r`3Yk8R<YdCjkLnQ3K>N
zPU7o+mIOGKqfv8XYfNyC18@QfUV^k(-kv{fe)HrGP&Kb}4fbvD3bTe7Xrcz!kc=TE
zrIL9)NkMB)Y*NWaAx*Nek<?Thz3#V;%1`un$~PN<+?8bu;f>+HsE)x|(^Jn`VDce{
z`asE3c_4<SW#QA}f<hYGy7#&@l*G7iCjS7^7NxpWA-h{(JoiLWX>hf~Gy&w2mHAOY
z_}ke<1t{79ZN4n6bowT;&XJ@40Ht2iX|&+jZ6~=Z=9-3zF?a2Iymm?cP5%H8d~C{2
z+LtoTXQvp)gd4=I7-_#^Lfh1`mfqsra6BrS<3$&_<+nTpW15Y?##TgbWT++QuqZZ4
z9Qy_av~U8o*K25)9Opf@SqjZkNuF6uJvjdWsB%-Ru1`pAG>f;*74|mHe~!T{MmT|y
z<8!+zdI!0nk`L7s-&%4_i&_0j>HQJ`*J>&!CeGTy;ZxHZ$)xn-VRgS{eKj|z;MTN|
zaD0_vr_wSOhLF&FCE~0lLn$SW8`Pc0vjVNChN4Nfmile%09#6!p^cau-gv^Tew`!a
zFL~J0-?}_gc55s2%^o7)WE<UU+rqN^gkXk--Q9o*(U!$%sloXtx+Xb;Pp2QcL&;5P
zfHzO3jsP!W<JnmTv5}L2f5HltjHhp_Qz+a<8{I`)ROzGI2d5v7<q1DQO2G9!NwK)c
z7r5UpO{I~uHtu%O;P*n+KyA9)S>*Dfih62u>PsdEl#y%O4SO$JOe7eL5#dy7^zLu8
zV4lDyf9fsm*$CRfjm1^gYYlXpVQG=w+<Pr25Gx$U{$4Wq4TptSKBu};8*(qgO3CJ$
z=FWBg5@}jo^G&(!ASt_VMWGPdHdIvGXg5FE8Z>vwnV*5kR<soCr;IhA4=1`TY_@pt
zu<IYPnwv^(_CppgmlbJCrm`lD!tU;gY|Lod#(+K&nZe2fsH7_?VQJmA=gChk1AwA4
zU+BBn4H!3B4E9a88Bc3i2LT9b7dCs~We^4ZfJzHM?1XfufTDD#?1h*)(ls;GLGL8;
zQ?71^!8?IY1b9OS5S!{)VE}d)zcx>df~);UI48De0fmi0&MgD7P1&*)uW`;&?sCB=
zC%S2H9n@s^OgH6Y6PW<D(@cWsR}wx_u##}Gf_IN8&3IAA6OMA8_>Gn|4iW+1?w#sk
zK*-8@U;~wmFRC&U`ru(e=-f^eZ(v~e8zI@W8TpZG_Dwa7ZzKg(H9&3wKvc|K{Kz{u
zB)cx=)Z=e-6-KH_A-F+OQq536Ye@&Xx}oXj;nN$R2qeXMK8o0?W}NMfq@RRkK9@Z9
zG995^!9xW*Z5(#_M1sZ)kP*<1O_kJIWj#HKU~{~cXxfIv-K}T{3cC2BZV0-~YW+tI
zIB|5XAAF>g(lSif&!{ntH*i!sr%=TJCDMSfI*(RVR6Men5;(tQT*zx{-W@C7W7_yr
zb8n%Pe#`w+t6wXf9W~wZI8+jiM^S&h&e~5GS6Xg~7y!AuiqTMMOcwS40?G}$VQp57
zzKzq@cyroTzf00#g4Srb_(wrc6fNwf60xKU;a2@2D4C2604I}SoCMh19HrT~B4P*3
zFJY3Tfv%K=7^IQ%V*|=MFGiV}Hz;-4tdK^=GVZ`pI-(HkTq=EcS&k+U9s<N_eOc(Z
zh}>j<U<#Yax(^?-(yHrWiX!Jc3lA#^)V)yH<n*9+=M%tLdc9j&)cuj&fcQmdT{lrI
z;%bLE#N^#-lz^H{v!WGRlwtChSoTLppvS$hEcbmC{*^%uEH)rr7ULLjwZ6!zLv{m0
zr9~ZyXdh*3PYW0=wQ~zd##GI1h01#ph1xs>*AfO2l1Z?-a~Me%2n8Z55^{)!3yu=)
zYcfiXYQ{#~6|B|t6hl}$AggQRg@l&@Wl5}Sf+m|An{XBjUDmZK#}+`>F{im1Q*-(m
zMAG#aR<fS#jo`bm1!608JwsHQ#l@^WuAzrds-63!+~Rp9Xf%Bp%^<m#KSU!2{{WD0
z=v@ayy`1couhZz62nO6H&{O(t7aS`A#kf?e2FV!fH)!L+m8UoecGxLc@nx7vZ()@i
ztnLyLTx=8B6RpM&>;xj1IoCNT*lF0$bF!ESjC|P*Sz6edNpJ(|jhnFfDp?pg00l*@
z>+sUXOP&S3R&S{KraEBeHQ>LCEIhR}y2Vx8U9g-E$u}pUx`}PB^(|d|j)s&tH2(lK
z)LK4?JyfCd-QOi$=o$oVj6O!?Y3XSh6@weXc*RGtZLyjrjTJjbv@HZNv4X%@1SC!o
zw&bC84ONjei;MkHay1qeb&){QOMqDppw}dOOmyb%?1I&5>#N>dPk?)<DQG2*&X|(!
z_fV9Z9Yq4^noUh*SFct}uaFk1Do;u<#xM(aL}-kQWu0I`vXRiY4Y%D+Ic{8NW~o_K
zPp8cz^TAizUWrZ{x?m62vJPtYQ$%(&6Xj>?b-I}zTIsekz$?*$X;H~GnXs*wPNW7X
z%S*mHD$18Y@JV}Hb&9F4n|U#p6XdGuonF1CZJbBKSvDA>S6v(e?*w5|zgCVJHV0$l
zx*CzS^{pGp+Iu6}qDKv-k-(n?PxfUrOHVthi(bgi-sG(|ocLjY2ebz)>~&C6H)ysL
zkXL?X<6y^<wbw>yx7289>f~$r&G=Q75JgP<8zL$vm62LEdx%w#Y1NgoUU?0?UdtxT
z=(3~M*-Pz-n~xVn$x%~SH^~10VeAmGXnu&?O{|$a=3`88j0K!q=*megj+&Se?F9Ux
z{{SN#Zr**z{3gX&>0C`99}AtT!2bYiZS_S$ov?FWh->3>n`WJ@Knge-b0Kq&%6_v{
zeG{;op9+^sHFHdE9exGTZU_lW=(%Q%6t50(ztp1Pr=+JlL)m|XG_=}_quSRN_(Rj^
zdV}T<l0(loNb+w(s5jYUY)LFOw+W6l4hL(?mq|lW2n0Iz<rhyQVvF7~nMy5eR~DX%
z$!TYr!O{>9AtX92JZF2&^L1w%n=F^I>Y_GS45W_~?0?y<kT#xygWSfSvJ$2mNguVW
z8%jys_OZk;mny1?x{yF^JHx(-?9^OG)3md+I>3F>H>PPKeZ`4YEvnYu0BzXL$o)Q|
zwUQ595>c@<x(%C6qo$7HF@!BSjLHCx>eb=X#qJgeI7~FNhPuTR%-*Oq`x^)znEjP>
zvKZb-7FR8jIT$R_YanW&iSEmQ9u{0dOsSHtM}IN;q5lBXW{uWkT;t-(#%g+a+qk(3
z+38|_YzN9tYUp<dR$1w_4v~S+j>qV`Q!X){8W2+J+I$h(Gr89OP^s#5Dyr!TjgAaX
z`Vj>BRP8&Q*5AsKDWYS6XyYYRRm&to{F0K1^VGb6!ai)0n;PiV#i<v@BaNc`WkoG4
zlDm1b0+xcMggVFfSCl@ZBmOAi9xU97I>9>|v=Th1X|x)Ozv7ozA1cdNkT}{l-2D{V
zV{6|SY<6h*K`)~>OJFY3{{SG+Uu${tx;;(^-F8KHeG&B<HDyEhRMcE}2-+<Uk~r?-
zK2tkF>H0HTmanKighv@*D!Pf2RLgmsZ+xv@sY?TJ1_Gv%N=iZ;1>NBY*I;%N1q6Yh
z$CP{!)kPTM;Z?z{xV$y7kO@~b)lQL@HqR-vfp%2tvepA;G@GF*p{;wa@aBb~e63@y
z?1GoqiNO0!kHXxSu+u4~XtqVj@~bL0Z#EVR`lc9M>xmlC@`C>WPHfV9Cuu=AhxP%1
zuP5B^q9QpYh~e(fgn#6rq>k@+aq)FqSy;{1jewAYX@w@c4R5IS-OnfLhM0d44s(<z
z=IUN7#(;ZS6Q;v6<^CzbLqlvn2uWxm)=2s)sa^ase#+jSju9AfCyy#t>JU?V8yO^g
zByz5dqS`Z4Y1Q$a(@BJWi$fJd_R0QK+O15LEhKwdtEuWGfB_q<Q`Lg2qf1eu&_N#k
z&A3$ca5dq~ZLQd$T{T3~12oRt;_7!g2E=xk7kyCD_7%tymLpA2By51?X=!y?j3KQT
z3lmUfZ9#Z0weYTVeL<1132>)5{{TfJ7e)84E8V&GN?sh>9HC#T(z%;h+n&}6N_pJu
zwjxK-Ny^7jCTvXX+g%$=v7`&2iK~?RBd|&ND%)=+)=2DoMXg;kCxn1OSWcwUr)<T{
ze$nu?EUaxie~l&(b=8`EL9uq?dj%;yj**$s;B#djtAngo`$evfmL}boD?dv|33m9}
z>t6X+v{2cD+CJ+>RtFN+ddF9@Xd6Mosi@JYV<t&nOO97pR=%CS#&+zp)9RJezx|`O
z{!-3TZjuUu?6R5hMR5=&%BNDETDo^Y>U>z(qiEeD$lo2ls?InVTXNBK*zG%DXNOn7
z>MHlPTrx-E{#R-g^4YI}+rT&5$XgG@8Y8)~GB8{naxI0E4s!u>0cPGn;4gm!xkAq;
zELxKZ(kr$*WUK+hn<HkPIb^e4lig9xQrW5-Aq^5=C8}C?K1ny0lViwNjGGeKJpT9G
zixGlCfyL~S*Sl;8D9Wa70(gjX5B~smD!G$^G49t4rm?#xicRlyL}YRD6P*Ryc031+
zv>p$_>UPKK7uzDmzbKmMUeMX&H)%KHk^caduk2n-t(qpu1KVOx{{ZTI6`iSLqngB)
zxEw7@gI?h)E+n;x{-N@#HA+@g+Z!Yu(#cvF&PopA9rs4`^=y<CjXQ{m$2s7p%|}w#
zZV`u`;CD@qKWQPP9^j4?B^%Q+bb8K_SlWtqxH|YnnH*1Z_E<iV)O|MwIph}N-d6S}
zwrE4G+mN_tjYXYs$;lAzcJ3EiLR6RA$RsB+cHe|5hHQrN2H4#+f^l?Vo;Lz*{gOi@
zTaNaNA$900{erV_;FUaYE;~siqMa=fZY&R!6q2w$@uj|AgV02g$Q$g9r3WmM2W5a1
zLn>yr4gSg*-sfe_AojRMHne6Snc#!F`>x!_<;6lx%5x)OIVtH0vUa_!Q`1zy96ekF
z5o>!D!IuExD~e{a)=G*J(l-nC%C3~P&LyK4!edy#P1K>d!N1WJ8V%UiGVaO3A~={1
z?b#i!p(M4$Cq^#rR(mlpdxNlWq-|8KH@a3agaVs1Z371>T1IwE-BO@_nJl>KQ%m}t
zbzb~C2^iTNeXS^bQThiaSo-AnvL1I1MbbqSxBVu;Skjn7K#`gHBgI74*;L6r*(4(3
zv9;9IaMQp2me`<L_d@U-4VF?&4lNc;1;W57+Q)z~ge^Tw90ifF$Vwn1e(nlp+xA6R
zAJn<b9IP@27PlW%ju+u9jc_&zfRU4xjY8xOQiojmNMsgV9MfZTOgsQ{WgMd8g#F^!
zvW@2Fn=FxmCTE2ZgokbpH%Dx3u9)U5(qg92>MFS-_PXv0d1Z!wX3IGO8bQHRLmkMm
z%2$mHrbYQS8F9iTkhPd|e(GkmqulbAX8MudHv)VvX~m<WITI@N7ev-rHpNoR`@8^E
zrl(C-;c&u2t&W;Yk5V^&$VFFW8_;zTJ1lczk0Li%j!^WCYa{(CcQ6rf2sT1SNQj3t
zk;>s4NhZK!!X5KV8;EebQ(aOXEZlw2qcDK*&()BJnbAD>@{!WUW3z^Ap>ty`yAQj<
zG-QUfMqPq4{gFSDcH6WAbTeac8E@SgM_9<)wc_^ji!c<hy^c2oA1RD;gSjW_uRU6N
zhV8R%hL(aSyZCo)(NF9T`T%s#0{chRG|1-@d|eeQ9S$DCN0keo8SP?)AnlQCE+XQ}
zS5gZHu-oA?)F5!1`IochU<HT1CjS5s3wcFAA*hJ$dqM4TtD@B-a52dkaPm>m!$UiF
zG5cJD(%5Z!5Yjz@<lg*QG(a3SyY(fODd0ZITw0)flKPo<{2-eR4|NgsKZfCSOmTW`
zw9Fq+g92NZXZKK4RMjxqu5*)ZfuP!&SYFGu;CvNRJYJcyf9GX<R(ovkf`pbyT>fwM
zMm(=z(&&-5zkDe}+%I<B3du-$X+=jMCd6S<iYX0|%_Ex>$fcSmhr=NR9A^pgG&q}Z
zR7JMNKugfvQ#2Y+Q&v;7HmWAb&w#I>*ED+QizE$+<Z)$%jjksJET9AYNWu9*?3}Uv
z8a+-Z+j9hk?c^aDAoRd>fmDXBNR62zfc~Dz#=bX#B)d;yiinTtmK6|3IXl=K55lUf
z>E=&!Of3G^M^aS=*yOXywxXH`o3+3m$=CKxv|;9?)hHfBjB#&*60*FsA6^%*`2l)8
z<9F(7Wd8u_2ujLLBA{AWy*GReBWvtcvkeZT8=dWU#fqF&gJ7;|x?Y-g7gITedElxV
zjV^j=c9%J$%YrGz_BScSnbI}G^?u3FHJ}!iT{CBkk&huwMN&&hk>9#xm!Le2_E^Ue
z+zT9tmDgZojTX4!M@1w=+mDqz?2W)~cHated!o4h&h%n%!4_QVaer&A@P~YFW?1dt
zM8j1hU1M?--It_IBW&#UP&gapcTN*I#NO6QUI_$X_d#f?h|zYQQ;9Aa9Ig%>!j=X$
zN7>vg%#jU&IOTE2$I)2JK+*wYvV@kFR&ohTX^x!{HO>lXWsmuqhj1;y7W<~|{gFsu
z@f#&KjzCY26fdWhr}PyZM#l!nvYnF1(fY8rMnL=A++-&ScVK{isqWhHNf|@Awz(cw
zOwAHG&CT!kLe2+cVxHoArWj0)yBrU~q)`lnZW1=vPL5&?jsEFe*;s6EjxLe8BXdA1
zjU1`$C-WCPT|d-oz6ydyhOxFkRKV_XrNp|BQ=D6n>!kH=J>S_zFyDm2+njQ>42d2?
zxaZ+>UR!H9L_>pqQ-|r`T?!kZfhpm_{{Td!wB)E-Y%B@;r6&CFg$_OJHUt}l&Cb3>
zmu|I)3xPifqHJBp`5$!??BJibC$eVW?3h-FoNZ*+xOWy(Ik~Y3j*kBTr#4QBv_RwG
zG?xUgVF&*JDW2eR6AH<x-qP{B*dyB3I9<H<%Bx_x;Sm{gZM2`dS!^-TW20~-aW8HN
zE1{pWh1BKjaJxaj(M{;AWDI0I$0<$xE-XHOWTzNEy_PD7o=$L}d$zj9;G$n*+*w5#
zW1d?mxLE>y5->co*&|)>O^RuF-~2{f>YVCEUvv`viQzPgi0s)KTss1pSEH4`u%<bo
zm?Fq}ff+Yz^WjL%k_%g9yl{q<jS?F={{Sl_Q5@!*_(&S@W5`Q)G<o|a^><ryc<{Ez
zOp%U>&9saxa-JhI8)zgCVL1q9kpBRSu5(L$z!CIQXtYA5^k4q;1&;ovsEsE4!60z)
z-8Hkw1)M{N%16l88-|vwgG`D>NfA4mQ#ZQywUI8B?qO%CaoXbOV%?_Z#P>{uc6IIa
zO*SUUcK|FxjPrjf(2^Zt;WUe+H{o{dB7_=AZ+j&Y8(G5W$_jBd;zj(YPpAI?N9>KO
z5$p&#gkJVGP`osQc8qvaOHU&XTf%|OAn|2XMniVnD~-XqAt|};kRAv5S)(CCoHKJ|
z{p};%(e+W^&kL-Ss(K%0pVIHLMzm(*?vMkH7Y`gIVeD3iw=8wCre$2M_Q>0X2yq95
zt#BsRDO^Tc2y2-syG@GcUAb@sc2MmATqgqI!>oYGkFX}=1#!Du*!+aY2NQqrxHyAr
zEXT3eBfs4tu^GupyRcn*;?^rEF!4<545mpNNVA31xgD;N#CJAMq)K?v3k=Z$*rt1a
zFNMOcrJwitQd;8T#>yEo2u`G#31gs$b$J{9>qs9csC5QRaqaPyQqT|T82Tb(h9c3n
z?Qrn3iX_u7DXOt&Sl`DfUokv5U$82Xu9h+Yb;6aEBwP}H;Z4I}vexokU6{9J&k(qK
z+5Z3tNGeNnemf#tR|CJ@Wxhfb(5(<U7|HfLXS1-F%0}+K($nyrG;v5thERSlWfNah
z5gSh7;HN^gPHCPE!MO0c28IG2&`-*I6^*r}X4CMbkcW$~hkPL4*_DW3f>DNx_))t{
zYr7HfkZ&KR?IXu@L^W?<&Ck^`W-F?6Q0#__s`<1jT1jXp>K3Xx$RBHsr5g}qfDJ7-
z2&pk1j1T%-+lNMew&gVG;A3j^7t_OR#xkIOolN|Ofpq#2KcfQeIo+-h&!eb~*aU^>
z5@{?hAT)hcPtnI9e`E@&vjl%I!H{irEH9DRD`hr}9Nd9#q8#XvZZ^T~guQwlWNgp1
z#?~P;y7^aA=`Lpglr!|_cLXhCa-y=}pDV1-2*akydo(2cg-8DYnnfF#^aJ%OzfI0y
z5i{wPRW(ITLx~0Uza?m!O9QOf*y-f#J1DBOY1rRZvEnxW04z=9uI88ik22XwM^4w9
z%HrYjw7PvO1U{wO#tuossw@m}^kd_Ol8KAeb)7r+ZQ;Fw*Ifpzv1=lfmq6RJ49NU`
z%D%d)EBZ`+;oO8SrBgfY8)R@`@qnO)&K7Nt*My(QbcULrP1lKl{G)XJPOeA#YzGRu
za2orNPrwM8Q7oXx8+|7Cw<Sy9i*`3Ak!3!$ELVyj;z_}`2_n?%vACBw_HShrQB%S!
z>^S)3sozl@G-qQ*^MC@+#mCq_SqUz;UjuhOK^Xp(6FQeynfqdCYk#Pvf}BnN08v(U
zj==U(Ni0oa5X2ha>O7QJjg59^k=X@CwW|Z^#Nu9moSYA$hjnAd`RW|!o^yonS}}K6
z+sR87`lnb}F%^mnq#jS$IivOOB+f4b_CQrKHpm*rZ6DmL+SdqT4Pd)~=d!A7ZhQ9;
zz30D$PB)}2`wG+P+87-v0i(6il@mqj?20=9-Brs~6(F>Z^<?bOnGvb0b7Ym?jAO7x
zFGw7fh3_}p9trTcJjUP&yNWJ1LdZ*4z(4LKR#erqacm=VyS)aIGLV1fg9Y7f-#w5u
zRquVn1Dt&J3Mk=pzWJYz7v(FT6GfUh?6cX3*y-Fca0)hv$kI08_dU>UsNC?z+w7z@
zER1aq&%$0wbUzPlvok{%F7+h(@P??b47sp;oq$k4$IJR#V0kF0C`+A?1An^GlV~x4
zS3H%KPr0}qh4@_#l`TuJAs}}u`Lyh1tk9ot+rmgH*={yg4K5b2HJ}sn62qd#GI5n`
z#^3;+&`&9@_HGCQJvJs0W&%{=4V(Zz07crtF~;ZqP-7%T>DxETX<;VnUxb3hSpmp{
zES<Lr_OVTMugb#N8Nnbf+UsK~LA5Q#kfRX>A1X$+#V!&!_7+&wbB~0FgoGt`D45}7
zq1}^gPyQ2{%-I0+aU+iDES<L8*(eK9tY8VvZ~p)(*2WUs84FRYbYmC^)*Pm`=Kv{M
z$6JddOxB1V;<%D~DU4U_xI%jcs1^=I)R8m;oSzBqjI?AZjDe0oHW=4!3OOEm<v=Q<
zwn$8UOlSF#U_{&b%4wOSz0i}?3mvEzODvAt7$qxVZ6eNEwvGr03Yw=n;kR*9(&@8H
z?wQsFS;0dLZ2&M6<b)lF<@9G_qN}KQByDL{^g29DJEixZm1ZLi7qA29n)%rnxo|@0
zU9xCd974=!Z`n)hvN7%<QP*nl!qRt(te&&g@Wfo!$XxFY%10y~Ci1IPiZ+wHe(Nu-
z^<)(H{w@9iSSsCjQ`8<=4(2eQ3Dg=TO;f|AE+qL%+@$nvAe~34t7}|YP8`;r2}4oo
zm37Y&O6NM~y3^^MH5_(xm<_%bhLVCPTV}8(jx@VBCd}5E(}A{gn{)E6>2#>$10P_m
z<6synOEe4so34%71wAtuFwt<GE6iZoPR#IA*-qIVoUHb1qM`Fh^NZW)r>CW;kb`2b
z>FDBNzR(oYNXXe>0I=mR6oYnGMG24f9H~V^8Oa3!sOnM14cq_=9j*0bFm7Z=d;A2h
zX$Fn8Zm|?BCwL!qjMw_gINa#rc#-}am6NN~H9b}PL30>;1a6blvPj_R8conjQ~r%<
z0y?Wy)+VtoYYE^hy(6W!5a|Zv^0Zn;jT`_H(68WytQcx|!9-oMvrN!og`n&M?5!I}
z*xP0Sg*b5?lCi}XvrrWA%e01J3fLqLyPQ?g7f2!aT80Ov4gd=xnjCPYjsa_&CpfY(
z$XHRV8%9$lsBB{Q2n|P5iUymw3w*3cQT23jUN~MJ<Jc6gNd}E}r>;W-33I^vtlPE6
z*H5wwxxPmW2_(9nt5J8C29v<yZhBWtFv8u<vF=jwat+aSNv6X1gq0*`;RC2aLfO4I
zn$z;FD<XM|YaMfL%D$6Ikj=hF8+f`Ai%e$GB@GNV1TYn49XlE@&=i#P?TLY*O5z*N
zEURS5!z?foIFa>G&0P}?+l4hT_08Lq9FWLiF8irrjn67}(;M82DOwuAV2zmQ<6{87
zE2WjK9N9rtP}tf@a9K{G>Nu%EZ>ZAlz;{V0BxJ0+)ir1-V{voZ0Qp{X)V)^vi5&$i
zzAg|o)fM`@r`$wj@D$p2PCPgn2i&De%dody721BAJ$%9PmpGp*chmX|P&6H){!{dQ
zG(<yK+kCApG+vtmwQ)r0whAHi$ZJ9%e+{M1Hd4OL1cV&ktl)<6!bc(KtJbw~3kzCv
z+RHf)=j*D2-FC-&{Z^gY43bDBk-M|u9?CeW;{#y*lCAa{Xsn_Pg`uK5yUI0`CVz9B
z8~0Gv5)I=SKsKtU*A3ikcmYvCAzaIk%9ur?H$l|8Xxd$J<KQFdAehDKO5z2$@}rVg
z5?EVd<v#?rPm?qAR?REzBTHL!TpD|3U@dEN$+DiPQH$7u^prJCjo=q!uvAiA3C7*B
zF{QDNH?@~bNk-cM*15>q%D9YYZHcn1VR0qaBf?2Uc*wA!rHVNB3j@j*RE_T!54Dd0
z2>OY{yIXyu!b*y#wWrugw{Vkb4W?CU5(wI%(I%c*NQU+)YF_D`XR!YO!ZS*gK-)&p
z&$2N_lV!tcs%#wh4iwQ;%?S39aDkShc>vobl2b@-cN?DR+MzDP>TBv80KfM@Ph9-8
z+@FArWG|k<w#uGOEwD3uwh3(@ZJ8}Wm31yAHW1^&pH9;zjlQKrjr<j(rj~)3Bm^aW
zR1!S0Hv$eYnpHuHXsxMq4tB!eeiZtA3}?6tCdCaq4(ki2x<cc%fCWA=AC$U9ycH4H
zGQl>svMOd5Il}({1qTf+L!-XnE~_f^simm9rzYo%td;79y7nzbuQaYDqz0<_^@!qk
zz2Kh8#(tlubasvQ9&D>(=_w4}q_UR}lz7)ba($M%J$q^xE(=kUx*?L_K5na^(`Tn5
zC|c+J0y=Fft<Vqpc?tR{Nypn6H(Cm%o|6rEXWXaHCY_(qspxuhR;#HXME17$#|rAF
zp{oTh=lYknQBsQbXD0mu$6cmIGWH*fsHCc<o<JaIA4Nf1)8?M4&o05u)vYh5NXEZl
zxKC^BN^H8Or=D1j)>%_)6jDVms^eqf7CNiZ9-MJ!j4Jxd>Wb&?m83Vd(kIF2c_kD&
zf@z;<?_uR=H2pr3MsA)#yXvv?>TuFDw49DC6jc34*+$X0p20r|p%mY<QLn*46i3sM
zw+kcbGNNM8;bgkB^_6V)M&_{jLTS|1yYSPwO~t2Wd0L{yx@{~iGD~ZKgp#fT{{Tju
zWf4=RY7>h+_612pqKE)@F7mWoo7gENHI&UUi6ssB%C^vArIKJaiy&r#TiVxZH%+2*
zm<tIXOeS(*NY=+qr^O!U$kC1#cU;zJX@l7i4j>@)Dq7|=mc91zbh<W%>X!$}_qrQ>
zvvtxl-|F>JOiXm{4JVsjUFlU-?`SS)X#W5T%Tdx<M+tLU(Ba_&q|`7@TQLA%Dv+ck
z?e-HrML@RlPtgrEYom|dF46T`ZQ5LsZ3J#1Wp(;GcW!W!!?3#2chIR(1X`pIlVh&*
zaHXZGZstY;rqbvyCg2O2ubWjBBzABB{G@WB_}d_dMgBJ6LtAxoOG`@&cD_d4XDe&!
zsvT-~>>f}OQdKzblTmg20)%Jw7Z0OfP|8-4?ad)k*H_cE-keNvKO6;H1sz+TV^Zh0
z<;r@9CV`lXbCb0h3vynF<)(d0u4HpZ)fY>qfZR-5k1Bl*l3JG!Tx}i|#de(>RQ}fx
zZP_w~ss|>WnO#Z)8L+AKJ}#uvC|F!1pJ^TLpso#qV&^r+-g~OL{-Q9qZp;iM{tH7l
z&$D!Y(IJoAW8H2QRb2FbxA0_c(6LR`8&K=*wfn1$I%+a6GlBS7%|61RB=pPH>aoLM
z1D-ww!kRkxCpXwyPr{CaQqw7#0H-fM4Z3x1u}wQR#Y?pLvXkT5D4e<@tOU3QINQKO
z!ACovfpC1GYV~stTTV)^9ZyyyvtTSAR2--22aJBrEL3f4uOpGIexAW+7Tsne)T^s3
z01dyArf!Q_Q)jwh57kXMUeL}luFJV0rJVZ!Af~@bVf`&O_)zIu7NWv7Nx$!fs-mQx
z2nVkbzm-PaY(%%Bj+%f)`kRi|3inGiw+(m!R_gWC>>F-cRZKN9NbhWf1qSz`)uYgl
z<XH(J&HE~SLcS2v){v@cgWfXdJMNiRMJ#}ZlG~(q%$4>DT_h68?{)s^uuDY{7KnXR
zM?k1^_kLj8!XcVN_W)dzqLo2VRYdb)W`n{wTW7YRpq~W^2TvJA_Ygi4YV<e8+X<yV
zbZU)lkk$!|mi5|4)htoQ8++%<7yU8pf4WxyjEa$>J9@4s<rI?@+8~xku=`xQ^A&Cw
zc0K}<N-|CfMp06Rix6G(Rg6(LW`9)$>?T9Fk&E)Y<6o(5A-2$59q!xQ73uv|MKtVm
zbU?OtkVne%9;k)WREcL`Y>|sd+gjt#)q5Bp{AZt;e$1^54rrb%hhe0Dg>j@7#@o5L
zaLxRxewt_+o8pk(K3Y7U%Sm5O%2zPo*&wyN6?o}cI{>b6WS55k{>rKJ^KOz@tXMAM
zJFOiapCh0%?cM0SJ<amY9s4VNZ$|$BL#=IG5wc22q7txP;E(1X-DekK@-muxgwV$J
z^KKQBT=NFrTWi^MJv1@Y32Ck(d#)N!={^xsutOkitkaS3ici=%74N3Icd?|jb8bS6
z#=?E}aPo?rRkBbiatOtR?0%jUl#~^+=AtGE4|WcI%TcVYeKR9C0{w_L1q)MQnP9*D
zz%3k<o|Aphv}ZRqO>F_1Cq6jAXc%)yvfKe^$+9YAKdnqlByTM}*26%q4va?gWE9j8
z8^<#vFYrI|62k-(!px4NdEkL|g)F#jSxk8;npYe4=faM{{3H5vLf17$G($lk-EF2r
zw&``9F0)9i{H=T<DT{XogM2PIW0ZSGN}OLsaR7O`>;O`{sGMFf8h*(KqogEvQG!Xj
zM-mQ35frn>5xkIxAl`$-=%;jN+{_{$R}06ySfd+VLgoM<7x@aZztNHRWOfRF%h3IM
zBQK1Tu-ttUNp-j>^zp^vPk6w&YHOf01|0L-_Da`DZs8IHWZV#(S$=Su#b^`<5tj?4
z4s$=45T<kh<P^_9lb#VU_~i}&n`KDS+uU-S983o}M6f~y?T;y22*C4u0+{z3+>}F$
z2kA-ZZ^#^?n5~1g&IbIc*;HGNg8o-JmO$HE?wjd69uWt!S698b4F~Lpb!4RYx*?Gs
z?Mi6NkHQp!tYsZUm$?^KEsV~=c=GRrEL4T394jgr9S%skM+7$~?3RN;bKSkp+7++*
zEKx^uJ8$18IdxZhds@qQSuJ*5W};*0RK1PtE~4C?kw~c3v})&$IE{piHt<sgj|S^2
zq(@xW56sj#=Ka>15(5TqRU>t=C0>S3EO0ILP%(~?_G@mZnb;=RMCgDS9P%-HAvy7l
zfh%ARqIf@~rWlKGO_rKhN3{D!6;P&*c?m86sNwP+M@<hn(kooU+V)N33eJ5o%wd11
zEURAN!b0k@Vvo|0*aPJ^c;e|DbW9<!#xAF(jlldU;SC4ee#q82jc+RnA<l)QUpGNK
zJ{fm3si&y6E`)rA=I6T2S(TvbYWRzG$lH}Hj-h)=8&zW=ZHY}W?R~+zgy3Hsg5`>r
zmN){0k-@hh;G}y_;n_o090#@7QEH2+CNgcZ3lb1h!L{Db>9PsK@p0izNgTWPI>dKH
z8G^Z=Tc$@5bho*}GO8Ef0>MG=VX+9<)L7B(F#&6j31+2@?ZZGkp_m`AIgYo&;ZrGf
zoK2FMBZVZ5CCw)u3VUa&jn^QXc~6b<fJ+E?J&NbmNC6T=Lfc>?mr`_=5=K7Z4=Y(D
zfU%*!MA_v8leWlvOy}M*cts!tNf~Q!;7XQ<VR>Y&4#o-%?WnfW9e&2hcDkxJ?#c3;
z+AV5mBY8VQ1Vs2I+Sj?ha*Cy`H`?KnlC+1N!M5y{{R-pkmN}*j8(q5IQy)?u;wE7S
zu?whLUVEgiiTkkBw38a!K}T=p?+e;ZxIxbOWA?q4B?T=+&^Q5PO+8?gT1K0Z$w!Z{
z*&HqslkGT3ByBGCjytL2k7y;XA4JDU*xm05quGHagx_!(Ty8OBb7YD9TFLT783S*0
zY{`}3#k}218@D&y+l4WQZ-P7~25xZ43lA1EU}y!TgW+&{h#=%ET52}b#xM_TD5ugV
zV~eA8$AXs7Wh7Enfq!VS20-ozy0WT@NaS~^8Rp1&8qJ~2KSfBiN=%ZHX(MPYu><)^
zyP&PpCU9*;E`|R9)(#eaoLusWW1GXq;qslbX&SicBqTnHaVrmQQ1vflX46Jm?>1Ca
zl~pv-2UE^j@z|@DYcWj-Wo#{V`6^5)2GKSN8M(6DkCoMQVxhS#f7GF&8f>KgUPr>>
zxsg;uFtfzXzax~%SiiC>s<e{Fdsq*`7D^Z%3tYg%<b|k`H@d}=S=QmpjB%K@&jUgJ
zq1|NKHQ#15(8~kv*WIg~DR>Mn$XciA@I8gmxU~2@Dv9)FmzNhgj_g52%k0bgD+?+%
zdtBs=^(|*)cqpf`dTWB<_Wct*cF5Cq*o1}SCc7YLEhG{2Qb(|o9dM(3jcK?@*&2KV
z99hu}kzqzQ+Tp|NbkTM?>^VshYlXLtcutZhfsFkUjQ;?k?XHo7-(oz3M0$j7!8!R=
zq&Qp=f2u~t906($C;>GuY?6Cy2Xzk6E<#3v&PCT;a6&0i-3|aA!s=GAo*bgNxUue@
z96$txhKRoKY~Z1Dl)kNv$xL~T;`km>GkYMC<P*w(g4Y9keH4>M23Sz9GY4V2zUq<D
z&y|M>WCM`z{-Bh-rML99yZa#{oD*pSn0{2?+yV{4c5^Kck-&gQJ=0j$y7wR^$l^Kv
z>R8#mppF#Tbo3}`0|5C-GA!ZyDFiQIyIhc)VePV8Dw)B)5AK%P;9WJ&a6Z%aP4$iL
zTl*ofwnzgkZY+=ikPX6LQLY`6U2X;zObFuJauiO!?l6j^8=P82{;El-NAi*rXbcUm
zb9onB2t1o5mMIu<bMT;ZuIo4uQ=}u65*uR2x?{Oc0i<7YYqOi(sf284JC4#p_$iV{
z?Y)zn(hd_uj$!7@31edRi#ZU+G1eg8;X>!J#_nMHgyvfJWS9EkX(5n6VdB?MYXCTP
zkIIRYIiLaw@}%_}CIHHlDwzDVBrd-q>w}9xDIF#7>?~0Xc=nPof^j>nManKw?YKWg
z6P!bZhEZDt*z(yx+{X}|4Q#ACUzIF!9fNahoYqAs$M#g>jyEQUx>y|3BMED~c2F1Y
zJ(SO)yDuAoLpnD`>o^`zsw*9#=K}<TWYA6Sa+3EPu5E*_&CwZH@J+5To*wq_Zjcte
zI7VDOxwk4Tyd<bX?c9O(2|M>nSVwFmI2J&tn70Kn{C!i1&A~|TBql;jWJC^mO*!(O
z?~dv+Y@HF1gxMh=@VVUFrahqKauK8_M6k^)F5Mi3u13YF$PK57uLrwLl~v>)DMQB@
z2!X${{k0U+iwA&DXC#`1j%ho8WlkRxt;PPTSmvG}1XDPU;{2?UHbGFp*OrdTFb%w^
zWOJV;=Z|-F!LDh!2jNomDHBJLWR|tEr}n#*&0|UOm9mIn+Tp<Q%I&;n>R&;w9@QC*
z?d1y!I@WeY@npLj&5A(d!BRHP93aPA7+QG+FV!yu4ieofLm@74V!6&Y>{7Pf*B0XK
zb<&N-##yA{!|u3?cU)U=m`#m}!RVGbq;0U*50vLR83sXVPy^uDCv7el0byA8!a%%k
z2k21m-rP80NCTUe;PRUKgKIxOP^gGb&@hy>*5o58q-Yt({2*o6=UuHJeNix<U<ZX-
zv~$WqZY>}bgfxM0hsk%f#W{|U9ONxRsS|A$xVTYGF=I~`Qi(1x%7UWBt0X#BMeDtn
zAmk@UUn_I^ugV<Z*1i%E#t{q0VW(1zi#esGPaSl2wZZ$UqQH3pFvrORtkhVJ4H^jR
zqa*cR-cfN>(n(<O(0ut>OUT=MuAJGP4ew%=<6ed0&3S^JLN-VTkfw%?KzA|b!~W%x
zhPFmG4k+qvW}+uy#|WhQ7EyhgZS@iUrk4b)sQ`_@wEUncdX6^$*_zXSO_9;n>GePR
zfu#9FPA}*wv#{`TreuN5<b6;Mr;Wn!$`8<}TxE#cn=B<ZS{F1r__A;Co!ASi_SF(B
zMp8O(>;q!6HBn&bSmTRWraqaDwcB(btne>zRNtGhv#?T8MJ6evhS+V2Ps+3Z0J4>}
z4R>_DtAD8*prhFiu|=oFwvmEKt(RR>)oSw8yt+pc<MVY@B(9cEMv;a2%g+kJ8c1nk
z^(S`smEE_ta%pH|CwrbYw{o6&+}MbXrOy7rLdh8CUc~rlN5erqO9SPzBeolRCaXe}
zO>DEwOs^%r1^`x2eqK1qBoI5IDyd+MWbd~Dyehh;I%n+zU_FqkS{m=MeRj<**qDB$
zPWL*RB1h`~04XV=Wh7gl`nwM33aP4VB=q5oliJCDq-XX&^NkKJnd5hl2#OgUGsBw4
zINumTN2AA1MAg$0>)&T39r@=&7;F&;Bl3SyP01y&Q(@9I*fTs24eS${2zxzAow709
z_d!yJ)XC~RmkZ+jBdQwK;okB%@DX}eZrBvi{$cxK8zKiTaZ<8+dPZzxy;prZp{koy
z;rjNl{Gd#%h1L$-d#S}R*nHBuLR|j*G$>rzp28b=$9oK^XdfJzc7MW>x}qiv2LgKr
zr)rG0K}SUso(zWP_bB(%#=tg#@D&`@^2KwA$M;J~T~jgJ7V92eZd0j8p<G>tS48*W
z@@;SQf~(&5GuaemG-Bi{`Z_7<01buCaqi_~2Tl*yJNG;KM*&Vzeu_nXn2D;T{V}!9
zJ%CTAps%SQ$#yfq?zhoskVlrVT@x0T#^%UzY@&)rCJiP)z|nSubtaJvX6|nD<gHoL
z#{dNQ^yY(dGJ=5iib$XgXaTk!5}4g<E5k(J7)WUt2LWy&<WaUK4$HkFdn>U_*J8u&
zrDZH&TFWRKkwVyAY=V)^cs6TtuZ=u+vQ|>Zn>B7A<WTxj5s*}FjzPm#m{Ub=6Adc~
z;T{OwnVIyYCm`84LnC_?re!Q+uw439TZA|u@-se^oxx0WG84foNNHG3KuRfM9fCYi
zIT^-M%Ig9OowPC$!CDr>8%6+5*xvze2sX^|p?$Is*>iOH4`Q$E-P|b{8*UJ38p;8t
zzqrbH)4r<Z@-u)kxO|0@M%hf=IF7`r2A)S{YzXk2ZEq;jHp*vEC1nn50=C(H0#MM@
zXvJ%2E!ZXh08a$uD;uR}JRzen5kl7FfS%e$_7+AFeo{H@V9L~F4f#gjizPIz0^}xC
z>M+B5IlsEj>pf8n0RI3Gd?l3Bdkq$Po9W<;xSWNJ)%8uUA*RR*-Dba1l!|DaT7Q_}
zDJVL2rm8^tx0heAQsm!8x*?>knxWp(=V!9KqNJ#h11Gl}U0G?GJv}1@qZj%sCc=J!
zYZl7bXdK`@P7&}@M;OCJ(E+Vs$xu&O6kz*+L9-Lttr@a{YRKZfh$UyWuAzdM9n!QB
z^06AXSIaBh+F)FKsXT~oC!uOO>@fp(fB^Eby3bj{&CG?~qn1tQQPf{|xx^m8;ah24
zH2Fw$jkn4PN<g%Vn$1g7)g`blV^3hLbbg(dX9q|LCz4jXOzHR_BJBt4v=r3QLeaIL
zDkw%KZMINpy*(5F7c^a7(NaSZ8(1t9_RknkZTuqHlA+`Vw+b<oT{IrA%AQJA#@o1y
zq0zel+u=LYaqNnUEys%mIrQRgY>lqL{(z%_;lUFY*xPbY722FI-0l`1D<iM<oDc^w
zkKXSMH%Tms44`bQwP>l@ZtyMgv6}Z;#ThJ)Pf^|i##d^Zo~<cpE@Wib0IW1lo0eAx
zO44u5(j_UGwGdjZM^x2i+SfU(CxEOpj+%UgI!2S`>t&>L<05D!fPIzyH5_m@!Jt`D
zK|~Hsne8X1B8tSf_X_eF2;&wF0U8KsvhCZEuu&6XXtjbNk&9o1+z#oFmd7r_R)#~Q
z1A&y*fHG4(W)J33nuvk9cv&h4P;j-^dd+T7QdUIP{=0lCU0+*<nkP8O1-@2oBP3td
z>THRo?%`#1{;j8_jljq+;1!P5x|*iCLk$pdCl>)%!=Y+5kM$;wLw-pKKWTJrAvJ!Z
ztkk3}iN%a37UZdP4IWyDhsx6I@>Sl8(yk6`pBL8)ZKdeKCXKQG0A$Ju3gp-?PjvJf
z0WA&gF0W>xj-D_YjH1)(je{6Mo~KB!kY8y4BeZK)QpIBHcv64>2FQ=eO$EV>-@X(t
zYnna6%UF9GxPHl!M%hKLbKyf*C#KRutQwr{lF<*j3!64cbre?|SN)42q57{9NbuHp
z3f`J1DPs*_1di%}YVt6D5yj3?yITO<lrh4$CK<_kG&4#$z*RbysTDg3bAY#%Q(4q-
zvNLyOV|D7<jYRE<&I~89Rdc-|IO}0ON7ZkY&We%6&N#tY%1t`9zNAYjbFNjUi=as7
zhsX)K-06B_A&d=xSyC|j6|%QL(nK+|IhnWYwN#p9E?_3#M9~Oqa4b^CQ0NFZ7Vw(r
z-Goa-*c*0*QK@P%(*t*8Bd6A2a4jwuRF$+WuakD{eNxMP1!xHCl1}}s4mLf4Dw|e(
zL=zb&#gP<ROmH*+%lxYbP(%je#^D&l><&-SH5RD(nlBj%wbBO+kS<hjEsdlw3@U9}
zvGJQ(&p!%^DG21tC$=FOwo0vJXY(7)tc262s;ZZ3j?s0bhe|$<_Z~&^sTeo1PE;|n
zJjJv+>b|{<0NvNW_D-yPjd6-2ay%jF+TLe*`XJuIm$p(@wn)iyZ)E*87u3C^7g=3Z
zLkz9604XRm`nNmye%5>hvQ33FOv(nZZgKt8a?MW-+k$*q8tO@-ZRLH!uc>1R_K&Gr
z*b6N>3Tb2YCE5xXRy2bQYfY7HWn_>-TNo;o>JkT+OyYhKX|@|kn^vd{{z12!*#}Ef
z*<buIo)k6J@2DFDL;>2$4L#Dr^CP2kT0DiQ-1J_)D%Z#SCV}!wN-7%A>%Kv5>C|=4
zmA2cr=E_QniMHA>N%FLy7|6WRq-`+wWyo%ztCpZ`4lN%DO+KLi0Pi~1QdiZ|248i`
zoiAasuAY^R8>D$Zbm$u!rn7%Y?wo3=T;0Lo{Ss5pPT4R<Q^sr9t}oC_{{Sw*$K0tY
ziyitvx~<fwrUP@H1(jIWOinGQW8Iv5t!cdmnp-w+e4;SW;1o3Qkw2>}xB9G;^*vgk
zjgk6cJ_hP_QhINx*bmA{C)yoJbZPZXd6docqO;w`5L6YF)iZ$WF_-L8(saNv`lfx(
z<dTc0pfqF_xD}$)1eB5K9UrAoh?^}<oZ>FE%%{^`W->M(uwGZD>js^HvP)s&>UnzE
zlqT)FzE_W*4plqs=!1(?dc;&Takq0JW&Q%K)`;|6*2R1;J9pyUEHV4zB}Y&AuSr_-
z7>Ks~TrO$HB$u((BCo5WEva*#9f#3l>MIy-&DSMsI+s^wsS}G>Z`ow%sUb2s&tbj$
zuT#O3QK=HjucN5p5<380SVu)razNM=)bT{i7Jw7#>!gYzECBgku6NNMFW4i-lNbL0
zl|siKkgRmZbopR=B49S`6;H26S76`^{)m|1f(DmH6!^}{TxgqHmXmJEc75!GqI)B7
zxffNst!-?wdUUkoo>UYxnyY1O(}G7SvAKWQ3nZ&XwY1XJw{s5FRjENW9LDtm-V>^|
z>8RlmwkO`!xCkveinmy({KU>JVg6F8;-B#*q}G_f>eSH2eOD5E0H@OR!1r1TcU!R|
zl)9dc4KM}Z3@)LqrKN+@XlWz&Ql)gtUbI+LYHxclBLi*aS3jxQNOrV-!40TBqPY7m
z8}Oi|(6^n_JNH6LDF!LMgw$*ER<_KE&cA?ybv1E2{TBwD+^t5E$_gmMcD3Gaj;XDn
zk~>+gw`El0$3jUo{{Ui-Mr+!@C21G#lU=2S(C&1Ee1v4R5HtO<3Z>Sb>V_8jmKIZS
zzJnQ8qJ0}sqKJAW+nfqMv9z^pCfimjC&5QCEZpPYx;hPJc^$EkI1i^ORwnx$%8Lnf
zxXJz;?rI&B4QuTruXy^R=&Lun&w=;vaIBpaPLFpAs}xcu=dgMj8#nkN#ZM%4Pz%Ws
zvI1Rq{WeXEZu{X*-F#It^OiJtNyROU+j<F#wXNU~eu-t(oNmI><xy3tQ(TzxhJ#gW
zU2xl!IioCXlIoShTnIn11`R%vqcbtKzZOS3QIcP4Y43jaM9}F|RGsf}iK|%ZIw~g8
z=$dv$z}x&HsQPxAOGxJdZ<TWG7M-X4^5=a~6#5+RZTI_oWin_EFYKt5^ppc*Y~-;|
z6+qpvH|&bkbgFuLxUf0?Z*^ZBjBT1*Ww+S2x+Z-rGn*4-1lmO`Z7$z(a*Si(Ey4GE
zCYVgG!8R&#Y;=)W+C2XN3FWHaN{Xq0pu9MFDC%t(Nf<53`lzcYs_B7qTP25pkw|VO
z{*>t$2Gg|sm1#TWe0yY(gnSi%Wldm^HLsDsP_1d|UL*cAgrBOGNj6dmBEqLk)8>BZ
zTnRx>rqf3yp*Q~klm%r}&p*Ixon%&!>XPr{Fy!LuH7hFIXui^EBe30sZA}F`+y3^|
z1a@Q|;sN@qy+W;k*i;aF0-8>cu^n4Z*opM20MkG$zlr)4)Fv-bHdzjPplRleOTEOn
zU%Ievt4kAcN*sQPQeCl~^jo!!5Z*ak`=Q;aLj$(dmf2OES+Zl$djUaJRB6m5^ZjyG
zd|0W-)>EAxzB@I;arjVGXbpHKnqU@Io2j%|<n*Eae+vHqPu1h7VA|pVPparCk(~=v
zVfMX`9}3Gz)9UHo4A5UWMp0D&+&=0_wP!_!w)gl=6qi7j&o%r^s+OLrGZ`^TWUwK5
zmr_jqQ&D6M4iygo6Yx1+mDcsFsMn*8rZDKYll_(=rjznrNk>(OMJC}JhXs2cI=Cau
z&gx90p`>*+W7t967B6nymE()6A0MdT=QX=W{{VhcKWz1-!G*1j)_=++v~t5EXKOA)
zw+8$!mE9wrT1A~CtfAFQ0|bpM0qj4_$7B9V2uZ0&6-Jt6H574^=v>^ecKcfj%1t|U
zdt`YxY&%-ud2cpO(`jB@>7$MEiyT_U$++IxJED%2zLW=h8qo2L*azd`CaVQ>bG7lr
zC4uY?jojNDE2`LIeF@zQfDRzB=WCi2I#mpkS(MPeINC1LA;<2GUW3UYG<_dYl8v)%
zaCjWG!vp5(#kCO7$NvCRD<_+P$k<80&9H{3qkALYS6MukzqT1RxAsNQHG-YLla1Er
z&VGJYro>O|g_G*<H(`#JCuiLSjgOw{QA)!1OHg8w{rxs=y5`f?2^}M$d%<XHx4V!y
zL`6?mBYmN<v=T`fDvBu+l%)DA>SA*v^{J^^(9`a4<RJ`_RIrH4h$iO!)uUmFh2Es*
zO~cL<G@=*{;()LZIsKDR$-iZLj<-(cn6(PH^Xx2;jiGf_cB4_M3Y|v2TDdj`Z<O5F
za1nLdo8J52v<@w0T>AQV0$U#Q+#&Hrt(8)APWtHEa9Q5mq9L9)kPU$$RhEf?f9c^x
z`J%><M;OBApNj@Oe3p$HVTI=VoBO6Z2DIYEW$GuYh3#}Q9i(3TtBoq6X`*qJ+s(0s
z$oxqznb992HL$a^A1U6Lb8%$YeK#9Q*EJaxJu}AU)DiGP=bR-D(OAh#qPAe>I_a!)
zor85~X<=_K+&)qPPRk4==8AD(4QUxpx#rnMxKq0fBos8USm50rXcWYX`@d2)KTX2K
z3;93>KMS`=G65;O71(r;#&Xi16mbFW3cfjI2ZU5ok}`p;Gh`eD<}?G&J1A+QnxatH
zqj4t~7+S3-qjg%w3othRLP=zdJ7Xn%8S-x1U+kf9Xg9wLa__@!V`kwbXW>+8ogJ)E
zw3kD?4+$20Z`gP;f-@bmY?L?y${wbkq6h7CPHFLE)|cAFq$*l_7TOF4cXZ%GU6W;3
zEkoE%lwX>8IdZ`-n<EAeLTmjO<TPLCsT)#neaNax(Ynq-tr=(`(KxtlY4}7%9YY7b
zhTc-cTE>t-7x_fHR4#3dZ6QmY4^|5+jjhMkT4_;ih<vKHzDmk~)<^B+tqnUi#0SET
zd8(s9J0YtfkU7gZWpgAi4kG1TYm>G({XN-P^5X3Lt>Z&YhI<YC%+4E2&62}RWjR7M
z;AIt0S?SvU0J`jr5|z=@P(8WaR0WP<&t!A!!-ck>=5cYjMYIIi!h5C}dFJWP4kHRT
zH{#1Ngf4OUO>OVaQ<~Cnq}gGRfEf4>$|GYAM<_h*y_Bqx?LP}p9ij3@cH6qGtf!sE
z@wkAk1fYzC8|AS!93+$zL&9x#R#P$LT3p!}!q#?4yh!rKw$AXPbtQ0p#6|7r3Jp=v
zq=wZ_(Cc<X`q4e%uG@7uxI1QywETq?Wi)PJd~UOXT@7Txp3*xYB;42W-ANR(?6GzH
zrv`~-1CJ{$1+r=<0m;vVWbJF1E(TD|(;smoUVPytVW@-wYmX&nCA%T2fD`TIMH?lI
z?r$T6Emcg6X*MI_K}%fc+!AhzPKLYe&{I_xkK@EXs#6^_r`pgD(N)1LhB5)Y`xHYS
z_K;i;)hoY7R81u<KH*{-dnI)#X8=4Q-thCgAdcyg)XE)Zy5qvhFw$Z0z6ih%ZqxKc
z#%W~af~%#jjqwIa75<1hVHq&U=3lTVG|fqcYLrmC-Y_{qwwy){z#%hrLk80(;qs@A
zvdBHy3D%GWY(c{p;|Ln&I0lOnts4XK=Dd7m4LN%V+|b}WtrxKRDq?$>Y(YiS)mhd#
zzm#LCp_(1cZr6B1x{cx1*l?ZG5;liEW=P;S0Fbz_9^pV?+UxDPNL)t;_e(`n3#F@;
z6S_BBJS!;rhSqINB>8hy3m<dkInMxGj_YwVEVUY{3Wk@)>l4T!Q%?&djO`%bg*l2T
zbN>J-=7GhawbvgDEekD`7IPhI+Q^DQDU$6s_$bk*NNz86EhRssPWG0SM>I;A7<(LT
zEIWQe=ffMDx+w|xDEB}Ot}vjih0!+b7Z+2qvDgF4<0or~aPAYSwMzPVHwiZn=_*FO
zq*#ooUceuVBNDDQUQ=}?H0=zliP5{r$X2whj;WWWtZRp6lVyzzC$g5E(nNPg^3&TX
zswCx$=+f59SEso8w9b16agdS?Mvk$TyIAhyy04_yYU6I%h>^D8!s^nBT{5_BbPQw9
z^x+*<9Pb>H1Ffcw*DNF9XSGUqhLIUJ9v0SJ3PLXf$#09Q>b*JC<M_<_n<@0lD={J(
zy_XN&=IexyW**WOo^37~kPJ^OBkYBrORaztG(uSa0J?Q+V%jO2G3;&;Fjc*s$WhNt
z43GBiiNml_KAxr~U<n)j(YVX8)Z~js&e>aX8+5|b546~LRgIJf0b;}8ghX{mhXfox
zipMwDP~36KUromrOl;A)p4V8ZVyJi)CgbEOyE-E@$jb=i5S$4uuq6?>jutl`+$iJ>
z7qI(<gUe$a030Y}X|>u^yM^+&v=L#Ig5_uuLO||RJBfJQK8U#+U~VpwH^=&1z<ztH
zMCHmv2ynB2DOkn_5(#gGDP&J@*zKhDJ(8Gq6W`<}WD^kIZJ%O1rUK@Y8f=>>+Uo~l
zEN&mnk)o*t$5t8xUc^X}2ZBNS6am_D1`|NB_L7o<`wEqyi?@{!X<XNkEt~mD9d?V@
z{H$6mYuFvgvGR}t1%bcSJncLa<0%QSvHjLV3fGpKwZs)OYNQ6vvxn0ter^Fxxf$dw
zLdhWZ)Waq(WAlU+eVZl4h&{rOaCNr;6J?8YaO@7(Opyjg9unWUHcWJ7G+nB~leOeK
zIUUo<joqw%Q(3T!I_>#SFgWF;ID8a_vL{421wJ^7joRD&6WG@SghN{cnmtRg-a-;|
zf`Pynu>@P}o*}+iZS+%^-)n-&Tl2_B8ZBYDhrv^_kwDHfMm^0W4BRDTjCkiE5cj#G
zYrCji$lg!11Lb0gGC7IbgLYgqY@+0a!MALL{1g+JC#`L^O%Z2w7ZCsr-tVH3u!$Y)
zBs;Z=9h<<p0FUmArJO|K01gMUyDGGDHtd;=o)KaLoAQO4Z-2O2-HNx0SYFR{<ND+w
zD(PDDxwa$WN%m3>fE;6R2HSp9Lvf6R>1m$Od?*~!2P7g@G3LPF5Tu4jv-F#x!`?7O
z!j+B|0D=%`bi)NpNDX@j*Sd|sImETs_)%W}07c(KmGoU4`-~8p4(>m?SGnP~E>T@F
z7EE*QKb1v;f>fJ{=Z}<yp~DtTiOHff&ybqz_Og4L>+y8LJ0>Q^*d7hj9L(iR+W}`a
zt{*G5hkln^;G&7JZGfL?zxh(J&u{Y_d0gfe-*bNBDKGE{?3kM+^;!J>)bk^n-OVAu
zA^oR}c?kfqz3qO>QLH3O1OEWrVQKOb`XHOc{p0(g$Oo2!7hJSl6aN5&8XZ|F5=QP9
z8QuLqx<=GEjjjOwQ%@XSEe=T6#QYJpE7)2IW3CE|7Pit7kAgy1*y<v+<o=+ab{-sW
z@}nTzBPjs-tU6RkZ)^5ZlI}uK_Y888&T+9IeUgO^-ayFgkQR_GY<#8?Z<ESS_8eJY
z_Bq1GB_wh^ggGVgfpm@^e}u?J7TTy@17#aeaujn@#`c#n;Euz(6oGCOFLT%~#}Q(W
zAEHh}-2{Qxv9<7}V0#C+6Y`^qs&<k5;CV+!RSeAcu(iQDZFX}_F2T1p`NEPi4|UQu
zGV3+Kq+~=`0;_r^iJ4=_;X_j0xxaKq!qIzu!XBgM*h_X=Hbv-rZVic1y^e1n*+|LU
z(PAzK3F2luxE?`B?4^PdZo754!Y%Q&*%lX2IsyS9+mTWZ$l7kwLPr38i-;|~!3i&m
zgl>&TSYdZRb=~Zc->?_@tzhCW4){)E-rTjsAA*^iUki=9@Qs6lVR32|QCn->`=Vmk
zCk{TS1S-5@#_PV<D_J>XF2B{-{{REZmOVj-CxxCO=jCwSy7wrmCh;><6?A8Z3;j~Q
zpg0Q<R#-^(_fKtP%{<{}8xg^yO4*Mfn<su_{^F=vsN>w9`QhY#$Z-$;k9(R}X}^U@
z9f1C0-A4^Hv;P1ZXS;9x+$x&=N?4p+%6;BG5HGFOtB7V|Y3<+t0EN{Tzq67`jVzV)
zG)@h>UoT)Xr-M+Qt-xIE><0>)OzG-?!z}zBT<jv`V1=eAAG8cP*HpH<7L(|+sHlc3
zGkB6t;k}TCaNl)<eyY6A7&gS)d3%t|o%76D6N`Z5=Y+Q@F{vb5#M4y$+k+Y1$GRnz
zFvh_R3qt_?b2(8|*7_sUVf7q2@T8z~svZoE0zP~MT)iVNwp_#njxDB*)e`r4P|KxE
zWc6y_bNwTLiEgb)M;E6VZO40{>UG$|OYRBeUxcZ}J7L?>3cI0T5wwIX)$u~|C6%S!
z#nlCVuUlH;%6Acd{{SBel=?QH_7|PNySuq4{G7ItxE2-K&#XNdJ<k6C2qU&8m&oGx
zD@`Ays$Sq+U7ktgtt~%E(=c94yX9^&>?$TEnyRjM>;T6f8%K42r)jk^Guaid%ZTM_
zDKtt-atMv2{Do%}EN%d|gj7DpQ8JYMEGBq;L$`bouc&ld8bAYK1pKQ!0c6|dGS@*!
zMlq3rwV-_xgL0GsY?aq<WxEfd*8{cJ7u`lkA5_rseo!(d2PsL)h&%(z=SVGef=K6C
zK=%?;OqVx2E)M<HFy?|eN?n{J-Yt^5a3c#EJ&F%>;Cv|XGDuEq+6QDTG)f&|Vah>u
z5t+A1>yF*l&;kc5i;(V~$)A{ML^Ku3VHrcZrzt-(_WGr4AtczQhg>1uI5@g=GKV+=
z-D?KI8VTSOu49fkN6|taFfVmG;f<%|2GOjkY#V!Balo;{w3V^8GHw+eY}a`VN~dmu
zPAz+qoE*@3Ri;UPQaSScrn45Cnlo`^(;)jQuTo20#DJixtt<yT1(<YOI%e)&`Gzwt
zD-)^p2j$7L@8ZP+4!KcOc7W{pNb)2Tb62aw5IG;Z&T4&1+_ExDyabfGO;vMu$l}Hn
zT{ekF1ft+LgtD7r-_e|R`nII&M%TvE+@k2ZMaABwQ7?CUt>&Le2xqZ?52Bi>u*Taq
z#H4hAZT4m$(&?#M16VMpW20&866$i0O}JT&TE0kwzlmU#$@>i&ug$>0`hhAL^*EX@
zxCQ3Z>#y|-M3?)hC)6vdnpqCvd|V{wV^T)5T<VH?M!R&Q;bL_zuBxbUWiUBBlsM2T
z>ZaW(bIIhDf28!FZr3@t`z)g6*c+oK`C9!#OU&nza;|iKns(q^%YByCk4J_OJ%b4L
z#>mIDpm|QC7@KUT({yNI0PGl6@j%GMgF@}(I~V&YMayszuu;qaDQ)fLBr!R}01-^4
zdA1GE4T9R~z&LigHacCSDP)O*n<iq|D=Q2QHgDYvQ>*}P@?4#$OHC6Ae1Lt{AE<Te
zD6Ymx9`69D$<XN5zo{XJTHqB?t94Xujm4z6+W;(84MXdya1D<cS{7*nNPr`r=^SLy
zts^t5>e{BGDP(ReVLgiNGpDL2czl7z=QmqDH>aA%+_hiR(J~f*8)Wf<h#RtpM9`y&
zqjNy}Eq0wv3}7{_7f?kGMa7ZOdqxvjD6@@`vMtWAKvq;Yb(@fzJkB^mmN~@+#z_k4
zNf=BMJR4<C90a0brek>sRfk9suaWr59;veJHoeNXEn@+-fI-#O)55}D=Htm(q-(Q3
zR%-_rYgH|EbwmJ?;)?1%siUU_tSxi6uvjfeSgq7%A~u#Y#gyAmqgUB+Hn&vg5FPs!
zUp!U1jG##3T2I+ON7Jfha4%{4`CAPuP7Jl!ok#2quSLJ%r$^DrwbMk`eOIqh^sbiJ
z2k>L#!t<RbvU(P@MT;xw`j)w|S)%63ih8Oh;j-?(MboLjLmJ<rO+J>1hasSRtc7N!
zsMWu8lI?By2uZ3dEI_Dm9|a3$ac8GRCY=DgoW(n8Xr^zlHr`i~HPsFybwkhHTT@ik
z2)0Kd0T(6?Cc9aiPmQN>U@ISAG&4N55qqw6B(uA8(h@#Oo+u!IS%6>4T5arQqP%I|
zsJxsg-J`@ifUKsSu>wg8JFj&V6p*-?0I*rfA-fk*rlhBgl1JTPx`$b#rg3C$4tK(-
z>K?7At$U)Ud9lUSUY(@Rs7fCt?t7%CCNp#!Pg3g1eYYU+7Q>~qhRq=L8GovaK<T!`
z8sgD)veLB2#z&?sQ&K>?Ea~*x8hUHlprC3bg_jIgCr_Nmcav)>JzhwuT0#9^DIK;l
zYKG5N#%AiTP_Jgk5aa~4PM&S7B<HfQq0<{QcaU89D?U#~O&QrGbhC#vo>ktI>BimI
z2=-`Ev)lkGM#RVtMnZVQ?TabDNHMh$!xra}fPj}*WUnlQU+9O_<YbZludr0px$w96
zV!)nN=_E$mW$UM~_qb=Z&~-D!;CHlGDqr;y*IB^0{4VumsCE4^2g)fabZcv}>V~EU
zy`_z}(O&*>(?S|uX7PnZNGaosbc8hcOq#McJJW^sx;FY1{j$<Q0Cv**6b7LjZE1T&
z?5s3>ItTv%7I|;qB@eH*o+z9na4L007RtIx&?F5DRi{kB0Cn?hEH0fB=cpZkJT0{Z
zC6wG;*=?E74yRK0%gve-Xv1YT!V6sWx02SAZpuA2Y1#mhyFz722>a1|Xeb>K^<8)P
z3bwmQ(;7FsXeeDqsqAf`B%dm)e5J(9;_rfyKcSkk>L%$;{Vi!D;Ve{Cl~Y-)7Cr)~
zr*n7kuV`lsW#ZZml^}(by$4C4(!&5a7aSE)R|Hh-aA+0^daB9BUgr_=gEbJ;k{=-Y
zT~bf&2^B_KzNTSReKwLW_Cr2jS=N!~=(Ku;EJcp=ngQ)@>bjRgnpf^O0G|p?Y;@S&
zI*uogbFFk#wAAsl*a^1?`1FR;#d!%;TBN0fHYSsmsRduM22eJpTRdFf$~*E@l#z?Z
z2_Fe`fiuW+TW>1HYFo2&vQTcqm?NQVvE6_&!x&XA(e(pTWQK4D$wz7xLY0=z6S{v_
zY_fphMth*!K(x+^4O%9E>6}rNjHn*!iEcbAD$3e_O87YJfQGG-oV0=TNlE%0N{0ps
z9kd&w9i<0CT<{JrWHhDhJJ{c%ShYz5cD=wK38LZ&a_r4@6hbGK$4-7q3r}<~$|Q6r
zcfeXbLQy|Ee(SWhP==EIjv*_ATi8^eq9}D(+yHY3A0bWos&`zl0^}aQBvMD|(>0*>
z+u2l7NmowWdQNfjLJ`C6CY0;5RYJ)hn_)+*QdCIYt!;r_)9<R7g5c16D?MgPns^KL
z3jnU8Q4^OYS7}-h*c=6&@{6B9s3PX5w0PlVX*#y4m9B-&aA-WMTAg;LczvgCJgG^_
zhl`I*5!bR>IXyTA_m7lLpA}@R52$c&!mfh42;J&bPSWmja+0U0B762zox{jl3f99X
zT^Cg@fvo|-u0Kns(O12LWMgmHQPbB4fxKk=t14H-;kY<lqqOK(O;}}RB)WrdEZahg
zho&gQ{YOrBcez5<K6a2qwrEr7(!o9?sVpPqB>w1VG#67v6*Daxnn3WYswBB1)c)#C
zUOInI_;va5xj#dppbXzU;zxP9IO3#fIWCIHKZe5RIFNg+{cU@NNFJlCJ6&mdpHb7P
zqjOl`OMDfKcB@Ar+F>p?=W4EzCfjC)9a@44aOou*t#S!fuhj;nRp`<JN06t|bc!uS
zz&@S89_6Gh4F^lp&>va`fn+=B4Zmy~P3an`8Y(2s{t?E3w1l_Q82D12qn?%j0F^BQ
z-zezy3Q1x0Cv!u)g}Hh)CT6udn!0dIP&LR(I;~Eq9r2d-veU_1rb{3VXg_56DrgwZ
ztYBx#o5+VzevGV|O+>EUBZhlfI%*fi6`K(&Nlh-6=`Sq6{9PAO`4b5+oA|m3sRo*7
zom5a)%ul5W0IPnS>57RS9aT7Q!Y;R06!Msv8FjoRWpkv4;nFbpOrrz`Da%HM`ZYBj
zKJzmThr-U+YSF~^M%h3g3XfW<)TX>p$s@k1zK2TG=5^(8X!$|O2a7b&Yt&Tdbdr*P
zvbCn_5m>;=XA7PcR*%y(a@o}`Yn-%{+D@NH%f!aqcM5H#(8)R}>*LlW1@W=2`jwuY
z`jaFgdUt>ND|<a`aK~U3VAUX!YdR*MlBDuwZ&4j6F4>=>muMTqhtw<TD*8sWH)Y-3
z5@3#`Vm4U(A*Z5_Ht^P!TXnQ9ud>FERE@3<X#&TEZ2fE0i}bPB?iNy(ij=&%N|!Wv
z1sN?ymrEAWQVo(yN~|eAL^{P)Tb^GGO}X%^qL#7l24(<03S^qaG_P|akR10<q;Zg4
z?{En%S3@N4WxXrQK(Gj-RMro5fmGzTZJRj<<wnS6eb1~N-~^gusI**5Q28(=a0kJ{
ziYhkm-03b)l7^<!t0fqdXz-g=q*gFo)i@P7Lb@F?@{3C~2XCs-6`|?sI9MGd*%{?#
zbb4yI+ySkTU;b7}W7_Jc9Cs-6w2YmQRL7<?>}<9|Nu%i#xv!|G1b8I{s%XSGyh?H4
zs+QB2JJWpc8S<o+J&#swDJgm`jlacgA^u7eR@Ah1F#iCjJ*18RS*nhgrKq!?S26jz
zu+n-{No(32T_AUY<yXo}vTBp)f}g4CDdzqpE^}|$YcyV{(`vvH##--`B}Yoon6DO~
z-@1mIMv95sjL^J&LRiVIGM)5_KgEeDWoWCU06nhTkEbgw)2)wJ&?Rj56%@oimpR>k
zclK7_iPCMJo;q*~WH%sr;R~Q?zm|0iT;j*b_X029Jg;}euZ=c&9#`|&Frt*xRaCY=
z;rfnob-WCPX{XVey*`!q+#Gk8f7-aZuBFjYMo5aDsm_(W2er*St156mGf$<!Hb?n;
z?*9O{j#p$>&KDv|sG)`e-&8tHqQnc`4+Ug{PnUErght%C-^?${CDOwiBB!T}F^nz_
zb3q`BUgzaG@lrzn09LN1I)`#2j{pwXOqH7GpnO#ovaz0#F_1wv%i2xF%CYnxOB*8I
zL&jU=d|g;aUR>X0J7I<67q!Bwp12ZN#)lA3ySjCt1;b725j|Y7wXVr&!gP|*(zp0m
zU>quUvZ{COEqksxAr(oaRm#?hAF;gHqf9h{B-J4#he%uq#gNBUa38`1JBty@vy(@l
zq+@+a1D$J;fAD~+nk|MX=*W`y5+4B#2L8b$6;sA!bOZy*10@AJs@&UvY~I$gwf_KC
zu8zmkZGq!rn@4;V)nb;WH$vx+V~-c`jnENAO-Sh^{wwxhH$=9YikYW#H<Cq&{_4W4
zP{$*f*?*e@xJ)t7PfGIohO%anwY{7>q0A{2buFjf9LAQ5Cb6_R+|$4NCsi~ChO^z9
zT@M@$a4mC-Z_W|XyCx=;_iJMpwgF6rRzrQ5T?`S3z0N+PPBF?&K*Jla4fa0YW8DVP
zwiOhOk>r=zq~v%}z2B92b6i~0+@Wb@+5mGmw)QCc>7bg3dIR(}#{8ty8t5)MhRD|K
zWx>iX^6^Mo15QWk@TjyXtDk^u){Gl=R`JPJ0fxX6i-k9W4|G*!lzoOjONuF2#<<Ah
zFJO2=R=88RG0_|N<u%b(Y1K@gc}a+j*xZFFd^MA~?0>hh?xQak9EV;+m#`C5=Vh?E
z!{KwQ4Xx=B@<JrlHk?TeX4e+EQ8JzKM$b}Kfa8m(PsMTmC8Oj<U6bjQ)7QIgJ6m#m
zEmoJ%nzc)s=P+zMqxu7;9`MPdosI`LV}V|`q)|SaARKONysZ91gt(&dijuQ4()}S%
zL>gs?ZXXMAM@>xw0Bb^EEhg6&Q!+b_R}*~Qvdcu0J%CtQ0aVE41+Hiy`3R>*qH{ni
zI3^xOTUY5iD*KTTX+8qaRP;0A1V<j`__FkZ?Ysrvy}2K{G36eaxh8mbP;|8M2Nu#u
zZQ-jES4B}Aj%(?rZhxe&sU(sY4}45NWF*v@T;J|e#_y{_tTRe4V3jlF$J0vOhP&uO
zSR<621An6WR&Jl^`F~XuU$TY0HPfs+g)Bqtx)+%gwnu}r=lE!AWw2y#C$RxuX#Fj#
zRXw|y=C{4V_Hj$0QsuD1E$|Q;hf(O%AluUfcu}94t4MfbWd@hi45fn4Z@SqwRsBQx
zZ8jG;y}O5H2T}ea(#N@wN<Vey+P1!RX^!czdtGxuWXmgk7Ic*fS*VJtw>ZBWv0|r%
z?Q>Nd=);}9H|0xBEU>!Ixg0NB9aSTqNv2)koF_4eT4}fVy0WJYb8emJQ5zdb&nurE
zE(($CuuZdx!NL|~KyZ7ef-h@wpCe9Aeu;s($~J2pz&NsyfCfTnA)#<L87mlT&)Fb1
z9!hh;`vn`U(}j$4i5<VPd;q-VxJOV?Hf9GrkA!dJ8r-(l38<TqTG-gvhi%F>mr;hD
z+h1Zl6%A9E&uF#PML-UH!d-e9S$kG#D#0y{yS^54QGxMDLt1vCshuQe7buA)^&7S9
zz0~E6NO;YoJn^-b1xZO1jyr)FMb_zWk-Ot0U$PdK8j4pDCkhgSM@(dxT{)<Y#22Se
zA$x4{7dB|${J<cp?jMI-C835&*q%#V0YOU*G;SyPydoxuJYBA_Ol1S!?aqDtizZCc
zrZSd5=X)HAd**27<La6y_L2NM0Ht+3nRw;Tf`=h^i3y%YTt{#@T}UrKy`*_u%Bs3y
zVYG|zLb9Qqlf}95H+Oq1`Zds^mYQo8*gNO4uGZm}jxSM`a02GYxn*>77YOXc2B}vJ
z;4!Zt9zjZzv76CR{;D5lxwgM`WluKv!H!HSd8y(hz>onb%{C@5*gTf2II1Viv1HN)
zmXVX(Amo}?Jb>eGlzUjm1GY;l`D1iaT>FLlAd#C4q+^`hZXo$Ymdh9}%YuRlS+H3B
zl<u9(VX-M&8a7tXKG{v%Wer4(bbKjli)ANseaE^D>~;CNXrY@3rHr^^7E(Qc3lVUK
zhF3(>ixn#>!Nc2iotZoAhM+VHG!T5Kp{<%T?R%^g)h=tlM|2#4%?Gv7TU#`fT?Nx?
z5A|$F9g)AE54Wh>k0DUH2;{LX&ymWKHcJ@-HxfI7nZXE~G$x^jF|pRSl+#ezM%N2j
zSH%AS;f>8VPA<SUNaIBiPS%%@(h7=3h8tL+$hq7criJcnz<;<DDvGTLNCTWM+|oEw
z%^XrU+CxqFLdzVHXO^tC3sy|v(UG5p(LM1$doX(;gqOAMo*piZ4OU&ybuObwKo*gn
z9IeMx>Ge@;t%SyYLdV|!0Hj?b$aV<*!qk|L8FyP%NF?7yH@Eszsde)a5!J+YaehM1
zdSRJktfY>wWrVSk-sEQK;~(sfOl;XQpGefB-p4RJg;}WR-heJ(C8LXG>b9Hm(>T7G
zLmT-!O~10Shf=74n`Lo(M>ko=TO_V5s+y6n!`c;PT@10h@W>oIElkg+t!<+qKf(?A
zW88h^%^>$mlU)qty_uk08MLh}DoEsz4{O11g?m+|ytHl`#j#+jq@c6?yMauleT6o<
z8p)n5&HfP))nd+V$I1=tm4}wQ#&V0Js-!FtR6<%u4huAjER7OxV~E-@-7&?zuBUYq
zBn9-7wf_JFq2C<QVpbO6B^QoFHO|4h4F3STf<l@{cq#@H>S0nEC6-B&ytrE68ztW7
z3kMXJ&B!4Y3}Ck9p~JBWo{n_EE<?S^%{SpbrZ%<KZa%6uG~Xxgm6nMmh$P?kNrF4w
zJ0M*l&m-=Ym0LLPu-b4tB@!0fa|?cKn`Z(nPu&|&AE_Q()9_GiJrFg)*}CJOl{4wU
z_iYXN3O$=mhEORMHq8e&`y|*)y^aSQCG-9hNaw;UV#sU5ntjbUO#<%roT&qd#s2_x
z8@9g%yGmq5u|_?lCb%??6tFxr?34o2{MO-2`d!QpjllR@*qQ?kJ(K;+_X1kFMoAGn
zg_6fJ19m;6f{O^EcaPO)eU}-p@RYVEg6Q9$1xD!H4s3-ZbV%6<%Si{}Oxm(q81{z`
zq7yg$Drn+s+mmFCB8iSKVRy6<o)VGrlt5Z83TXwrixPq;h~y=$?ZOSRxJlgI7c;Pf
zwdA^VgqseH(7akeT72-F*xFCD+#$#%mbi8}Jf^bjf41!SDb<|K7EO%o!61&vV<eHj
z&2b8NDjXxT#l^o+P)Oz%62rRbA7$}~>bDkcdjLK{9Gm9A{HK;Qlgmnt%y9W136Lh2
zqpS_=Q;6<+CIND6LHJH3z#9xA%?8H~ZUTLQ@R-xwpR#ZS@OV;ZR2YWfadjC0p9)8{
z#9>A){L3K7;4DbEKUAc67Wq;4xXMPz;cn^C88S<_3)nj95?js4`lpvLocl;z@o{oP
zf^<!hpB6}LN@4w2?zoaU7)?SpJUPwc)=R!3J<YScfSVkRZ?(<1zm+4K8-dtR=v^{D
z*o4t+k#I_RZL`5qo#OW&vSCFRAN(%ej|r`Kz6k{@$@scf$3hpj-rzy<66K=c?g_TG
zE%jZ&How^hQ6@c-iw)RP4W~RPZ*i87s7tWk?Kb#9pr=H+93?h5{^~GD<v)>e!dfVp
zg{Igkm+VvB$8eKBU#i9!TXK@euumf5*0<du1Q0BkJqiPDj4lH=T-$fD;!TC_mZ%Iz
z08}zI+<nx<+^D2$j&FqMgwYMGa&4d8631D&#t_agY5t`nT-OZY%D#?SHcA@O@1KPu
zH@A)u_HZ|8Qo|_(ZV5oCg$WM_3JQk+E<$r<Yp?$RDU*AfZdPo(2u8;YV(E{M0E2rb
zxxVb-aC4f0OY}G1*IYP)rH-V6H@4&9MoDqG2@9`rWWAe@(IoP<%(H*GfFExL$;F_7
zbe1EWeG?jmWtSV|TrL9``=ui|@P(VPy{*U#t#O{|MY!QFJfFJO6o%TzDYrb>ryG4!
zP5gaRSgh;cDM7#drvCtBhU0^Egt1-E38Z4_0XF1>xAL1{XIlco={>#=?3U*EvhQ#7
zqKuLB6=R}nt|J4*!k<nw(Vtb!-tK+^%gI?&JFdo?lY&S5C^cPTeKrEf<1U<x+~r^7
z;;i#pZ%Eo|TBDvlCb$m7o&v9yvYH64<LW&8V3mr|<JNUbfi$mhVa@mfXy>elONY~^
zr+sxrtX;R-)9{ZyY!yX*ty5n+ue3o0`0h}0>u^xg`es{LewOl7l~kJ6s_<lt#1CMd
zN6-~DZyuu@>z|Z3&Gd#%do$nql6k6sg$tbC&GN1zs_Gip!&wQ5pV9@Fq4d|`?Hwyx
z`he2@ZQ*Na^g0+o+Y@o{nc;11jGp>Db4}27i66da8=e*Y4@%X{N2|HR=L^#fBn%$N
z$Ly3wz!6xYgKW;|{X0oW&|JXh{PtH7K~BOhz)#96(**O630)WgQ=m}KTs5`;G!7JR
zsy4;SQyWRJ8B(^LhSv#325j<3Y#KmB2RID&3Q)#3046%iQLK&9yRwbbKKy>ldjpIv
z3}`%k)~hf(Unw~yI63NK8ZUsFNbI*pA$#OLN<d^hl`Yy20_h8~utoy=<vVe*ZtJey
zb&W!|apgPQnhk<SKeAH~XeYi?fU<;0Q;V^CrVR>7;dO}$F}RzlTY#_x^ob!z$isfC
zgN3q?y<-td-g2T1E_H_pg3}?eQnC%8+#99PZpb|$ZwWm%-^!K4vP)Yl8)ROU&M=9l
zrg3nyNlc2{#_l_XqtaOsU~{Yj7G~%LpPFoTV=NO3CMNDC>iVK;Ml^szqpsB9Yl~wS
zDsR04Es)G4aN1q%Lzvh&2zsqapc3~6s#^Y|r-TqDYGnAWj9<$5SlhUOs_S)1c&-5p
zEm^HqRualqIFsEC292s#NDV}!1K1^VevmmNS!#Vp9Cr-6kASLSs?~K#OG7;<&vF)$
zgQqE=Xx=wFxhl>&1~(001K=sXP3@bOjMFqYTFbenNe?9DO-ZGCG6#lVzzbCkBLKMx
zOJa}0DGPr<aI&S*i1!vW4g#5wG9kE|p7&8!>X1_mxB{};$5+zRwco_!!9mI~3Qd~_
z*ES~GaI&b?I)<8+gvldG@pa}}r&(20xU!HNALc5VuxeV9_sHoTbLCHzpGay;vtO=t
zyIkionWfJ7;bp4pH9bxK=QuQ;0<_Y4W=EU7r<JbKx_$_N+{WEyj`tureHiT<L7r(E
z=^98pt-hI{HaOdM{Z-u^BoF`^(fcbHSY3uUA4N?rjknoVPo={T@{6KHJ8fXlt)kPW
zl#2q7k3*0$?z&T1nsfrnF#{YhK`K7Dt&2gXboCMjF}_WfU#I%63eS6706)}HDXXHK
zX&S%FFlO0G$ZkNgikDE1q>oI4=P1K77|alyM#3qfV;gr`>Pe-BF>*qquGS%^2Xvqh
zs>y2oUe`RsNPS1~juN@ixcfGB`os_eceGo{SiYg_dU}1)#QpCbhE+V2dcLj+d)~%7
z!hHusIKJ}lchsPpm-HQaGqw8msj57+h0S5?4U_ck2BN9K(zV9rdKCvr!4<usUQ%gL
z!q5XoJEu{K727h}2TzzRNFQ4*O)V1`(S!F!$4<~}00B(a0gQdou#qw*4jPoQ{Dn3G
ziO1yuhMNI|_M76#rLJ({5d}MkD^R3jBJBB6HV`sGBrr5zlA)-Xk&C$5V=l)40Oy1y
zU1K3>yMn3KHTrru+)S+mc`MGf{;a8~dznfcN0m1}NOcx$b^fY`k&gZ#zhDaU{bQ-C
zYu@HTcDKnYwUqUBvhI|)lC^z5(|e0t_T%WXk1ow8T^X%6N~x`v)R?)~Je9c7I(8`7
z(&i7@Ur}ihK^WS>`y(Taw!kV<LUuz<r$ZPPXhy|O*6`4!fw)uPafPhIVT@ngq;r@X
zW~d(_93~f+aIuFu;3y8~oCM;>xZcGZOHW~U1*kSdOHAVHt7s$i+rmi8S%3m{MN~0F
zOPnsVX#ra!o<cqqb!B{X>@IV_`>I}{>RNh6xS0SxFO}x~LDdzSgWVlD+R~=y=?!0I
zo2t6XICn=A_dCE?3YwimSgE^<_LKHg>Dnz#Y}=o?*Eb}s$4~U@DZtz=eu<+GYz^N=
zdqe4mKF^V*ZZwS^I2zkG`zv}%HbofrfTwq~;3`@`NsCPjSzrLdw56+tows;Y@2C+1
z=PC_jTO)HLxhKMunCTi$q3XDzVPpUoadn86dc8_==O1Y(OVm#<sVE_&t6C`=9AE)s
z-55oC1g!;Wx^oyVc~-5B@w9Eiqmxq*yjtX^$*k1L9>}0~*2=mkv|Uoxi|uk+);4B)
za7w4s<EfR~<hyUmwDqB<kKFyv@Un-nIWR_1#}F@i2T*l0{g}@Pikg>9P4L^Q>XybF
z3mbg+OzO5OZpOh&9_{ReU(J+-f-!Q-BPb>GneL3As7W|=OrUMr6DmtUcFH|X(>Z~(
z;JExD=xF4C`m+~qK1$tE)9KJtZjiTim0f3{JpRBf@PKTsqN|zndUqj%<ycif$zuIr
z<H|{3iHrrUu~pRuO~+%bktcLA($LRs6U>c0)$X0Ehp;mQ*<>o-Oq*no+rCwfiuhs}
zJCiifEf>0tLECo4a(o3@ALd?3dv=b%D;CV@MVbM(g<q-ER7Aqovptfemu7#^Z6!Q!
z1J!eJ@|miNI2ba}gVRi}XxvCA<w2>?K4;zJk@Zg1peE4Bq+{-5I7aF3Xp`J*ou*P#
zdSW*a+kDwNqMio3Y)%CIR$r>opY5}?sTk-i*W~zFc;a+Zf4J<M*cE+OOdA<<-c7S$
ztEueg;k<CNZM~VKi;XfSIuQB04ieRB%%>tanhm}cWYSd;wWDiSQAKC&k)-^sD4-_E
zYPBh*VGWJ>^3**HZI)ZiMf@w#Js5{$SPPJD(rPAgmM~fmfRQcecm0M!DPUl+ZyX~c
zh)oXg+k&$4!})3U%_FW2@~tVgXPEsOc9MAEWe3|cl>v1XG)^{fuvBnF$fUGG_FA`S
zvuX!?^*cc~uqp|(nq5BbG6xX18tm6&C?RQJG7bW5U0hW5*v;QXUstL%qtk`l;T5CO
z8IP+u!SYtU8>gZgt!TCvUN-^sS$fTOHpp`9Ev}^9J~kNS4amk8M^V%0s$N-73yY5g
z1uICSxqB<0uNgsZ<zb|6m<Jb}^J0k7x<p~}umR<0X*3#m*Z_Xc*Sar?*cH73mIky4
z;@oZ7IvqZ;R|dVi8cqtdfwc54+GK2>Qi**_=V)tow07*99$!ck$L)sbeLpiAB=tqd
zl^0V|&d5k}+CUjiq^zop76~qXs6AWrby1s_0zzqW_5|X(Fx4={4Q}$#NjX<k^z_p}
zJ?(ABlrwb4`sL3z&wf?C9R&<vdd?tycubU1*p}{$<z9sWsN7$Fs<5YzNusAE<-36U
zt6#}!^)eWlQb%u;Jx@VXO4Bdr+~Rl_StnN!t#r(WudKDx?51b59zwU$Ye|K-VI-m>
z=~&^AwZITNt4b|DPo!vZmALFml;p?90-~xNMxo@x3&{PIe0pxFH9?4n#eU&!;MS>G
z{3xEsmCl$+D3ctm336Km)f80!0EhMUFo_Lpx8~R31pc0_qMy-qOoU#?E7kNpP8U-K
zIl}f-omI9+86#_PpQ>48Nz_9KHm#Xx`g)MU9V~vMt)0jS*+oTK0ig~6_HEUyT9|7L
zau6IlT>)0@&h=PZxO}3Wy^U0~T*t0aHV`ACF_1YeRQi^&S3Ug+8qj#LR2tQ0t0PM(
z*cC392C^!@k8yK*CvvWdt-6t^rl6jpK{V5gocyV){R(J(^WMXb=-LVwNlM>U+i<Bh
zZ8d^Z{6{=}aDtP4pzuqeD7B4~Y=MR6%C&1N>*MagQfX1s$7ZsZbNt&1>9qAy5wv<k
z#gX`;*1)GOkxNadS5iBBqxBjJBBNQFHhO=Qa6bWQDPm(8XSkEyQS0^aQ@Gq8*(CU{
z;)jcOvYH`PQ#SDn@>ZIIMb)Q>Iy!M{cU3w)W9nQCPiuZGwbYfm#1RI>=8<m6RUw<R
zIjQN|-3xCdF|;b`W@<GuhCbn>_*xxaT}q+F)lVdIWCVJJJu__JHzrIK{e;tL&xyOe
zSC64mny~=b=?*-q>2(o1Y}xh?supIKu$bia4Z9vyHS|tOx@DY?WmvJ4G%AfkmX3|y
zw3QCVYzlUnLtgo^-)Ztzfto0iFe)k9N7t1X88@a<EmqN+gQ+7Q!l#t(MrqB|D(ZyN
z%nW0-mBf8NqcHCjZEMGcGb!R}*#zE?WIi4)+p(TSB~?N6vgvTawt8l{%8RHW)9V_4
zFHF{x{gl;OY^B@9X8!<ygOXVxJ1ukMgl}Ntidb}3GH~N-U0yOE*h3i^dADGJd3k>F
z;mR(PswuR?Y3YNHlxq7z@~(kp(lsinu49rY@6W<MpGl^oZt1IJ+&eg<+17@>KTe8_
z3-_|1)+np%o?j%6W%G{7HPsJo^vf6O5;5MLJl7s?bTjo0OMmem9MRvx3r*16$v^z5
z!_HOnD5%>NrIb95a+Sq4ZcQR84OOwb_^t@aHRunugpzzJddhlm;$lAEqKY`#7!EQs
z99;=0p`zr=*kyfGmiK^st2#cLr<m@2Kr1Z`bzqZZZi{bX3b2N{rW3kJ@AN7%;95M9
zb*bslQpd56E<LQWwR$$MJl>@%q-gP!eOA8L8+)AL-pRDRRaG3DcWrO|!AD7yroi8)
zYf-Q^X{2rOh0N*6Y9$VrQK%Q}9IR?}#?;yK&eLqzC+T{eH5DyvM|OEa30NfBTQb_l
zoB3T>QaVS<*2p%O8<iDfDyp?9{R_4_SGG2ga7X~W{{VHT>c}Ji08{m)A(>^5+Uq|I
zl^2ojiZI8L(80@zHzj=^ix<Hj4ta8$B9ghjgp7&*0GEN_Kh=Ngemf&*qO7RA(6&(7
z7#i=9;3+8SDXH1&*TmB6*{ui9#{+~_MSh_j36oByV_MO*qyGTE3$e6_sM*6#skm(3
zuF&su543}C{!!FAED_f>cw`nh3?}6ESZMWKN}{Nm*(I7%>k=G$c2`nQsR}VsLr*)5
zXLHMbenM{5o2?h`r)!@iZH>-zO^Zs7DtODz%23A)65y(|oo;Gsk^ZAX`JU?+A6Z+C
zMy>%@QK#wB&c=<#nn!Nier$U!x&<P4&rb*q+W8*d0B^VVKvYcWkLqJ?ZU7dtvx=)u
z)}V==tLSPi{><LnpM$|&Q`553JNW*nzv&^j2kwXa8(xZN>?%DeJw3!-rOxN*jdLON
z<1<!42<-Na#9;ILBBY|FlAqCS6px%AYn*?wtCE6dH*sTFSS;_a$^&V3Rn}HgM&com
z%zK@-1tWE-KxXJ8vmLpn-r$y~!pTUM9nWtz{{Sf+QKv}oO)G?8Tbq!b3H=aB`C7?b
z>uh|t$7`tHrMGXX6+pGFbHPVM?J%{ZLha3VNOi6g=4&N^{{WP0P0mA)zyAQhRszvb
z=;deg8~9L(rDNPnH-de`x+m3qPAzjt^L(h}o#ETSYtU+j*#7{}nCV{z&BVAlj<$Y6
z24PV%gx|>HZKKMzpsS^LB1jn72X8+_9I|i3ZpH9EP@^eqWih?u5uZ}oA1L}L*%N(g
zsQskaf`f<FbMa=qxxWfZnzJkhDV!V)iOxYD7SKzHwTfuz4LvMC2Mjp_O{hJR2S0<|
zH%*}x(lxQP-q{5fboi-fkUWRCu<`d>i?DWqr>&lOLtXA@;CV`SwZOCp%ZEH8>6uNv
zu44dr@}bq5*;)V=&mI<W1(3Fo+CuqS>|7L-vpw$E$nNHgmiZqE`gXv5If>eE3ZAN^
zx_hD`7QQ3IgO;H6*w<pvYE_iq#M5gZOyKK~2^K2)kFUC#8CexgVS6~sa#mcn8ofwK
z1;ZY40aHGfNh&`q`7By}q^?gV!Nr|^%VlwAls%rm(*1d-%38|m#>W2piu4^fSkr2w
z4uY;H{T#kt)^ysoQnE)ilC^@)b4GruoAWx=1B0lm=ZU<5dxi7fN8__$f2T*Kk32Ge
zv+SWO9xl=fjrJ?$Ej#fKuIO6ODjPFL8<z8={{R=OWG#zUq;n5<1;*BBe<+pL+3ijk
zLexms3zDd4de=s*h&WX-r1m9M>%C7#);rRjuE%1R<Znp@M9|b~P{)1FvZt@=S~x-e
zDE-%#^#@i@B#vZGKVq{p*HzWK_>#B}s=PdWv)j>}p%c`#F1>~#L~=C!7Jjd<>ZQ1h
z5%gG(L7Raub<doqh@3_Z*Hk<hujI)*&(UqE^+u&o2yCux{#6}CKDA$RYIk3;axNV{
zc}3dOgiSpaY)-hi3cmy(v<S_<%<R1{sb$V}{{YHuK9M920#ZWOK54^4UgKp0+Q|>P
z$)Mk`&P&ie1rG2wzdtC6baGpV+@)iEG3<4cNmDQuxml*3g;QR@A4xSVn~Sgtv7)KI
z3y_r(z2n_;@`ir)fwb8?TYZ70=+TJ-hh)=oaH;8LlK{Ia#t9u^d#4t~kh_bf0PnJq
z#FLz+hx3~(Fq>R*cuEFrxz7aPrjiChvF?fmk1q`wPKp-FLy55LqYV$qQm~8weu%9K
z?S{hVMgVERPpGcg&7kE2B(`mueaJ@_6Oxs)D3VJlaU`BfVRJ5{JS7%3Kyqlvz7Y|S
zc|o(!bt@i6bQ5L>G7v1&^+4A-?})Q#<FYB1waHE~waquSR%t%Mn~9p15(zttR371b
zxSM>f1zkHF4T7qYh2W6Wd#TGGv{E@QOl<=_R@gXQ5&3$632pw$2xw|!cHrwP3V9}l
zpgp0%MopJg0VPE7U557gQAbg@p2q6Th^j7Mge=;A3*vqLER_r`J50<s7f*$f#PHaU
z*r;gbbPw4euvQR07rx=b=(a0Xbb?Yg$sZ!iJFHQ?j@;1Ue*tPFGDjz=zW)GaU#x07
zVJ&nmf6bALRtB_V36-z0aUodg?{LT`_e0msPFh^wYrH8m!e8z3x*pLKm6vqV#NqB4
zPnnT80v&vzY+B1&_fWU>pK)!Ea-+0Ro_KvX2Qk;bDIZeijij4fDhZt-H)HMsYkgOb
za0kLQVCW^5m)#rMn>2EZlO6tuW<xM(upt*t`IybF$n1?#ksM%_lHv4R$m5Xz07+8%
zo3Z<*i5MMYU{D%}rKSPcKixx73)>jTca%ia+1U44M>Nba_#?6@u-~9|!gc}_^zpnK
z;Nt--GBxe702D<o9dK@`x)Cx0_J>*RAg+<V&{%o!iJN1jEj9>Brfq0+Z?cg~BfHw`
z5y?&l?z>#0{L8lch0?XoZSLD&DAOpJFp<F6v|Hgd#J`6S6PWPt8SJ_24b8#>CWuQ2
zB$0HSaHrZf^TKIu&PEnYbi`wT=N~EigS+lfybzJ3kAzwZC2$wTlw<-dRE=<VCdDq+
z?Hhs@Mr{ym7r4RfLVIc^9>+<ze5VFB#O~~&niqdBB|4D|kxZS`;@jD|t~t0<)7I(`
zS)ySpf2HcRl{GMXZc9gHJXP#*v2JXhzK&M?GeZq)WMK89bWR>J7fxb(F5uUE_f;@z
zEMvo52GiwPdeBY)05l%psXy#7ThUotMA?nlY<nRMEbM9C1dUfy#?T0Ed=Qc*?r32n
z<RYDg{{UqZB6)S-d1L$(`Kqg1AEi>qZT_xD?ynuE#Nr;`X|jr<o><vn(BbivU71N4
z?@~8|XA2Jr)ZvBWAsZzu5}dR#-axW}l!cRf9vm*2NYZ5fm~glNl_U&nS_uWN@|a?K
zbIrUa`m!`06E|e-p(;Pz_gMWDZ(su)p=zfdue#wrDIWG%5K_3&XiL!Mxy|6+NF)aY
zWT?l2ER+`Ua+JCr=L@GoP4BxZHgZM^b3wOoJ0Q?g3XY;k{{T?j6rR02jrWgt!VnX|
z8TzMU`~;Lbh>vi&4dVUN3GSS6p2?-c_O<&bK#+pn@VKy%ag_Hpju>^m2vJ%{kF_#q
zJM3eN+H-%pd~>;<rRBC<We)!UaiEnOz$e;`CSdsMK?F+1ymu-JhC<=K6YVFC=t4-w
zLPAO4U1b^q(Z_H%X;McsnruzSf}tm{Ob!i2#3_b}P01bmDPonk_X{B6etaofNf<w6
zHc>C4(jwOjwcw8l(lX#~X;q`nQBckZw)>w2D_=p{8#GMZEG|F7R?)=&0Mc%JCr<me
z`*xp>5RIMelo9)aifj|A2%3nrovtnTAwXi4ga<H?tYWQe#@E@y<xBhmF30WocM6E+
zZkPmNg_pj>Bicj#r-flq3r=FVKg`q_1F}gfXI>_n7+gU23xvW!KGIsHakdSVP5_&p
z*jX{B0fppt81S9y3tPI4-SUyH37<rgrcNwIdno}H<qQeE!BVm9zq=nQZ5=R@99-_k
z;Uk>Whc?O1ZN=K`D4a<BL1a6oHPMb*RA4v|Q_0Q~PE(>1M;8w1EHkyrSmJDrHg<dz
z$sv0U_SqW{jm`L6){A7@`=s|b0ORF#?s5f(DbTbv%s05P?}V2iVB6}aV`Ff&!(5vr
zPHqSe9~`1hk%=wHvUqSN#AnD%A-A>5PlsVfE*;Ij=xi1_(nejiz=P#+X*Sw!x!&Pt
zHva%Cm^SgiL@Le&z+ATJK?LDFq#N$R`AM`Kj#9KyF+cqkz#j=t;5#G&{M;pDq2T#y
zOkTj)CAEdcif#e{L$?qu%0OC2aJU?0DQG-6En_4m-;{;c9!gs{0Ifh$zjBj<WsJ_d
zd9{jN!?;lvla%J<eybk^FpZBPq!K@642=NX5L3;?$qAd9K@KRSB#5#dg(cX1uNz9{
zFz&&+k=FiZ{3k~wh=UI-b<>($4W8e+LeJ)Fi+(Pj?*lm=5oV1cOD^NIkAysh?G_}E
z6yUUsbM;ZkLBA+}vhhPVw6{1ZIpWC+K?*&t0_`?QL$pcU*c6AHrUyHM3Ac3M;CrkA
z4ZMEo!1ftPa5Kv04a5P;V{A;=f0Vfg!jQu8V{4{ZgJc>HBZ<1>fx=5>!q{D&-?9`R
zM;_%j=$7XfA7q~;FpNuJq$1-T(whNc%4xX0teFZS0^c7A06ndgpqp`S$wAGEAQ}ch
zu}fzBB^I^pmhJdL!jEm%b*d@`8hs*+&pWVYc>e$h9RoqD)ar!wY;=xszTUxl1qVq`
zQ@eZHz5U9+q@sof+9<<*Y`Z=se5CC2mX#u#PU-4OXc{G8d+qughW*rx(BXWWoW`(U
z!n`aEz_LOJ$xM=44SkSPX|#}!Y)v0F$|0<4aL@oqU*R#&KXhD-l>`R{iv`8_z0?EC
zifiRy%bXCgiSBHg;fp9mLoMw$L(g3pcERp>@!1YW4`Bo9l$(xFF-!w)_XOis%kzbq
zs4cd=!skh}VFmff{{X02K`x;HxZVZ6R^*LA&Xl><y@Ku7!mR%QQHJ;-FZz@~Ug2v&
zqR(}L;`=JGsk63IU8y(57UY3NseS&b4bOE@bv$4uf2ug})HxuR2E&q(#CcS2)ZP#2
zDGsFjUBM1PMcHudlaZA|bxA*_-$ln#n%HS5SZKbu^0?=Y6$@)>3A<WKkW|!jw1jL@
z?V+IDl%$JtsXcm<N3^GzYIfep*u}Yc>_S$&b|F#vwM5~iO&O^+wf_KRg)N-_00lGD
z0P+e1vZC1qMq{Yp0uXjFaTLrPkfeQ3BF(T0nUK_;KgxgQs!lFagV|y0Fb~w1*JZg1
zzw+|1dz^%<m_pJ7g8u+iLq)@?Vh1h(N;NhywlfP3%gwdUpb$K?OLz7G2SZz`*E->^
zWM{ca%^Urmji_tUv>)ONeO7X_sabN!33>R+3ZFx(t1UCi^4|*cOX>PrW4N$gD{cP(
zLa7w(k5<&3?YwRBQ53x>3&fQ#GCgZzip>m-p`+-gYePm(R!WT7U8m`k^sNnKZ3KKP
zIH7H?U=s|DY2`;XTNo}}2i<G?1qJM27AgtqVu)qHEY`KvRCH~2>6#DKV6~pOl6N_@
zt#KYt3UbJoL#UpasB6$uu$Mie-d$yk*E;S9gM=>+cfnX1imgXeknelQJ%L7Py*WJZ
zX?tux%0<pbbatWCTArr;tlY+*3K~5Yy1C)fZ#O;pTa6c`qm7}?VEU~+4w+8?9>%IH
zX?6!D%x;6yEpFFH%l$&uQ0R2=05$<{g=}3L2G)QqhN+$4V+gs|Mp3e8X(3?R)&yi4
ze3Do(mI|tty{wRLJ=ViUucHwMNcM~=xuEd^i%EMdTnR-}wi<K%S2d&LsCt8`VTv;q
zAP$g>EP#%-u76&lcbwkWz(VCO;u=Y8^k{W$J|F;lTvS@8R8iAYJ=>dbFcu%vdj{5@
zxhe@_i<#ZK;FX+Z_GHn3{77!E)%uRcwalgtztt~I^poir(L9!D?6ta%t3gD=V;Hi@
z>OD_AOT8)~f_YhRhN7%4<=Lqflv-RCFAcYHR%c%8mM}UxQ@r`M6-m-H4N1lIRS(*D
zXeh|~GA7u$xB8&@N$lMjdaX}X)uqedwDxMe>3tG+OvlM`50$6VI%){4c8}R=H0lVU
zwVPlS6cSnz+a%IqhMorQV7;uTmO|$ZtpI!lHqbx-VM!ZW(Q{#BDu(RpIA0+Ew1sNT
zF~&RDP}Fq>pFrRrD@(jxPY+sBK061r1s9e#Nsh6;*hORxg~#CszUP~jSE%(nYNRZH
z7ku_dX)T&|hrAJWNKH$jWfp=!bA|$YAaOZH!xI=XnNc$sGhh`-?Xj$DSS@R(I!g<x
zYRzt%oRD5E^+Nvu>N-hVX1IRpQp%Q!C|G`}tH((joZ`IisCw2(BrsCkyUNpQkEN`I
z#m)qg!pa>A87qB8Hp9Z3lYNet(N{@HsA{tZPF(Ao*=XpxS&WD|?BsU~L8DVs(!@QW
z5IHGz9Zoa+HeKIE50TwP7Fg9=W_SHDkjb^6V66s{(Gx(m@PmPq%JAVC$?g@jEcDxV
zSQTigF3Gy|SW}Ymkzl%Ak%CWT`Zn$tJRmjs%OP`GEri)5;(-X;*dC$OG;|IESz6G3
zRQhhSPgHj_-KUJNJE+m+)b%aybBG0PbS)6W8)F2Ee5J$6O4xEzdM+oaV~@1ld}S9w
z9`FsU7eS{%11|iPAec7|unP4=Y$42zhsjKI?HrUPRbyD&k^;$f2U9~y8;7V1hlCuc
z$~J22wR(DH66b+$m4oVzwTy0xnfsl_7Bg1YE44X`821LA!Aqm`{Y6ZH&ko8}7cRqT
zbPFTvbxMu$7aN=ltu}$vjvzWlE6oq5;-_m%nVwdfk~p9MZ6C6wMj)pkEk8<SI{^&J
zIyRW?V2_E-kXQsvdUNJ)w1Bf_MSEtj$+8Df)nTV;B!X3zr=V&MjQR&FC0)|m*^s_s
zOMC#L=je2R>a}U=<T1hxiBr%~J<bo2gx{4E6tC0e9;+|s3i6*(r!j^#w#Ac17qdB~
zpxSy0LjZfWgKiZTs|XbvU>H^+b_@Ht`AmkN*LiR_D$$A~DLbJw%|4Z_64a4(ZyU7M
z3$d&t<x%QouzwBD${slPN4UwfcFGP*q#A2%J5tmb$Ckrud?cZZ*Bjp9ZzWMwJhoeZ
zbbTb{kbq5sbx8=*WA#Tz6oHH+k1E4QhM2@3HL`?{^0K>huW3Tp%^*7|oC3`yvnI=3
zPNE2;+Y1NQ>X%a0n+pgW_5mNI(9b#kE!}iQPM@d5H%)EHX^nJbnW)xOzhrR9ZzN%A
zdVf!q%=ISC)UARYfz<E^VIb5erv<MY6*m%kWA(Q(HtoY~7Cx$J9XV`n+B~ambkx*D
z=fnvlVR`*{)Z(kN+(o!TPwXig*mTI|{v+hx<f4d0D{SLnaup3FW~4xh5aN80uk>v<
zQhb7Hxd~|E=va7~Ju7P(2V><~&UD7d{8uo#$QWM~acs59q1U|#TkAc<TOkQ2>5mkP
zQx)a)As{mM7FD|LtsOHxExVj}vZtl$2Rs<!HfhD~tTfmut11DUhe_J&MsgNd!8Eva
z3du|NIgC64RnPi-)Xd)bukx;c(w!YH=v>zL`BW9Is&wWVWF?^&BxMl<f?{LbTt*bp
zQnD!bn-7IuSu<$kCNN8qY1K6~PX<=FH{~8exP{agK1Q|>UFOKAz+tD~FMOztMJ)>q
zh1Yk&9*a>rq^37D&1La^>p`xKE3K5~x<_hzS#rjle68IEtN#Gv@WR1xJSxhK7A8l&
zCO37v1Q)FMJ&Bue>6s-UZF(u|s#@sCVFewdQa%QcP+#RFY<!2*BG*O4$=z{%qRDsI
zTvwy2tJ@IT9c5ns07|K+d)#m2q}ATab`VH&)m0@}nn8O3e5Itqtppu5jgxL@4px-z
zEsQaZ!Uk~0w{si^(5a}k7DmzP0DECK1iKZ>=rTj6HJhqh3x_vV$5hiJm<Sl#-v9*d
zQmzSw#3tjMDq2=kzOwN|Mtg-kuDTl?vq2`MG{81E!(00)nWxlM!?;XXPlAVYVu~x1
zn`KwlYcfK@$P3Bv0-RyZ6qLBJYcyGDX7wLhPH$pV^pZwMXXY+=!BkY#diJqb?uu5#
zd2w3pJD?|QB2z2FxgeDB#Nr1vE{9W(LBadC0p&%h^*j*9=*2lMwSl)Obqaa(z*{TB
z!$)J;X6mFhFFP6oPbC@Lw3s52+ao%w<($axV{he4F11efdU1Q?w+SCZrwD)Qo*U%e
z$uznh08P3%fpG72J5hBeJ+`hWuBfT5g{D?VYi9^}_04`~+BUkwveeeWrxsbWf_|tP
zc_V^Q83B^t37n(<08=PB{fb(>V_$4#rkZ2)1!wB&_1cG!=qGQ=_AMTIS(*fpSlfaW
zI;=1q-i%R$^g+pnIOFY}X`xY9wc=Uc@HshJX|;%HqYX0)*;-KPE~$N{7HQ=dH%aJ^
zXYnt)<fc<pO~Jm5%@0%<rQF@lZTJAAXX<(CSXjthE-mg>QD_tt_=%y}?xg<!ONg6#
zU=J&BQg$+vilUE4)8MO|zP0Wd#f_GVZ9hPQn*OcLxZH-Rp{HbaY09LZL9D8IaG1uy
z!A{&(gtpy;Ni`sp#{dWClqrf``=fhrd#IVDzK&sflOgaftOF!t2^8-n=k%pXF`Swb
zj#=4>Tr8xTCO$Vgw<QPYSIs4x32S~;wwp;iS+-Vxbo^}#dn@$HnBt#f$lZJ^_~w`m
z@y1{AZcuevEBA?;6K*&th;;|jvtel5)fpz4RZSC1s#P{J2AoOyEXJ(b%E?KRkT4W&
zcT!e<WVA*$-^J{Sj=o8wxQB7`WLMh}s_4$r)3SzU$m_?Ot#*y5Hg*8VgJ7}R?DaBC
zeMpO13KLJRt*4ZJU59t}Oqza;Z61NFK7UA?1CI+k6+I<XpY;wc@~5V&)@s0H%wTGf
zl(2$DKxicSM~hpbTTj?sCX1sy4YGda7dD+sPYLwoVDXe4HklUf>~jF;4n@ljoFdyS
z_C7ClIm%11qLEek*r}x^N`YW|6jVCqnJ~p`!S1OwN_sZTT-R@H(2-YCL+y@$ljg}3
zUudMJmYJy<lwgw_h2q?*nu?jGn)~*Ppj%Z_Q19VVxr2n+q0}4hzzXR~wn@oejb4{F
z*g%l(ReeEO3vkB`-v|min%4mvS{?K#@uxOIB&ldBZa3KKZ_%G+WkizgF}Szri<e3j
zV}GLO6=h#hK}5h9*6!_P9T!&9()$fNo=;#ARTDPfWc@n>=wt!Z<TvCk4OLVUMYKlN
z{nk@g>I$03h@_`<cN~#qHjXtJWW7Y7kC20=?9sX|Wr?qG4RLSKs2NPwOa!iRYP5zZ
z!vQddA2(7KM)B?ipHv=1x-x@%VC*_um|9MFu_=zyH2Tsk@-M*!M=UgKkh$~556Wxm
zDHsQ*Ah_%jHrV`9Eg|UoSflkBT65a!8l66hml99A>Qks4Q&7+0&UXBjCZnf4@ZHUH
zgm_EwsXd33mq3qw98q13VJJXFRF)L2a6cDRx{Ot^Nwt&{xC6*nT|H4#7#pb^4}HoR
zaq)UDj&_10(j#!Y;SKn*wb1D);GLi_a+Z4eq=@c<*zBq1sC7FZBjs>(munk)5>Ua5
zB=RJL&5|k&uzs+tcB7~{u)<7CyCNX|sXYAvMpM(lr0IW}u65@zpH02Xt=&6EreqYd
z>h+CjENS!_?k=;sjI}kamTBcKk@y7g+~fuH*x|-J5#l#*lNL8T>~ya$G8;SL%ITDH
zNkHZqNQ{fwxFo77CvK^pE8VPp!7A>Wx=3lA8(J<h9Dj92v<(!@(j5T&#FOoDH?ZYO
z%I8yBFU-^k9DVjAiy}8kQ75T1obWA+rfN(MqH`Js;NV;I&DM#ekSisk{M-F8ER21<
z&K5r^+LpR@xV9<fV_r6p9czV4EONm}(q7Qu{mmqNDRj+Y(U2bmJDP4CwNZ7lP5ly5
zP&C)b>86>D4>sP?;0I;0>H3*ypRwBGVx(xhgn+rAeG1P_sk*J(<Sic!7EIp^(8&v|
zM2#)E?S-n)RJL5|P8H9Vs*1ij9@A+X3-CM;JQZCXJg?kjtB-x`K{;7XI$D}K#?MPD
zgp9?91b8cBOX%0-^u{?{0dq<J00+WUg4rEjkSC}0jPY+_vw<Uy#Z<YJTMHz6L;el!
zuD>Tu47;R`c*{;&TYLS`Rn*#SQnW=J&$+vIGap1u`T=z{DGhXQu?IKqr)>lm^<zHk
zat;TClF)$C_B58BM|Pl~YnoekY;h&I{>bc9?6aw*rSux-GGA0TaU={|=eSI$(i~>m
z`cFy6AnpV^=%6u6GkqtV{{StGkqn~U048TPLCZ_KEwQa23XLi)-|kucuApv|LmvMC
zS}@>mu$-Tejg_T<u$$ZEK-PM%cGq0A=Q&x#$O1;*aT#%Lc9#)_D>Rous+feWm8H9y
zLAWU9HO&{1f>z%k@{O7FQc=^GNQ!no%^k{GplXPsV_9P#w-z=|a~}BvH(TzD8hn9)
z?gTj8oM0j4j59m8Uyp>qPthb$oClF{+$rBh1DH&XE*=mu$tzvCmbmP4j4qa`fvjlV
z+yoi6Q&bj5KGv5o4m;gQ=Ngv!Ww*tEw<y}W6A)z5Yz3z+CzS+Jh7elUG@dRnvRV&B
zT69ur)qAClyBt6*?%$A~s=w5nO3ln8g1TsG9Pd@{8-97R9=>qb2E35MEro&;9;{gl
zp_g{zHn>~L0t)z8T~AdV;6J6^+N5;xRK`6*(=1}a{1*=e1v#+Yv>%&b{Zh#(8ZV2`
zP%#orM(pfTk}LqpRq)h^A9lB42K!DyTi%g9J+8;-zBbcVftC}8{TGM%5B~s-50b7Y
zr{hg!d~TVQWY1x{O~2tQ>SS@+=^gv8NpDSP+lyw10F8&FdS*~8=CrRP2j#pxy*-_I
zJZzEe9#Ua*&gSJOrsg<ZrsaCn-5H`r!szD%{{Yfit#3=y=`LF%O}pK8f0>KXAC6XI
zn;CJvjg+v{O7n)4v+9&^%2^wCkb4C7>jvJ)2v7b*q`z31!Fy$;1XIS`xLF)$dn4LN
zx6x+~tx!dP4MR^+Q7HFL?D#2oWS?j%N<9{}wJgX05_~GB$tL1MZ=Mt_GLB@q`A%$v
zexk1oY6zU2j}t#Px?S&nZ*k#9=^XC~82noHPgW?el!2QjA9r;xrax7|3GI#|GTSXi
z1=}DuYme0vO;aNX54Y7Lz-jgqZ<Nr&P6AsQQE3!`<Np8&?~8ck54x*~(#GIzap4^e
zPqyR`ie_TEEso2uoW`}sF5yIPJBcKKrj3pLBIxuBY?Lzo(B$(L-{#6=i(?lVDW0J}
zUkElbLQ30Yo83l3w_5m5cqHN9WY)FKIX6Kth$AGWbYj3M1KE_<Ij%MtAqz1USZ#bK
z7q`DD9rRH=2Ls^%l0Huly6?=8EJ_f>>)_lc#~Bzs(;x*yD3Dn=#5ulIj+vw~XgxtI
zcOKW_NiLN%cQzy<3n^r5jTk5y<(P*zAO&qx6PoR)IpVu*!kdC)$0LbHEmX0(#5?So
zHD=|YxI4i|PXk>40C4`w2I=jRZQh%9{S^KxDyLw-otjBK)^mG#M``j9{lFAUblPGp
z8)M`tpr&jC0NUNsIvoVQc;stZ;;QwiTj;p8!;jez`hQs2r0)1tI-FC+3q8l`kw;@$
zoRE<r-Y=f&*GY6l+2+>aSIWb>&gTCBvNn#JaJVED)cPWp%Xa|g?ql!pP_hR+*tCmx
zL}}ELZn3#Um=5AC-Ad_|AcmgI=jxU8=J#o_@T8JfKrHNGM)}&}EN$|FW}(nX<~)bB
zr?Qr3vv0Md36QWoo0{NCf?*_Jk}OdLirFJ1yK3Sgk>DR`J<#(9N-Y`MO6oxNn@S0?
z%~s5$x)!TXk}@3=!-4riy{`@1BR(#zq<bC!YpkPbio{4e@|j2uAh1RQ0SKyjqlj&M
zcfWMzK*N26DCT3L9^reG+<=kK5X$mnd1*q{Mp!c7QwVFMBuTa26Sg=DN(t_khoE6`
zk`c7EO$Te6fIFr+ts~oo1A%Eb7eT8iv{^ZjKOvxavKmIWd1yBQ4j$o_xP?6|@Ui!(
z2WjpQrj2yTVjv4{2kM;mw2mx}r-M(cckrbfj{!>UCG8ethsILh*`({DmQlC4Hu9oz
zY3KVRt7$42NU%0Ry_P=VYbHa+Rz@;!l<^~mHx(lr8ED$!e(7Y0ZMfwdOlHVSi5%FX
z>D<SV*NlV{n&vx;g)9#R;_li|U~Lu?Qo}23Fi;a|rayB{!A3dKHKD<~oA6XKN(lD2
zhkT%<(2fyc4u~|6?#g;{;NRiON5N3t?svFn%6MhP@}01(X_gfAZjAo`6dQRNN*@%G
zhc-<76<*^Y{U-ka3Ks(7dk}jNilHTm*{7$K?Pvt<V8FU5n<Q_w!u~F@u~gQ=J&zA>
zf{dcn;%tCbM(EG=1XYlhC-hj>v9|ssTWyWOS2IkOSvNr_x!@44VVKU_MCj@mdtSv)
z1P}vq*F^7;WK?fxn{8>7Q&Uz`kK#m6$jSxt42QEH-E2J<pKNd3gRaw=D^IOYXIqhl
zoLUDY`!N-)YoF}rz0^=V#_MD&di_1@b(!vOj_L|}cICNg?{S5>6rm!T_;9#SaE-&8
zDCg7O(Y`WTdAK+zU;4=I3<gGyOHivFWT36T((I?lB&=>*$CLzhEic+loI5)OA5T`$
z-LDrPDDlwhc6X@9ax9ki7VM@if?>Ii4R?ZvmKU=in<b*0$8HwkaIrWl5^c%KKu!Lr
z&?M}Uz~23nOYAU8X_SsdlHIRuiT5VrLAnv{2ISZjjBqCo{nS#2Fx>E%9MVOcjTudQ
z32^RiQ+ALrn%6tAN?t)(8I8%u39c9C`zIIQl&!HGqS2IwHsGn^AloV}xx!IkE=`o=
zRxB(7v{>DBvvMtU6E^?|b`+vpi#eqsM8y)x9s#&W$suw6BTG+~rk$tsn;!}=-OjKE
z=%g%?C47y(+g{udofF&*n){ChLgp5mrD!e~!3p{yBpk`y8bKEM?4T}bb==$^3NT(8
zK_I3L!zpB65}<&<;q5oSWdzZ<9t%>m<2S#QyN}8GsoB?7fnRaiL|jSACE=#`P`#Nw
z)mKLx)iGM*Y;*FYV}boZq3mtJ!hCPdh`2$a;VTFLgK$>|pXRX%jW@`+Dc3gPDPKYm
z!`{j=GtcavMUBA1X&{WM6L(|bBpg`~B(bsK1_8a=p4Yf?0m2kc(g=}|Nqd6Fd~k=F
zne7*CoZp1@$kWLnCxL=mNgoK<TLB>3!hB{;xX2xfSC4VHx?#9DHcm~Fher18k(+Pf
zM*4OJlN-KlkV%hlx^WFREpZD5tYeuYS__)+2<0GP#k(RRo@fP{L22crTooqzNk&*;
zf0pIHvfcCmBGOMQn&JvI)Up=uWu#}8pZG&MJD%XBZLZ2irZhP&Eq+r=OHURHn{$Dm
z_)6HyBDaeImwE0#vO)nF<#TQZGCQr=s9S<?Y?QY*2`<um1eZ3jLWWYIL*4prl#p;m
zly)g@M;vxqg58Qh^Mr=SpRo&x1Xv&0cHO5Q6Cqj@TnhtxsAUX1f)9|SE+C7J6mB;>
z-|Ct@l9HjZ2ksAPy^-vDBxciN@Su)17J@DhbdoXl;2-ju&UQ@taCkN;o|KFiBMLa>
zl0N3%3MM*+J)}R{vjkBIXgq)r@8;LR;aC{j=KDw}3ED%fe5G!S#E#vPWDYP?jfkJq
zo1}OxHXx6L3Q-fA;N3K{H&WPNH%iunU`a)w5SE`MIlj^f#k;8tb{Hx*HNg`k5ftUP
zc0zgdUU;$YgSLKB+}hj(ELMVFOUY@vfX3mH60%n|`8HEFpd3706|T+DD~4}$j<P0E
z83eGQor|Jj2+t`k-ph@HS6ta)7~5lvrH!S|uuc{^AvuR@t`k_a5Xu+1yO=JM@()&8
zbyF+>KV@g@)BgZde`Pl|pFv3a71h9S7k+u(FsAe)4d5uuG58D9qlGp??M3~8Of|DS
zUug)&K_B#sr+RVQkL-mYSzc<UJ&KYkW_kT5?u{|VIA|p+cD2{A`Yh5lgFn{|CBohZ
za;xQrwnuJ#!+QmE=eGH>W1Q334lCHjIHsv^+8jVrM@1xK7*;-@XyGx>B-pH|+hu%|
z(;PL%{#0UuM;~*^D%4nurvvh~s3k+_965c`GfOVXckZpgZtJ@xIPgGOBxY5OF@utS
zbno=I$-fG~*mK!5zp&wL86Z)oMBZ|oD4-d(eu#^cl9i(<nt@$I8_2k@N@$`O4f~@2
z9n-)TLq-5@p9^wZa+>NGZ~6cV#lswYsNB`8U|8rP?9iUtC>noAL;@N(NF8#uf`&4d
zA^f8s3C0!^`c#>+<{LV}YXFR=jAXQZQ=JnpfSw6Rvt}FVNBtpiYg%z@C)p$R2HnH}
zfr#Ap_z7EMkPuaxg*7-ga3|`iEBc}+t^>dR6s}2jH5#(`Vi$9og00pl>EkYZjc6V2
zuvPljuUUV}LiV)(05g!(+68{1@clw}xxdmlQJa*t6DcT%YaMCpPUtlDx?J0E2w0-l
zbz$!&D9<Evw0cKQQ&UDgjRbZ9T}2ddv<5UKP)oO9a&j{IcS%Cm2_<QH{-<SVsdU<U
zb^z9bQI`N@*&&snT|J9K<6ss50HiKsGEK^^sMI5j8@|eeSL$k7c9Q9u0QpGeK}nja
zYZ%Yw0asURFhU7*pnXd74P&mi63Sb;{nlouR@F5J`<~#_*d%k4=w%h`^$k<3>0t+K
zqW=H}_gL*`tZVBWSxQSA=E|ajNUN$NaCX(G(t2PpG`*bp2rP1c$jVF6k!>A*qb~WJ
z_mkMI7Ln4=cfMdn_*-2!M}`myVEvWEP{zOjXjF_+1g*0@ru6JlwWPEFJ{8qH958;C
zjC>-=?PU{<&4OnmBoN0iTM0{n;Gw`aQZ<B&Aeau3!?sF@g8bPP6*+O?867JC_boxa
zncAvHIO6GPsB0v4(Ic47=IZiBGWGyjLp4Mc&AW&g@|L0<ji%G7;2WGv-Q=aJs*V=_
z04TE0>pf9RO4nXi<K<wr&a<AW&W@Vlrx)^-<h>!3S8UyD9Y;+}(p@uKZv|sDUa*#-
z#yUp0-@42;8tqD3$X?)lt%pnWuy|{n&i&H3%3Ye*qJ@-|+Jn7GoZ>rNquR=SE+YBC
zac*n^-Zw{yj1k1qf#C_N^we|H7M729Dv<qp7Dfg>x?rjFV5PONF1EcnQ&Ff!$*K*3
z>=tS-!{EyCI~qs^>vg1QzmtWnb_fe`_RSK`nXSOGHH{X*!U>KI1ls9jtJ>QWWvs=7
zTW^F8xigy!n+ZFu*+)+4=6Eb=4f2YXmRTBF#$V+ms#*%sgZ}_Pnzo?HBb@7=>gtQ6
z!x}pUrlp_|4blv$oijnU074ky9*|`xCRb_N6+Jlxz+>TDHSt3on_vP0r&5L%l3Xyd
zJww(M)XgnyfV+SJMp+b0qU39<^;n@{E^q)WFH&`!5tm04rS2Vq%2(@JhN~%K3!1`g
zQMy-4zIO-8((CzCxlCk|=mr|fy;`h#m)Kp473f_v)0FRkIrapF9+T2ufDUUd--T`Y
zddg$9n}ANLJt1k!Y;|6NOA~Ho1K^YlbOqAvreSx=Ih3<Z@MU@Xm2;*?6*(5#Je8{Z
zH$_xh9KtZ^iMNZW4IEL+v8)@Gn^M%`Y<`>#4}G#qqK&Tg438kW$*btxpRvrREoIGu
zXQs>UBIw9se9o{|)Y=!S+qpLoIZ;Z=hPAtRRXU?xR!Ctc_`=lJ=<&b}?16?DVL1T(
zQaGme6)&QTOwt_{j>~x}?k0#??dQspNt$>9$V!T+p=mC638^DDWU@$kaj;c7uB}f?
z8FQWj&-GVU!AQq4H?`0Hki5rN)$8?H&CB*407~0^8%wiU)O}~_Inh!b&f@o3MnhYv
z)NXs6cNBL{XlABX`t2*xG@TBT2*C{-mQk&PmG)-3cc%7+zCcgZEwv3JAz%$?!k#K%
z+gJ-CBW<x{=FqGb<w(|oE>}KAM$D?J{aKNM#u2$IX$%`zsWOeEmw{zgdh$wXHo+60
z_EmFGS88%@yS5zK%6eT0K+q&^enMG6%h(i=r_p~9Os)c=J-$kpTkA+41Dg{GapJ*J
zQ)v|Mu{&Cfk4U841ZA#rSoqEM!t$ljOeU95e)lkop5YNDpCe)~ZN-)U0Octto4!&v
z9s-7QB||L}cCmISa8!<WE>78){Jh)l>xAj`8k%$ILdQGhTgb-Kw3&_7Jw<FTpW531
zQrd2U<3m5w^;*zna3B>MAgQN#j&0{W_E*||zY`-7SQGS8R5(_G;sZxGRO1T$M7dtU
z=`^^i7#`<<d;~VBrb-xF2_RdQJad|NZD}UT9amShC6SO`;cqD@qGdc$wwT&UZcl5X
zn*4&*QYmXBsS?U8)qOzdAtBQbvShD9`z<JIWf0k|H}Zp?BQ;N{D~YytrJGcY4V3VZ
zJlR7W&U?2Ll)W*U(R)o<92B-Tw}nNi)kh@v0>ip{oM(_RoT#hl3~_EQ1M0Kn&?7|b
zuY+J@P27Ch49zAw+MUw?0X+Cs^tzoD4&yU{KScrSN^>^Y8U>Gat~I{Q`6g{4>6&VI
zM2#&r9I7p5u6RF%PSEbyRkb}~Jdk>9Cq5LqGo3sASxLLIl{u>DWbZ?$U0HJKkaO58
zS84IqFbQL`Pn29!!w|Uurc~<9dwnS3u^qxil2t+CkRv*0OAo!neBpEGDCpmKo(b$i
zY`(1L4|6Z!G5Ry*7kyK+{{V7+TBHsSu(Mpz7Q;{)E#*;ax|KX6`cCy8M`dE&3V;#o
zPH*y2Lq*cr5pxSk`AXvZY@(X#j3jk6l~smUM(u#`La?gTj1lZ$4J0Www=x-aK_dYe
zuqwKnN~o_T@0@u>N;RPxm621`7f9(RHyqfb8LUSOhok@_!V6N<4Ln2%w;zIpq|xhT
z0nB6E#PCi_K%1`3j+?E`P|dDz4f?37wJI8abkejR3pZ8y+Bn2QGRyw}H-%juhb?@*
zr9|#O1g!4O9ji9FXHZd2@W|c!tLY?yN^`aOw`G~>-j|9n2yiyfD@7$N6wC}HDsogw
zr)ED~rKxnTk(0Qy!C9$d)=a^$1GJt(^&rhCv-qcX!l2dlN(xe0NfC4VVM)rFMy(YZ
zT^^tq8&LOH^L2Ykqg6S(nIlhd6-_N>p*i0qMXdQ(nntBN-XdtXYlL|<=oFglNvJC}
z?R9`bzM7(#?;BlZuze(EpVgXs8(igN^=(3(wFVfZ4>z_C2uW*UPP!(cf~u|7b1V;U
zD#AT3N_PkTS-&_{6xzG!nl>9BB|5WQ)n{hmBLfnAjygl|a_rYq&0h>d^3<(9EUUE*
zW2xF)(GJ1d%NlzAzfC3r1cYNHNlVrG&aEYzPB!^ezGUl*>>FNZRMok}ya0I@L(oua
z5iovcV%%|ccU4iTJ|XPd<BOG9E`zRDIJ@(04LpE@jcElxYzDfG)hB1>f%3YGL4|_;
zqp$E*k45PDTHjJ>i<~(g6SbJ((xco!Ha5XQ!KJa3m4MM{(FY3xbIDqI4LocPYZ@)^
zvpQz08|2;#K))AS2=xzEFxVs?K$0qoN!c}g&8K@<)(e~)BIxw^>KG-GTYXBTo|{tj
zJ!dy_J6s~P`pDeV6pV0p7)98QuVZzJ_~>8h#6j|@D>Zt;&CyfH{{WDz^?e{!d*TlV
z%5@Da(8L&A+<8I{y9-UN7;4_3*M&yd>E9S9!m!h|okT~zreCO9xpcqG8^3A!vI>0`
ziZ@<upeJ0Pqf$$3ucp-Io<P>L9P@QPqyDStUNeF_DI%by=8WZ8Qt6d-4ch9E(cBbV
zE3tW7(<(Y{S${AEXlsvkwtZfm4K>Rzj|(?lqlzZ_#&Az2#Z*-55w(SZ!2L>2OQ?;-
zy~wcC_2cVorlxa+@NAMA%DF}C=>E!@4Ose?VQ0~5DI|tkc9*v#c1A8<%<Iu#Befat
z6KeJ}_W^WzL!xh~HCyCAAr&K`j!ms;%C)71l`(B=32^M5#MiJ5F`8!+MAwn!O{{7<
zbsPuLfC2|>pmm)(z5rhxGp*Xe0YOmh)~Jf)avl;%xo9aUy%lv;HCmg`qYxnZ!YfOr
ztfK-+X@k$vTt88y05!DCY4QSVg;c`v$i}p(Me%f2tpQE1xu?>Skj4*i)JtO0s#)qw
zSm1mICdH)1GyeeUtK<41wT(WGmILTiwd8SPt;YS5a;MNWe7bEZEQ+#Mc=sy$aV1?=
z$Xw|GJgUF+y4tF(!oi^a>fVU|0HqM(?XC$pNoldvqV|!l(=<3lA@fC>Unp&2uTRsW
zBhrf=S`{<;hgY6IN|r|0;CplXp(5!We_51ERZs&?Y@sYtztz!Il0Mav!PO8tU9G3@
z%UX+@U89kfbW#)aR+Kt3^higm6mKmY*c6j%6pnwU`dESEEDEX1Ns8kav}dBI-6r^V
zGV0BmjE$!)sB6!HGM!%PBF)VVjo%Gb6t%35tKC%4!Pu(35=<}iG!Ay-1f|2V3P)DL
z)?K=Lt><7?uxgq?j5x-}yU115`irG`Z6p?N$WgT4MYmdHEvaO-+ZU(twHFfu1^sX@
z<*K=~`lHVA6kvYIB$loxT4s(_c#`FPhSh4*)5z9GJ4pWk=|n?Y6<mMCsB;g51w3%f
zF84GZ;ZOM{#&<^$f5=g4Hc>Z3hAJZe0C4p)%1Jb;Nly6O=6qdD+DT+%eKrR9z7>TY
zfmbd}tpN7AZb@_s{(&gsFjzKYaq_KW)av120wEy!B4Fv(LN`=5dGZR5v+@*Cmuz_>
z!iG$(=&W(pz^be2YQ4Xg^v9bacDna{PQ&354yR30Efg>Cn)*X4_qnehRnI2TMNgty
zSRFHM9dL2+WGSL#`im+mAGwf=1KZ@;SW-mVNZj_3xQ_~>U8|0sFUh&i-yjC<8L{lW
zPsc{CXCIjKqF41cr!{5bggLB;*{vAB;R{V8UqaSA`;Ey}b5%}jrH*E~zSfTzRytXx
zxf94+9u5b}^|87<*)5R@h+uyCUA4sc<r$||GDgo6gMnzh?T$zOR$Eh@(oXvu0(<?{
zriU|yJ0m2LcLyJ?NBCJuw@5B2Y`luH7d*zs5pL&%bTy@rz6M7foNh@MBMUnDJt=n{
z#^fhKT^nDxvBV$UQBgLTX;lyAqS+w;8(56lLl%$dvvlrpW3n7S!dSHywc<#c0r2MX
znI&82k<O6!y@v_b#JU?BwC0yaT{htCdoV(>rFNAZ!O}WM$AVjBT;SI*8w{YD=X$#s
z%L^s}e%bVxD&G1EXE~R+5_T!omGVsHy@9bgqTbPKg-FOMLAYsc`}R{ZDNTn2Em}3~
zxzn}d46(9c$wPQ#oFBR>O<JCJyVTQJw41lmepr4LJLsWn8zi+5x%T}ap`TV7Z4hv`
zp2$^<X&G5dRs$M+8j*&Vj7ji(6c(dO*&qB!OmFYEgYv1Fs!qpk_Bb9c+t{r}ms3%w
z)9szHIo9@(gY-gx%>8UGF%e>3G8_VBBmFltxZldZtD<0x$rOaNex{yB*$@7mGp)9q
z5O{DLtzZPGWiyD9IYXN6<F~@Do(8gUJaQL0_BZUbG@47LC5>aZ_h8M?`i_`lHuRqp
zhauwETE^(Ef}!j;Ex0EkEbfiO6BURz1Pc(5w6NaavX-X0rdoEyT@<Zv1h?Ei>j4{x
z=&AMoor<c4qil?B*<;{`4pus@3W`^{GHwC>V3VfxsdT+eJ>JOQ?UlWV@{ZK18Cv-r
zNcPEZ)YFR<sirYh%97LXYfZnTBdF?{_j^ENt%GYSyTr$zRyQ%%&fW?(88q<C&2)v`
zv4xnm^b4s=Gv+RP-23<D%1Q}hv5Ig=^WjZbtkOpVm^9|POM72?e(HnQk?(WfExWMn
zvUj1}OX`g^@3UPaT*m@qeeItLo}yPZo`lr=bN>L9IjNRiCD9j>VsLbRK~d4wil+Kg
zH*A1r;@3jGSU}ns2`#<*gWX9Oh=M^SjutH^g(Z9it=}7iTn7ibs*0xb2Fnp)I48H&
z5n6tNbyy=5{=6=+9JNxzUix|2G%`LJm~PVE%Fd<F2bMZFV(mBo0PrfxxB+WUEbr2O
zRA&xqpF=_MHWdATsXCRdnl{NN^|!y&AnLliTax~ZOn<t^!8DYw4nL$D-@?;r)lt?%
zyK6&->H&P#Z@_qw$nq%mdf5E@l8+Y0L$CE5j<c%Xz>F2O^E7^9XFL@Uj1$Gai5yFC
zTWc#r#Knz%u@&W%yJWt?>+Kg)#|Uu!WE2Zz4mNG>rEA{bC0mVX*X%6PJZIDg=%bRH
zpOq74lKho4Z*#43hQrwbX=$>Nx8#ebN)Aa;Z*}}xFszxo3E;G)G_t$&4at$pS<6BD
zq9d$eHvo$)*oYa-sfgLpxjq?v_Hve8Mb2qx4gHmS-s1hhB?~Rv9B*i`$wSmN@Sbn<
zLq$8=+Tl#<mOGP@jUW*|vPNRV@5+qVNaqi4)hzB~jljA1;W9Qc&I5!iL05EGQ&j>0
zHXc!;P{!WilB-1voZH1KZkStB8MDYgM7+HZ#*1L>#{O40kTGkZ;gQ@Difh{AluVtA
za(k}3gL%Ss*7iK6xcOLOC!O3Tvj*g;EYfTemH}&bSOVhQs3v2qY;E*Y7LY6xNI1&F
zf*)15<#(#!GBSvBPlO#q_7X@at&?GtmD9%W;mF{vpw=pb2y^#im71rWrTH1`tl)S)
z7GMl>x5!C6sAXU!JQnaucr7C77KYFS(T8C}>Aj~0;T=0cHw6mv?bZV6y8_eE%wxMg
z-c(f+&$I`$7K6xA7ZHmg>n>Vsab+oE`Yjy4V;@u+;`UvbRT`G9H+Hr5{nAvvR)Tk2
zcqn=aDBn44OI>5aSi|fte?@$iZJ37!kgW9TfCvR$!_)M2jNc9cLsw|xgD-A8s>v!A
zGYY4vjg7_bogHw!o&i*5U9KWG0z4G>=WE{9yjY$Jj}}oh%MD0HJDX;nauZ#rU>Kb2
zrm>D;xOKqttZC=l9o)l&AM_Nyz#B_Z3|r0cp_-}fX>5)Atwx<uPdr9BEHBuhbsa7v
zmJmVsLzeb68QM_CPF~3X@DXlf>~1ggP|rfxU&XSerX_@JdAAu%_s|ljuz6YO<T#9|
z+{eA%*O6|@%35aBgJK7SAf%QPatR(#Oe~H+Rj&67k0BAU^RorU$ay!DcAMjisUoa&
z4fi+egx-L(4J0mY?#mJIoLc5a0VjoH4Q)Kwco*X+T}nup;j~$0FGD}*6!~u<LS3J5
z{nK3hrf)BI(NM^gfPYP{nr_o#7iQciHrKPp3d6mL0WElYe`RG!s7xPWBbt7w7~{?3
z&%&2!<gvr(r!9huN7Tsn?sJ2}4sh9laKW+(?{i7m@-CXm+}q;eFCU{th)EBz>{I<$
zv|Jo~rKNOoW#ZRT$xa+E838?gjOAeOl(^i1_DuB{9B*KqBr-F#{)#7!_~9Bt$p%3s
zi1g-g{{RZk2_k%ZCyA~<)CNM#n4BGUxR0VH8i|;8yC5ZS7A^E#&8D^Fx|&aK${Kn}
z;LF%;<R(+rNWu$TiI-4xjN0~n!W%`^&@^q{Y=6S(U@f@`-m63IJNHUw7sxjFTVZX3
z2Dl#y&H>mh1R{f>c)iEX(8Pf9SXQyqQqdT1rv1>p@gIYQWk;@7zyl@%c>HpK4!$1H
zLXnJx{{ZbcvEB(xr9|h7EWD-F=;w8Vj4!rxg=bGwAz`^}(c6)gjglPM?FZy3X=JFS
ze&{A8y~B~e?B<pOO+7UoMnEyR^L`2fZ844n9(!304zqU#&mQ0Vg0!ZdIa(hSfZS&}
zO4AaW?5g~Xj0MrVb4Ox?sEj#>+F0@2D=F&?Z*xm<4=OVFrT{#TstUuVW-8+jaT7o#
zAJoxe6C$UK5MrI!{zrv>Js@}JH~1>Hs-OPCEU2W!s$>Q1VY9B&<S9h2E%w>%;^7Ez
z{jVQ;r@4)=AlUf@8~X~e#FN=3>lF+C06517$F^1u$CQn%jqkLPxrX_=DW*3su;|+p
z*g<uinI$uaxN<xxX#_HRP23Lz6kBN}ZefrU{VwHe7F#PwcX5BRWR&c1%YS8ID~L9p
z0~`F=54a92R^$o*EtV%6A8%`p6r(M^4aa0d!(KLkg)zCO1l)GAWb6*mjt1AVLI}t>
zPh_NF?F1!nrtG%|!Zu{=V@Vb_PZAyttdQB=lM8Z@mQ+j}8<6WKwdUCyzKS3kKp=#c
za5&{5M8a;@w(Pp--)Cm`_)s=t!|p0V<~)Kf56Z~`OrGs_Nx#)TCa{}Z_d{5NW0dwh
zhg%<Vm`yOLBEdE!C_o&9(IeZzb8*KYu582k+xscAqZ$<5aTgq?G_~U3i+u9CYg{nl
ze+dq?R1G6@VlVemkU+R7i5gq&Bll5|2;ovEE<}iLer}%8a54V?!sj<X3z$3HCw&r)
zSfRX-Zj^jsE^VA8Hns|zIu}C;^3~P{AG+gvrryUr(;{q@t=c`N_wt)&zWad%H+7qp
zC?vP~k)mvm({TMJ<H1e4$CjU!ARr%Ux7Bl;E$&1Tv5tGjTrcvH?QrdXl-GNQv{-md
zEwL%61GZ$?gu=^xS8lK%gzeYD)?_B<43ZDR?`aoHi(oD-2Z3UHC1a$8jJ>W7jz={7
z6*#IdX%!K+Py4Nv3t^GjXf8<L_F>H+{H<W5b?i>ukCfLC3U?;lB(<=HiYqt(xY(ca
zmc!_f++5oqC=4NK;AJUmwwG9t65AL#Q$bMpjkbb2g0+II9DJmAWnx`LQY_|rFY-81
zO+g@L_={y=?haP7f3PbL7D;yusS68Dh%G<eH)#iiY|RV1aI=NSmEV;P_cg?PCX-;f
zwFQ{uCSTDR4iQSuFKZ>-ZSK2%RMhn?d9eoG3MXtbi#EWfAu8wv-tI=>-^x!#gx#cr
z;G!g@4LG>@3NpvHk-Oy!3PfbOJ6MpTd-t4=x^(s<^>NukTI*iNgbTnb7Jx8R&VZgp
z(A4g=u2Jzg7U#M~!qZ?<Q+Nfc2g2qKE<P2zi%3j#Z8`6Cl)zL1=AH^xxuko7I%<1^
zgaoZEaRoJ|Va{t@EZYRfMn&<3z}Ns&*yCYyaGH$B3v+)ffF}h0>StKof|<ALgh6C^
z2b8uZ{nDJcSaOh(+~&&y(1oV!i!p@0r*Z|-`$)mc$VM||%3Y*<r(A^a=D1}R2V^16
zZI231%s={)mNbEH942k}C>b;BS3bhUH+F7RZ+lzG`zCsq78$=~-)9#Pk5b*zhmOSt
z?bpkI_);){GEuWt1eaMbJ2xsPO5Efq-7|lv1S~X6_vf1gtT#cvW;gkV?va%saNvVA
zP;;AZPEv+68<Ug}ouS0KK%Q#h0{h3+9*toxeXatI?mf`|0Gx#X05A#v0GWrKz@cHH
zW*c+LcKeb774>mnE(7klwbbDLptgV(0Vx9ye4+mU)F1;6AG(eDq$9XO(Ay3c13pvP
z!m4(u57+9N?OrZF;cEq1YF(QJJu@zEbw)LKg75XX_ynPPH5b!5Hv2|Oj^1pkf7L+X
zTk4~But~6L){tnta2Dlr8*G(GHCGXlWXJ0g0dUjxTaq;z5=VRlo7g*#-C=cJsgetT
zNGg&}xno_m()+%s+G06VJy+F^_uLe7R>2r0&uIIvD0f;uOhR8Hy8xB4>-x4sjXY=1
zDIETTXx{35O-D@Ad0H*uWwjo!sj5Dm91=gl?3+W<+sKlo&Xo5qD)N&_riQ>VxJhmH
z!+%CrDm`ygl)9!@M$_4=MWuB8JunZEyWiyGtH@(xMT0;JYcvn}TdsxM><zT6HX8sP
zg^|?pF`!@sz~=t|Dkh!@COl)pNlJn%p3p4RHALG5?`3Fd1S}4HnzMaPBijKGF~r!e
zS^1EQqLIerGOJgLB0-VAy3T7IXG=`N#>u_ovsNdlf7Tr{w>iyi$-!0B8dXI@{mp&P
zDdRUjjN?U)tJSsDPH=>f3ZyNsu8?nY-+wDzr}WO^H;?SJx^9C64Fs?ftsH4>h~=#q
zO(&)%kb>rwuhIHiDE65e57lYuXb<v5{gGmxSjXr;RQ%$Fs{*CdY2avRjkX^M(8!tq
zunH**fLH>eCBSDT4puT$7GD?_xKX}*S-cb|Y>z((s(M!tEEZM)8uvL(3{D{UMbps`
zE>TT|tsYjO*b^b`WK2=CexjW#n$Lw_S*XJU981PNP;De?vc$cyf^Gr|w^C$nCDH(~
z+TU112H_bpJB%#MnwGJx&FRL;7}Ja>OE=K`Xw_@IV@pZ62?L+l1Iohc{as&N^2iBj
zJS|R-_-k3H5c-YBasAfkL;NG9g^e;q+j$`vMdVh%<y{^T9W8x)w|J4)_$x)Ebd^KP
zT`WWe?{u9HK}gYP!MDPTQqyTEBRg6#;411O?VfX`Xc1GeU4tJA_6USv2H*txiI^rJ
z3k3L|8Sb^%-4aAQskbnGv2?(0EV=9?b7HVPkk(ei0|_Cc;ZfD=jJ?1lcCc3R>Cwvj
zy6!(I4vSA~?F%&Dvn>_06>h0@$gsM*q@|7I5-;^o)9JB9`{N45g|V{D!WBaW(y|!r
z2mm9+O(<^BwPvd-{X3HH?trD$U^PLqOaKRqu3XQK(;6t(%MhGhgOy3F(bUBmF|?d3
z{VP(S^jmpY5i`|L$ijCpg~$F=>9P189n?(L<e0Ug&1b@;rO;=ZebcqX-Fs%K{**U4
z+b_>5rk+hB)V}E2E~$^ph3qneWe$VWwDHE*J~4rkLeN7L5CO8l4~1tPPLSq?vR0IR
zH71`ncQtf>kp@qT0-~;othN_bRI)+rYP33S3q`<c60h=5H!p3z6RfaE++@mG9^mB9
zS;TD|qTg3QNxQ*K{PhfEUut!hEDkJ=C}xlX7)pETrDjV=N9nq~2H@7cuJ{Ow+UO;W
zh}Z(6lJq9Z%1I1z0!g=Za@}mj7TDWwm7bQWHaLJmDH|)K7e?8rKC-%6hu!WdDIC_c
zxz0k?RW=6Q#>*Ady;va*j+~dj;UkiW$r?RtT&JRq#nLoe<$1SJb$v}+-4!dG*719)
zokF6&Q<rq5<)=GQ8a{<A(gNmS{4Ap0*_-+*;-{*tlXJJYp5<!#Z>R3&x>i_tS{)li
zWDFj_Ps-6z(g?t`e0(Y`3eXJ>lp|=^(BGo8r={7+C*cs&Yyo8L&0}ujgLE3P8Usdf
zxK-1}cD=wAORQ@VzzA!>Dx#7}bqTk7gHkr%LungX#1#<Tq;Rp-)D3Q<>X%<Q3f5`a
zNl9ZaZRKR^^@loR>4Ra*ikwq!iZ+rr+AV!OH8}N)Scla0SZZYqr;OVCtUjBmimBTJ
z2ImuNoUP3Un%Jqt(jRdbvb`MkNeu($i_|jhA6qJYLsMpwcE<A~i9}00@>Dt?@)_VD
zH61oL5hRBBx_HHlCcOmdqOVhsO*7rL_zL}%G0??#`>d!ms)oYx9qc?S3fTmd?hVOT
z)lxzfn%1)ILZ{J!Ba>rcWj#KMUl4QJ1~RJ}@dbYKV6K1GAL;ClGUH{=uVXqzY?^S2
zZ(%Ctf|f%aoh7m5RZBFFadU}ha-U7A1|Lc{0_%BC1;?;A$Tv|m)J$=Z-1k|^okAx#
zm}9%I&5^pBMN<o;ef|kU>Gbfl3juU4gGr30t9i`9-vL|FY?O`GYkp8Qdm^)(!fnNZ
zf?Ang&*8Da5Q>?avi7EG1~X`pp#W=OV^61ILeJ9alU7xeG_o~>@p~<G28BTlK4b;o
zD02HV-$r_)TQu+7);Z5Tf);IWP^@8WjdL0GTDdfayDWvK-v|llBx|f7{>wSPKu})U
zLSdnNLDe|(xmC>t0hj)q7aR6knL2g#Chr#mvWBjPEj}%bgm1Tnsrwq0=+FLchL+x_
z&x<4J^{AZD=`{RUC~35aYb!lk&8=ZPUdzxlJtL<nX@lhviw^3SOJZ@^gsAEo*s&Ec
zchoChovNv<dtXumFWFDkx~ES-T^%FibGraS$hLawi~e3?6F==XP;T9!>W@^83S$;(
zBM0EB`qx1iB+Y^3tj2++*GdDOT_cI?N}p8HrGn3vsn4<fB@XtAdf9CZ4yilX2nV_c
zTx8Hj=EpOd>vk$Qb?K?8y*QxUS{83t*EJa?-6UIEe(Khm=!WbL4Hr|ZuHPi?3@4IS
zg_Lfghi|TL^+Rd3b#(yGKrp{ife^jCE}ojaIKF%B?3Ln9IvzPG&|aAOCe&`MaU-0S
zqyGS3(b-SwQ%2Xi*02j1CZAbU!q{+6b!(z&6*Pc3@R=Xnt&TE^rW})t+(fS~ta*E*
zA-vdxkkUixwbDu$Iptec(rOaKeJI3Y+^QC7u59F0%x!-*T2bS$DRR+!L03rynA(<+
z@>8`Lp`C`)jEvZ<?yF6u(?h+JlK#Tz3Ku@4Igv?klBLNMP-rVs)v4$~yY~@=TTiMw
zwxAk#K|QdYSJUy%{{T{^pj!8~<!htSP*IkcTnXW2kuHrW*(-F;qNt`Wh_RrBPelh(
z=~erkPU%58EnA4|Ya?iEAlk}JJ5UX&-B!VW1yV1Q{fWv7JBeJzYWkff$$d(2MsTW5
zffk<gE9y78{1Uwet68LypVOy+3yy5DmDInRsduj<wiAYg@{KJaV(r^0CnBO@8(b_t
zctn4sZ(wYdjsW;7@{6W4`3CU!u=gaQ-$|$G?FI5SKs@rKqP>)IGVSPkCj&R;o=-mG
zbXJtwT_&hS>PB1M<y+TPX|lz!lQowdG_2&>6(v<h;Zr5ga8c!2K~S}9+zPEGN_)J<
zeuW45$|&4@7k_mQgZOwWV-6Ma0pOK!H$WODjg_0R!6_xD*kZq<F{|}0L;$jxr|zh#
zYi6uzeN>Gj!qaN~Kk3{#*CA0mqpItiM0H_}@U_=rX+DYuz7NcXvd82tPKw%kNWEh6
z3LclDWuTYTnsGOBuIQPjw1{Vp$K@}|k(N0XT9;PsyfC<t<pZX53~*J6<U7spZ!2Z~
zfuYq4w8qaj3bwnYbQ*KHt`0v1G;+t#C5_g^sq6Y-PqsQsy5G{NDfLZWwy;YSC9spn
zWp_bGrbl3D!>z@|(Q~q@M*4bvC5N91z3r0UqDoCtnwlZ`&uRLq{cBp$CC9nf@CiUy
z=#{2lQmyA5yDQBPM~X<nb7ICa+@bO~>5apY7f!!Nm;hxl1LWBqs%iQpk)Kakk&Xiv
zdV^TfX<)ne#?x-gH&-PS2?d+}KvQ`fkwu9uu)(LX@7gsd&d>Xbv5!d6qJwnoiO%_1
zstS4P9e9i51sZfgCTeSDX!vr`$EyUVS{+v&l4aRR0|UH(jBN132l1V>0c;dJ6#9K2
z+YH{Lhn%SE>1MBl#@c*&;ZykbCw&x}zPl4DKk4LrmOKTd>Ahlc6J-Q6k^IXp{RXC)
z=0;fCvYM89;O|S*Z`dIjucJ6NYPD{ssM=#K4{7cKtf7W&M7hp?rb*>P6&9l~8)9yI
zl8kPHsx~{mwTx-(E`!M!?t{Wl*)Zw)HZ#<gw(cJ`KvzoYc3J}W5AvppmX0Ys8i{0)
z{w}N|f+j>?PQvSPbtfl1qRDaXnYbgTt#Nfkl0-+Fg(Q?zF<s)VvfDPgvaXa#84^I-
zoLmK69TVe!s>*h{{#6rIvU1bW%+z3wn<J%p?Qo-QBees0BEaq486c{7vtesT!nDw+
zT;~Dq+<OqHq>(n8?5L+SI#B*21Ae20X-m`)JO<O$0DCLVL#7>77Sm6>Tj;Y=bkk@m
zJ&-%;YpG5RyF*3s(+r-bzNw@!hFkXq2Ti2P>VY*#F^>nbzUloQrml9evif88UW=!6
zwv7cab$o&5*)BF)Nmy@mk1>9oL+M$v2fEx@X6rg;3Fa=6j&j@o045ir^}eyudJ7yQ
znh_x2HQ87SU&TsR)p|fQ$9xi0B_{s>iB-idhiRQRK}^BvQ_N3?8><iWx|jQ5)8Ao>
zfV6!v)OuE}5O|UXpZ=g0otlQ7OwI19gaPsp=Ok~}(dYENBdSmCEtRc3iB>G=n4@7e
ztiRVQV0y1f4cgks3I71<3a?P=N+}vzBx{GkO7r~(kJ*sabWJ7zL@|Ql;}%r&ins^x
z8+MN>>rvEbocDTevGA)TseF++w>Ir$(U&gFqL)C_pPQ|Brs7!R;b|yzZC#Ovwo>+i
zdk$3%6-lRew#VwPX?3TT0A3h=sbyUumHQu1+VSj?cSe3w8Kl+KoV}8L)qbm9`2&ck
z4tI;7^!-Cnh@VIo{9Q>dFGU+~Me8(riZ>S+PoF9AY82tdDS&AnLavKj)+LlgA(fs>
zxJ6ZI_0v;6qD{L%+~aN&rswEd<FZXz)WVsMVE{Pbj_W8Sg1b?IcQ`lHmuPdpm4Mpl
zzNMM*LStb&SpW?B@_y?zBg>$nYjbi*KLh^&mG1cX)FY$H&o?;*ejv$3S=ALUplF7j
zp{!{i&Oot0bx{ng^$j~7NjN6lCss!<=3Lg@);J@&8G(>g9sGlGFPo~Z5?dEjq4cVv
ziG(|N7yYmQ04l~BBSizj{Y3NO4BGh12=wlMmDb2V{e^Ecg;fh?Zx3zH)jl<*!8c5(
zk?xvY8yjUTQNMkQapvkV5r{d(+&c)WXSMUj3HB3Wf8{a(J7II$Hnf{~ML|O;vz+i7
zY@Z0a3f(e|)~k?T`9K#qKx(>^DkX7%IgEGiojvGR{fSao+qczkwE5*ls#Z`^%GT0M
z=?Q2jaN^_2uA0uVJfW*wmb~$6BJ?UOBC33@JLI+dUkIq#a4zyk$yBsq?syG2`BzcG
z$YN`p;`8F@#1i^M(Ks;eEgA93bwxC?G)l<bV}he?Y%mbv0C65ll76ABc`-4u#KYmK
zn-wZ&LrDxII#-2Z4NGE-hC0pU9^p_ra!vPKq!kX$oNwVRjYzm=r02<L-W={P<vi3&
z5iWwFSZ~>`Hd*rbINv{IZAVE{H9qb@;G*f7cVxn@xw7wNRDwWv2LqIBT}M|deH~ei
ztB143ByZ5FLgqkAUguxJV~Y-2<g_)Hl`u9)e=$WdmOe%-N7NwMSl0V$DI$6DE(t==
z>MWup+0JXfP`(N&^;C7u_P3ni`+~q)61C9OMR=eLa2R&$sk%O*Dt$@u)HiRe&8>H9
z_6aoVC}(*Burv&0B-C`%PDa|8q#)g{VMR651G)~?;Jck814#a6_X@0IkJu??u8@Fa
zjF$nIUzFNOStN!=F|RGjYl<~U9ri~x6;((NiWe65Rh3Z73xJWOn@&a6rY&s642+7D
z3yWazRTX4a6>>U4#}^Zlrmo6egF`87X8?kwrmClkP4Yk-5cP1&Pa8=aZi13WTf%P8
z6{6m0;HsZxJ;*#Z`5y|lvI5y%xujc>+##Tq%$L+@vGNtQO>wWKYi9P$&(SMz;cxPS
z{(|4xN&pTZ4Bs~HnOxK9iwg_?0CgnpsE%FJ?U)n#+AMzR#ng0lROV`G=zwUunIW+V
zH=`x9H96khrw7U&nz~&!t~c1Zr;tCGcL>Kbdz`>QAdo&#(?&}i*N!+Vo^iBMI%c|-
zsySh7vAcY47ik4fUK}t&%5=qJX{v^wJGRFzVs-Ex;c9&^c1^AFy!?^k&fIU8Ls}br
z1opY@aJFupur|b%9FxHw9V0>dsab9f6Sl-;45V>$e@*_%x_w3l97qZHC|B!_VLKQc
z5i?X<x@Vj?D1*z5uVqm#w=9jtIr{`Cp0;Cl0^9Hwwk;z}Sl})lbb+LDRV5@kxwC`t
z6_q%s$E?F~&63+5m!Qi7;d7bcI0o9+%5S(FSsMdG>0B7`>NGejs(LC)n8TXT-|VQv
zytnSAhG|FpZX@9=lk^Dx0AU)2oFOE}2@0-2<{xh=<{9cGXk?GU#zG~!Bj#_Z9F1{3
zkc^-Gfhg}qH5A_PBrXHtTRN60W4k8j$`Z3rsHQhDoOcQc>L+Wg_}yz-=_kFRp{~Zv
z*HS*lM!M&+o|<;Zd9og-ZAHM2#HK?8)b6=yEln3oV3dA~VfFs$NCfhtr<OOg3+KX^
zv>OZl$;^b=Yi)8@Tyd1U3rGB}>~67$!_EGw;IxhtUu%F82LO0LBDikgpz7(|^Tp9l
zBeoJXq~E$AE59t@c;OjJ!p7u~i1f+jcG4Yx0b>rcoN&8oJ<<$u!t0Pljg~bIF+AiZ
znB3FCnUfy>0No?zzl5}AGx%hCnxm*>WLc*LE9AJflS5kj@)0pxQ$ZWAYlT@pm;>>`
z(a8xvq~GX;o+klv5mYU-1EbGTK``3lTm2`6uZ8rwjW~{G07zMY2M%rr!Y&Gf6K=w6
z5N?K|4R56;VRZDQzrYJKJ8G$9wD3Kpr^4OQ^(-+E$;kv`JS#@OPSxVR);#?dZ8Q{`
zW(t>7jE1&Yi3hk^8d)f3q$79)@CuVs>H208_~HZXs*au_b$}pzE_qj?@o(6*G?E7y
zDdrgCC|G)eqLzO~t~<0F5)-C$l)!-E6-8X8NeiUr{H2P%#&77;Pdyf)4(Me8$I6B}
z4{jfB_gVOI;95(5iprX<rW@ybPm+sGbZ_<$^HB-*usC-uIZ`sIrM8q1prx;5kFarR
z`A(Ixmj_rl6Os^Ddkg-ED%#WTiO53d5wXVV<I#YCPqoB%K}$>SC7DfQEv<vcLFx_c
zmdC<^dV1Ji3x@W6F0HBIaAyP+B!WQFPEX2iMC87V{hKB4aFLM~i}H=Aa1T40KFP5d
z+%RlBCcOncknJJ2;Wu%>IYvFc(`#^paQ7S`$ak_v?ZFQqqABZIz+;iSf$o5Ke(Se|
z8{YQ+04^43Gh0Zz^eE~Z{5e2z>`*m&e3b6o99+};D)-MLY~~Uyr;Ag0Xl#-YK2S-n
zh2)r3Gz7(Gw$@KExu)^FgtW7^M%!>0<q-)7+Tst$L9l^7X<7()2OOww$KLoT>gc_{
z!?Tb+kq09v*y`Fi#^7)+5`mnl;Cn_0wUo_;vNG+p*19zTw08;Nz+kB#1DS*UknVB5
zLf2($M9~|%#>Gln)5Ej!glnz9x?fO-WGz6lVlB#JaPDrL*)Be*jc{=&G2@_v5e?h|
zk8PYgC&x3IEyxO1zBvYQ^-Ivriw!)oMqd#m1d|t#81?{sgx5M+W4Z^~NZn16fgNNZ
zpXwZ~RxN@(xxqN{jHGSa4XjU$Ccd7YMwuyU0UyxrP;HgL_;Z>^f{n2y7|5`kOeAn&
z4{7o;ftWflZMlcPgj5qs8+YV<C6-uZVcm~6SxSjZAJJVMY|N6u#lz(s$(Z(7gSe{F
zcFnn<bKMmTvF-*<%=rq094KXV9F1Uqrb|z7I6^j^?yzO<eipupXr_op3nXdqRh2%I
zO|#T!Yfp<Lc__*##5R@NY;H}s3JSVn=G$odt-W57$27QmenPFEOtVexC;3RFV>sx^
zz{z2Fa|s_sV#=xgrrU??RMm9iFhd4>6bmGgjv!!oRQ^ayqQ*Mx2Dk%%<#<8WIuhdV
zOvZeJgr2({VDYry7fq>TayH^Z2=U!y>$6&91<iNqa6feuy+)hz61pchEdk#xQJD@~
zxZzPW!7YyxHNwtq*9He=ulpP(?%dmvf1*!K?*z5C9|`PAVw<-F5W98Hkeg{8?Q5<)
z9#rv$?bzno$TE?U6~Xgy`z4Le0_tN=;Wg2gjuiCEAs@0v`+^*YHU82^!kNc!ApJsC
zzW2a*_~mYZ=woJcaNyuaasL2?AdozJTyfz${+>)<VgCTRC*<7H3xBakLZs}HH#=>e
zdnecs04a@WZ|Vf6i(F#K8P|;Myc>2)b7Z3F2_4d+?PyO?%|1uU=Q<~g<)`~3aK)1d
z?Q4X{=9t&E#^J#DvOw;{BrG?(T)O40_cV{HrD%$KAAZR}u*MTHfD)Ve!kb0n>|7s&
zn{bo2kCf(<dtGD(G>qkTLBT2a7SDePu5Lw>p-$iA2Y+Oa8;A`f=vNW(f1*MG;~!K|
zv?sZau?Y#i%I6bpxw1iH!eMOU1-qs=Tk4)K-zhP5f`o2QDfV#B`AqNGD0PLefA~no
zL9}&kh+0-|2MB@aRN<}{@Ks?TfGiUWNH=NWBSBgZmXgGl<H8z9oYRqyDPpajBhAN$
zBAHcBAR)lD-`NeJu8RD(jM*q4;N2}_fOVPy35|9JKIo@tWwG|iOWODQB#EwhusKe1
z9@Fk=vIY|t@JLRISH^C~6rV$4llv@S*4H)QHlilU^K69;NTxP?FLk?uh9IVJd|ea<
zzK)T%xg32|UY&w@b(?!8k_oxvx^zlRR<+G_+NEsHY0d&1OJ?(Ok+WRf;WClWG+0Ga
zYylvJBd2SI0UuRg83f#O<xb1?H(AhPi5?j7bNhuB=72@=oJh71&KsOa7AaaU6ie+t
z1f&m@hV6CKb|U%DlDIk7v9=JQ!dX>|JX_^X$w9W)UdStlVAzDx($Y4%-*l-VXt0s}
z&~w=HWgBW_AE<6je7lY=E)k{*8cTnakbY8+n-v+kc1Bc}0O2@jK;V0&xa^Z?z3iKN
zWUMPW*ZD|N^WAU&lx$iUc>1Q>z0}TakC2*MaeoMby^OgZM5W;NvTK1S;WUd3*sWFu
zNL+Vdr1g)55G5tg%4C7j^jXwuMqRj{gum*wAX{y|%2@y-4FNDkxMVA~&T0|5omm_?
zPaRcj+q&h99F)e#VQVFGTup)dEbP=pJ!MVo+nn-B8PnH40F-HHY0oJEB-l3VBxVGE
zI!7n!p3zl;WFzRT8xzRl$y*zNz*>L+8CL82ic<wa{{Y-@_`0$TJ<^t9>k3y#6oC7m
zYjRZXdw|;=^W5@?5nq)oaJK6)(q(t$<#4%iPh}LJ)PHqnW=C!mPnn?D5p)AU!ie#?
zaiVK^aVU`DQ`*NoVHz+Ar3BjP?bF4t{z|Z9A)@BVByeSkAS}>84HE})N|GuzUhWEU
zBV2jHbEJ$6y1*<78|Xv@niD-3+V6FO8n;xYfwwPcXzz8K)OweD%W0VT9l)|zB!@LK
z%S{_eaRcE}YMQkqEg-xD;`dZd8s4Dmy!tFYGF66~(@YNaXK|6|`tNiVvT~htW_7u%
zwIb$F)4O58aSFPFqpN0=I#)Q7SE)g!)5mKv_V`CbPhn=XG<^~1leT6$ccfsX+WC&>
z4$EB)JW(>uXanfFHf%R3<<`xzw;-fDHodGAW!p{fbjha;{Z1HFRr=K}C@y@hA9RwE
zk6|uEzzd=0uZfr4CVVUot=7y0$4u8e@o<OGpQ~$CjojHIjGPN)MtRa&L#Wqhr|8m(
z$%A9N^Vx2wXxUEybHLt53b&#(F-1hjxt4vhNXpX)E_k~0Gv}PNibg2U*Hah2d%5j(
zRX(0-F4G?Gs9S%@vEQgCGJ-qdp>Xk%Wsf(g=?LmSRAT3xB!i-&h+(7lUYcQsCT7bo
z)qPK<Xz@AKH4I_w+vKO0mi&0zVOai0(MuOi#LN(^Y5IOVU<HM%{7<4YksI0oD2+ey
zHj-!A&&Sn5AC}3J(<v_%MIMU=l}{5cKtE*^^bD5)fCWWG)^wA!ZFT;t&Yxb6Q|&kU
zCSFEdvZ&a+6nheF5rlhMsr3yxv0w|Ig`#$;9?Y96s=B5<<lHY~#Ko0vOy<cY=&Glo
z9FUBStc+j;$*SUOa^M1@)p~-OnT{rAfHRW47c_{dwrC$a8ZKM{tgqH7shUfq01k4z
z?_BGW=ay1k{O7XB*41kotIp|UvFsGyM*1I#z1Mo~m^sl?I6dDAk{Pu<a&Xf3HHU_^
zQfYlRSovC99B=W$_Fu!Unqdrc*a;ZnbLECdrLmKW?5pXY!}in$$vk837o~LHLQ&G~
zccR>UEq05fLr)V)YjN3IpG}RhvgyHtgnw<aGoL4-wu4HhrC<$>xB4S}CU-(=74g8*
zcL8DNg^KDg#O|KZLHzEe3uNrj;dNedk7A_RwylYQhlS_8ZK+UD#_!Be9Bw^{7hYZX
zh5rESCqoT8>GT*~QBpwx=k&FF^Q`rrx36lBuGK3gk<K>^+;+5l1<#UllKl}#((L*s
zuT+MrLh4yV#re8@HEfY(?_MjQb!|j3wl+1ycv}4uvsKlmX>i*e_zRa3%;mDuaHG^{
zH6b^(r*ZgJ@NRoSBFdwuG{(}xA2Wk--CIdlPY|$se|6v2WV;DtEthspmG%~GkfTtD
z{{S#RYMRwGEG5o($9thECE2Nk&rsOOaUguEeP5`lsN*H_w*LTCi0V$WbIX}a`>bU1
z*6LE1InH&;i<G6&N=a<jYn@*`Npy71!S1Oksx>D_UmTJWPm)x6Zi!bTn&JxEXxcbr
zV{=1|vbV!)U{l$hr?1zT;b~v{t623-duQr#KUJcSN{;s+e#qE#_5u1w-9lazSyh%M
z5^>ZuuO;;kX!uJGk*R}sRY*^DzZ47~$`pc)fM05L;o@F}`HW39E~N{uCwcp=E|FEK
zM9?>%y0HATcl{v~3@mM|6E7DX^aqi)GxM5^jsF02+vuw+W2=?k`JQj`ulF&G%SDhi
z5{J6YVx)0FbcAzdOcYY_xT_d+b07upaSOjN$bHYi39r}M+%=B3(LKd_7jLq{4L%xR
z2p1#5oV=0Eg3r&?@v{%YuXk0%TtfzaR_2V6ds}8nxRh3#Q4_tT?criIeR1<dL~gpq
z*L5zbr%X(4-`oX0ZM_WDc6)B2q>9$<-Zqs~ItmxNcwjePZ=n7rYE6}_ng<c^y;r5W
z<_X{qm77m{gjM@S<rYH^LNGfKD{3x|Yb*c&{3tb_#41P`Xd^FwhJ{&2_=j67@kt<W
zlG`Rzp>_6Zk4=~vxdBvQr1rkpO&woRJvrSO1di&5P_L4zTbq-90?ycNBG=Z5_aK3F
zS*wRRghwZC$lVV>s;_u?bJ)Z7T32+PBsAsH$&fsu!bWmOlF6r+NMAF_9OS3EwUp78
z#zn?3t$NA`Da+doydNtV?M{`C^o8Y=oF-iXvRds)?mMa+;Lbq09+{u&PYs2ojPt^}
zqR^tQjkDD8;dNXLr2ZW}htn2EjNeGt6}HPRnb7I!oZXf#zbBQnlAN}bZ*_neSX~~j
zq64@w?mdZCH5!F|TZDUyMfeKq9U?C#$*ZPhZ+E9_{3`d<$syWq<z_VL83B>Zadoe9
zvoqGoPgq(a+;3|m#l&7omoU)E_X!RMWpPF+{Xb4uSgN{e=^YsLMS%M$jFHYQ9vrii
zT?Iuk+NA{m_qD(g#nlB)txrTtTkf}T6|vK*9{b4h=J-<$7718Ej2C<asmTn|^k*q5
zhNn<>pG}`zD_JRY>Ub|4jr9+O)p{gU{^RTleIkyJlJM^;ZOO8cQHtoHsEn6xbDg*9
zj-fHNphgMvb#1J_OQ&E5X;n1Uw337AH~<lEk7CvI9W?Z@#kx_s-U6uq08!sjXsMhT
z^iXR0tPncPA<`Zdze|{EA`?vDFUl#YbOxI2Y)5l$L2dgK_f<zuL!_v%9j=Pj*-Ykb
zf<d3@SzSv&)oQLGb`PHjU(uR1^j&48Ks`4}8;J5%X0_Gy^;ZxU{{Z?cH>Um{Y9+>6
zf_C%WX!Kr+rg<BjH+M+eZi*<<v!LoGQ_=^zL3=Mh>khc6eC}m9Ww-@;&3{AC2mo|~
z*3I0q)qjVYDSMvx-#5PGT6eZ(){*8ky8f*{xx4OuxJAYOy{SAz`DScquqAJ4bZr`j
zPfjN_?gze6l@zhU-SCDq{SzwoCl*!o=Sb<ygiTsWdFOFO>Kc6`2!@Ee{{YcV^=g6L
zASHva3frb?VwQcch&1-NLb*P|{{UY^8f+SkJXVeun+{PQm#CcjwRdZLErm{{O-D&_
z8#e&4I=;J8TIVu2+Sd6CO{Jt{q}{MRQ&6U)CMtGrd035pqOy0FHZ%Jzoh2vcW(UwO
zb@FVkTccCO8GQ8Q4tPx!D(ntXx@Iq;Caw+*F_z!C3wCt3&k&MnEIw5QReLFA+eb*^
zM~0?Ltm<;aTIkF``RtM8$p@ulaD=^<HFa#$+#43x5TuK%B!QRwo1X6gEbMT~`F%&p
zy7{pyO{Y`B=o@yln|M}IoR-N-DKRPa`prU1$q|Y_2yJe92E%DG<JclK2gOFh;#vUl
zgf#>-8kyZBtZ4ZuC#A8Yu8N8+9)_|~=g3Qbs@&;%eLQ49NOidgx{6IYnj1qaOZ+Nr
zMz)@bh3=GnFLb=()ll4Db_1wUvvGW~9i!z`)mI8K4K#0Y99Sl5`txOBY;ALb4@%WH
zOR>>he1s&FR)ZUCyrS#rspApLr@h1soxG;Ashy}+dY_kjJ}k5vBXqim!K#80j%}4;
zQr?=Sk9%JTaPefYn!9699FhUkDyu5oA%+40<dC$K-7`0!Y98_(YuK!`JylIdQ@)x5
zCA)x*s{BQocwG!|Ii!r@%c<mz9N!$1E4qraP@t&vSm0Vsu(R5}qVX5FxRNpvj;oq^
z%=28dy7spTD<#v2CPLe&?d=w&(`6=srq^n9WXCI*3B}6X({$#cNY=>tE-bS;MySeK
zt3XAsg}kHIYHH$aUW=Rv=d#Ovnvx~c^=h~s=s_V41B7v(S(frVk~`d#7@~$EY9uAE
zweqVf_37U@rHX4b;^9s)PFoqejg#t<zDJGnI`_?!sH8ESpg0S1RJ0ltRUgNFd$*j}
z@QbO_t3)M{R7U2Hh1c=MD`Yvzy#mWsPY`snRGe}gv)boS>23D6X>slpdd`aH%X+zF
zEbn85SNSfVra#0tBl?a?l+-;T;^*wN>FqMNTAOrJ%Gmrg*=i@~nJHlPUo8IsH*%rr
zon!KZ{{W{#T+n-AX!RbetCEn3o3|WYP4J2yJf!Zx=;-Moacq-1;~7q>)T5zo<Cg6U
zA62SUO;qwO)|1K>t5y)VbIE<VYTT`KYHQiQZEY5%PA=!U-v~)%{HeH+;iJjnWGH&?
zPNrqQEL!36s(O#FO=aVzh=6_;<kv_Jo|`=eO)95dVHEX(Gvt&o=#4{6KbWYlhE|N(
zVme=1*6uwS9>9B9X=?_vsW1ar`#5B9jI!&aLmPcCip_SGjisK=!v?@9s3<?zA@x7h
zj3EC2EtNe7Kx$PpZ<H4_o^G$1piiRH`-7Wd<tm#RSjY~D?H%S;)Hbi<x`R;GD_aR{
zI&8z`qUbqwO4+8g3@1I+y$vl~(1%pk2=Cg-Wj%hujDPV3>6*hNgjQXL!-Bi6eK?G|
z2xF1mtQA#$l^a-nIo$GmVFgKBCYtL?*FG?Fbg;`8&}9iFu=Z+|u()obbZj3ew{=FE
z#%-wqj_~D8scY1=Z85YM$;H66kaXHK6)i5CQibexY~Y`pV#gDELe*-N)m7xu$ifP{
zf*A!Z{{T4FTwPZ|)7nf9-Xx5>$VNT1ZN!nfMse*cC4R$Ac7R)76cd<DQzdoyAz8j!
z+M00MXzA{In}o=t>1e&?oy?T?C%T5BN@<*1PgEdhl$v@UeT8Y%I*d-d!UObrv3*T#
zE1LRxc3r*-%(dc``<toBE`Lpxy#}crSrHb=e<UQ7r4Yt2mdl29cBJ9xx|z;*7yzo8
z>GkQVJy<E+)*fyahfUF(NU4f;F!N_CS){FsKTFbzLP!4EWZaM`BO^(xRZ<WtWc1v8
zB-HhHR7P5L8LUSDqjeo7u4xRiQr*Az1wp9CNlXZQL8r<bCF~rd=+0^y7KK|Y-%}xc
zjy#fbt3UK!jMwgL#DaM6wpu=mQ>Z=9ru1EN!<B_kN>oJ_>W|^uouyq#C9-wBB9lSs
z?FyZP_>}?PL(%p6KA9|bj;^3vv!8;2o}QkG_H9$-&O($vnxZ{{le+%^93^v1Wg04~
zw8}bH5*`o8a;`Ioo<vnI9~+g!^w$YUY;S9M_aX%~7=*Fxgg?m{Q<H?hlPaMlw1Bkd
zRa6bI?t8otikgdAg`3?Rmj3{?w_QUkscLsX_P4eco}XBpQvoGYPsNn~07cN>v5cmk
zPgc{p;DeisEnbmLqtwP7Q6)g~TIB^)u+={zHxhZWVLz8{VY5eYY?@qJyB4Nj8a|z;
zX6WAcfAzNLDw^FrgKaZITs#FsTdP3k>}j$3r)bj|-OOZP7f_Zo_hZIWOQPDJR}j1O
zIG;AUezU6|^ru<wXqn!a1NT4J6qC}<=!3*f0DnrU*BbZHvAakS#!aosd$!;94qcue
z6z6|LJe-Y0sn;r8XQYYlHf(O)oZO4&{3xJ<cAHOAk{HJ@kEujz6l|&0DmO?Pz~i*?
zdw=Cgq)ijLLU=(AmN^{TeeHGaM!Gz=Cuq;fRPx&wSX+c8bW%2F%+|O9Y;HTLr-{_h
z1?>(GzT5nB{{RTunWWUAbN24q(Z(%g8v6~<E}cm|L=H9#Xa(0i6m(UMr-)OB?j6vt
zmPq0OjwAtMfc`Af4UIP^3FDz&%_ML#qe-4%+qyRaZz{T)R!18o+IIuN`l4tmDk$k>
zht&b{;=?7SzJA34C#mjn7bM)G?Sd@>J<pP$_W+wI+auV(Uz9N3$(ryx=je}gY?2`6
zn~Nh8NEFm>m(yT%{)nh(q^N<<c(4b#vaggmvg6vBP-K$VbB~;@Y{?+DOk$A2%V6bM
z??0E_--Sy-PWdNm1<85Z2wOV+2BM2jjq?_lIkzI*BNs@|Ms4nM-THt`kcR*XOCfl9
z0ib|vrK6^OMMGl^191Qp$%@Ehb<KfN%Hb3x#N`*NQ_|4461CF-XE&QFea?A1iLv1Z
z%~lZ=YolevZFk9B{Z_0qV`g(%;BcXP2GU!{aE5TtI7sYeUV`JOd!J(Klig1Xq;a!D
ziTF^_M;K=Jn*rroQq<5vAeGK9J_anFE`*RAkW0KaKwEzyO?cyAY+zlykgY3q=2bu=
zWf%ZpKERbmTJ6Qx9_+2ziw!=mCp@yD&S*c(2MX?nmWEPeeQn%-NgdWz?G0cgi}xWi
zDVRn{`rTmJvzn5TkMvn6bBI(LjVtM=4)-+Q1Se@zJUykk&kEkASmnGk#w_8GLS%%$
zXr`vFFv<LQcLT|9Z?e%rtLY7hHc2A@kJJIUJ_uBFbRr#ECd>S486CCG?#~KNq0zt7
z-ehg3rYH3SmfcQObW%NZL9SOrUoWRl+pr&NfaO!n(g6e#d*Nt0a+^ziQzR9UnHqO`
zRyS9A-DghB-Lm>INHBLagZr(?MH-uWJn_vU&GJ)=C14hH$HFgGmX0c>{#tfS&c(gH
z6b+fOy3Mx<lSXO#A>0mbN$v`Zb681jt>EPl+Ic0r8EwO|s;hgVl(FqCaO{>+pr!Oq
zV`PppK;X$nLpTTMtXTyPsiy}+Bv4m0S@AgAcmDt?oq)Z7wC!+BlEM4SKp^C)yR8lW
z!D}d`Xnop2jn+T*p2&(S+S;aux#xRu@;s{z8gWfoA$_HWp_^XU3xJ5D)7ek0Wy~;D
zH~43^;oIuD^TYMB*riehh8oA%nwJ6M>cW#wqmcgq)y&|0-B^k!_gcp3j-qQ%>A%%^
z$7*2j(R8-ul||nKsM$$E!(ce>i)9Y%v=UF<aiVxW=Kla>fA(qy52lXctZ5yvxs$}>
z>}VfrDNQ7Iv2Ii2q>P^716b;Mr$_ol?w%`}O`j15;V0!>GRItaDks4G)^N!|s|t}b
zWNe3XL9&|`xk0iCT5i(0?va3#y6MsvkXbiRhC&=Rn<}weoZNkpRMjkgFLa^owBL5$
zl?!TXVR!JRbAA*<i?mrr;P(-7aD!Lbt;Dc8j-Xp<j^Xl|9Z4kbYK{pVyfBjMq9&)i
zL2ZFZ;S@AyAq_(}0@ei}t&HK|Tj+q4x+7wn9I-n4`9Z@&^RSBPVzuEO<M5-Wt1Ym5
zvXE>8wTG1yvBduXaJVR~3e~dW8N-`{bn->}sut9`2U_HWbv;{T76&QNf#+?H7EHyw
zsM!6)+X`ll);uB;n#<=3K+9n{k%4TdI|H1hY%4<uu(E~s-Od!(QI_85fswV=K2xqa
zDSac^JVtx0F$0~IAE}&_QHT``l>Nc`AlR&6cqcq5TGqexxB`ZA9NXf`HWD3zc|{mF
zHbx8I35CGn!8NiSqupi2rPd=pQA}DCh~3LY(i(Wc;Y}1kjEth22q1Y{&Cx|yOB<R)
znk=K!T<Ry@7mx>Kaa9G$!U9Mb*N(+3qS_uZuFDuT$jzBKx5{l@Wi#9|E`C*e>EW8&
zhToN4s8CeG?^+33_V`@C9?SAnTTM?DL{2Os{uXyoq<C>|!VT4)pE)i5Fmz>F(Z*hP
z?`)0i4pSuK*m)*n*%YzhgZm?5d+ay20conKY2|PtJ*SKzYUr58ZfkOjl4h@>nXyG7
zE^WiSBdBi62W6@cQYJgz+h*6YmMPjuYi*Pnka4FIGSRqS!idtz7$MCk=&UIs4QAls
za-Qa%5U{638wBt??z@L;qFYlL1UOits$9nZ0Js7QzJ$!c_8*^VMN<P{l`Vvw+gfkR
zubq(kmW}1O;FZ&fqb05+*#|j$oB<pvMKgEMRi+HRt~{o-&SxUw4%f;s2?**JJ8s!y
zxbxu_sRG!>zA`<{PIN7FcLaGy`V>!$Z8mqxW2p>o1Q6!(r(>>)Y1$ZUM=D4uppb$^
zioNtG=U{7&$J>Gwa%l5LcfdC{;T~c%RQ^^-<lN9m2cF7yI1&hU)86Q&-H+QKEItaE
zloZu2Af1P?1urkLqUZ_n%suTF`2|EC`5IdB?j8H1WYX(t33N^}x8Y5vGC5r4&dshr
zYa)tW6x&`6z_|HNY>sbo)u5kE+6$w|weYKFrm(qgQM(5#25j#p?mL%C_C2|6zEp2+
z(_z6)xcRcwim7N{Pv3ECDMMQB-IP7AbmkLfjawe*aeRQ9&tS0^vXPQoy~l#0dArHI
zuCP^)4r7hKNnGJzEPrJSx%(!*;{g1vLn|ls59v7x4%ZIhLA}HPP1D<xYv+rgYa?`F
zuDB(q;|VTWe5oaChZzb72Uw;^M#5s9&2BGm1xO^0OdJ#&Ug2PJ6YkUG6{r?TGg=M7
zvW<_*LP%}y2;oPITsuA!As&L`E{*=AWVPN}Y^>=u`q*s4wd@^_DwEW8xW~eLQjd?i
z4kA)!&YN1Msf;ns^qzYj6Y5*GB15h%$SWrU;&r!sTsTKl)J+*19l5>~Tn$XE)dcUE
z#jiF62OQ;>60-jQD^SPKR9s2~G7*(qsA&#qGQdQG;Z_n|5tMC}MpnF7FdwRnHPM^2
zpQ160j5xBQGSl;dq!eN8yl)5KrfmY60Ew)7hUb{wf89$ZGv3jLxcLfm6QMh0h=KAh
zmMj~_`+RmN1tO|=Wr^6_)8WIE*mW0EJNWS9`nd}5$l~3zLLS5Lg{Y^YknN4e2Os5r
zT2W5B1GUiVX{c)~TIRLK&;C&pQA*Lcd)wOzj(s`szj$Gcllr4LD4H!su94PsjxGJd
zFZv3f*lQwtU64WWN|4)$8?^cCl1ljMSP5Vb?m}sO*=yWcCuNf&mIsncK_lT0B|o<9
z8&8qSCwU+3$XZnKN=W`IKH(c^&x<LZWWL!LB>C>9r<Lvh0B!E)^uMyOk~m&$EuQwu
zh1AwJ1!m0{SfX;_{6<+ltpwwR7;A^LlVG09@Gz#?*$7a)a=478-bNhT{a0-qf^YJH
zX0$ij?m=nt6CBrb$WA82+$12{?8y05iN}#_g!k-M0&kp!A$7?P7Ad8t#uGA0+YpAH
z*<HZ0;l>5hn`I@IM-JeNh1O{v(_`|JDGz)gY7{h%%Z5`!oH#f5DO~YvHpNgwh(9T=
zH{>S=T-frF%?nwX)+7VvFtiTVNJ$wVMByeZ<V0gLbb|hDr2~@EGLg*(k(6u+5%PIS
zV4he-@(MyR$L^GLC&4SXU|;ULX}U~{cw0tREy2Dlkb(TSzrx{e3hSI;6s)2e1FkQ1
zBTG%kaFBD9;e&*xXhH}#X|kD<$!k1rZ^~dGjEh}33|tj}$w#3n!PxHwM(AW<x%Upq
z3qk#3?h>)jXXt&$g0ZZOpCZ>$J9YeoOtP`fAhOO-kS%}gm>};UjFi^g;1w*R9AOSz
z=DOfx=$Rrjc0J7_E^a)8o|_yn?EI-&ByX^}Yray+4bQow0|lv)IoLRB+uVyOnJcYt
z3Vk{UKB27M2tGo)e@;m>eyuy2O|sN@HZq)3rf1BA99X0eBaTs3ntbp(Y^-xg_(E)R
zO^Q~Zv!)+tUEW72Eqsd~s-MyhXt4@6!tue%Ry7RZ5J3evJK6ykx@aU`>y5mWM0y-!
z1YY+{EEZk8!1H79q-(bfg@U$4w;8%Z2*}|~=*J+a-q!<+tRF;oH(YY0vt5vw_Bo|w
z#dI)?BqW6+9MCL5N<&;dq$elP!2bXwr55aw&D)&eL~gJeBsbt$Ap`E2xP<M(+%00U
zrMFGn{{V4Mcj>q`@|o%%AK4V_$I@2|w*kUNu;%$n8FkQejr9w#-V>X0EE4QLYjB)w
z1(pJ_zMkxIr;IW?3j$LZacdB`gOkF+2=yEMtz6I#WH=|fm9MbDM!{A*w%-ey(Qukc
zDprBtC<mc7_{vf?kNhX$qW=K8=8=1LT7#fs$s{-yP7pPM?f{=97jccFDUWD%$u=J-
z*0cgRLk29RE+-6VJ@`-;K^QK3zyr1URhq9-(9y<2q-#89lpK^+%|*lBBWCBD06VH`
z%HZiRa29H#scNg_ETX4;m*K?NDd^~G<#2serNsXLC>9A@Z=hO5l-i>qVRqu;J2#b0
zQK@RxvKCWC=`#NSsobl$^!5Q@)nQFX6eA63cXTTIV!6LYYL`NqbLv*g=?{W%u4wdn
zcx`4heU+Ko&`Cno*GEnZoNZ;UF&3C)bnK0`V?g;*MNVE;W`3z;WQLDu?t~p@xx_OG
zK2$P^x@9vP$pnPw7O)#*<zk`gXUT7M$>0RFeL^FQx=A+UxlqaF!a5ycY}C4<CjO@Z
z<dUiNO@5vhmd5SJ;d%bM);pY7$xXPzrl;1+<OD|P3GH<+@^a07kt(pI+cz`TYC4H<
zrw(gRB?LNY^$xvM?t717<OEvPTyTQe_KwXQqBPA`x>+|lr<@CAMo`Z7Wx&^T=R?sQ
zuXt^jq;&3qrqLF=Yi<{wXlGfeAh3|%g{q1AjU-#8cV*1spXkeh=+H?MS^yvbr8N*Y
z0mAFdo32&3?Q84@IZ}VD)du0#`BjIHm93yTMD$53VP;(M_f?vYQ_xYcmrT)bm4d0Q
zshZ|WgSYEtSu<H7$u9ckGVo{Z(0){ddb6)}Dwe*VM})Tc^<FR+muek9tm_qKqPnhG
zq;bv82hcA<js{-Ap;=MWGjnfcNPaU4e4gL-Z}KFSBhK{C!-DV(g~WImRuw%TO{F!j
zlr^T<7s~Y4RzX8gXqeYYY<w(!uT4IoQ0b<W-0_|lNBFp-r4oNE-?Fld(9$p&Wdpzp
z)()Yhjk{Rpf%RFPV@-w#oMe{UMe^l`)GKz#V}e_cAu>s6BR2h>zW$}By^Ns!&{dsJ
z3mRR#73H*X)=o*eKfTfKpsm?w0!PVC)TmU@Z&G!wNxLapfBK2S#?)6=SIxR<Uh;os
zeg1<{G5-K<*;o26NwtJJP(F#Hj1p#BN7Je&aI|iAd@bgKq--q`N5_!0S{98<9AfNi
zKp8exb5qlT8w*8;B{PafO@PzV#2OmbG!LTIbiH&`Z44gKg`6VB*iA2UO~a77HCgG-
z>Nul>`@pctUUS#qje1v4mq8niO;2XGHdOk>MNHJ@80B!kg0XMt$ZG1HJmJrKjmaoJ
za@EoUNg3|4{AKFhd5?!ph4j(88~fRLv$RcjR;hILkD6D!+?TkO^bViVR1uH%7*Bhv
z%1)c4h}+R;*etQaCb=``Z8z}tx^w=^{{UroMfhh_U6y0Lm%p=4rG#5(HcRNj-WbrB
z$|sWO{{V;Immrq$%GT-HdD9~To*TS(D_0}oU^}*jO{(iOum?4}T<-xSq@uPr^opw5
z{Ykejb(*Ums8+~G^$GeR^{UN6v>!$ttUbb_hOVxfr)=C_<fta3^i?WbFP~eeGds`O
zS5`i*uLbTS!9+(_C0G&D#$EpacV%ZorOX%$fh9Y}#ZpMlL!g-?$lZU1d!}e`QnWr#
z@UAKJ=^J7|Q%gZ4qiJygHAq&_39hDq>|kgE;T2D*u#anhvgmXOobk9Gc_!-G9V(I*
zk7dewbOzA{Jz;&lp<2>AdoDtXIAUSL1{Co<tR0c90F})rvSDkE1{2#Tape%g-wO-`
zB6ZZPjoetHSkQBX=Z1lcERA5oCfd&BM)(?V1=P+t<v~4MaE;C&S#E%V<<r>w$S^#h
zs~bT~#~19t?y9<ztSM;N<_T^`03KJE^#@Z|*U09z?rRCa2au7w)JE&GN!1$N2ICbu
z4t4TJWkXL;XMLJ^`BW6JO;I4QaVPt&e@*B!I!3+Vgku3*?69KKY9@~gXu4Um%X)!(
z{BpILWg}pOG&Ekw*y0<BDbh$?`zWaTQi3Lr;545kD@r{Qk}+Wz0a{04*>tkU6HA;z
zErlck>Iz85`%U_&XOfl?hPL5BsOoXH;e-;XWqoC2wu<)dlapbjgX?uB-)wfjfVEu=
z%4we2s>4C~So$3zX1G3IaUNEJk|#vV3yUX=YhuXsn$1^FrKhw`ZNTBHC93Mxb$f(G
z&1#{ptaMC1<M%0aJ!+YcwLxh=R8ot7vla5K8UCT8tEqWr=QX6{`AyNfdrYQps_Pj!
zB%7=5rLHyX*+&5;*dbKYP*ySx)g-s!7sm8uVKowv&rX;E6-<=#MJbwW=J{4MPIF}2
z6G1mqRq2&gZQUd6--K1Jg>K%?)9PuYXlNUq@D-&2rixJ`t$zxcl+UJ*XuuuQsA>x;
zT3pS-_9UY$je#U-wGBd9;`HN&%{ahAQ|M5=hNf0Eq~zUP(CV5r5C>GfyRE{g)jEoT
zq`D{`8sDm9*ZT*vIjvN~Pce=>v~q!@)MPUO6l9}o+fOUEH#a#z)Kvaf66m98J+2g5
zcV(4T8WvWVsf+3!(QlPX?yHs6f0v_ZBKF;NnU+mgRH)kbmPN&aywdu13ScBNUF2US
z9k;Mvv|hc&qMOvJlJ^+{vdQZDq|~w)sM>z2?`bbFG25+#7N<ZP5tOpzX4d6V!`cx`
z(V3N+wy5hmLIGF0S4dZw0W~jZJ_V6II>x?j#1;$i<-MbYo`4OK;>t3nJW=O!ba7+-
zNh+M@e3d;Ool{Q#07;V_zeTaAr!JdoNONwEjk<k2SC$axSp@VJwo>VO1ST;w)kk;9
zM^i~pLss8XK=uR<p)=m{DVpHh{>V4UVf;W#zEDa_V>cS3c`mo5x{S4<xfrlmT~}6Z
zHBodW&1opj9$I$0bwhw}f`sawQ$`RLM%EYkMW@>pHRy9SIV#}0r8ZfOa-f=zNwrcN
zoY<#PYINjm4Rc%A0FqzJPcZc0adrOyQ3$>shg0-VrfJZ&A5b`#9Nd*1L~k_$^%xki
zPI#0vV+jYsI)g#o7@AkT&N(46{fWCo5>_@ib`TBwsA;LI>R;;8ksr!7eIBA&Efi;H
z%7VV4uS=)d77qzrXk{P`dWTjm9;T(X{fV-!)8N!#HV4%M%6%MldX-?3vS*Qg<!a*6
zrF;Rj&KI?TP>rcoY_IZGNz&EOQvm9g*!Kk=s%wp_v{cX+1MziM-43cFx}ohqMPn6I
zI&1`rQy~M87ebttq(#9#m~Nl`pHEHd)k4ObWRS3(d(?VtPBGDzlYH4bTGwi|N~230
z52tB1$hFW@^tCaB%{dQuJf`_vmiiatr=qW?^-s;r8eO%dt=&BI)X)O?KsN5Pnk@|s
zS8t-$7Ml!mv@NEkk*yA3Av9;L3n<rMT7)p_(Ge7+{R+%YqEt}S0xD!=MC1oqZKP(K
zLf!E^HP*;kJ$zQ`PAsJ)u=q(iCiXO78w4#h{{X?8)RNuGt^WW(sHm#nRO03y-H}~6
z(i)VH8>@_DpVCV7Jrkg6TnDYH4ZbdlSGooLm<o*^o;Y?jjSlicc8#LM**8DaBb$Zm
z$MEhEPG9+<A+o~trkVbc6WUw_yd|1%vEx5z9(r9ALR&3EVmAJ(EVX3?B$JlWJWrm+
z>p7{!+RBn2RPxi_>hq*2sr2fGO3H^gUpG^D@1mb2_FK?&=A>J=!Ws|4m;V4q>JrR0
z8-2N3YJRWNX=ucAJ}cX~${o7z=YNSovDxGlRG(BVlwRznXGUuNg|;@<@7+;X^hIEC
z{KHS#Y$nt?l1J=??TwwuavxN7yeUhcRRhn0R+OZLidK2_JvBWwU~5C}4Z`&PkJG9f
zOxBb8tSvwK^=6<P_5d1iL0gI$>nUkLG63s#C@Y#7s%DC-L5iV=*Pg@SQ@f`$8fk-{
zE#1f@Dh*qzD`{?A(;)u<>Qu6IWR(sF(Ey*Dq*0oBL$;dP=_Z>;jw{CPpbsl8s@KIx
z_xdk$n|xTRX!VMT?AzFVRCQ)4BmN`onYpdV(TrI3*MF$gh#x3mC%IR#biR^ly-7Ao
z?sBsFZ3P6?S(KL!`<33I6=gjU{GCQxF>`cO(?UuOGPbzSOH?WJ$~SXsv|%M?k<>L1
zdeYKJMZBRjy=zvdtp5P2gucfP0c&9DlO$ppgP6nIsoRU%86^5=m(|CrHmJb*X_!Cy
zaEzzWs-|Y=T>k*|0=<7ppG&Hb430?;lxrx%CKCQxn?`s}<oifGRC{NNGo@#Agua%|
z@&eFlJrklz*1n=gM)BEt`PMphuo$Ye_=~M<1%vA6(YfYbE|Kj#fD$aSvq~{*KvU@O
z>CqEJ8v6_lsy!xf+KW}$gThT8Rn_HhqBQ3?{{Y-MRtKkbjY-0C#=-DaILWb8lyqCm
zUq;$b`g)f&_QrTv9ePb>wzFha`=cj<RsDZYYV?i6<CExZWl=pQqZlSg{oZb!;}K-o
zW{IXYmN6w$&Fyk`T`sEnO^0OeJ_XiRrTVAlHkmfE`S&eOiKo%jzzs!Ad&u&U!c1i)
zWo%Q_ow32W#Nb^@G|f_ZFHukJ`m2^u(9l%+jjCjg@J|ZfJ%2-v9j*kp4#h{0_E()4
z+U+5xBHznx`Bj=$heG<xRvF`M?d@>^Y)?_p$upvgEx@1V36+tGsJF4KVeN!dpJBN4
zO-<5z1hKS5S1Voe>#3&vJg=3zwEajH_TDb3sU@n4ZLM=$LGrKZ`i`!WD>z8d2Q4>Q
zHy}2Vi|Q_s*EH!bT{K>u{{T};hfLF=19R$IFa4z*)%{e;)|Nh5<njo$mO33t&XkIH
zCIs+RQ{uLXzuD;8hS0?x(MSvYf|&&sYu~;X`Xcx$t3-oRsgOxMK#Du?M=Q{Dm^2^D
z2Gv$MukUBsMWrcQ9XeD~Q_HEv?3$}^9l|o6wXnN*t&?|y!X~DJO7(YB*1Ut|*Fo24
zu5&L2qYH(&;Hq&?p&XhDsp=ZH#9@wRzp~F7S87$;DrF1==fOfv6m(TD_3Jh`ap0h4
z*I;CuV~{=GcumH&U~bP>>8&b;f|PBYgpUpgex=rEVu8@P*ZEj&Cs_3xV*H-O**{eh
z%EIQiakpc1K0kJDV3RvXsi^fBCf*J0bYyj+2LAxlvO)C=Ick_@->`w<T+sC_RE*hE
z0R!YG;VLqkMWr2hnA&0PJ*<Y;XvC0{6gMZpP)n}SRc4+xhjt)k3f)suGVKAusTzGT
zqSe_Rm!Ys7(^Sa9?#A|3bLsHY#0+&Fq57d6RXf|dM*@6ZSHDnqud&Z_0u+MfY_g%$
z=Ao#xl+2Z%Em|6S?Hf{t)jD&V^1?#TiYkh@FAZfgvHaLX==AlJ#?N55<btw{Oywd?
zLqh4dUE%dH{1r|9pQT4AWj$-6J+F19)TXO6=FE)alVz2boxZV>q%h|Aa?T#m6zj6`
z3VO()yDNQ2fXPd%%E#(bmS!eH=|%@|8_(`ak3*=ZeHCEdSsYR3=egj2WgTcNo;h~z
zU@v3-;AMI~9x9EqkIBh$&;@?TwE*~9>rEKk51Xo}A$<f6E+=D&BwPEfJXEfz(W_>K
zyQ&~%g}?1^AK?S1QH?^K)Vs#_vC+ExhY^L?m(k0AWK<NCHI&XZ@_J>CykGYlWPgQO
ztUSRJSp!5&ap9?Hp?wTSg0L1&!?~oM3WC0KETM&-=9?4Pt=L<ls#&Im?it!jx9Q0#
z#ZZ>J6zvCa9G{}PtI}v^(8RIET~q+iKrp}9!F9XYXX;~PSPOVK0R#}5gBGn-Ak&y(
zm>a}gZNA*!?4_uucc3IJ0mZ)H4aNJRbXrO0tZN|LU1CL+#yuiW^syZKVtDs%DY`=1
zvk?R>l6G4m#>GVst4~uTL8RH%Age>CRcUgAJ1);s;o~5LcCkkkx`Sn=0LWqvdqL#+
zL9qV-vXUxzC9h$vm(hdyinG<~dS}v#mW;_EZOM=`B=}Uilu{W8c(LxQ*vm}ff0QEI
zT>&L!wux65>S`EvhR5m)j_Ymshg#=MBWtYC(S_vDO)OPyt7Z4G`<i}>d(`!9)M#m|
z<I7}-U%)AQRvwv{nsMrrxP#?L*UKQo+<xc@KT$XCpA7DdjfDJyvVUfvy^lPD_gv<i
zU%l164Ik$;*VRIIIx%-Jaus_frFjf=o}0h!7Efqh*sxR2Gf9o4n{W`uH~Ph!9Mj_5
zEv|)E)7pI}sa0PS=Na1GRW7I0Fill6blOG${_Yw3AlexwS5$_@2Fs1aaDxKhbg{@K
zaWc5?zEr-LxUn|nGGcU3M*Qt|0wPA1pW(P4KPWbldjL_it-IUuoeI?gOS#P=;@#9u
zkKA*Gb*X68aZ?(&S-G5$-a?~cb&Jop>XnSTJp-mR+F?q`*&W5M;_k|~spo~-jp^NR
z(Pw>Ebk9)Q5d@6@w-+7K>ybq)znF)=>Ip5_byNjKUic+zi?B_V%(XF0eG12If#dao
zdn~NrwfF@67N&xbR_M*%J;Q|3Xwg(l(s~^XTJ&{r$|Y|XwhFZTOX=7usb5(|6JwdJ
zxoF|RXLLHLG@VpME!xMM1KDf!+RM-v8xTTS^<iD?@W+DL2p0zVMAFncCpE^zgTV;h
zUXh}y^00eeNmY+&jl@_Lk*J?juc?NlRna-Iyo`g8x{|rNy+Hi!8zY~)qIM74vVu7O
z05Kbz!EQiMP|E6Bp!WhSRAi}?iFaA1Iu`nn<N<piVu7_4QM5P#FSPs>qK;P7Q?bF_
zva;HtmXf=4J&pFPrCMg=dqmZ=l2A_Sc|jI82g)ib2#JtXW}aNfDE>!z2gp{iYZ`v5
zL?YBEWn|26`;E$M6jb$8l0gGs=>u{+eEce?@<O*n)U}19WkcF0Z|cwL`5#qfK|D1t
z*y7Uf3o!a;duS?OXRzL$QH{g95Bw?V^!Xzj**n_rs`5OHE)qQqSyPWj;teiFkt9uH
zyV*LTrkb2=t)eYx{$MV%x<;v~P&fxXOy8bWtlG<~n`xo9mB%Q}7mSkxuBy?TNQL%3
z5P(z2KZPLsq3bAMl1=T7#Q0qe2#+^6`l`k*yB1Q7^b%S@uqnZ(hh;J_S%(AlAuG4?
z%MhQ4EO-_hgK|4rO&nr-4@sroETM*1gO(Q#_*WE9W31*f#Y%a2b~Iq+(H%cb$xt^K
zuzOisQ1oO+1~oMfuUkY%vwH_+XCGJ7j7t$?kCdM>mqGa2TLgbZ!r1N{S@%?Wr%Y7R
z`<WwN-ov`q4y~a!5<0;JS*y_2wZ;kB;qX!B!NkHy*Hg$t+hPiqImac)?M^uA96%oL
zDxzv<uwll@(@(H8(IrdSA+wq``9hc)a~sNZb`AGCKRl^nmL3i)s)S^0hTsD0rn)CJ
z-xo%DbpHUUr#}TFgB&e;A}xYCn7p0}jKKCC%q19D8ZW##GEy!tbgn-^vDB3S5Z9X(
zV#l|TRZhk|mv1Q|nb11Vxj{<w#{U3C-s8p7Zb?JMJ6zFXr4Dg8$}Gv*BMBzRh@%9O
zL9!G(xc!kd(-Hcbfuu@f09+rkf>&)eHnN%1HNe>iE5UV%N@Upm!7B;-D6mcnea*6%
zajs$Ug%hGV#uV%}z&xn{CzXW(Y-A~0xN($8Xuk`CTV;$SE^h3b9_n!@7zk-t22%vP
zaeN@aODvx245%K~zm8L#D_w^Vx>g3*SdxkbgP5#N4UqLz#lQ=j50z>&a7D-XT<Drd
z{3g>j*F`LFH2Yp{;TuUp`0nT)eB|9FT|c<n3cg9}X`D+PcJM(-DB28VOtO5_hlahQ
zo>Y^}(9D%gHIwRrDBFJBm9rv>t`RJDT<#Qf^GyRj2&ZB8SpNW&476e}9Ls_@vbUD>
z@&5o4JC7j;x+zWKlk7rQCwmNOq8fUMVhwKN_wKD=u507>uv~am6(qUV47nJ%O@L1u
z@q2hHRfMps2B4E`1ShLCFtc5D{GzF<E>Ei4D76N{@$7SWOLQ`gqB&%Sp@pwwcUzDw
zv-M!XF|ani5z{!v@aDTI>}x88q;I)aG7+tn%#oynWOY4AZ)|u_O+@w*=J26u1CXCj
zpxJj3rKvWsW4wT$B|NbJSoXYp6;lI<Am^239ObPSxhWc>5kGUB1MqtzDQ2jLF}#-j
zaHI6SY{qVUCK+8Fm_f%VFfzg>M_B&=<2AQDkcF?(j1DiSk>LGQacTl5TW!9f9Uh?!
zfCs!b{!%>#FJ)ymqgP7c$y>Z%H{n{dP@t)9=fom+kT8a=ju*yV?KkcfLvF%-GmG$<
zD;cv!C1}5<@aFs#9ch9{2sYfR8&P00WZ5Jp_d9_LP-3ixcz`(J4Cu|y)UT3Oy4Sl(
z=1L9?!lX)nvNvMDi-e%~HdAeD_{w9LatN@$WI}Nu;Dm%@CkvZ!Jgz3=B`C@0jQF+}
z3lYj!;WXH$1&ZN|ri+enxDpO{QrwZn(hSv{*(^c+$^QVrdkbx~-c)6+{{Zl$Xy?j3
z^i83XK;ZMV-{_+!u?k|>gLd2wES2Wt+|hp_8xIByZDVBK2MPOH3APhlEOMNav@CKK
z;{<prW_oYH_PIgY_6b;h!pOaXiJZr<c?ZIhDW!~D5b!%5S4SuvvXHf<+}TKJB4JR;
zu>SyShZ~Z|Sy@hP47;1)<qRNmuds*xRC^?gf_{gxZYh%g0A-B2taCGEOaZR)0*)!E
z%eOLXAzL$K_RP)0<CN1z$K2D)W8j>v#RWzBE@Co<7Y6#QJoh0zv=r5C1(JGF9>iHu
z(@m&RN*oU6j?NZWbXuhiQ4FdADGz=Slv?Ol{ex6cR#P~EX&Kw)1ot>eX(G4TYbo0!
zS^OCrJb%(oR25Oc`;ay~b_sbjYDFAS?q%V9hjyHx>S#zL?AYRY94m>TW&NjV9m0gZ
zcHzzsA4F8e;>s};vAX~f<S82FpKHl)$W~PmvFreQ9q<)okv*h`WFvNJqB)DB$py{q
z=KlcUItqy~>AX07a;JyW1Cl-oO?(hJ*S^Pj@|;^7Dws{Bk7@JW5f~C!#VyZ*f|@BK
z{X=_xiPUe3+}i$Dq{oA3CRgn{UfXB&B`vrGr+3Isa1OA&$M{?#BP~C&lSh6zXl>lz
z`-jRvTH}kf{HN}=94?TCyM(2zjo^X8VK(Qwlmgse36C4E*)q`?#AVt?xFv5Gx6w7t
zIn9#>;Bpl&L^#tPYz|G5k>7-yv2Ig$4iXhatclMAw%<h?nBmAErE7>dHdDngKG{a^
zlu#N3HynhV=IHm+HTjL!KPYJ_q-(NvrcT6UHYDSehTz#f&3g$p`=r`!dxDro#@t@S
zSvA0YQjua$bcW#kqe9rNwZ?3GsT>FvIZ<Gor4Az?;Rmpxa=UPKgSk!*W3cAi<tSrZ
zF47O(Y8+v;?l@cp#nYXR!6lk_Hc9AYFt-^000}HDboX3fWG1_g`B*y|0S>qqDa5tT
z&Dv59ep7&P9h@w%7^3(i+&&YUK{f>4M$qB<Nd+h;`P*aglorVyamcz>hLPjwnYe-N
zaB%RHJ)~e|V5fbG#|z&C70+u)_I}Bwr8MC4VzNO)aeF%n@1|?p?K~zIo8$r#GDfuf
zO}-P^DWpL)Gnz8g*yffij@HO3(m9&;`<kPcmML=ET{VzshMulJP!}{t;oNYp=`~qm
zv5nx_XXT`G9f5F|$2ucmP7&k<9$GgP`rH*U`gO21{e}~2G(9%FZ=;*iaTsHb?6K^q
zB!O}YDw|N67c{lU=PA}i`yM!@AL18Xp=uOaF_*Xco0VK%<{LewX!P!;nT*)?2^f1h
zR_k^2Rc_qan-rfN(#wyck(|1bUF?0WV|2$sb9Sii&_>q_q9S{?0&*0(DPYB$2?Ql+
zv9ME4_Pw|nPylV%SsSxZ{zcLOf}^<ylAY>b4sYzX&9R_cHswt2_O-r>AmDz<*Uh=Y
zHY-OtqSv*QC644C>Tgw}A7Gp|lZ!24bPgWiNqD+a8t%g7Nh3pzhzbV>0-Q9N(npI7
zsNCJSwZGv=*B#clO_Id@mIFk0BpY0={{Zilw(WouY*9j=Of<0DATBP197(vUX46%?
zT*^TD@}(5>G;&YfbZs1W=(ldmT#@^xnIZ1rN~d%+MEj&IZTMC?eKP}ZDY^Mb=luuJ
zNs)kGfTA@KcOfNPp=h%ma;s*fe7W90_)MD!e6?@`Z&N-OHnN?9<-n@gw4zP-6ZI&T
z=<RR@N1viJ=vyWK09Amy+Hv$x{{UElo$gT5>9p(_=f{;_S}19AE85?w;Rj)|<Nab2
zoBfniYqacjt)G&zlWP=?COSqLU;S3VOpcyvk8|!Wmf5Wu8qTYyh*&!3z*N;;TU$Gb
zf}Q23x$d7yqBci@BDwOfD0D^w0BFC!Mw{)5=k#UWCcUW}I!{4_^3-mf(=Z7=N|0xe
z@?LJY6uKZ0+yF@Ao&t~ZjEX`7w_6wNg-|ylzLQRZ7KX8ad;pAPF}0f1R3b2QlB9f>
z78Yn){>@Yk9XJCgDbfHq2_~tHfaHD3&g)%Ir_lrIPSQtUa*@t4>@kaF@oP=)ZagY&
zUQId{lTj-N)T|b}*YijWbU?MI`HogPzg4fUl)72o`~2ZADNCdpQS8}u2Dhf}F;gAg
zt`$8kQzVk*!L9gN`btWf<l4rP@1oOa-8oqD*SI(n+T0-U%1W%?B22obv4?OTn>^no
zRq7Db)yc9eka)V(QRt6rK$N-X#g)|tl?+5V?F9HskHmyF#+GL#NWp3S5j_6@#F@Yj
z<g5K7q-o%Ivv+)uwk(aHSbztF@snUJWpt>TWqdjXHqX)pz7yin>Ee;32DA=Um@Wd>
zO?V(&f{hx>JvzQBSoT8@HttaRoo!uZ_djEN4(K0OXyGW8&)^#+abCl8NeHpAQq;^N
zVJVG@M_7;Wk?;pQ-b=m$Z$K*yv&{3cq@(E|kT-PC1K=s!9>&>?00hY-3>heBHS|q@
zEYJeuIEl9|u~d4dzehsCWSO9j%LmjQcPoq8M&F}~lgPSTAB*;SCaJB{Q#86+THARm
z53Y6K1jj}TkClR|)GM_KZzPY9pCwr7S_OS;hS*#|LyV=^9Fpi|cB!iB(%W;$JOEU*
z8XbGcdz$N?0d9JCqumhSJ4pWkv;}(jqo*F5A`EEr%6O>9LdnWS7ftDIf)F0dxcOQZ
z&@kpkg+8BWn>1s}E@oV9Y5S*a$bt$=c4uh6(Gmjy_Jr2L8qQR(#yKTmk7L{gjnn;S
z0ou!*v|%>w48Z4vG>u~&P%fNq>=Vi!IBzE7a#2i$?pYy-{U&$HA{Z~g7E{LqS}yFB
zEv(!C0yZN;F^y|&$xU&0Y$dn??%`MJnyob?PIIMeKpoOHmt!QtrIoA~c?yqM*Qu!D
zbDtwxKD?}7Q+2=&d{k#~{;t7cYjq0ELQ-UqoA$a+QkO$N)YbI|TT3Z)bcBKZMFZ3I
zZ>y`{Q7Jb$B&xkHM4qY5=EZILccTr&j&r`rCx@D&Ms)1b=~VI6#>k+JqZumLbTt#(
z>P%W(?C_nV>9SC@qCR}9aO#Et=gIa*9wm)Z45sDSKA+K)aWoc?J^-?Pc9Bg;!a*4F
zS3gp!zR2BS<yY2;>P_UC*7#Po#H4{_bbI!*BI)gp>!GD<3Ms6xx?m5};bA9ru9mn$
z+Xg!B?xVed0_rl{-D45o%HrU73BoetYjUTG27#5dY9WQLF2F`azy;p#ut)%HfD4c5
zO4*S%>+!;lXYCgz$ZD$SsbeMX0>hPy>VC4Or)!xL_rI_S9LJ+ct7}yBahE<pk1Ni4
zo2;KZofR=Q^L3onHG0iTQ@Q29oHQ<=&}*u!;Ta)rE?tV`mqmQiPgO4Wxz2I<y0p=>
zNot-8m_S;7pXo9j9a7E9Z$YEeQ^)LULZXU7TV`WN>F6oi*Eyp907avtq+~!?0IVX@
zXOP}F$p?h#Ad;McD6%clhOwXoqWL|OgPF5&aIy-fz6i-~@qemWNMx**s;!VTl5(?p
zo~ta5EM@G9)T=4p+&g>8;34R#SoeqQ$`MXXFGw1Ol6seJcpx6jO+il;G-1vFA=vn7
zTX$JzdY7wWrv@k<9Vy|Us%j#3YU_0f+ThW&9?A#LTIfrni*_)u9X~#!UtZdpsZQJe
zp3BgwHAceF!Ue36zFHccS(?<{txjFK9jqP|O&jamSkdS_v~oyZwMY3Xr~{=91o9Ir
zDRju0b}~DWfD^A7J=s5-?4#3lnpzrh>qZNJ?iEh4)U`F!`c#y=8gX-lHlsy5=PzUd
ztiL5j$3+<p^!E|)i-S&>RMSDab3GV6SJ}_C$O^wu*XpC3M#kB<?5r6qTP-AwXgz|b
zt$YucWHFf@O@h`64})2vV+-nEe0NlOr&9`v3=|P}w%`@RI&wK;Y_%iWMeMIM4Ld~+
z^n?w#_)Eo4uv>{uqSLmn7W%;MBR59L)ASIZS9@-A%C*-crJ#Y*#TjUCV6ri4b5}@g
z9M%KDLJ-|p?no}C6L&{Q&BwB=evzoi>(3_E{{Tw2h1D^*7~{C|iL8=SOiZA$SAvS{
znw9z~*(RT-i%TFc@Cu*RHBoPi4DDr^n@*0iR{^uQfNr*w6!g?IV)?M{R#LUIIQ<nA
zwee9(eQ@l5F<q$jH3?{IV=p7HQ0gpprBSjd_KWg}gQuxtXnf9TJe#Pz@%t#TGO3!)
z-Rd$QOkcu|v#ck9yCZo6y4KTZT6^N$;4FS@fRm>*w$He*VBabke1#RIWh05V*-4}I
zmZ14I!$&N|YP8eTdb`_d0~=3rQqdhhP9e;vX}5KD&bX$fh<a>eNbI;Do1fGR{1LC@
zU1<F&T=<8o)&fydejd7GzDbDq3Y$gzPmT2=8JrqC-EQc*mI}B-n=5iWu590x%JkDl
zkBt@mnfCNnnE=~6OO%oHR)aQu1|O;~T-T}Lh~49N)p@SD*4m77y|iY)cwTfo&nG1H
zZ5<y35;nT0P3UwnmkM@VEH1k}1Pynh#*1*XI-gx?Qj*z=jr)>=(yG7Jr!A<Eh7+8w
z>{vX!(q54_JWyLYZF!XSfzNOZzE+Bx@dHDKArN?yOL1jWtZ2PI6)}9Ix%TsXs?8gw
zv}&onSlZ_Ivicl&9Acv0&Kc&nXwl8qvPcPn8!+)@j@EjDvZkc_96`nwwc0}|Te3K=
z&NxTueK|=|&BQdn#gnAs_6F3KWiL##)}{`V+TuGc1uZ3eqynBo*7r72ROu2>Mr4i>
zT08}n)w;I2ndX`%7<(5uDm;<;C&B%iJ$ALaR6FXbgPc1Ov(WXsWNVr!?%yjo`Z@Kv
z#MPREp3-l&_zL!iNz&kGiLTt`7am(|s*{hPI-Od2`K?U=2gpa#Q)==tySE1TD&mfk
znvI^TA{PSaN%dO#sZ4N0B4_m;>v4)zVNz|`&xR^k_slmCg^HrSx<ef!cCcdSm0i>o
zQ&Q8HPdi=k3hs^8qcZ{l9oCDdpv_tjsp<OnJUXIT4bgO(CZ|mn>UkP({XuJg^$jy=
z05rko-W5~zH`kKZztC;dYWB(R(Tvr#{aa3{bvxV|@!h?Voi(rPwKKGenTv1sL~B|d
z5vly_)i0g>!Xru5XyR*W>8P9?#_hOG87Aq1P-|x8omDjspZ@?;QNw$c=KW9Cbb5tf
zpymmiyCqs{8cce#Ej-U-Nc|w$P#%S*Y=!X1O}HefPj75^rk0RJJsz7`PAUXVU^&9C
zt7C-!0G6a^y_SbV>B-|eB+O%r94nfL^j$5R>H`DEe(ARrqj%ZoRXshc$bDIc_I3cP
zO%k@ZO^?$MI?e7vw$%EflwFi@gV+*O8f9Fyj|J`a-u6k#RyP<>Jxym(YVP!?9qGI4
zVvN%|bEu#muBle%v}VEAy1%3l(>y(}Soa_!DtdyBC<`WV<Ach2#@72M`=_HjS*=p(
z><rp>4r~=oPgBhB<4V^*zzBY&>Ka2aY*bEo@&Q0-okvF<X!U7!wD|}uaa)MbBf4N!
zwS7UUR2CXZg9+p?t9=`%^%+_{L+KZHc;Rofp0&_vX~A?&b-$^qcXg(ns-H@iPh*e6
zY*G1A(YW61%CknOqKVHn5x&EPjp~hBrXc9s8?Sys^nFq)x3ko38<^hy<)38@HB9!X
zV{Q$ADPB%an9Ch2Mhir$t(KrTx<&=+y)zpnqiLF}bB|{f1zwj$1UF<%2jO>59Wc~v
zo?V0<3zm5Ap_J)t)S7yD0CQ=?o@}2y+B2f`=cf_7<Rjpv(FHc<)!P@uii1;<f=L|=
zSC>7F^0HN?!1uB@zKVg~wH(2=&9BN1e!Gy&+CeqJHa036%?>xlWZ5Vd;FD#ate}aG
zKbNC(-Q;qpsj4K?TRj?rt51>vEXA*Vulkinztqsc;}s<^aTvYUB0WD=mf_8sCY~};
z^qM75H+g%$N{rmoq*f_3X*7zxQmMYHBMc|OPt~<;YL-09ByI0x6&a}0z`Ui6SB#>k
z)+zQ)sKhVi*>uGx9rkm{w90)esTk+&tg3XE<Z`U)>nUc3_zjru@3h$lbP5d~q)N(&
zr5DZJb$Z=drj*A{%6E`IqbM(-mHRQ8j+He?eTis2)ioBJ%6g*7E1uDQ<!UNF)GKP7
z9T<h9xZtY&U#49+zvhcwY}rOjB6hkiz9y^KWHkD0P?t+qB)2zm0$oagIKfK?s(iO9
zhyMUey|NJc>4QPd`z=RH>2&l(zLcVGk}R_QzmSbMbbz3u)Fqv-j*n{({mWHJM^Nf}
zNdv*Pjhu;^k5-x^`8qOjgLRhFW$NlVOJ<0%o^QfwCl#a!(|cr^l^pc5nW>BZj&iN5
z>I&LGTTmN+H@fI(s<l_2Usy3a>Z`TBkgRl0KkFW-?Tn<1qwlfgq`C*6srQ24LKok;
z0S8T~RC?Z|P_So)ptRnXuQgjkjEukYFH-4#nWKspne^yna315iG~d{ePVCQ7YC4U4
zVxB!M?<crzmDZK`U#;r$ws{>rC_RBTSJhK#`cd^Fr~J7Y!Bc5JjAKolQpzKhfZ(_(
zt}*mdcGqH`!R=Z&Zx*uln{ZWRzlYsJrpdYWteK;pMc1K4_>&cU8{&!(NX4G1buOu?
zsCj5Hi|`P6SD_;r6tuJy(SS7yIHY&|!stzNOwj#3(CM_`p8IU9YM-l0-Rxv<__Cp^
zmO%0=16X`;nlfX(0O^{2FsX3Z%NzlI6@_&OY)8-}Keld$cA=og+c}PGzFXZ_R@c0n
z(n#PB^>$3>=n;kN8naK<3(Lz($I$~&$l@DoV<Wn@qt|LE&g#edvG{A1-8Qk&+N?lU
zM<j3J(lX$wyt0pIcB0HXDrlJN(}!*!2)0(e<TU#SkhIkuKhrLg)}jpn{{Tz>0O39z
zFHU9{=-=>4G0zvKE5$C*CXJ?3R$1b)!QH}>Sn1a?BItpT`2kpZY@}gy6h!>7Q&#mO
z;*iAn=ZC>_3N5G8HrMh+6(*fq4Q1tusj%Pq3g75jev?rPN9X2={v2#pdWWd$!TuMc
zJ4a_L0o0$F0x75>Vg9D6ILWb;l17Ss3rce~Rca40_u*0NJvq_rjJ`cl%y8sxz0>2T
z6>YeX7N6x0vbfSZZ%KPY>Y#Q0a)WZm>}AGpqba57RPWJhjU29f9aP2(jzAp$0Cc*v
z;tE|-f+qTph2EC&*x(cUg}JPz(<o%7f-6T9g{L^-;{O2HEOfBb%c^S*jNP)-dW~`J
z+plZImn>-V{FPH+`VOT}OGz+bCZYB=cMiDE_)$$X5Z5zNqxVSbJ?sPdyRMH*6#A1X
zYOD*$k)K1^S@k}c?Jro8SXkD;=-TK=7y`oo0OYQ{C9(_Y8KDa#s)l(SWoUTZN#&&f
z0O3QgY4ho`O#xtiF(L6t1@6*tFYv5%9SWmSs+O7>lOD$J0o)Pc6|S;*=5C)66Np$h
zHM#7TT4>QskD;pR-4#qVX4|Y|Kg><7V4c<7IM!0TQq#bWHn#7L$DbrBZ6AF;xk?H2
z?CaU$!|t^`ai|&S;-rk0vzZANzsJfA`wq%)!|Hh*Q2D(wK*h&ocVARgLfC2Jn29CE
z(fvOuIy+Hi9+^_eL!_H)h+{@c3Y({<6}rRc)Sm0)+4!<AY|C3UeJ@KrW`i9iOhAU*
zUHQ6^{UaMC6>+?=?ecJ~v|7qZVLKifPZ_hH+UQfS)7R=|f(KqUpVkf>wX4yqMh~oX
zspu*ToWo<Af!StV6OBBQatL1I)Ou|-cAjI9hdra&^1Q2C(W+@1D;U>g+z$%`$+93{
zYpZ%XgF+<Jt4o;+hUOE)O1SBMmzttxO;NN*d)vCubw-I6sP;CVn6^mUv^#DO)hnbF
z?DN-A$tB+w*%^P-4irwOk}uV_>~6F(=v5Sr6!Kx$#jp?)Y3_~0J>R<Ab!gW^x<^y|
zrmEOne}^x$gWXv5K8zup&jW79<clnR*Tr55xFOiG^(t2WYe9}%5_b1fi(?*pBmtkw
zx}GB?Od+@~b*>e*tLd`fFadjACXWnqR7OE1`-PenV$&wnk{hq+6*NAbR6*{JL3`VT
z53eIw1IR93lc`IoNkkxRG-MY405QS)FE`a-o;ufw<MiEr2MZ^?8lJ3cD!|LJ^a|@n
zs?yr=C1pdKY}gB|_T9Xta01>FTQ?MXy*{(1)M@S%5(%8f<)m1Z=X&jMt(>#aWB@xm
zMUdKcWR#UGk|!3BRmFCmbt+%a(Z{*RFKFz7jk{)Uv{TSX`gxi`zs=U3o^d1>Ehoy#
ze-a6Hy@wpM_F63tuS=8$%~l|jg4f`F>o-P8J%%!#DF7lc+pQ*>7okel*jmc3PHj7C
zcD7M7I~JR(@wLscVQB4jHzCrZpI4x5TW|&W9|cKN_l}-)bD!cy)MY~)+mV$^)Dye?
zGH~02wB2ja8re^w#~pkULnVmpd=){iY12_umN~a!KGLl^CZiG?i-#+%Z%&U?r7vuz
zDOtyGP*S0q*@e@AHG(nAyr{JrcQx)~o3+5JIB4dj)uUw5;2+dDDE_gee#ok++8o?m
zBPN=&MQ)1i9$6!af=smVnXd-Aa2z?dRgE1Psp+TH!adPD+|k(^SEj>JromYuENN)X
zuBJUuFG)j8UhmB}*>1}4$0Zqbx^(eMJF(bxzC5aC)Y7sM4LdgN{$t5ch&l24jI+Fs
z>#92-=pS02^S`PFM=&=9mmk?#Xga=^Sxj{8N|@8uLff_D`P<|w`HWMuWXvG;Bb8TK
zO;E;%f$HqbByLFfA#(XRen`=5IXE<FY9o!Vv=aJ_KMAZ7jE1Q?YB=iXnN<PU?j&b|
zJ1gkqpxR@tfz3bEz`R#J4w>n3<+M^pUhYDUR>&QD3#*E)J|aD88iu{U(&Ll`V}n~~
z3lNIQeE~p@I*E*7u8(jX?3p}`0Bva8g>`%oI0wtK{2~mZXoI3Gka-H6!N6dud}i$c
zEA0zXqIdA;0kR(JI9f06!j?GVxOMD&-A6Vxk~L$(TpgZ?6$BMAdmat^6<etE^zXZ1
zc-``V(6uMihK9U4-HBT28urwH9Tw7iub9mbFU6I?+C50TStGO0H6EYVpai-DD|?pZ
zRmBYS#@>{Xp7<eqwFNWU(PoD<_9E&%M@OZo1<$5ncaYW7hx1t?t1MB^KN2n6S>rL*
zPR8Yg{E(tGGCjuq*QUElqmAW~QwKKw61$`HD(ryhoO~7256yV((^M<*G9FboyWMQ4
zcDr{3h3YjwhVYP0Jxi4?q0ri;ATEpvo8Vxs%zu&b=hTQx1lMTC#6xgN2f;)%7k9cQ
zvX*LdvZ9&nBmUGZj*Dm+X<d-an$ahWWQ==97s^8*KG!EjC~fx}gr1O?-Zx!8F<b{S
zHj{QZsU9xfvaoy<I}4(dY017(ZIz^5+fbBK*b|^I3{JaAEx&bPO*0)}gPrlb+ZHM>
z_KxNg^g{gvxf^kimiWm*QdG6$Yp_v)pzv-J2E`x{EtM17Vn{@^3tHeNx*|s4u*5Om
z_Z+FqO|8mf8H|-MZZ5LWq+Z}}-99&-;VXb9*Id?tp34Ana4I(u!8T93Z`c(Z+}q^x
zwt_H|n>*n~=I+JpQ)R*Sn~uqhklxo=7C#}%Xo%;97;tt7POxqkvjxWH5%y2s(Cd64
z%dvu%=LX=SY6*72GyTw&G_k*o6rslWKe~4N01qn|sH)S;$r}L(P%E_Ix*+|dve32L
zU3EB}k8PgDxGd6OPm9q<O|J>#^y)yptZ&K!qM|lb6Brg+3fc`ac*%2iJN8r+nrj;&
z5X)wT31crDh$@n(G~WbxDEQ}r{8%5Ao{}n-VU~5ga-^fE+Ak<A1G<}oMLDP0aZw~u
zw)<|YD_<OpA~INf5}YTBcUn0^f-;_ho~f26Yto^N{X^xA!13WGn^QAnB-n*@U!l~n
zA53p*tBQ_Tq_}AWV6>-HD|T5!SsU&pV9zLenrLOa;vuf^p2!1*oCy0U>S2;LdkHpK
zXb)g-WRVg6Q{tXSce_H7vbol4+kZGuiYVOw0B^U-XRvOE`i3mE#g4V`pG`ZZaWW9^
zqLk9P(SwHzAmpZVHxNr**d!Zku!@sr9lqeICyrM<mJ&z!Qnq@CruQ4Q6zZs?Xlah$
zHcYJpuu4j);daR!OMX#}mY!S?SWj@E3~R65sqCj=Kf@;9D71`B_*@&vb5F_{?G2Hn
z+z%H|6FxJv_VS!6TISkT-^aom9uA3E$Ry$9AC(N0PC0M8&65fKlk{B4<%_@BWR8m>
za~~17yL^J2$=*etHw7cA4214zcfwaTHxF%?d?F1IosI;9Z-o=uM+XVcV}Z#B=$zZM
zd05my>x_QMr^=bY6PzgC&<bN5(|lVhR+2cmPz&8Xn~w&_P;8i%xY&VzDXwM5vC1;{
zH2c9y$Fz(evd=)V+n&-v7fMSUEa7C*a!KVV7a7U}A}Lr7LL8ffL)r#K!X4N=Cy6PJ
z8Sa&a$K0b19FcztLA2V)ikR{*#jn{h&wP0)`y6=ek*>KQi~UmATF}p0;2YTd6*DTI
zhRD$)etA$y177cK@9>e0EW@+&blPN<*l+M(`auW5E4?5OwEdJ(w2`<J@J`zsgpBOR
z9S?YWg@djT?rtpRDVj(<)Axcb@9c%p(#EJ|HBC)99)!ev9E4ca9CI@+e1tQjVHawT
zWsXI{Hbvl1qSl{MrFgWA!h4*_i4c(Qf~mFuc>R-_*Ecab$Kb5eCoEEkZ1I-!*ddMH
zb~&Rzx^UDsjgv?5bfK}z{mheR(>6gxqEAFdnnnX=ZU^BpjXSbF#aM?_(=&Xu{{WbW
z`q`T&!rDsWJvkc_kM$cWC1jkdvbs}Ya7%H)?tqd@JKqrc-Cxw{Rd5aAzN<c$2pK5-
zOO`Z){VrOlWh*P=scT2I`$vZ(X{x~hIDNtzrjE=aNX7m_tz>dB<*bm80HOUc)<+XU
z`B>l$f$~Cb)|2gb*p*on^0WZ<ZuthqPRW|{?R}g-mDnkGoe<2JO~}DqY;R>3s772A
zqDbBPy{F0)U*tnvEK?jig)wW6N4$I}oYBi%ev1Q4YnlzN3Tv7{P8djDuquvj(g?kZ
zOE_ZRvRmBcD@)ogFK-B;C9%yiv9|!YDH}hiJu+>7E2F5fvxR}}YlP>v8Aa{4<SZc^
zu}L0paq^?QXOLKY_EHfn4Le=Ar?JQ?2f2@STd<zplci!Y?q=rS^$#ILSV!q~(zHFf
zY5j^vJe%(25K<UMa@2r#9C%J7mfH7B{%?d>6FWEVxMM9gDM19~DFd)dQ3zb?i>}Z0
zClTbP+rq;gaxIj*fk;KUNN;@O!d5b3;QWN39$M=rfn=bPemj&b%~>N$jvNQqx>q!E
z56~uV+n!UKAST2VK}<(9@wELyVQr5JQgMQj#NQ&}C>ax8L9itJC+=&7$jU>s{1n2=
zkbH8nj+g%46h<(43GOAP#X2**Sydu)bR$FC`dxp5luF=k;bkwR_M5eF+C`q*c`FfP
z;+fX$N6L<P!>(;&nj$TB_})P9o?PsS7=Ec*O^p{og`^uEQjD8fPcs<s9Mhi)5Z5y6
zGo}nnka2|Vjgym~DLDiZkb*J_$&V<eE9l%BT*Gw+>7v0N)JrOTJUKhohFgbnwKhUu
zs|Rge$Pa3eIgcLFmP%GgF5j{p@JSXxBkr?CQzvr?<u%PC35=2L063qjkhnRx!9!(8
z?VJ*qapfj&jAcs365EFTQL{9e3-UNo?sHKkfQ1~4{>vs!q$6dqvC8KV=JKF(Tn+3}
z2Ocsmm`eI3KiM|j#s`3!ALqhQd=-Oi;xYZwS-w)A-?~q-VQSB!?#Q`2igRWp;3$g*
z?a#;jr8BXkYXQ$?(`O*_C601@q-&&<ZE3Jw6i$%cz<mc~OG9I5;j09OD1%Mpx%g8z
zHsD+KLRM;2G|`hR%ogV=hOeoll$L4qvQBse41VccmqyYxPM$c0!2;dNr_{QRik9Ki
z2Rp+`%SjHssnizLOkij9GyY1o(|Tqotoa*vd3H)P#CaE>8tr#huP$bt0gapqBpLfE
z>Rz3%t)JGenn_+yn+3k5(_xOl+1BA76jmXuXaQ<V`w_{=%;|kQ9XkcvVy)@uB5C~~
zt8oS{>kq0{h79tB*b<;<U;(ycEIcBhYgp@?u5^R>LXGn>AYAtV5p5(I44$e-HpAG#
z*dU~ocQ{nqw^2~hwZ=)<E!Y)`)%xx3ab+ZD##CNa{{UT%px<YqRcbKPMqMM?!SYs9
zTkE<SR=Kc0)_)k_EG11|ud6({?vca5Cd#t6ORRz4#AC8}<fQ%Q-iQ5SzRO)>taUo#
z=CS4`9|dQg>Y9lz;^z~|D%VWWrJ3M4j&09{veG(QAR1(4&(nnQ#E~a9%pDeuRaD>`
z8{K~EU7~be?XI8NZIA-o&}k4r1(?xqg=ol_!C(j3TS!`Lq0>5cl9Uaxw&USk)6quU
zF@T>IM6tWEYYVG=Di|5>kbu$2C|d_z0n=$SNZ({wNj{k9hrPfblvh!8rjw)7IgEDq
zH-OBNyrZc)`>AzFT^^A@=wm<5@sy5s>N^{L&q<C5T5S1R4~wFMboL8=VTIoXc$6@8
z&0DVex3h7`;b?RX3#b_&eMMZZJ_%WJeWNP$desFDJmhV2Pu*D5==80I<brIndOK?=
znA0Su9E&SCwJF}+fRXd%7b*od!7C_Z6WAOCjE*)DVRYvg5qA{RG!Tu_JPRdquF5Er
zw0m#D5_zMDlHwIMz18}C3~nB%Bx21uUTv>+y;Wn}%3xU1ac)$eThs?ot;qCUU#Y0*
z+U?S`5!f889>3Pp&RrcTEN>f%$jbW4#~B~J_xq`7G^(nXZEQ#Cv~fyb$(iI!plaIc
zim3^E+~Rq;PodMNsdyVn3s<7_ldc^zP0wYq()1`P!)+K>Sky^5wo`OZN5d@4eMDu(
z;{|%KqtUclHoj97b{q~>EgKCxEfLsl*;i|H(p1FaUgr~xo1)&S885Q-Eptz(C9p6?
zKdARr^{j@XZO!-mtj3q5)v~JYbBjU1TH01@U<E2vHQ3sCwu@~7-IV(cz7l{GQcYrw
znUA)7*-FM<*EUc_;_Fyt6%21ATZ9D;)AWZ`Sb}U-kN%c_^%Z5(<|angxaDhLeI0;v
zn}4cx2!YA;Vd?r+_r6i==~=e>ZWivDuon9OQ*L8NWZY1^ndY^9H#{QXl2tCL4Ae0f
zJ*OGKUaeGPkdbSun%y2c!L`wX50sLH^gLx<pFMR)S4&O4IG~Zo$P3POjcZWUBtEQ;
z1G7P2SZW;$q{_qU(zfT}XR3b-^l4sQ=rDY3QdlY5b~niA`HBh|=Xg6!%F}3_H6zPp
zk)#3ez1g3K8f`XN6LIjS{{Yeuuv#{O_EbuRw$D7$^p-%t(7-&a>QCU<3@h0>W@aC0
z<G?`F=~Kabg{Uc<%9n=V{QyjGt(xV-YgBC_C*8w^El#xUo|G{U1eBD5!G+r5)6aD9
z3yOiRbI#{p=enLJSb|d{69|Jw=NqVGtEOSGBI~N0`C3>Xv{?krF|TlQiE>t(3eh>K
zj!)6Y(Mb?4<Y6OeqlvfyD`eVi5kRX64GkYDjwb3qP?8Bl*H=YN882`MH$kA6OdE3I
zFsXIEqNSi=-y?6}6_e_Iv210~(zrS2xZz-R8v2Uq3*~ur`&}b^x(ij=f7G2@J!{<9
zZq^g$m6W`bN?dn1pSmK7j!KDI14`ZW$4|xsT`XYzlc=bQ<k_9+trDuHcE8a(SEuO|
z5>vv~`WD5nWNw{F9Vixv06YX`O>>KVIN=QWAv0!CUdS08zgH?o+W5kXJ?=Mg$xnNm
zA0#2sk#$9=MNJpH5`0-vbsnfH4oHoIHoA(Usk>~~i>$V|CXvMY`0#j1DGZ_}rLIiS
zVW%YB14#~{RPRz!@CiieRP?PNyn^MXqx`d2Hi3VX(TqivqO(uZjlpv-_E&77bWoDU
z=Gaq5BU~)O?oN&>!6x@K?d+_&(kI`u6V(*@ysj*UHwgQ<T~=uwCminGJBgD0`CgH!
zy^n&$&2M5AJ1I<ek&oI?QAjdu1`e0}tYyM)X&zLRx>;nuuW-MWU(_1YsqGM$xy0JR
zU38}D>Ax`{<O7u0(r-YNopwd2KC+%N$lP1v%1)pB)UVx8_Yye;Nvc&-Lo-aW1C(~1
zt5CUsHX&~*+e_GqHZHwbY2dQ}-SVjEHcrA`@woO1^0k_MW342gWdro;2x8pX8Ul-z
zyC|chKVPKOIzaeIBkHX*S5axq-CDrsj_10S+N3nC+Y>jQFKenQ_d2?uwfuJhQAtPm
zlWDiJL8^5|oh*KwO=!1ZP~AWIx~ici9Aw>7nkq_ocTCodB6@SG4x3Z5j-E*y@Gh0R
z4J2-6(RDhAZB-js+h;jhjaN#iqYiC5hV#vWH(2Z1*HhX^9UeGY?LSzl)F<^edwxm}
zV_g>dRBoq()Sbkip2!_;v-5z!#|DAp3iI>yP|=Z4!MfJEp{%4Di;Ji>wE0TXZ(}7$
zpo#R_Y@6Kj=bt5Lbg3iM+6k03zbhNAXj+6-0$F8ih4=@Bxae&NO-|Rj)(1DbcvaA{
zOfIT|7$GJpT1~NKKxu0oIdi0Qnh#}n))7-_(OI&cz-Gl#X*%;B&q=Y|smd6p>V{n4
zuE}aOb43ARW86Z|R%_aoMMFdoI5c-wnz@zd)nz-LPhb>UVU*%ZLffASmNc{@osbIo
z!w2Ra$l*;#NGqhcfy5u?D{G^4{RHv0YL)@<Wm(mgY|>ihY3u~>0$J2h@lHU^>DpMC
z>PX*mGfFZxPf8hF8Zplc0a2}WRa=W##)kQ_FG{A@kGg8X8;?DgEU_$)_K8(d>7I>W
zLT7{-YQZ-CrI6Khs)(Ll6z$r1x(2KLTAbhWZ<P4Dtg4e<t8Ui`7{x`08db)OrzGyf
zC67#FEmtgWBf>wX;-QvnLriw}J(VVv)52+eN~zpmdzO;4)U&ru4T?66x9qPBd=V*2
zlQdN{x?FVN$xhpW-BHIa8L8Vz8(EtXWpxBp^^k6yxZ{Ob>Rmn>pvYl(c{nyo+vJ8-
zK~-j@w72&0*>_87jHRj`tZsX6;ShA{w=;gny@SFc8tMvaa@WAtNISSH&Dl7kQ&p?S
zRYYTkowv913okv^w7PnU-z9u4ExrDTi8Y5hqU@A4gSF6l$5Uz4@sU#_U-ZhHV!Lc+
z%1WqoDC7}SZ)^Mx6_phf@x$uVQJGD+D<7(LMI6(g$<j9W!>q0}PO8+R*vEQoj@~ks
zaMhr~YuK8_S5*g?;?m1ncq4^dO-I#LQd#WT=F8Bi`huQ%V(EiRt@T-*YgDZ@LDUT+
zwp8PaowBbYszq%5B|MROmDMD91gSKNEhdHKub6(w>In61P2Qbkp^REsv<)(rmwe2L
z?gKZnw-!s1DI{|yk8LA^!hw|5k-oWo`Szn5TcgKPV{6+H2FAk*&Pu%wC<KqHj`qFo
zohZpzt+eQZDJi3m-2rw#m?$4455K1P;y-LE+Uly^N#-poJ?+2h?4oy0OB_ONN~TD$
zkki7H`Fb8T?6r<2Nbi24$9!2ncd{6br!GCLvvX(;l0axH<Si$;S2Wsew6V0+P91Ld
z<xOIgyD9Q0^j6ku8ryFcoE(4s6<HKI)YYw@S7YR5?pj6`-%YHef?&}Bk={U3>zcC}
zPD^PI9s*>z_9yaoh;+tu>)--v7=|-&g4DH56HeUPNCo?CSxWtGvRO=Y^o4@_fn_F>
zLp@Z!txE~+FpE#q3X=AXHj&jvR|ZK;1AN(A)lt*y5MDT2axg$yshrA2{{Z<Mgm?DY
zTy);4A@<Wm>-G*ya{eeOC$<@-Xy%>bI+_N^&+6NiCcD$UJoueEshb;sCg3SGO@F8;
z;V*8Ry`Xa2EDpWbT7<>Sl9BPA4mm+{LpK^T{Yz044}5g78v|f0tMn~)x{^z_A`feV
zw>=?Kr|QFHZjxkq{$Li0ucP#k-(H@T@g8=OaGg!Q(7zh(Gak;O*R=*V2=35vdtGRB
zeuva`2DWK67ct~t+7`Q`Y4j>*?5mCtenQl0nwEo4NJST?>RP}sWob$=5hl+n)H*{`
zrI4~+LDH}xj)5IB4DM^5;5+wPs+tX7QmFM}E@XGU4<SoiNZML0v%Xu~HVXLUq_$3R
zu8d5Y?w?H8K|BSdV%JHa>k-LYYAQhN^5spdG{LKxzbP!yU%Po%dUb1NkN%dGkUV)7
zD>*2ED>k)L*2_Ro<f9(m#b95lR?}*wji)vzwpGKbYh$J&s&lme086=5SCSgmRMW#O
z);A!w>Jqta7F3lpO+`GCuszhTdAI3ZTht7sjm<h#g5AhcQFR2ah%nG>aUavd2D?qH
z)QKiS)}G1X&Owrdc4f7#ZnC~@l(fa5@B)`f(E5g<!bcBHr@_k8Xqqc%sv0L~wf_KD
zD}6^nO)WTd71ZLxEjTF89IN{hGfmNfr|C#$iLR@xoJctvu!>|f+Cu|dF829wSGtC$
zL#4d_ctqxp<_=X=-AB`vqtk0!W6lyra*mi~7`}>aS6*-Er--@Ti$YB{J!-G`jBo(v
z#kp716dDxY#frU*KhoxKhSs`)nj>!nu*e(1Xiqlk#7S9EtwpOr6NBknCO?(7S-NWK
zig|t8<31IoM_p=ql%hCV-M(z2Gfe7+$yG|z+?y%E&RwFn71Ix+*EPm8dM&BicyMkL
zwMvarx}DywOs##mArYqPEd;fJ%^w^fwK~HsO`Q1}-Y>N~TB{dbnGecp46d}2Oc}c_
z0GlsM=^YzOmKI4@T<0F(n<}^{rji}->Ja&})oo_6HlHbuW;Nu0`LlbeNlkW&#lz9)
z^%Pw{Ow;L9v>w-4U3@|q=SQiSM{SN(5LIfrqZ(+msU#hVQ_G=sB=Md4TUydTsRxR4
zThJCnnN<S?T&0p~GE_4C&PuU8J*2iTP_gcC&Q(;pCap;|-%Mh;=J*RqqES`tX^@w;
z*&L_G8g*jMSJE@JT8W`>WDt$5#uPE@6_phYEtEzt;`UozVuwvI5j7Kd%dKLv&@)Pc
zQxt7&iQ&g8t`H=g{*5k$4x?7lvrvt|@&opiPO;IIb<pm0RYM==^#zxyrHr$69Z08t
zActfkw9cy4^ddcNNwpD<Z<Qzdb+WpWrci2~H>+tA7rLH$h{4O44gUaTR_$-{?%L>O
z4j;=S2wtMk#vLKii0bJ<e~{Ij>OQp5H6Tn{baE5HbV*e2q#io#tI}%e^*F(oOk=!|
zRg>F6OJ{$k*njmZN)6RFl8vSx`&w+0z1oXL%88`(&ycAbTM@O>3)Qu{K+UxDk}=;7
zRoZr^G?Ll!xudW>mFG`%#CnxDk+m&r$^9g&O3sEcMY+<4g{4ohCgagk{du%-UA4A#
zxKGeE{{Z!R(Mc=X^6m|haOhe+Fe18?%6yS@L^M4=0QIP};k~E%ZVH=>eIlIa_H60D
z4l8S^#I(^<5=FppxA#>#$KlUX(h}jPvv2iA@a5WHTh!@|3}r<`3>dSVf8`qg0K|Ce
zo#|F;lE%~g!6JDVNH(8r#?(^l8cc*uP8`s4XIQI!7pQ2e8|c(cEi3PDaaZF@)Ajax
z(CXrHcm&y2Y8?+y%eZ=PXy7}QuN=G69;UXo3)XWq(No6+#%4y>yVUxsiWh!jqfdxD
zMqM7)A0%a3>(s8K>1m^qJ)~KU&GBNW_P!ksmcBeb87=X`_B?t~RC$@VCuXmz?kef(
z1TAwTXpCQyK;;$G)Bblvia6sBk?q=F*jNRb>OESe{W+&rJdai6y~5ZzBFQA`NS&m|
zK?9u1hcNFp!+rv%Hq|m}DLWUXpDiUVZlK2r9?QbePuD13m8mjn@>EC(Ed|n8aEj2t
zi=_1s8+S(6JL+zS=-3PEYTNyBjQvq<+X|{7>McqtooU{!C}U#ww;4Yu?xUuDp`g>$
zLCYJw0o+@J4^q?98p$CN15zR{0CRA7{jRhfD?Ky%dOuW#G7xt=z)Gu)je9a(8BbL0
zWsPiZVI$qU!n*uLg|K=Kf|@bA^~eTpJADy-HzYc?zgJOC&5*<cV{pdncUHZ91Rwf(
zd1Sz2ZV!U0-|Cqv{h5TKtEfFYGg~Iun>VIfJDX)gqgTF%QjPJA&T$Q~`Bn6in6!Zl
z!6sLk6Q~>=RS_;8*9_m~1=*UUdj6dg&dP~jxx{C}lT)Uns2i#wX)WN46;G#Y5C{4Y
z&ey)&UiMZs4+bG5j{pplbZi7M?S+HUV@KI7HC~h|EmvH~WI5XNU{-Ue`j(b}7~zq!
zN=6zA^P0&jbsEP{Gu&L`$HHFTg0zoZ>T156%<}3K&k+mlW5Fe0#atTP(z+;p5Z8Mf
z@TJl^DAd!oqIZEEuVc!)j)zOpX-ntX$FyHAOqUn72JfR6sA;6sHdZ$vuR!VjzmO5R
zx3g_!kY=w!{Y3iEx;R{M+=a2AuF{<lF;&KHIJy$53cqGgS<|=FI5Zm)PtiX?(~Uh-
zB!6cDu638Sgt{1v-Nw~K>YB=lN2)zA-Wn94chO009+3lEG;A0+vaHwoY7Ig%_cRFy
z1agPz?MOL-H#;F|?k0!zSpNW&-3qpN?z5v*QA}D}a1Sc7Sj$<Kn}zB<MNH=lHMh4n
z3pFl~$*vsBU;C=2n%J#0V(#E>Ftt4uQ&IVm3tl$6^)}pvT~Vg&s4#(Y6|RA&J}QR2
z&k?vB+}SchFpjtB*=bq+qXU10;dhS<8x$bFb;9+Hb6TRM(4>y7&6%5W8ta}Hmj<#(
zeQG<om*9+rHzjmYCst~DOo-Wc28VfCnB^o4tQME4vNpCbEJrt5T|T@@1+r3hI#gbn
zE<CDTdY#i!%d?WxaIE5%?amZ6Z4xoS5s_rKL8Hw&W~=hm^)Nl#NOIfh^R@8V*2=)@
z)X$^Wob9A;D@UbN8!%mHvq=|KbkWMwxuDx1td~;9Byn0dxuAF@YK(^2HdK1^8t99X
zvnw%G8ntyL8^kpaVLX6sbwy3qTKycpr{_$qVgCSXL3X%!vbfeDccS|RhA=*Ar?7S^
zFHX??qt<j?ev7GT#I*6Ynzk@KN^p7dLOt7<Zo)_1c+3W`O|4|nJ@8D!cD<&=E%#6L
zd*y3esx#Dgd0H}lp><-<>O?1wx-|l69s1l4$xjlN+dols;aAf$(|X5QWi#z^9~nR4
z0ySQnbG;$0(_gcIb&vK{d12Ly!InB*Z{%vk>^lIoKuf<^<NQYX9#-N?aZ^s$G10s^
zw+;uD=T3}m-5iXmfaiQ>_FYA+ogPNTRV=23?!(*v0JePn7oFyKy#D}b9lkzpKdg;a
zeI0cebc~7HM|SYC`lh)v8d)SxY4TdPf;zv+M?6&mrkYj<GDf=L!DsboW0vAb+i~PC
zDMcqob?ZhJTK7)j>~R;r3tiIshMgQ?lioY?eh{XH4c9R@>IIas%cWBQ+L&DH_y}f;
zlxYu*B<-GorRkbYV+4WBc<`?&dQ(KI0GLZZy25Dnnrm7OG{6Ddg{{*1j*<q3nx+Hb
zmGhoN{H!naZKJv{#WMa5hSM2mLoU<utfJ82qKnwzNL1|VXgxdcYrch5>RnzK2y2Su
z{{S<{$j4Yx=+M;b(P?+}!3`b8R1tNR1!f?buJ~SUt#xB61EP{AJ9a**jtXg{f94=-
z<G*&4((ztsT-7rt!bi46Sq($4jH4kDf(r5dKU&ski&}3WAJi6_hpVRaz?vH#>&|`#
zSiNlMc@-X+Ni%K*#g&YHi|kE`^0)O_ZekhmpsMS-+F)E_c>}mzQ1LTYL>%JZXR6lG
zX*0C`W|k-UyHyoVfzomxbaAlwUQ=86tuS$8p?My7R2sM90jnOzmVf$LUWbq2`BkRT
z3FOAVv)HRT8>XrnOce}e{1CI+kKyZLyQphg?~AWCpz2LY?glEC=eFf-7f|Zg7Mf6g
zw+qpSkLBb3GyeeellY{%EGznFQh=Mr2p#UJYG|sUBtAC*@UQ80?Pcu(SBV>L;X$Zs
zRRx5;mBZ(57iKRb$Xc9J{{TcKgB#jrY0=6Z&)B7Bt7{vTEcMbo=X4Dt;8`(~w40A<
z`CZYUF44~@ap{pr=~`|9!Y+oq?hSqHqjQ6fY<@x>XtQ>kDo}}<C`)AowB0Fl<2X3*
zsA#HXh1`<g3hEk`P6wX}Xlo~Af!DwaLnGMVZbB8!AlxT0?rE{%V3G;Pd>@pKlfk-;
z`&>9sfwto7P%M?wk;zdx&LHQ78{BVWbg`V9lxsm3)FR*V6Pm#wz3uc;G&T0QUFnt|
zg{;Cgn@AVBoC9o&sMs2N*+|zOE`g|IfZu`wOOxG7NU$YB{P3_&zm$$7A0ab#(i%#5
zI7AFXCQ`NJaFE6wkeCT+vci%)m$ZW0-45tMx+RVr5V`wpV6dfZwC`!$)4KhXZGrCg
z+T+EQgRBn<DFeSyy3JVWmG0A_E-!0c9G!?wajU0zvx}|Va;$|`!Td%C06yqyinci2
ztie#4ce3zltp{oP>)Oq;v^aSQHAg{K-&UQ%{l|4dQd@n^J8#%2s95sg;Ol&(QC*be
zO4_GD;Ma}Hchtu-53~XC*>!Yxk9@2I`3NW+-p&{97W5HgX6X*sA|VZ9&g_dQTILes
z(U6g^JAowqPy(XD9hWwK--1&r9`-l%hY#+dFBS&irEAF^Lc>}FGr&!YMf=<)z6j)Q
z<~$7WrK*BAFqVrOD)$FQ>>dwv@#scO<~}@GbSHF!aUmmW9QJK>tV)ovt!?()9|??@
zL&0-w;Mas4jAgFdkAkHVG`KWBj>U8C;&1j@4-y8ngK(y7d)QAU3|#iQ;9*G>SZ$i&
zZ<Jael?v$G%Z%M6%AK=D^T-J#V=s1)N%=r7Nsy9no>DpGzbb8@iyVDZ9}(x3v;`)J
z_c6xYA0aXLT_Y@0OK*XawGDb532At1h3=1bn=hrknF_Ivb02-V3gb)FS_l#wAnZ;+
zE^Luu@!WT~Q8|%6i^lH<g{v*1tYyFg;Z$mxTVQB=90>4-Br=ti4r|y)ab%)Rzcxx+
zEM$-{qqroV78x=7n<uvRQA)x-Q;P$J2OZQ$)r{co3DB}*2R2V<l)l&grr4xta5-6;
zB&~54Ckc*}2U*PA66B96F(7FoMuGBz4Am1;y{9ZU{{XehX0|80xFrW*;dVOd@fWm!
zQKCuP3iKS)jE{twy__ze9K?~_1g;_O1PlBWhh8!#U|4XNPJ54)F#sMd@K<e(`Mrt-
z9{M9=$*?K=@pQ+;M+fejFNWC>W8TR}l%4((18(FeTpmUKh!n9LZqN_7e5jom4-SdW
zjQ;>-F3><DvgWkC#@Jalgp?xt382<$sGYV*#EkgvtfP}c)krco^3(ToJ*W2WsUFfU
z2vErr4T%Q+LS-|bCyJiYs{D?pLlJ!qQ)=NEw|jjGfwd9U5XtHN7x!~N<SKd{M!Jo|
z)1A%(v$BnoS!G3yO)w7rrr`eoWO=r7%g1pHnvdD;ESa8L$UsS>!#fM$cqjT#DB5a@
zN!xE%``D@f050Zx>7BnE1)Qs~c(XH8Lp&E_*@5K*_O!URM%*ovsv9Bn>RDnuiy`WC
zntAT{tV!|838o6J%!Ho2U+qb`ztZu4?wZ=|rqjge{{ZgfE7|myx7Y}9@OvuSsu^Q<
z=q0I>8A?l`)b%ZpZjM3q2$skl`rEtYDrZw{H()LBI8w&?wl?7UfOb5iMI)Q+v2hn6
zzI&!PdwK4KZG2m{%+njc?g)_PNZYa7f*LBNYfNt!B}*L6XxoB36&V*G90b<~U)qlg
z2ReHQCMWkSJ`-IWjL6773W2X_Hn$2^J?%GZusbEH4W=t(b8&J$6J?Y=zoZ9w9oI`E
zT+efJ@Sq^u1u(55Mm&#?qE`^?@}dOy9hY1lL0Jko<FZ0|2b8S?u}X205wj#TX2SVP
zVtx`}aBh@Iiy%5;o7&5Ue#@{;!sCAZl8-`LH#{U5CkbzqhW(CKpo%|amhf(z#usFA
zk-^P%%TS=$mLrRm#Ap8iDH=`hbnAjMkce)^5=FhleG-Sgyqk}r;s<ZpG>$Ajw?%AI
zobW~MWzB!Ll$$Te;VEdhw4*{j4Uxc%iyz%2PA$pdM<8&{(vT9?^OVUVQjuX4z>FJ(
zA=>WYRkiKCvOaq$gpO$*?Ze>~nKvXF8Emw!E;h4*hAM)7RNkm9;3>%u28bk#IQw`U
zD9eb$h11<21oliW+~88S&WNNmxun@8#qPL<lA3T$)=Z;9JX{;79~+u((oq8<>8>~7
zHItGdWb#IAZUEsD+K}eh+R6ttrKFK{8EbEFY<ngm;({JQ{V9zqGr6YM7Wht#p5Ucr
zB8fo*k`0mcrLJHFR}*D4QaP^3uta89KAo-x)*nPHw8f(r`l4Z&SR1K>n(r1#bR%U`
znQzoCqI7L>AYog+HoD@-S*eK2Mevz13dtZX$QV)NUkHhdm~-?@yIpYLnKq2r&DhQt
zZa#mqS1=QW-jVQ8v}An~BRrg_pHWFonIvEUEPYPBtXKPJshu2WhrLBjp;p$sI=Z4+
zJC+9!7f#v2<rH1&y=kXXU6kR|$=R$I%BpUo)Ec=jF@91Lz&xvsGpDKP>{|mGf2fSB
zxT#@@zo!2HB??}|bAF7zpP;&V1M17>JlV$!Nd*j1Md`;Fjl5%&Tr83P*qO9<Hbh5G
zMjS`UM(AGHBsA@d{k99Kgif#}7}l|(%@+AlJ+3FcmKh<DfZvrb<^u(o-1)MOM>aP5
z>;k0KdWwTj2h^RQj>9T)l3lTsTQ2=ayDo81)#?yH!s#Sq03FSjoa-HW=a({&W6H<s
zdgXm{$&yzQ;Z5Y5{wO?B?Vg*gb<G7JaDl>Cj|E}%uC~<co<k(`n0quV%ULY0unr{f
ztn}WWtEq5195dW3u{Zp-Zht^iRMbxG?|Yo%<f*jUN}8G48pk*joGqr4(d=f|&Nm+G
zRi|k5)a|=t4If2i6p6OkSD?~IMM%-;?v=yG2*31(Pbrp0wa-3#E12PIXWG<5T1HCA
zF2`-Mwu4886TQF_=fbjRWM;vm3EQuNEW2R6+)-kr(cAN22MI&7o31voAYdUKE6c0`
z4Wt%WHbHJ|0!hr(E%aFO)_iwDN9qta9C%iGV;tA+bA6$0Fi<@&NVcc=j)!si7eq_b
zkkWy<jSBbuUC~47#L(ZA1hY#!$#aP-a`b|ty@JO_1Wf~AKV>UJTl!iWx=9+)cMz*9
z^;jvGT_lZbZRI1Kb~Iu1SUJtL+;D}duBU)*aSa2xD-Ex8)jStu1U=teEFQDewe{{h
z=5txt0;kQ(_@Vgm?DXAxt*EHMWO4_;z+Qi@b&X|NA(9x{djhi#e6t%g5>Iturf4;F
zjvmKY`3o#AU&vRN(gBvDdbtTMbBXR%&rWEMs+c+KCB5#o8XreBn_Vk&^0pKj6mdox
z#<i^q+!R$IEw{3ggGHocTE@gaNDAhUNrFGq8(KfQwuX)<MVbaXr+2a|L3`{TI3s2N
z0TUA&YorY%*eRJAvep7O5)RN)Nb)d<^oRu7{#0eTvIZK^Ep(;LZzKedyIWwXH33~K
ziy;LEDj6ipm(CsS2KP^fmGYDZk*8EOqDrYQd@J~65x3eA1rf(cVHbP9WgwdySS%7t
zHtduv^)bZK=R6C1rGMDeS+=5Bns&%SjvZz6wE^#_aRA)i%M-74jV%}~WPrcGD*>$a
zRb^w`81lxR!AZ{F>V{EEv+91E>Z)43u)`>G?VPP#4*bJKpOU^R>He$LG`WM~k;S0g
zo3C&DKm1mPNE+I*Lx(OZ@yV)@87=7d8htw6=eZT>#Teu)H80`?4Nwh^U`bZA+Pqaw
zzpmW;r&3R$Y5OiJ-xmVK23Xr%rHWc$-R1uPa;x=ib4;U&(oa_uZEqyFAnHAh5=ytk
z&(=U6D?O}rCYh(P##)HlM{BPt{89W~iXkNygA?jy$lL}$b>VuQUs&t4rh1vB4JP4(
zfT1jsmY|BLrP=j7eQ8Zl`$X_ZWV2VvS_#`=yc49xvqT%}hr7-0x6~TGpkix8Zt;X8
zDRjcrO+8?3?R=o@(VQXa-%~HXQ*VVZ+-$0}BOD*t1t1S8tpsMuM#@=>0#>t8#jYHi
zCz;3qG;oj-^OTMaXt_4B0HJQ@cO^$NqlvqoK>DEd4NeM3oaa5Qx01a3srtpz7ez|@
zcHE}tx<wNEH9GfG(onU)$}T$v=X(DDQ`YJw(Xr)`{1rh{RV_@r<au+Cl8K<CmZC<6
zu$z=)2Pd#OCD9CVNi*!$mlA(<eWmo>Ou?^wWDk|2>5UFJOJtRRm9U6J#s)Gl2hmcf
zpJr!A(Bp#Jn{)J9S{5>#18=gBL`XIk`X!DRlg1HdstI*jb9ROS@|e<G>$>(%Xbcy2
z5E_o96*~{OC32wEu)3<qpkc@hHLB~(1hJ;yby2BmHMO%kDrm{Mwh<b4NY>8LG~~FP
z*cCmpx<F5@uauWW(i*Gk{{YnL99q}AKMQOAnEFNr%+LT92s+BmKTm0vXEHy!D-2%P
zK30_?i%Zh0n`hKaTG5_Wth&S$EHSi~*nL)hr(USls=W#@?@s*uE!RirG!sS*SZODc
z;;8kcgjV}1G(MveRfYz*=bK?_EBc5wn1&D>Ms3Qrs?hW*NDJ5_X#<hnVY-J<q=n`x
zI&$}%Tnna6rB)=W$Q@rSlbIg;6MJ1==~Wc70LqzmwEpUjf`QV*>QDSKb7Bzn6cq4G
zWpz;>8`G<gp(~MV)KnTfq-&szNiEdW&8>omY%mtK)(AZoD9qvP20%V<b*8G;%{4!z
zB^zTFw&E7$>@@l_I&B-Os`pl#5LNAD5JLr^Xx;FsDm57AdyPI^Ph|{}YbC$Kji7ld
za+3DONv@Ex{$;Y+fCKW5rKWS)>Q3@}<z+Q0x#^}7)zlrsuskWC>X{^q(vF$r5pBgP
zaeWNaU78C0OH8J3rp8_V6Ldy4sm4IZ0OQFDnw8PL!dVzg$>4>h(e)@<VCcOj3=(^%
zP;aq$A)2<63(H+4MXmg|RvJ{AMw?A}86M%|H%-=R^cT~TW!(F43iHiUx<^jvsYA<e
zf{cITeVNpeq}TNrb!vkJJVBu1>H1!eQv)}$TL3OrYfhlm=6hcr+xEKG&{Jx$)7qu`
zkHV++(2Xvvt<+rkXB5$w7xyQHVWnv`w2=C*sTMi6g!XBbFR5&x2H6)=Pa%Y{(~)82
zCl@7bJh+v$hK5X4&I#|8XQXOSM+k<I?r0nposOQCI?wuv0R-TZw)!_uQdQE2!6R98
zw(5!{dnmQdB5hyXD(r2?bRLJ&jG?G9)lBIKJgcp9PpQ(Mc23vZ!<T3klh$3bv{+*0
z2yKFDmeDnD<(W)b2HX7=1Wc)ptjJso3E^1vJK>~>&JtMLvZK@WDsv9$B|C`Vs_ssk
zCut*1{;=jiA=)$DS5&r=S9-M%ZTkYL9jQqrb6Xn=q8zIV-^))=w9~w}j&h@ulv!MD
zNLMl`$EQqK!Tn89H>b9^%{HL(-ou4q(iD_Yyqbaod9f<zU)6LfYF|yU-N1GU*9fa>
z#g`|mGqiOYZ7jkmcT9hEcRegM^rO%XjFF64RrKss6;(dFtlh_g7LK}_Ll6BJ9C8qw
zi&o7QCDD&PJ6#1)ad<2}!j^hnKAtlAnSH~MQ98Y5p#?dO&)R>wz|?7a<$ZIc6TQqi
z12$P?;<Sw8Z)UEOtf=(ay*9+@8Zp|+U03k}ibk}@LGJ8!gcnWp>>=T`t!tn1t~Gvy
z_32CKpgX%*EZb_#kR>PLG_caSuZ5rv7Iv?!Ak-^&%^7P4ASh2r>PEBj^*4>T<gGm?
zL{QREhs+rB=KQ3NCokA%Ds*J^ZlHo_3|e&@kCWgm(=@GizN+(6J+Zj0)4wB4USXwc
z1c2h}Q>STll@JMD_5p6oag%yCB$mu}h0>5y!FqwU#aYMG)G{0Tg!~0<U$T|kA0cu0
zK+CB|NYeI4zslU2dkUtsOC1ww8?v62&uQk$#-B^3o*?;}VsY{~Lv+TyEmc7h(iTKc
z9c8A~x|2wwpmBQ|Tn84)(s4?~R@sr%^!ebJ3TlU2;V|^(wO<k0TPxasq+L{MeQ_MM
zJ0PTUSWUNCYx)aX{xEcP2IS?0VJezSVQTs^GxTLmE6eI2nCJBnQ{&U9BWM!FFXXRk
z)obRLOn7urJ*0OTUQeuQG_>_*DQNeb-r#VV=3n(ejwbtMcju~f$6AJ%mYysXl@6`>
z#*g(Fi*Lvx!B3~vx~McVoH4&4Nv!EL62RxhENnLJw<$fO9x+<6C)M;ySoXr!HQx${
zQLUb`YeO7{JMz$0a<fC#A6{9oxRZU&I9slhGwC#8l@T?-59Z}jHulNMD7^yEJ&@Q(
z9HvA60BKNa57(uTmubb&4)@B{Mbz3WCI0}biY7QF>wRCOI+tZE@e7UtQ=IQZMSClB
z8m$eC*;`2?B<>4&SK3`~OvgAPmG=2+#?ouF!cEdXH=j1TvKo_XaZ3{~{{YgoabD~)
z$?A>HtaNIc2YL~;rNavm1vwSPu}UKzROTI3u@?$+VmJ<2+KN4XYN8r_7L(;?7M;<Q
ztyP<8DB}FR>a{~_evm?<Ju#;0lOM}^ug^HL7yUk|kbl-lWU$Uk1a)xHAGS9%0CRI>
zvgO?k9zSNDEdlxy1EV3W?Sx}%BdLpI)rEtMDvCa;k6na+7$1UA8oeV!T_B%l$SLuu
zHL)hrdON5z*AnR{<$K-8v(X(1tLb`d`*pUw$PX^aS=~6+OHt`VQsOV1-wNhkA(6%^
zC7$jX$X9VqXpb%I^%=UiK%SRn2qDB{+hvZ{r(~}(K6^KtU03M(-CO1Sr9A`_cySg<
ztm!)CU@vt$DcgUt=9F699TDQ!V`=qG6^`3dTJ!RfzDfz%x{K0n{{VGCS3v4WiK%pD
z&G2%v^_rWbnEF*4TftM5oU~CSjeQ}ER{C{L-a7zRsB0876jy95J4XaBC#BTe8@)%)
zT<$`PSn4;)35ZI3aH|bOjM{A1R(1ZKD@b%LX$HiFbx+p%OqAdTHso<-<$4x{rs@)U
zv)0JhoSUtEE{~&7ux)p$>wfEUOQsaRqHdtpB&%sO@0L8{ZNkq*tXIb`rrP?w$FM6`
zr|ETCn~Zc(HH`9v)_NCFrj%BiqZ^r=w+l*Ct+0FOp?w~!s7bn|)oy3VxK@<VLrVy5
z;eIUPm2;r=7^i3Dt6L1AxGvzLbqKT?@#{9H(S7gjAuYe5sXt_TPKi}e##BRH6B_K8
z+*Rq*bRuJeR%|zL?EXs5NvUa+05kKU-G{cx(ZfTkO4rEGP<gpe^GZ4w<4u?I^frS~
z*GZ<-$qBYLxDXb6=v5kBXQ@$CCyA#Q@U;4FjZF+;)bc%o-JVc7<t%TEvRPgSkhs=)
zsTcU8$7a8!`irI`plnr|Z8WX}or2{-)K%IXtTJi(D{bI61$osToeWZkHlk-|0Igjn
zvUKWj4Jec}cgpNp9Ef~;O3hnV(i;V((w$E7IcT-k8&H&0)fUpyOzh&q>i+<%`p%ZA
z+Z#aEyd2yrZ4Y0kimQ32lpie@3tXROTvtVwm#OPIL_^VrrL6+?EGq7w@gH1tUYF%$
zcpUp}b$6la)HTos?GjvYMT)KJM@2~2Nfjim{{ZP2M%r33Ntyj?s%onkMDWQ^f94@l
z((2VT&)rL3E6?=uuV||Dde@ff0FZk-3Tmo8mVt%z&wMWJXI(0%wv5|autxO_bky4_
z-1dCAioPl+wLMBU`jNYF&t)Xqq>;3;7kbeS1DFlaKbYMynXtMiUicPEZF(EE+3Hju
zg_L!4f>u?%q>tp4WxAuGwEZqeGN)3MTgqOW)@70}LDf|ae``r)Yb^{fB5KGg>W7l@
zP;zT%$|>mc$5Lrj67OMUO~0wC??}|>%tXbcM&t0?g|KJ-nrvaFlhbhQ<^r1bX+VF|
z7)QWp31yNmbUa}t?8j<#lI$j*N!atjV71jV=z5Z<hl(lvEAT?q>vO=_Ju^_&?fKzJ
zqwB^NmbO747`Vzf@~HzRK05%@D`%pGvDDH_5ooo`NKL8gStFPY&oTHVSnFL*`Q!AV
zU~wFWv1cX~8jQ_}^z3MH&e3Gtl$}tj6t2xak*UyX2XCt8Jn#v+v>Iy|eM45z-=fOt
znhjM8#IeUI13X=58L7L{^rfaJ{{X028A19onjzGw^jfC6IrT``{{S}&Az!AN7rI(a
zMhe)64Y;~HU7)3?kjdx<9!MS3w0eG+`g?v+!q_E<RM)YtFVQbb*4DkvbP&Z8{4kKc
z29K#V3P^)>EjjZ=Y?kD&JBFRKl84Ya;Ey<7i=b)_G))?fBc)*+fVpzGw@ntt+FE5V
zS!-Hmp{G5XbTc*2Zr3s6^q(r9MG@9?#Z@bw1EOyG9@bY~V-}D3QBkJ{GG9~P$9O9{
zq)=2z7NlS$t$PC<_XT@CBL4u2(dT(C^6V>7qIE|}P`cx7J7gu@wu5zvhjaBxSDp;*
zC+T&ro~EWQi__?i1e@CP+>m%wO^Lslr<ZN*Ah`Rkm_@lZbIs_x>$xhldJ30mR*IT;
znB*4V9}7Lw`qf<}IjC;eJhx@t*>5$PChD41T@&ym0LD*i<R9I6#B|T0FQt%z=9@a)
z0y#>f`#Uw-9VKk%S7xCj_evfMiQtamZTi}h8f_w;s)&|A=LX8goDku5m5PR(%}~g{
zt=3+ZRi-|tq+3BF!FT2C*MHpHwL6MY&=jskcj3_x(MwX-Hqu}Y_*R`l_^Y(ZBbCAJ
zoEuw<*?ILfb#)vDjwyW-eXam!!t@O$iPZXCG!lF4-*c9G*_Mwn)nby8p|p<SjluE|
z4(9}dw%un#Mq28*ru5v_SbYBg<zZr#vXfv()dlo8ZjY%+r`3AxZOIlsRhGBa8kKc7
zpui!BiyLxP8-sU&km7tTgjzHjhJzbJ*xIPZ;cnp;lNRW~pHqI~OPqPRS6V%7Ek0&}
z(mUXws_D!#7|9n3$EGOapHYdDw{r$v;>n^Tqe~4|r>R8G%L7kO$G4O>R8zx6LdVre
z>1yA=C%2WNn!S{;epgGT5=haI%-LnN7^ac3Rcd!@hb<?BAM_RdnJHdOmmK*@$GDqk
z_e%R0k_D2q3mcrQhAi}*dZvNkJNWVNTH>@+_4-b#N2Ku#w#y!EbM;s`TH@=p8+TGu
zM&j@XH|1_kGjTV<ig@G(5^>ycwE7q3fg9TEd9w4GZAPk`4@#;=miE2T@%3)K6E??O
zK;T_~ttV!Q>NOMsrMuqOTi`6eQ_D-H(!A5o!9BgKJgob=<EUR4W2(bjY}vf3hs<jw
zbkCYeWO2K<6*QgfeGj6O^AnfIe~9d#m1Qh)${V<hcL7v-PGh%m{{RZkk5Fs?Hc#S@
z1$3z<MaG!+(lyZ*y@BBVtEcI7kVe-rkqw8kmGzKF+r$Vx!it)!W4OPRve}Z@9<8CX
zd7hU3OHh;*5>vdiw1N$?wGDWC1LLs>TDmx@K`mfxpXE)V)B8G_yKwzT$fxc|v00}I
zno0J$H(Rj*S<*T3vhKo>N(1WcGD-H-!U-cM9ICAx&L<JQgb=or{{W!I?|W_C0b3I(
zCKEOdz<)@}7fj84iwG{Y+JA0UZo3im$c{Xo%GQ@srI3KuO4nM%Ikr<zOxfGG@B0L4
zvuN{OR+>gryvQwa!p~^BTr$Y_KH>Mm^({k2bzGr>H|@SjY7W1qscG0B8~rH<fy!v&
z_QiAbdG4)21K3$32JkI@>V}1;inu{8V|VE#dKR&y8DlPvX1VPd7O^WeU#GTsT^xhc
znYn6N!(fc8vx`oSXatdfai5i2spu|<nc|CdNA)xg50H!K{Y~Deqn{GTf)8-L4^5<o
zX!f`@(Z8|mmx7S|sTdBCt$v*&cYhL|_8{^Xr_0lte^6-u0GQMEhqzyFAgpgw=%48|
z0;(n-LHKos0ao1+tjVTS#zoys^V_m`D$ufaXgWGMbZrhw3aLnFej`7~eiv6k9Ye1J
z+VXo{UG;W|HGLTB8gzw|*f?17d=-Py;iz-VW|8qq({5Lh<zk$2ay>s9QIsgMsicxG
z_abvgn_)m12M=pr6}%M{5f4sh`mv60l^skpl};uC#yL$&`$3dws&zdxj^;2h{3(AS
zOFKYx`%nGKI*8p9y*D@?kfXEPk}f<a_~QEmZFF^JmtRcZQkJZ~G2!a2T~2no)ek(`
z9a?031+9C591E;gyz020bGWo9KNdH1ULH*&XGYknh}uDM;c0Y<T|mHOhtz2BF1&9`
z>L<Y{4sjOpw>k${w`gpIuV>1$!H!YmBu(a%cW0xsS<xyX+bd&h$7@)s%E`31xcU-q
z9u<6ZX<DN$3nP%I<<n)R_r^U)$iWMl{ys5x5{o;1l0FFcZ>O6-(pNB-J7m{y*MuuZ
zZdiVM6l@WihX%CY>QLiaq0+Trn!iue*E87Q9pnotSvmuEzkYre>XMRpow?22J`t{H
zkZmVnP06l>X)^&$(^ApfYsNg4VH+fZJDWS@YAST%TXx7CeoCyKhDTklYnyKUmgd=%
zP#rU;kb@JpyX9DkwP--!M9Jf}cq+PYUXXsBz;_BtUZS3zmNp}c6r7r4@l2kfx>Z=T
z)Q_f@;3|r}HIZG=&dD3#@{gCOY3B!hId_s3byY<?_jF8jWirVoCkT5hBr-Af+CoDi
zZ~&VWlRl<74V)g+=dz8ijq(Eh+~&&gZT3cZ<9Z%T*~R|p^z}|*&B~m|8^z;zJ^@H*
zcQ)qDKLuSYIoqK6TJ|_?E<bcgmpmJJP-xvPsA>`Vl#gSa4TDL_o~ugMG{<bNqLcyL
z3xo~HF-)G@;W4hhZjptqz`~G54+{kd+dGxp1+XlYt+B|maSj6GAz_AXy{t&>f}|UO
zw<(QwZg8az7r-bOL4#{$J)Y}}uCNJP?HERkGE(bpO$Qe$XEfPF@IkeT1|x8|HnBmu
z^0C$f2-0@r7EB?pcOeu9pnuGgdxEBlQu~X7o#;kQ%RniQjg0*+=jC9sP;xj*TrZp`
z1cVC{_gv?EqJcx?7dL8)bA}5~*(r8$aGuAKEaC}74Gb}das~cVT}H=TwWsWfX>ZXu
zNEm}wYiOja(_9I4$nJ-RSJJo#*nqU9?UAGwUj7wEsYJ;^^oa!aDsBZMFR>)mBXa-^
z&vXrNY^~nLkpA03tFCQLF#*hW4<IWppVq0`@f}M8+kBxMbjNenirPBaVw|#e5DDd6
z!6PMY+3p_;RZF61dc-D5XNElXx(2VOPMsy%F4NpCJax1zGJ0hxrgq!4=jc$*mPi~)
z;aoZr;6!pY*8SCN%xm0ZmhC5nC01DI>*A8_dk7^*H6eU%Exy}b2`xO4O<{Wu3MrDx
z#sCAY<nWoQ=oj_{vPjxN7e&!ju(Q*YebIuQlf(_|Pjv$+SR^ffxOoV2u+Zr#Vv)Cr
z=t%_8KE~uC-2{=?!t4BZOmp1#2EC*om6I(L4&eM33yyH3CMO#^7e=+ay`@D}PS+0~
zL~IkFc;F6k^j~s&B_c@Owcvt>Ep$)2URp;46hw7Wy3Lo~)a27?lQvtoIZqM-E)Ur-
zv7}vw-wFca4Y*2Ltd>UtZQVlb-0+dao>N@nk3rD!BZ0Xaf^acD_7-}IGuVI%J{oq(
z75kxdPDC(EEGO9`hus+!RI~oGbMS+fo=C~TBg$lRNlxv}%2tyCbP+V}Y=lU_TA1kI
zk)_eNhj_AlH4#iUxC{KHeJo_%q_q4TA#_nC=n?FEZp%%)rtSwF)Y6GsOK-iZ2Q(0E
zf}JqY&u%W7*4)@%?v~}L1Fw))u+U64ZHt<gT6pFcjEnrFf>7p`I9y#lu?)H={MjRW
z8SQMYnvwCk>?C|AG4Ey`E{$}u4{OEH@)kP9nDP@QMJi&l$0NFbxN-qZU?Z}4z5Z5x
zomkG_d~P2^(&9d;?*Q^L6F@fR{{U16Xi+I2bmI8m@Z}rY+hImQ7_!tWvU6kF_Fc3Q
zb|0WB7@lv39P$wiZTP|rHZ+0`L0s7!!Vf<RK=RSG;1Cmw81aLZjLvMaJY?;6g1gWU
zzSCl&bV&oHkBgDutPQVXO2WrvCJ~-gj;Y?=u5FV6WB&k4fXczN`w(0kgJL`>p{uEd
z;p}m^`B0XYoQr)D4stG<$;%vBc^0orRKXo|ckQ{nscGW$q~AwZ>M-YPxgT|%a0cee
zT6tuIS~&|m_(Mb`gXp}LcL&+c+V7EYnIz16Z7fBn&9H=nQ+q|HU?a~c_-bgX0Ne;Z
zK}L>u7MKjwwC)AKTK+N+kE9J2X#{*Ln!P**dXOE!=L(_1Rz2Sb?y}jKJdnipmQ5Hf
z`9Z%)Epc@vL!0r)N5wc~jt>UMn}l3c@XR+x?T$VZZ35AreD$=B+fz;IFn=>Y@QI|X
zf@AzQXZlYn+M=3vAAEkRJdRa;MHLj;ICsVh*IkE`{{Uw_t#)jqEOT-V!hzJ)a2wOk
zCTH}&l#H)vcFCi3Zu((5c7e>Fea(on<K!h0M)uvV2f+z|-;hzH#`!+QA3wV51D+DH
z#}45+(Gc6T+<X)$ercjI#{x({vQXz+i>_l&@|^fwc)1AB6o&kOLGYZ>aB*~mIE#xe
zW321&eo``sT!V}y4hlgdUv2HN@|V+Vhqb_^vF?a$IR_~Tv%S|-J~9RrWx2>(v6V6K
zO4eTD{{SeP$18EQ$SYfvqi{L<6_J7;OgU$_9nkM%o5(6?=W}p<!A>5>w<60hCcp*H
z!TCz>`-j{qYFN>fICZc;y2#W#AGj;NJERsiH?jJqb->Cgfu=FS;@0k=k*z$Bx*?M7
zcQ*Q`krbmA1v+FVm<eR9_c6eZ>Nd#T*EeDEtiLYi<)-CBEKPPKZhVAngCmXn8)L{)
zm+ooK6at;#lM}82a4r@SHpON<D0`Sk86FcY{{Y}qmbfrF_X(E--q%QVM2_Jt$JIH_
z2Q48s))`AhQ=t#QP2<XNy|`U$eU>wJG>iNumI67-mNu6heH7o8J9}H<8=)FZ1JiJJ
z7c}iY5pIZ%GNF<)-wRq|w9t)p`3iP0TH`2RO!g^5-qUW#Kj_J@vP(_DO38@tlrw5Q
z)*|XaL$Wb`$ZQgN4UT^{QVAOF=nvA~f4b(r)>&*v9cW6%dx-%CM|5PeZpR@C`&_3+
z{)FR{zN5YqLrPDvMHu=fI$CBn#iJdXo;CyQU>^grIMTwybCd9!{5HGV&<g8p^HL#-
z314Gt1wWw_d2udxgszZ*U{BFT>Eepz<P+ljBzg=<y+?-HFdEexNxtG$Cau)kbrVUJ
zrJ~(|Sp9493B);+QP}Vv?#gn?ms=S@o{?3k($ciPqDHZ!%F64%h%^*|(b5Ae{I4t3
zwd&gUA6jQR{N+WaY4sX}fw5V~<fTe;{)Xikm%7JV>Q(O{vifZJR1-}#L(87`J;&u=
zyQIrn8@=AC>=n+9(!wT#C=Mr+WYNTy(61wUW*L-Ka=ZZ>jr;|DrF6Ai`(HCl8grHC
zG#X7jBw8RoRjhRJwYe7iDkPAS*_hF~TAB^FXmk9WtvniZ6tP(Czx0JHYz#L8DQ}&}
zB{t1MF}LBWcE)TjE|M>C8~}=vNMny4=XkyX4UCW|Z@S2auol>4p<MSDUgF9VsYwyD
zW53PPPEB+?Vw>1ZvB<-?f)K8i#o?nWzfjgSDcoVEr*Z5_2(2c9z2r$$L_@vuQbulG
zgD9obEJJq1cX4F|43cRM)_X^CteXn}+6Mmsl_OvykzwE`p$MtsiZC~g?(B*(`)mf$
z@S%{lA#y^c)%t>tiG;p(0zOcb;~v7I*?Re6jBa~^tJJmHN;t`Mt!N)B&N_pw<db`8
zc=EB8+LdK<?=;SEIp>8wQkO$gk7oN{>+oFY=>6Td5V2a8w_m79{Arw7*|);4h6$uL
zjito=Ee?s(l~n{e>>wsslkZ}@kECat1w}-gTGu?D7Mn!qZBn~y%muAEyO!Ihx_%m0
zwa#F;_+FWz%|%U4HnE_Ampi(xMJ<W8d4`ktc_lCpo;&?Qyr$9Pr2qy2WvbQnV^IG9
zPMx4O`94*BffsST&{7IO3>!VIZ`~0c$hlK&Z#GRJ--`u|G1nvu;c;$LjyPP>I7W;<
zEsYl`9X@fwWAASzK@%mCKrLbA3NTA#d%W2=XM{u$wXOFgbC?a7&^}Oa=qVA1ONGi-
zMAn~cMf|A*pjzVU87f-Ak^<H_AOn{hrF@aF5?lw}Q0o0hM@1Wqj{)8S^Uk8{I*O9!
zQxd>?_fmO%L_B@7d(<6CM?o8hstdaSa=hbS>blzJxsW)rKR*jOHDuK?UPrma_dU@x
zRIiwZv4oS37Eo{b0nILfNtRcV=Q+fl=-N6d<*^YG-=fp#T{9$>e4@)=L!;Be%LWcJ
zg<cdRc6rNmsoq0dPUn4=qo*_p+C!ybW&16J6fiQyv4vp-EgS&Qn^Y>Yt||{eUNS-W
zRyuV}Wjpr?T<dnaCD4K}KumK)ZNN)ZH)wXDtZNk!`a-SIv%pjpI!o&b{KZ7F1IR8a
z;f-^iafC}@A-ES>qx2P{GapOov61`+lkyR9X%wu$iGY0-quN2pOqJV3hbZjbkg|rA
zfL)CRNgQ!7`x-xG7=}rof^3Y2ltw+sY%Yex!tTm;wl)m%x$?E6Ya3zR4Y;}3TC5!t
zNI@ryD1&eGNaM6!#=%u;`rR!QNBE5dcE2fGQ3^$@wGqJ?E^xxhbuU*_Qnk#9;qrJ3
zAJqL(Q&i_i427-uSz`GneaS92<fL~Ytswn#U9Hq5adXINH~^}+nJn)ZCo5yp+5{EN
zFPIAjpl*Su!z+CzZave+DQHPI*^be)IVX5BG=P2<<44h<r)aZt<yccuF^vI@0UHc^
zMSxY(7J_K$Vrw!$Qb`*Fy@f=^IQLQpY!@U1tSOVmJ)-GfQ4}q^h*f%qs|_q>?ie0c
zGg|6NrjW-?cN5_wm!ul|HWl?XbysC0LBDlc&Xd=x<_?%Sk^cac7fEW>l&)*1X+6Lz
ze@)g7Z8&RSyZ-=Xls?d|MLZom-6}BYhDV-Cm9_G<rIFdK2z_T;ns+*ChXyyr@D>+c
z>f4u7P#y9UYlQk;nYQ{2>#nAfiLPue-zQ+R-7TiOsVfA!q>tOq-PQ}V?GmR@oAXu9
zb<b|f&aX<IjvG<V<`Ov=LmbkTwPu_fMwe4(O!VfQPpK0e(SX}!Vq4c^^IyPt4ZVXw
zRZ?`GtE*3wEX1B%RnC?8MXWXLnpWAI*aE9LbJ|3bYfQDK>Pp>DYcFQ-Kr2zBf2UKx
zB&h(%21!;O9n#u;1R=FeV;$u3QC&l$P&zx)uojMQ!Vs4pkYt<FGg_5P^%=c7PvNtT
zz;;tm^juRkOFYkza(5KQvDAe6aS{gsHQL^#ERCfNd@Oc13@yIcZ7m|=I=w4HXn+Xr
zs`Yx9wIhF7tzkXNy3=}FOQ?hMRkMQPE=!%2n(B=ri+O^IN4ne=l^m08(k%p%*<qt;
zG_7sfGYh_`U2xY#Jt!UtIIvIY{UOmnJ!*%r5uBpyA*6wY(aF8T$-1O4^8P|gFC9e2
z$)rdmH5KkYc}Hk<`e)`_Oks=xY@X_`T$@p<tq`+!qE3E_%R<w1iebL4-lxwhycN>X
zH92<8qv6sGFYrT4?b&8^3UR!R{>$*EtgK;Yr>4N?y4Ds6+DsJ%-lcpl1LPqn{{Ukw
zpGX7$0LAdf{6Tp<TIfkBDk`1o(?r&>ycMR@>iT+~E6mn0*6(GRlV65;Od4xJZTU#!
zzU*a@FG9hqRcW(`%L}~NU1%w~f=SvK$RD`zaHG(fMNaQqPz`gAP1OBC)p`vbDQ!F(
zq#Rq6(v5b-=kyZTYwDvfbmAu4jul?6e=7s8S_8+*^X*5hHLB{<9V;b@JKzAN{FbSx
zMhvc$Zszw(>!7#x8BH`U)Hl@DZf)<)!qrFBvC~ufRB}1)1G3KOy&5EV_2h6RUq7TN
zX<#p8)^)q2{+Q|g6*b*Ms8vgPi?yWrT5T6x)2ZpVI#%A^Rz<ou=WC1~n6SSqNk`Ds
zLYH&rF2{E(V#lkADb2kyhpT$FmRU@6(V34N6;-6NuD(F?1EXO)kguzBO*)dM%q??)
z@{ThaN^Q-Jt!Ny8mBpuQ(R!p$L8e0tVn@o+k18Eks3^4f{X4Xt0abDJ4F{;^%OgqP
zf>kEEC@aDAi2D@`lW*B*M!GF&y2^%~&UDWv=Y?CW^~EJitqeQ9%D+R>^zY1u)<?Od
z*m+yJJqx9n!0*Xj!@aJRB-IVR%07<P>T2tn1SB&47qC-Rv}yKhTGv@&C#=#a;}Ou(
z?SBHo${5|M$_$cJdQqMl)pdz+(HD`XT56u4t20d_9^VBGQPh<2L?MP4_gdGo%=HGN
zRM&bjM=Sig%B~1%oZnHw#FQgxQd%?a*{`H!MQu}OlAyB2`&zvNN!Hs#NEsk|>^v_f
z&^0+U`he-<bKB#UvS(AWx}3uW7zWn47E_h3hKu_o>YZ`5jv}5A$N3>;;ilHL8NDg0
z%upV7qh+C*X?<B`5w`cRH&E&oB88WZVB_EwOlhTT6MUT-O&jp*rb~Y_Q>n@(=H^80
zWzcA_xs-J;s$)g~$tx?T*UMA>>2Mdpx;m!5nwB8upLc?Uru_ymUqWfpw_BKxN=P1Y
z?-o+)T_EV`ohhyPwbgY7w)(2T){rgU$jxS=QApxvbFbRzUKvSR8Dvpl+9g-z<MbmT
z*20%jw33HT(DwIg&QVor5zA_NH@uV0xmv9&O0219nzU`ccBW5?*c#;Z(OxL&XJ*QM
zFWuOI!nn~Ps-$lB(KWk!;_92Kx`nzMOmJMkfGn!?9aE|G!d*nmu%1a={{S@dJw&&|
z7;VVZ^$%NAQAQz-8D8UySyJhG{PhzVDs;{Jxg;X$G=8Oxo~>OZZntzbANqsm5WL3^
z)eLG}sjY@dC3a|7=;~?1sp1j1_8pZbvfWwE^aGyO99(dYtI_qg)0ffK)0f)#D;Hl+
z*B_fP%`4i#a7PO6IWMA0abC?;9*3$&7?rgGPmc;&q+=T9SI#3n@~ZUMweQP@%U(yD
zCmxk%pz?JMT4K}V7EI#eE1x2tUez>ecWjKdcVCrP>uK`1N?6<YTIzqp-kbG?-AVF3
z{5-7`e}#Hf(FcdP3v$=tO-&EN(dLxepfzlQmWVj<hTVEcPic)b?3vI_8|`!9NvHId
zm!rMgDw<x?{M?l$t*yR-n26=GZP;+A=F+q;$8Tl+pEHT{OwA1#v%;?GSR<!}(+Zf0
z=D@Es)b;wBnt~$KULH;w-cm<PsOk~_02-#CkDH<M&bBMT8_^EE)pfAS_#hkmVO3~a
zB%MoK8>qTUXxwjd7ohZ~MN`!{0vjW*%a@{3^bB!82{ANV#g>zGV2om&GZmtK8fbJh
z;qhux-rv-%o6?#b;72udug3)0N7VXQpo!m?)eJ5l_gpM39<yHse%Dnpc7w=LjO5)W
zS;h-=Zky5Cbra0AGmkbUM_;T^X)#*0kvI$zMb>{&>gtGTj@Gfxw{o!hzM-#bt~+$_
z<`c+rNlz+uLnV!?vsqErx=fWtv|+Iu;lNoRRjf-@M0RThgoTFEdOK08XXYD3$2j)g
zVys`%`qTt((<f_ujD>jJQzF;0s$W_9lZ3NLQ62p9k9`K3$h}7ClkVq>tB5GIDj36~
zre@$cc(SL}x}RBz<{4-q1ISsXw2`fQ7fqUxzSn5`zxtv^Y85oTlVkq?(_r8EgjY=I
z{;4f<MNAjD@pb6B4^mJ7$2(1Vzb9rC-e&@zA0&B&9*`!J)rOhS*yXzjMoUXk9t33k
zkV5yZA70QZni~Bw4d3@L1z}q+Px>YA&?)6-{h%!Ja@tHv;CNPxtJP_2xr_nuRDD6#
zlGW3?pKG!#y)#y>=qB7&blc(`%UG)7lkk42_L3LC<KFHH4>G-{{{Z0WQanAz80Ph5
zWTltL&j_f7fmBY%)xd4qOXu#r#oZ(LXQ{`wkEl!+>|Q_QAg25d(CYzyo7C_Za^1im
z@T-r=i_>&YQ1*`#euDamt@*;{1MMVbdLKY&RSjs`UiRMC<!LGZ00ugSic3RTO;-^9
zm*@Md`VN%pof(&=(`S;yhFFjCs_uO|1Z1K+{T3!uhdbIp$>C)6_ff?mi`KdDRi9Jq
zom)*#=qKsDMWBz=*a`mt3(hr~&02QulSI@S;mPz|vWN6Ko%=57tEs5xCTeple6*`m
zUqM|?e=kidU)uaHJkxrfs*<s=Rna@pC)_2Bi!W5^nfhM7nXd%XJdRpy6RJepZ=(mP
zX%!-&(#;Hhk<TLNb5)|!Fp^@8;AB~E`lgzN)b8}9hIU)|jf(Qx-4jWxsXv*gbYpfz
zav%9h@;<0#4`{m4bxLZ<cE>is<)L5IXp>e^mor|GfRE5sK9SP>JqTf^t(u+RCgESV
zq_sMz%XIx_oy_bUnlpmaGlbsEq*^^C4NzruQ=|@eEm~;0J3z02uVrRPy^EDLqtbfj
zpCOX2NakZr?$=#e=~~W{Pa9#ah=MRpidkFKT^Tz5O33BXD0C;CvNBeV$11N=>Ix^s
zV}^t|+*~zV>a?9bTuhYul+ir!H(_J7Q9hX=FjrI5H^CW9p^-1yrUyKCq|sSdTdXpm
zzMoH#pqvmD=AYC(OX&J;ilKtv&`Qq3)e;H)DG6!6Wv9|QmRQ<73Hj{dbgCEFc}DFO
zb@h6rlX{c7paajagm#}pHDh-&zF5f|IjGG~tSUd-buBymornnfilxup9TSQ0!W5~e
zTuLcMyDXs5Lmov<NRWB8zsk3yq0(vMxGfI;rI4)Zx~5#srcPQr?Lf1sDJqFFNcwZw
z5L2kXLds~`>JiYG52Y=fcsAi@s%dq`lO+XHC1~=(3S|bnPR9>YCQQ#D*sTpGR<Zy+
z9X-XLX9Bf9pxXN?G_6OfgZ93CpkRU(yfoUidylVJ)_e>jM_p;PC(^0Xgm&f4j9n82
zUWHUQM^fnT+V&v?lkZ0BYh*C!lQp2ecFk_i?xU5=(;QyvM}f`TmZF_CEGPI{h?IXz
zosgOStjDy+BS~+7FLa-*9@y^Yv<p74+USd8pkY2*EJB8hs5Sj6@xGPMr@k+n1v6sP
zOvYx!_*_m+h`KxdPfdy~o1Z2)=IdmhId@==IYb_(s42Bda@inbWIgShsi3c-(<rN|
zT>k*!$XRCm--IlZXf+<^MKlr<$ZdiTsVJd#l3wR~n&9R%{{S_J{{V&Pcv84Dj!z~Z
zwU*sUN9uH?6?|;Q_sHgs*LHv5WT-$DP2V76TJY@r6|B{D!w*eIM;K|7YnnkAXm|er
z1!Jk2WROJBcN_ubcgIbfkI|*qdXgCJO+mIvo-p8lNm;(0+gGea%7DiQZV%pYZV#W7
zJTR8)RE;BP_1XwOTOzvGN`9BAI#%EE)h=_I;lOqB)V&+BS!1H7>d0WCpVWlN2+!#~
z+jX?ob=plXfI6}EXYw?1SCYN^9@!aiLB0E{4O*K}uhLmnGhXn<-HvhPzx)-OZ3QJ}
zjJHnKD8JS}F&r;!g~g@WBN(!?)jFP%pH2S&r=7Aqk7xkpdA^4O<dKlH9nUrw;aO@_
zRWubw8mL_xyLfQ&7Ex_%-4+$G*7Z9}qHUcQ3<nB^eKx00dz(=Unp=}~wfs4iks6Ot
zmuVLV<ww`EGPa7)H!-^I#!;0njIEfqR0jYp`g@dH_1Pe#H1wc{yY)%u;a1SFx^0Ii
zz(wlXRMf$bEpTha@;F1$y@9e)Pr27WD443}g``CxW&A4t08QJ8&J%-(H_2HvW{tm1
z>MYXqiR$Hj-ypLta!StXI@MOD@@Mw8_-F_zC3AyX<AK0K$VhfL?zFZJf`Gq!sbh}D
z<qJyUU4ekC^oS}dYa0_9)4Pj{*%<FZW2m&()j7?ztS(8$6y_Q_FwrBf^VlNwS5fI9
z&6=Q3Q)>n=;4JIqbkZ3e$y=AC1e+`;^ohG106mlr4hIE9*&Hok3Y1D5ECB@?3K;h|
zV(F}v@Vk3Y+sb(!a-(?!tkJEO5b8ofvCRx|?n;^m$Yi^k3w(K1Q8w-t7qT`dNY@Rw
zaPei9jo4i5GdZ9=(E-_*x|#;az#8Y5e3d?$*lG==aEO8Y!B~D)1`lfk{z<yYhtU-r
z?uNzJ+EI^qHhT@h9guD(^lY%~x+%REZ8j|_*2H>t7#_(RwZI4VCy%<Gl1SkM)%ssi
zfn)>R+iniQK<aLFL<TnH!-S0uc8wsf(+)o}#{4GFU#AGp*Y9`2#cA3mqge3f#Ngi~
ztxliQ8(DgalGE{&RyErZ<n(~5Dw#8_O}aTd6<t|ZuhSd)vKDqWTDbI$Hkj`P(nvp<
z#RI78a8rK)%xjzS6H@dGWhEa{>MbBm{6TwVxkc(#KboiYHaU(6YMRj@^(o<DwroOL
zeSV@LvRD`!;I%bU1KCdKCaaM8V22J9WTW+>bTw4rvp4j*%UefZO;o}~JWP|wY71EP
z9tQRR2M!#p;x8l2bqZHQU+YH4M?7Z4+YSqF(t4zFwT&<Mx5|QOBCKg+iwv#coL}y<
z(z*I(pxK%nz)!q?%7a`PWbGcz>N;&siPZD3Ig&QV{{Sn@bxK;UmDYbJJ4}?)I`I>L
zLfv$3s>-@%4c_29@~!&EK#Qp~2gcApGZ(%Wcs>?u+A{8#-h=8$92re3EgYEIb7XH>
zXmL_U`O0X4j!$rK?7WLZ)up7Z{GC&MDu`dT!;FRO+E%K~N2kp!uLkY7zhyj-j!2Zp
zH;z_}OP>1>EOF%tvPM61Uw-5uU#T^^-1<FE*rsETrt^UI_E+>eXgtlI4lBu=Tsu7&
z$xH>#WWT6;fKlz*dAEggCWBJaWEOLI!V#KmlTGOv3miDy6yq|ED5t1o<Pye*{SdL!
z)6X!DtQG@{khF7XT9Xg4yRY133qFggk9(mHZ|t4#rcE`~6?HuYM^-&ra>umgQEFWg
zEi<=L%42Zscw22X^;ESDYuNC>b8&#Ls;Ho^gL_=yPYQhGyJK-p=^ivrsieFan(d?c
zg4A^PSUsReJGVCg(m*Z0!<E*nqBH{8c93{kjZ3Fk*B8JxICl!slNFn&r=ip#5<*(Z
z5A2E4<bpXiPqYu}USUmBU8X+L7ZwidNv3O1R4_7GFnpsZsrEEobb53TjgaoAmN^HD
zs=Z#iFw$jbrbloVaym(5_v!VH9|71yRsR61MBplJ=6N}~jPT3Q>T1SR>r=9%ig_O(
zzjZ5hy2&FfbF6+sD^C2SNDP*kF#iBhQ`PCz(6o?CoAb)&c&MtMqK<7+sh_Ev{Pzkv
zT9|5P-7{L>ASvdG2EOn~k;oxJ=wp`tq;@_+c;hq4MXfCr48$1Z4JU;9%_eA>yjoWI
zYNV1mpl#`-`xM%3cU_~C{{YS~a@%1)!q(A0mM^f^Ll`?=(hq{5bu)Kduv*-!NHzUB
zzAIMJItf3ip(LV_?7UMo<F}O1bm^0tb!ez{IRNY#Q9svdu_eD$bA_F7<t$;63rNuK
zs^}s9$h4hnQqrm$H9WZn<aR6CIv1_<j-sb+4yzPCwXAo5yk<&9jIi6|vW1)AkVwK>
z@xz7+Mz5n^(d~U{_<K(zZ>`cJZO(SLy7MZEd1+=a)I|8)-fk7APW~cmT5DSjlYU|$
zjjmF4H&tnx%`>EZF^+q7ZzV}eN$hlyPhjE5DmOF$Y*lqNYhPiy#TF#V{{YIp0>=;z
z6LQn!C2NVbfFSr>M|<4^RgVv89tz^)x5!M`3BE#H+u>t$ahBg@-n(6kTk4qR0+{&E
zY~2b7_Z`O;Dl#+joB;#6aJ7aOMjN^NR4#SF2fCQJa6)6+PkWBR6A)h*3yX;5Nw8k`
z`X@RvN1w95vNpY?)+J0^xLv9v2XHt^8{WfUY>kAOh0G`0g)g!EVK7PvyOPEOvI-)I
z(CDAJu2Pv`kXoV=3I1TY%qI67sNTm5cMCB{t0<y$WzopjH^EesX_T)!wrqEntGBl8
zup{V&mNRo;u)z9DCZn5lQ#<TdvX4+QurhyeJ<7^m>^?jqscUwS(hAKQ%Y9=(6#!2|
zDPzwdEY7D-s#4$Ar}bJtm<6GSQ8C!u*<8|8#a&KgKAXuFA>6KajruJa>t~)**EQIc
zwmu5Er({yo`v4^NJSS@U0}V-YV=>=0RB}gIr^t4fZ2tf$8f&rB`Yz&vC*NV(d?;q8
zd@s2d`XMPM^{uu|j|k7rNXs%%9N#uePR9YMo$)+aTz3nM;%JSq<V@_QsLKewm2kXn
zBb=vH$Bv1iKQ<vb=N{p2qK%euz6Z*ZLgu#a81kD;(qPZn?m!?R%RqJ5a1RQ3T3i8-
zp6VFd>)G6<G*K&Cx!2&NaLEpD-8eD-08p47=HTRfpoi!}*4n_~NcuCkbWRQkp%fCv
z94^CU3!|D7b~^{c7L36Q4(mGw84D_7hkF_x!{d;ogtAauQ4P;$3>5b{)WmvD-yOIs
zH|UdOQPs8H*Bc*{+Lp%n$p8l_Z%tTjD|SDzvWl{jSQ=a<4~+^yOs@?rHw67rRMI}c
zU!N)l1K8i{mmu(3QK8m}WMqN+fgfbu?Y7sob83M0yj*!4r<j=_FKfXcC@<_}$Os*Z
zZr`y^a~#w1yO4`37h_^1IHIGwh3r8>aPiqqPG7%m@8K&}2|DbSM!SP|A;U$@k=GZq
z#@`sihG?^KZ?Y&@kTaC<ERnYc#VEG#g_+SE9mjrqCHYU=f1D=mBP5_YX^bF&{!;<D
zHwo@OKFOy408}gz5!U57uOl843!9MaF7(eWH(8T=31jyUa1S02DN94YLx6XOA#Onz
zQZ_>2YutERfSVlmy{_9MR~d%{0uw+ExZH2^!bh>q<0Ih;7<SglmYn!dxuhQn!Mndu
zx5{_9zxR)Ys)2SyUh7-3P~-Ma4r9ff!qfedz9Y*>AsYeBVRl9bYxhJlhDWn}X6Lvl
zW=SM?;CML&TIn@0<&Qf7HnGT9&CyojBOF@bK^=%n($>1|C64m6brgZo?t2>M9{i8p
zR#a(r1<<^-_;JVXvXC2$yE>a!sDuWaIj6Wq3YvPM@7hnoqnbG)acRNwnYe?HN6S+t
znF(V0F64!W+U5xx*c3aV*z3USTRTbr00j#bWQ`WxxxPWl=hwRa;7`hUqB4U;#T8SF
zwm!k%D9Pw3s@Pok%OCwsRMeI55<OM|6`W6kKm;`;WAwP;B$E{)uCqs|r@WB6)Mx#w
zrlGAQi5f5R7QwsPFbMho0OeNd6meACmbZV9IYCQdXv_Xq*K}?yzm5|>>LNbohYuka
zS4~k%A+Wnt0-=Q2!)gA>?3j_%G1d;knWgOa#^oN^<i6lOp&)>Zm}D$IISPtjVF_&Q
zb|r0(keudwZqgh+5QVet{w!dD$!cq4EpRMx2&R~9B!Pb5q{!nTN9%4Qams)4;Di{_
zn3on(G~0vpQC#>+3BCwQ;)}*fgfe0WyaJWaVIu9qg5uUGTn{118XT0g9I)L*Vh=V*
zc;>|^Hx?(9dKhrG1wE%YDj|VjQtl%>Bn=Z19hWGKci`P~U31voE%TdwmIF+R#Bu%7
z-vC>MCGL5+OmH778pb#@pK$xGh8w%s`}|!c>^b`-jBao&yGpEC8H6>mw3C$KD_x0M
zpCLXuUdCEL2=bQENo#UbRh-SyAEy`v>?zF=ybaA4@|ySv{RYKGM2*Q8w}h=w@ODh*
z7LRWVH^j$qERf7^VS!|=m87JzrX&xA?c*vpcfHlTY-8E&a6cEyf@m5^1-2_#$=O;h
zoY`>sPnr_L%8tg#gG1U#&D7D<kN|gNC?|xwyx|H1ECbl~+!1uyA!~u*0@6UcPaoY&
z4MT_OL9d{XeL3tDUWjn9!9~YBZspi1vptRDDQ%%_0rc-__T+d`lJ>Y^9NB?)$I9on
zH)Pu9uuXqpphn8;*+0|-cq!7;5=mzWa>usd-|DuQ9g8EbO^RV1$x1PMCp27~@|&Yj
zz~VcnZT|qgt{~qWrsK*e2h!#310(_E4Od@9Nf~^zF{0hd^DT3(=6Nlm0j(d*;IbNq
zt6y63>Y9hVA0<<qpYcbX#V*fE*ZTg7p6sLkGlwUDu^OLOYE{?UA&rNC(`B4{T24tP
z=%%Kmsi=O~qj3klu(HR?y_=PFqB@$1Wq#+q&L_DyOk`8c;26?;El!itbIMxjfzKk#
zWux@PJunB;A2$k-f?bH@*@Mx#R<^FvNZpL`LfYtEI?6B_&(?dbGbtg204>6r7O}P<
zCUxiuf>Y`7#L;^=qhp8x#e$Z?*cn~4{roLvp&MW@6pSnxca;=?w<jM8AY5N_b%rbh
z1c%xe3P(Qn$U^$^SO(!p+2<m_;Vm-~I+(EC(%5)VJ?#d=B}!wKKrVlEH9Zp>?ti$g
zK};GLC7t$bapfA_J}7`P8@s?$Me2`ic4+uhdMEjgP_|%pMH>h3;bRY*Wl0=HM|+94
z)pbPB!qQ}st+&q$C$IIL4HI0*r4mRx0;epoLnt<FNv46m=e1F5y;G%W>^rAxo<Eco
z<htir>Xn7UDNJ#n9IVvS&pV5sBc9`wt<GQ2->gliQg!uBL3DIijhtV)#MWvRwUQS}
zE1iFo=qPF`9s^oU)}KY`I*E&2BQ~anB!zh!=*&^l%`=Czm8H?TUZS9fJQlRAwvW>A
zKpJ)eepZ@~Pl_?X0a}tLwq`Vbmx2J&SRM5XNlilx4FE6&WY$E+*?<$}FvoMc_(J}M
zudrbm2al?ip~bej0d%fwO@>qAAmo%7f3t*pdndJ>$Vy%=nCUndvcaNpw%lDqE3!`u
zy=Jwf6&=j3@5;iBX%12}1BEPbhPO7q%2HU~E%jN*DG17a`6j`1n`6MROp>DB)|;qb
zCwI6ZVF_c)`=oJeZsTATE~BkeQAS-P&1fGh0o0v!ESsUBCfsgQbKM}<wr{o0prO;+
zOp`Pb+WB66uJy#Tmok>^Zx<^WS6xw6BcC*mdyjHb(b36MAOpJG9KVoxrO`EAeDyCc
zd&|l4Q5s&0Td140ueZQgdQVBY#j;4?J{HqWru>aJrwm2T@&aWPy$iNwbl!?^cr&<*
z_FAnor|Ia!Y|D}5Sm{)i4}YmpK=`_|EMVZ}RY*!!GM1f<ZGcnyQH~T&b*w+ae0L+9
z1RD)gCyFt}_)aF+3Ow5CdI-H)gIrJz=vdhOx3MR+l#HUNl;wm4si%)jp`{YlNXA%q
zSze~=y&8Zyw4>B;;Dj4Xwgqgq({#2EbhZP%)cTCtWh^G|U;~@4A=EneSg)9}f|^n|
zy{r(d)B2ZLe(KtX#~J=sl#WgGf|0q@_02rVvKbm&Ph{Fl)O+khe5$Pzrl{yhmRC9Q
ze4DH5unml`9uq+|*jYSpjxTFP-Q{$TE(#WcGs=<Ajf~v#0xg(A!bf6*tEq;OrP4j4
z>Z-brswlMhoIOUDb^&>YyVRAMjE(|Q$ovIAlK%jR)R$(@sk*(9walk@KOuS6qp8%^
z%;!E=Sp1<KE2MA^H@d#jI(%0&Jd)P@_eL<iv1Kxz3Mr~{9o$O1(exQTP+s4y)|*Sw
zA)|GLoo|j6%oM;8VPL9|mtfjm35qcrZq}Z`T|rF@ZQ|uVnl^#J0T5wevF?~E$fIs}
z!j-K6Udc9w_d(ZJ#ZJ;(;g6J!q#9vT)HWfTEatt`O@)QAoct<%bEvmC#|b2yVOCI4
z)K*9&n{|odDqM{x#B1iR)aD=)w4PPwlcU854tU(|ZjaNn=El$(z^*Ciz_#G3qL)P8
z`v#__XJ7zK)T`+<_)Fz*Z;Yw+%}$3(qI2YU4g-bb)%ulpQEN@~%e@fnG;o#5w1Sq6
zE~ingbsXM~odbkF)=wy{52Y$}*ZTF%YoE#ZTE3Zl`hJ+kLr1;Aqq3;hk5g(DfBsMD
z#eY4PoK<Krl|7b}HI$nJJupb*1=W=_AdSMyv<eeV9jc?Zm1$EA1g!Q#2_FbY1un*x
zRbbjCzoyYh9_n)7GkYs~&&0?ihw}80G`oPY`sEc|gf^BE(Z%ee(fVelnEql?+ur#~
z;V!R0Qc~#C==GJFjdNzKVPg+#_FD?AL#OGeh?-_@1A<mI4KG)%hh!77CffuocT#lT
zrAt!hRq9@&JQuF0$>NP9NyTJl!d{`$sw@2(R{DbWHsCAzeLqQ>4^~&ThSy$aqcB3t
zQ^eQ5&6T{Adi>FDF}aaj`z}nrOr@gO@FZAklT$%3h6;_@;2ae-6?UIX2dOk|Bo0c=
zIrLO-{yXnKhZQ5K=dOUggf+c_*kd@m8zN6kvDEd3RRSoRd-zoGes(vRB?n<t=Bm1a
zxWfz{slPpy{4K7kr}b-Hv8@-{72Ca$P)X2j9;v2_M<ikLAB38of-Bl*Vf0&TfEHU-
z*5RU)Wi2t0{zFeG^tzu?>Tv9a7sk(`Pm_^H3h1<=*QxXum>kXSVYSj~J$P!F>A?$b
zd!T7_DyKM__>IqUlE0^@V+KZhU*9Nvjp>JlZ338`syw=(p~Uu9dT&is$7j;OT6-uo
zN@<~xJ|-8Q!D-;G*O<ZS)3L4jDv8A+JY^#(t?4~R0R(Mtdlepq)AC6F0Q#42KRH)j
zL8xm|u(A7Df9X6b?GimmI5;)#@={7|y%bQT`x?zNMAB&*9V}6YSr<@Xa|>x;<Gq%B
ztkeZd9Z=Wo2lVzUT}Q1@(^2d+WV{YQ<!(>@z~YxiUbb5J93312<I1JfwOwXWv9NQF
zR-S71>Q#m|w8q2SqTSNXnk~>zx&5<s2Ft}Be++ty0hXcS6V2|1sMYm1yhBf4BfD5-
zY4u)=)txDH^)`>d#t>hY)3he;d~KEEz13prUqt5}m6~psUo4)qlgjtIKH`t9(6##b
zeIZaA8iaLgA1=r#9BhA-Ee@5d)Ye63MCiftES*U*bw(|n7AY!yO3B28^W|!^zLwKw
zga$=tTas0UT|1iJRlpJd0CK9IR%A|deO;gZDB9|cO>DWK(lmW8Z&IvAS~6~~DtgbO
zscHQvDcJcqvs-oMTD5qrccxz<2f0?=EvISlQwjYb_jkRMB;J;VY$H(D*;PBFq|+S0
zP6=(0)cTI0Ji&$#)}G4kwQ<WJft2iM>_Fu*wt`khC5*L-f3oOxPqAN1RV6-Qjkn~G
zg`|P(k<rPq!u)cEk64O13>6hc#A3jsXy%GnZh^ar?p97$Vf|<uRi~$lKUA~=Gs32i
zTADdFQ@{w|m8jGxDyNHgrUQOfc3(n@eX>F~6Tn(r?_#E?vZkt~o-Nf=78_&|s&z@|
zZhbkL;e1_OL8j8y!|Dbcg+s1s{{WXeSwvm)Wu<9!7^QuLXojWkymm2yi`7~SLv44J
zS))>FQUF*?4Dn@cD@7>0vNiGn$x9qpx6uCpB@t;)r=*OT!&pyppGzRtwHDJ;J%nD@
zz7W)uZ`Eq8P|fg@z{1&S8Wj$n!7Vi>r0_3wR^q+rMBD!WsiV^RKUJlqWTEhuv;$;4
zX0=I4BdO|OW1cWWLaWs}hgfVz7%B*8#kgL1uGZ?&&gs2C_q)kT{{VGsp{++uxax@`
z)n+V)fLNPuBZS=!qJEl$x+$Xrn^{(96n#ahJAF$_B0buyHO&GzsSD~IQ@9QZ!c{1x
zvu*7R)PEBzbqmq5GBaZ9a+^h@>KcoMM3cR@?A2AGS7?;=CMnoUfw3f6YFny?)1UOv
zTrG^GxG7lIIWEa5m~^(?)vh+@dzVw|@mAITRK7Q#s>kaPYMRAcVyT_5HOG)u)`!q8
zrwyovx>;Ro+$*bOUY#2G<BmEfNfaQPc34^UtzhaVo|ciW7vSM&;?*j&=Xw>i(iRME
zE#*g9t7sPW$ZKRC3P%+ub`>VIKyp!aHB39km?L$t;NYXvwGOACccorl$j2V*p(X1Y
z*(dzInH0sm17fY{zdbB|t#G~h4hnLMY<Ni^>Rncu?%wyAWbOt~eMPI8U@U@^0(-f<
zA}QSiWIvXsVSoLhMPFZ9PopM=C1JrfPg>coo{BD=(rM<XH8mcWse9V$>r~dG(wYD)
zb9{U&EeEEl>qwQ9a?!k-ousL{hodQ(4(aNoBHz#!`5{$6<2&rB)4Gz0(R$HTm>zRr
zY^XK=0K`pklbT9xNV%r~-55GkPm~zwD;oK`G5A@XOQbdW8u2YojQOdrm&EPLZ-j^a
zmt~Y)Kh`}(5S`kiHoG=1P&=hHogz)O6%m({Yl5`BJReO+1Rk_R57Od6LhCw}L!{e1
z$?bBQF^qOBoSurQ`WLD7C`6Ri6vT64@`9<*`maf8WXxrU^EN<2wry`wvNQgg_dTbJ
zA)%n^Em7sw^)kosaEC5^An<VPXH05(j-OZm09NO0cgo#O)EcRz+e$a%2Xf2B)3k6j
zI;T;VHy-x{Ehd|$QZgo(^_Zk+95?`yP;KaSktMcJ)}3!zyB%IB$n09HD0)j&6~3ia
zOjRrgjoht<p(O<nFZ|Rc*6dbJzpPyZyCZ}+Uct=^Cexu`7qd}G)B0>t`i7CLlgL48
z721snETi<CJ6%;%^(|dvHbI9UDi21j@)>I0K)vu&rR>t1e!#1BexwyXquU@Cx!See
zE7na75!O^q6UQKeLeI&p(bJI(4Ro@cTGvy@L9JAQBWRl(Zpb!8&V}P<*H-GCJJ7r8
zA($S{ZdNXSt<Zlk=08qr^UGKY15~D|rfD<A96;mBqZ36f!?dQx2lE1&GUd=5S}rxs
zTT7{genOwoapu@iY2LltC;E)=cN=9PQdAmX;krjc7N?}yqRSZd<}Wt>VuZ1&1Ce1v
z*E*(<;K=nVnLz&l_oZocuf}a)7RJiySbRKO6-!w`ps;U_nU6h)IaazA2TRnD*{u=z
z0R@ID=+0JX8Thl+^I@NpmA*?7NBFC)#UcLyP}6CoXzv?T(CC^BIHITyHsFjZ{Z~b)
zxtf-aISAtXC`%lyx_Icef8r*KsKNgLRiL%!!>NP6;ZSP5Wzz7Izopt6-(+Ql1xs07
z1B)u*6s{a_LK|4ssvgoO5L89R=CoZ-H_O;uBG!W`b$`RnY+9y+QKRj4NNlX2>3_p&
zk90cyR0Q^s!~RwuPKE(e=|n;7fAVo;bzYyM)HC>|NFC%kbbK>v<0GBTCq~j=!<`DQ
zFeo~`gBTBJC~AMh4PKr1r0Uu?4#RP3sOiZxx+p^(RL8Nsw`Bh6E~C`+$yi%MSt}?0
zUrh3m;?4G$>UL;#55xYh4Bh^vNmx93wnN3D>U41WRhj^r-Pva>j+d-;T_E4Gz47)h
zV~DrZB2QIoZ<lN2F}wc&tl=1}scw)RJ>7(BnoP5uv2^uZLir(<S&IIYiNwG26;#rH
zM6nXz-Fgm>t@R*-dut2Z&5lr7-&$*Q$8ALwJj^)vunYeHWj6A~{{S2R0N8Ca15Hf^
zn(Mxrnzr8-R`6^31DY98)9sD?Zev!PO4aAoA`<@q>BtLRoU;W>RB0O0YC3Sj-|Aqv
zNi3~x#g8BAjGyE*jYeSVclvkiMeMC9`e*X7`mL#?lykJ5r5#G%l&P7lmM2rVn{SQ9
zg=k0Noj$1$mrUwOqYfXYKpp+nA?ISMm8boP@yTq!YEnoGp=$(g{ld)D>6Mid7Me(9
z`&oKMt@t<9P{?MY)oE%-;_odbX0<9Fw$Q(YU(?kSMBI9@GkE>Ns?MeSS~5v#lob6t
zAbSG?BR#=dnpz2{qaT^mW0{~}g`PD!l}Wr5vNBHvrr}9O?S7p901{^#{{Su1xi-5s
zMS3hGlS}-`d=#@&$S_6jKV<hwQ0PC0M9D!vsiPz6s-~r^nxocyyJS6pz18NMQD3FN
zC45m#!Z>iTNeRhyu*pI8Q=Xrzs&SM(@e`b2gz72^`U<A9YNF`xo!o_WFJI{Jw8vkh
z)IjsYnUGawZ&7L5leW^bO!2r_r*TtzK#SqiJvXK)beSm|>d46)M+HAs(zK1Pd@(}j
z59RW_(u#*vc=c)BGZ=fYtB#(Iwt}?HTUP0qc@lCElv4H;HuprDr9Cr4uSqlw9l*jD
zTx%+NVwSC^bdX3`<Kz&%5)Ds5t)ei^4nX}tEPlHloakhv)8yXU?{f&@9~G!%@3Uw9
z;n7XhbjB?%j-j{rLN_0fsI=+K6PbVnwB4c0S5Z7#j)uxeh2ID+K5Pb77N+qMLGN(A
zi#*1xwXdp<zg>c|I9p8D7Va0oaPGDpK~bmI=+aQv$rYqO!*OuCUwja-RPJp>3z%@>
zbMmPw!`m&(+;*I2gtA)D%CBMd^b=6lib|Fi$Q`!!!TAf(H0o-2x>QG20BaaSiR>N7
zS<bqzWnV{7Rk5x0-zx^|WDqhCH5%P@bu(a+P#72*Lq)e+xm$e!{gCNmAN80T$F>%F
zhR$)tf$#QOUbEI|rqkr4rF3-?#x1_r1L#&JppBy(cUFBfq|K<uBjRzqM)vss0Pv#I
zYJ+RCpHA0n;ih#AP7$!3#l!U<y58vY@>f#|!yf48goE(m%E)UPJke@0%*ef<?vld5
zFF^b`nTMtw9ET9Rk$(kftvdttMk7PgBt1_|(!wE<QZ9R2mFPOYl}}Q^PVfj|uqvUI
zwDWaq=_vrUF)x+GaO-3RSJiz>G*h{(2H@BbgOx`?t9u0MS}i+Hf$_%H{$bn!*<@V9
z{{Vz^)4r(s(#Txrc`6T22M6H=Y%F6KWMKochtqcJ5pb;ZRy5YJj=*uU+n$)yAYpw&
zhp1b)0_zW|ql&8&mgvGqNa*RkKn;oS-4#t-Xa?wAx_e-b8l=|i8BpfI0|O$6+T*!Z
z7O@FG(A8^aR60tjjMC-jlARN5Y)#T$+$UPxqLmntgeE!Vj@$xn?+Gjk%47-%58mED
zQ9ZyWwAkAjO^|2G5@Cp4AGm-yRzI0!1P3&e;a2JScmnHP)A}@ZjrFG>v=P}Vdox9K
zHlJ6ik?2P7!;;{&dS6V4qHXG*y4~^>gb+tf5RMjYXzUSiNwjAcS;++^ih8XEq!IyZ
z$HEi+7N84BPWJ_<6%Ho@`=TP4f-bU<XvDuj)Eq5N%Z|+^%BHhV)aYcrL=RxUHeR<I
z*yiJJ?4zq>H8B{f7zjKPI7RdX&nsr9JuD&7`-cR0MbPyJtadzreiOQ%OnnURmKJV^
z{-I@&f>?!DBpcvxv?Y2MBo$gVRrAPUFKH(WI&|voLTkkvh(1;Bj?+AC-+K=#)K3*N
zY{r#p*(A*No1xWHNDV-9Tig(=>U7;Ec>e&3cD~%*9BL(<wzd#eT5~07bIH2KOsjU5
zDI^k7RR_1WQq)8$V-1o=wcbJ+N*aMFY%*f~%CVr+Dt7zk1buFq0kjK8p~rIO)Cc(l
zD$b$M;e9jQBx{_}!qCf2Ejx)42Lpp_DC4Gzq1$A0ta%GKrl`tPWI7J2S`MIwnpavk
z8w;;vrJwTEBR|7;_Fie!eLb{(Vt|t)GxDywD_{QrRH8IBM{Q&nAmF%mDlIjls-?0o
z#qN~c=Jf`e&>TPA4IGasevj0Ps2am9?6-7v4XB}#il)xRtb4B^*Q1v~*QAMnvKdJ%
z_$eJljGJYTT<D*eVANVmrl<E@a$2rBVo4vO$0beMc7qfAj|FCrQhL;kW8O(~3m%Bm
z^&>R^kJQ_=Tk01Nl$~hn!1rv_MXXoCNDkiK#1%Xm+n#MR8eDsk!pT!r7|*t&aqvny
z9YMlR;zS(7@s;OriP*AA_KkFUjIoXJ#^(?FU35KHQc4cO#=FRH%BO8pBmmRQV|QRw
zPN<o)0ap-~Gu#ZNaD9!*2GsREJ&PoxEk10ZhgRM0g~g}E)UTkUt&9p;TF0N{kXZc{
zRc#GUoa@ORIlE34QHu+cUW-|^Ii+ZAOdFawEeL<iLCioq%N>OVovOlF{{T@Fw)s7i
ztLbU#qA%0x7+?J)to5TsUto3d(bOAC&r1F{S<OdDd{1-eCf(m?R)&{UGML`mi|`7X
zDteet@nL&y@VYVGY>rA#Ms9~+t<z-;o79Mo>tUnyc%6-8?hkLu0;ZOdv4%RB8teBQ
zg`TeI$zYSz)2ASFu&1`V6+1mLDQK$3`gaK5@R=m_G~|gICTErA6xy|ZobcJ$_JQ0j
zK9$vsnXPP(ZNIunH2X!MTh~iTIRZF+IXO`VJU5Gv?uw_X)2l$aXeALP6Pn%dygi-}
zN{uMlRtWBzLEDen6E4tf@Ig?yqp=@k%1M!w8ti-}hCQxeHu8|g14$vfPr{6IYyQO}
z-1dSUkh3ycBMu?=-Fqh)i(PP3VWhjpQo1KNou=yw!rMEx*qg3#-`L#(8zW8aZ>l00
z+!`*>QK1_Y-ZzI@;1y#PPMc8}ieT8?Zb}c;f$bsJX+cd+*Bh|k?v_~WXtufz)HKFK
z-&USRmh*z4qN;0MvQAWRu$Bh;j%oNfOp=yHf=R#1RO>^yx3cYyW1G38eUr_|3W5or
z3FML7D=K=B`)zfdelDB{GWID8#@-WsK;yN;CxsNCjt#;TZ4WXI0xp7{N`fth{HpO{
zbCLcP=ABU!B5Zd>=qFa`6EVA*HxGqVEOJEaI1%txt{R61-LC{H?N+{)K<JDu^#J4q
zF3izD**7?YWYgpVK35iQaU&sfWOD_JMUgd~yB{lrrKAo=%2zdyZNaz2)GoNQZ^Fh1
zYnt}rz^L8`<S0YSN$r(0U%jI@MHvmZf|NeQWQ48*vTN*4P%uPOxxA2D{!`yOP6++b
zjRUba@Kc-#JYiv3Gq#rda(gIb4i~t>kKWU9ke$4qPwtrv4*jI$DPg2CH+xSBlQWkN
zQ(>%p7`@x!8z$_L&6Xo)HsjzT=%kBtNs;k8`hiJLR|Mk3+1?Kd8pf~@v<v(tXvzJW
z>L*C}H%YRtJ90U)s@3ReY5{Z(40rT9vZbP)rj^_2=6enJy~pgVq}3fPfAy649LT_v
zB28?rHq+5VUqI&Gz_fwLRm`4vPRTCz`C2JwjzU`ufy_QobrdIN@XG_=l?0kP8%(VH
z!2VYM0CYrgdaWlPPU<-*+{3$R_$gs~m_faW?2G<~k3-ElXt)Od04ZMMw_~yoI7LBK
z85?95`BBwL0dcVw9#FAZBVo6=9jYmdL%bfz(g(W!k;VAs2T>{Y0DZyvP6Z}ez(I@V
z$&*Ij!o?2+p4=R%nKYZN`iFvs(;txfU;}I%0r^A+2RJqD`;HJ*LN_<raO28tB=W>S
zaSm^SgH7xzMU3#+?`6-(Q5%8o0odhD31p2fX|s|{*8z77B~R=P0!b4~31fggfk8T=
zMz_;;Ti(dI$RL1jtLM91sJ1H!j50y&Bj`$F-rzPoTzsLJ{igS_A(Dp=;vL89!Y@Nc
zLrYra+aAz%I{yF(?r7V&rA4@dgJdkCRya!I?QjCgTIS_9oRrrzfrW-da&0cY>lMtA
z!!8)|6JFEF7fsss4{0QLMzkc@eLY_db);{Ca*AUilQF!o{{TrUmN$*Vb8PP@)|U`1
zkUSvJAWt+-jrMTKOlif6;UP8-aX(bx2b8ZzY*nL!d>a&@_BjdG9q>{)xz7nuXy=Ib
z-_L~u*>mm6kb(TCDmR_BxVO<1B(y?JjfmsVDp(vC>?S@y4W7{P*ziK;ZFXaDK0<0H
znhJAclwb?|s7y{_;M=ljac?*(Xy>zR?{M%?9=?e3GL?_=N+6aN0>NwY6mE^K$j8+S
z8EjA(@%<<JCXiv}yTQn^W7zhb{{Usol(!cr$SVn3AGSA(w19jloYyhfC8a&ijN}5-
z{g*ad5F7)Vc^sk#V;v>N*&BZZCT`kp(_~BIjljMaT>k(`?1wEIh;ShN5EVNNqtxev
zhg$rOK~_=f5megXF~^WND?COpk%YAF2E}I-z~QpvRe(97MvfIriLo|DGJWxY>>mFB
zC}|^jadUDIS{V@79JJV^E`Rej>Fxsg8BA~^Alxb`0ii>0$19rY8^f+YWY)N_iz#=t
z+}IQS(M+4hm_-(?Sx=AD&f(b##w|vQyAD5>koO!akO%Udq2-B%<mHa?IQ@~RvND5;
z(QjD|TQ6YRh`*`1!mE~=IR*i1`S?pqJxw_ww=MDyKV(#-Ngt>in`X;3MD+Urj*N$G
z$Uh2WK{Ex~Z}6pxS>kr%8)Rp|;abtl1k4*81CK2!T$(aT^iXb=7i1Qn?3`N^{{ZeY
zYrm*rXeFg%u_Si~$V17dMoXN+K8q=%aA?m<M>`GSaFBT5s2ek(b);*Ud^juD(#Z?)
zkE&$bWMO4QEqi<1CQ}u}u4K%UA;B)!437QO6HqiA)UGZ60JNyRYKmiNSZtoq6r4jh
zZ5adiP6qsTP{&ggjrSd=<v$j<a?KZxLO?+o7)n@dNZ~|W=I|~Q)YGx1&NjNA5}fFc
z__dO>;G-V{B^PEchL#669grxcp*^J7VIjxO(=U_Ccy<m}XmrK61X&}FG5fBy&lV{Q
zag&6mdm?+kbozIIa@#0m1xrtV(sN~4ocS~pyxPFr9?6@9@q(D<xI3FJE(e?{Ba&}q
z?3PBGcJibz+}oQJGjGT#Tti!MY=nn^*<1s-7P^ldgKx4)p3-yulSV$DDrZ~?p?lbU
zt}1WLxc;Gko1sA?x>9q^h*K!y8sAP~&QuSla6Zw66JKL~5iFdB^K`<!0zH=G6(6UZ
zBd08qJBwWgLxs)OOv%{G5&r;$ocG~KNFzL?4F%k-VPing&ycyr)*|<^aba#kO}D{V
z6=MS&1@GNT(BM0+0FKuRMw}zqlF-2SwB(z8Q`+`8*~29xfW41z?3(DuAf6Uz7DY1!
z@S4+Sa-AS>Ja$oJjtVHvk{zzS`AO-IAu+^{KM8*5@6aq`UilnDK_sg^KSi&raN7|L
zJ<9b;4wj*eHMH~$7XD`olCJ4=ns@-aS}oWG(vnA+Z1cSzqev}%LAuxJnguis17NqC
zE5S?;=>enVJVXHiy6bWUdj@1NL^iRiVH3-D90fCD11GX`KymIu)*1qJJKRYE>0_pI
zNG~S-6_J&IS*-y4rZJ(}aliON!pI_E;FZsiHtmg~{(GsV7_?&l03}CHPbqilE-8Uy
z1b6p7<fgffFR)^>Y)xxy^PdS?7~j$d)nI_dOyh0V2&mzPF?(G6l;>jh&xDT{yPQ7B
zY(0))1o2>=8eD8o9fGLTwVDk%j(qd6rrcd(b+5!w!sbv7$AII)o646%aemKAtE+~R
zBI)L2V0kMauYMuX(y`IflQe@DZwt${j-u3c7n4y^^K-@Usox`<b93;KsZYHHILD(=
ztaV<asXT{H<~RCA6)7&2_9VH)+T}+>Lp@Wr#~Yk)`z?lp((Wa)RG*tFLkf>Vyp~jH
zx&>8RcNUhn&9JU$Iz{qI1CO+Sb-2?s#<7iH7HI6QA*G5iI4ROdU9y8j>8L5%35*Yt
z7KSQVVQAy%6R+94c}zDi!MfLBN{N7DMZ5S*^(j~Y&m}STX+BU29k~AhEz^UE2_hF4
z?xief7j>?%2uNuwi$iiv%8qxI-(}Phi5`DZSlyC7cMsB-(<7bTPRejd-feX9Sllz8
zB?}D^vJ=aWJSk&!kF*OUbH$W-BbzL5^i1gq`BAyxG?H+FtgnKVq{$;ivy!phN7j(B
zu8NSCyStR$M6^1Kdo_BFuSrP4Un5y=Nh=G~U2$UQ=*HvyN3zIjn!Qa^++>uS_Ei^r
z(qW|hAe5!qxh2qcqpQ_cJi2*HzW6{he3D=je}#9VbmdN^D_RACIbN63pN4R?f?1@`
z%Cs@kB`Gt`x_dyHvOr$P2KiozrgZHUEG@Gx`*UTnqUk80VDz5PYGnFkl;n~w2XGOS
zNHJDbQBbj@V+z1AjAfbv3To}LdQq^OcL=y{=z(~#J&?OvGmSBU?)#^+d$>*!j^!vM
zamvOQ(>B~rQtr1YuXC&}qPZ@~uvlP?_6ir)%}j3%_x7@Di1M1o7rNnN6?N^^H5VVu
zRJb?5Dk^@Nf=2@*H~#?jWoaOxbB)b_@{1-qcI{}n^K=r52H9PwXtdOz5er*yg<$VY
zH){Z}QAtv4ams50-h3@q8=;aglZ1?jwC>!xqIjv<x$YQQE}`ohYF4?BxH;p(SxrPK
zS)<goI(it3q<9t!&$^qfohImM2_N??p1H48Y7&zqhi~-X3Y0m|eTHt5oVyLB&_#80
zv&v+V?r|q1sNihV5Euyu!m-mdiK<IZ!(z624^6fp9Ohj86=4)kPRdT3>DS8kzJ4#9
zFF?}txZ#X3qQOZ^Md&npc7<n78X6O`dIuD(ZW;+wMFH+Ch>LF)DndgtQra?BM+{cy
z3#z1KOeC9GMO&&;(y*BvKXr=gKBtc@iP!J~NlWN;6603Z<AILa;7Ivcy+>25)Mhb3
zxB_`lM%ukfU|+eh{{WSw(zLcj(d-wugkuZbfhpHOIwpca5>0ow^L4M&wCI@_Bv~ap
z0{|`@Ahq72qthWfo(sDGa;n-$m$LD{m!>y!n}ij1u}t@RFgzFh6^o(ND|(7z$eiey
z4t|Q}4xTiv5=Qc5Jd$`x@(;nif$N<wRjCtEQC34vb|vY}E{{!cYnaknY)XEuRXqem
z&rs(87CvovRMaZ}053xkZsTIL??^V1J%*22r-gx#MAs4fDW9vn<?u8E;02cHEeBVQ
zm{e4_JB%mmn!S8)6!i3>TVVZFl%%^L=)RTz0G$Ldh8rZKrEMFx%P#ep)92NFR+^Z-
z7GE}2mHM?EB`G5EOKvZGpt(JU;<Q<6-AheM&AyOu1C%b9X4i-eo6=$9E6VkaOINS2
zJ6a-)o-La%Lg<FgPfHw=$!B*|i*kRktyf0Lx)!TNPE9pvBHVXgf7Nsq($s@jR$gyy
zw_06uU#b!MaL((IU=}3Bs8m<_)iOv$?g2@WMfw^R8=}K5pED+r*JwAg+&`<Lewt%s
zLyKO^Gd7u3Egz^{7{C>NoX=JMgLe=x;<;ynE$JOAERhXkW2>(+i#_+g(c9{-w7oM_
zsoQecq3{%x+I<BL<@8A>B;S<<Z&8StVuO2oeHG%ARY>QQoSusrsA=d(FKc9X_g7ja
z7K>Bvt($26o7rGxua;4`z4ATXm32mq)Y_Z>0O;E@BkXQc%6HJwi(Q_(sMGXaJvsEm
zE_fKl)>LW+8j>ieNr)atg^;AsHN7RKN~q+K-L6SmEhf6SFc;Gh2au%}?(DOTDrKEb
zbLw0hJRX{f-6<xbJ!qdM-f_WMj;iWO;*i857ahlCd(mBAsJ@&-1YC<<$>8}rVzi=x
zb%Rx)w8Yo}cLM6Fmsr=TE_MbrYxTW8s=OMy*R+w4F0vIG#B?>n3t6|ZD7<w40AqZ&
zsE|~%RH>Q1ruPfwY4lj6rGObtg}-F#U3W=jH*t)<+#qUo$m?YEBQ1@m7gdB|9WKbu
zQ;}~xf~ahYp`pXcR=N}vtsqv&)8zSC2z2^dFZ#JP7Zc5|g?FU&2AJsf2%RYyxoXl>
z_Grq>t#XS(ju%fAKx2n+R#X1~Rl`9eqNb?bWbUD4nvKOYPTS#TY3KztP-RR!l^H?H
z`Y5MG*ZQujuhjZcRysBwNLFm<>NuDtubj?#vyUsFo|cN2d=!DE-GYXPP_EP_AO?u<
zY@DTzDs+eW6>N^an@^*K$4}B;_W^>|@~V1jw^N%}^s6YOf;-^3wqA>->TT0vADCoi
zw(n(Iu5}$Iq<tzHX#GLmqlMVww9aJ0bv+&$%`n=a#%<+!&0P%!l~C`^REY)d9C=oH
zy)RQ39Omi`iHC-&8g7@bt-I?1o95~hZM`ZkxY2E(*61}gp`M4V-ykhUp+TeyBI<4M
zxQ@#orfBC$s2d|}V*UH0^_SLEz+;WX3x6q17`BPIB*EyT)TOE|q^XS9<0{$ucCH(`
zx^QFg4=Wp_vU&=~Na>y(d-AoBjYCzY4Q*SR*LhQt$hsYHeX=)HXw>epf)_u6NYCz|
zmtE7TU;F{KLx2WVZFfsl#W-{8ZZCTg%CpmSDh-?Eb4!8lnlf=)6~#V+Vy@NoNQ`W#
zWKBFC>Nq+#R5N~NSw%qR*20pquTIj&DkHzuT=ef)(vTP=WxlH{sk3}_*<W8*Ri;yH
z8hhN}E$s^zscT(FRXwS+%7D;$EndAosixL8&1*eF<s=$?eqT&tG59D-b8kbeaQ4qB
zrPMltILl?Ddr9Wv$n7ggtJSIp=OlD&Cp${pYVNBI+bnToy^uP6R1GHWYaTwxCfnF$
z6qcEHq-eT!n@$W<7rYJ%6H(QkBoUa)V>rE&C)Vhx<NpAtm8=%#>piGy+I4BPRhGFz
zc%weWjz=DijSO02;NL9KxRJpsms6qBq^R~%7XWW|i>fGfJuZmeS&PY0)%A&Fjc$_*
z<dXjY$_`elRGE~Mdq$nzO-G~B9k5umaj|5zUZ>SMjsArdE2CjH-dk%emrd##j;9bh
zj)x1e!-iFrRGJJ7x1=a!K0vk7I_^a){{RyQrgR%bf0?eTjn8&Xv1M7RM@2_d`ARCs
znNBP+wpz_DsP-4q7%HJ78xLiIs&!2srX-S{COjS-GJ~eq&{AnIx?Z2uoY7Gv<c@4s
zuSV*5bXK+}QAsc!8+7Ui*H>wmYod<hKMNPD{{XD%+K^za5(k_BI9(1cD@Q*h-p@?`
z0M|5Hn}07hme`(g{7BVar_$6qkTp@dnWvjH*sQC+)g-49Nh>j&skAuthe}++($4}*
zf|HAVj^)Q_E;&YvIEk^f!-96*Us2CXR~@F6tqvR@WTn)kk89vyC%u$sO^u8uvUwss
z>@b3iqv$QEF3XyDbc#8I(J}IQ0NU$QLDZc+99w46>Ni`G+pjLGt9=OrPpT6So>bKR
zL953f@fyc?7F6Y8acSAB>Q1_XoVq<Wnan+dnzL0Jwy&v0>bkv=x01_UP-|6swx;l4
zq1^C!00n!}p^(DXYZ@HQm-@y*P)Z70MH-tjnzp4aEm19TbN>LTxJ=Xf%U_1^wrOT>
z^tj!6UZF0O=nEmBgn~bvw;^M79U3z~uTN1FCimI`cH;IeKS26+wX9WC?~;g{^LE)^
zR8l&+obIBGJn-wMbkLQghi#Ay5<)AfwRX`^xVAPm*1%5cgjZ!wmAgcc{&kJ??}FDW
z8ogqIt`gc>hX)_(AM(7zR;$)EDNDUMghztWg<+yqRq5~sIj(RWoYatl_EJ-o8fmnb
z);vi4PByR~(r}Dy6f|*M`ce=%4&`9A?QW`9g33u7ZtQ9Q0EJQ})#^v^8!yn^GihlG
zmo2kNuJr{AYRpp62_wC%IZV^F9-Mo}{S8cRJY1604wciD6)qCi$mTnn*<MFO4xMM2
zy-%H)Q{ffcAC$XDuw^YA(U~asLhD=*RVJ$aP;O(VX=fKat5@o@BAmByB>Y)sH8wh?
zUC>m9f^ZADPh3zNZ_wHiBoc{O-R~I-NIKVBp{LvVJ<S5wS?V60>N>XXppBCc0!*vA
zKAGwW!%cg3H@hAW`BRlOv7^a!XEkkaRn@025lYt{1-MS7hg@(QS$3Xow!#e-kO4e`
zo&I?VA+LrRKZ8*Wt?lhe8OAzAB?m6bO%tT$)hi=*trLws^Rd}po27IoPEpf`!7*XC
z4^<j;l2!izvm03R-G<89oi)@oZ2`4%TeXwClC2^?8YudPN*z0MBc^1Q{*bBk?P7vw
zT1_Tx-`2*Ewvv7wYE!sNJ!ba~&K6f%W{aumQ3ke}mS8(vDXfilKgOAdI)sgAbr-K0
z>?LWku%fTmUkP!QfLoTiXf?{$25qd<8BX5rXa!`ohV<mjE_Sr)X936QSt-rk4ER9<
z*Hl-sQzVXL%{;ZpI`LC98>7+4cQ<4CRWj;2Y!x1rJ$vR2{$lJD>b|U+k~>21@oZ&U
zEk#hSJhmhnjYTY*Drn|}_#s+pm0EpV+bX9qgXCFas=9{1QJTg12OkSt(%OA)rwC)C
zh5ku4aZeewwoY)5{aLA(N$HnTl4p;L+?y4P)ElHhsR*cQ90@k}a7r&*={;hJ{=GDz
ztQjnj;2>zGo+ppZ!A&!V7RXB}sk%XeaqQf5^=7+83tt40%G+>4Cc9L9X)V+=ig^!r
z27k(}(DlhFS_|n~8b6h;!n%J{)48@9a~|Wy>|G@CN-C+33~+Ak6>X%JQ18gRQxn5|
zOn-Hf>bhNWChn<oof~*_NFv{5>pC}2zh1PG(g+&w=)$(tKLx03sr^`W8oGHc`gd+=
zLK%`@uqPeqpFU|Fb6KO0NzxZEU<)hv_0FZLM9)ODF!^p)qh07>({eeQg$y+?jwLbP
z>ofUX74<*#&1E?Uh9p^Gk<!rr034#PvM1I$dosQqqx!b3*WvE7M^8}7VOGY1d3&s=
zU7*QdPBzyu!?$Hy28~sxR&JJf<Y+z?@^Ev9MB^mc^o=1C!q>$pb~_uQBWs(7G!gPH
z79;TQR;F}JfXlJqa7y%Ogi<s)uW4Q~i-V?$J(ZK`T5V2d)2UwL+{7-cYPvH)sJW9%
zh=br+Xe%a;orT5i$I8p<{{V>k28nTBQpm0SNx#Uh*_0okX+I45QdjQuYH8eivQv-U
zbiajqTbM*zrAFWBdqb5}-;TWq*X(sfk9U?b;XzyY)zR*RntHjKZHut0N6C^}zyAOY
z!|bi<Z^Eh&-QS*x+cGyY%L%OL`hK3_8{1ECZFY+k-nsl>mZUyCF|V1YyP87DX`23}
zsQYFxyu0~d{{YJ9!94jL%b?4ISN3`@OnSwlI%wM@WMa<BJE%0xL-NGCPJ6yuE>;Dz
zYg%#j;17Uvb{s3+C$06_Ef42lCy(NbE~koi1(FqPtdCFBnK+UM)YI79wEqC%X(*oA
z8qrlOVnKrE3lh2gSy>Ce{AWP~>^#X41y0GjV_k^)Bu6>^Q0ov-pX$?kG(T&tl|4UB
zBiE|w?hTqw4hUJDYL+)tO%OIA#>-VMoOBI#l2J3C48GD`$OUJ0>0|!@Rg^+7*K_52
zSZ1db&o?AoWYFyzhx6K8jE)_X(&pp&$8c2*bvSWzfVf*uhp3FrQp1N4bxp3(3QbZ$
zk4f&oz`tcjNzpyDMI8(3`Zs84{u_jX{z2pRRE*sNg~!!;bvBUE(-B9y!LoaZ{{Xmu
z@Vx6(h1B(uK<-%LFXUeZ5Bm+;BB*O$1>0^`&+yIB(^5+$nY)Wf@(RYo>Dkf0>JgOM
zy!3Peo|Ua(x%c<_BIQUG=&<VTb`SLmog$EK2F6J{5OM-5r}au*Kd0soe(7W+Ha4Cw
z<znX>=QG@wyY(L^igHhMu}!LBVcH#IsP$TjiMg4$C&*Fj@X0IRKOw^CIUGcR!?M`u
z+Cw!BHM2|ZW1C=n6nN+f?DN<QqIHN@{{ZPaizyjZ=zj_S0HxQ#Qfj?E`bedyAO?q7
zzbj-lIt??R;B91O<(6%SF76guR>Ir87#6ZhNn@I=hBlM!BfXGaQ?1tOnzLo~9~==g
zV;T=+PPeHYR;0`UWJ3&RfU6{9OD}J^N&JmmN6}Ba+UwmBGdwErEyt8h6$aa1VmzT^
z4-L7xb*wp0V?(cJC;Ddu;W}Vs0lB_Yw)V1@WsU{Xe=bo?gy9$=C0!h`vw0rVke)Em
zM?9;_NGYGDx~jTgP5>_B-|UN8*q2PD(rm{xz19VKW{lY4po}r?H*QE?Q59V^O<TVz
z9wKYKx9+rBR;?{LYg|c>#nkTlAEs~pQT<6wgxbYZ(N@P$(CE+F=*G)&YZN*hHLn1U
z{{VDLWhU3iRjhHo0aG$k)7%umXt|`7mjjOo!ItLE3XTcwgOy=VP;Ft5wTjRVw+m*C
z&DneTSQ_mKjH@!X!#NAmtAr9pebzn}V^D~Pkl%1YY1%fLpiMW^iXaQFZP`mPh`Re8
zN(i{cC$tcWhF$BWH6xx;XqpK_PZkL)DhH=#_()@v{)Xe_M(R?3TmJxLMbTL`SEk}X
z&(RS_T_x^ZpFD6vb7EIP`DcKAprdqe{S!|xk%^jgn<e*wW6F7^jl<gGf2snmGYgA@
ziMPtuYO=#osDYrEhz<)ctkYCBvOQvfo}EltaBmL?#>;oz%qQwmtga1=uto^^S*t;f
z#3M}BW7H_)tc2~AqS80GJ;JQ(s3X-h-&L0NnU?)kJ#%HFs(oz`AfNYR?C+Hi`qL+6
z+U)-TGfL-|(PUw_KYQ9kn&!JLR=PE5jr$x;zNnAMLszIs(soIG%sze-9YP}A?X!XK
zxp<e0H5617nu9MB!(K*iY@}|Hs8PJ^mCtWr?1h`sE1yqQ>5@P^EsX}PJ6Y+xZypX;
zpPLhmw07diq^X@Ao2fb>Kjn!W-My4jI;oG?>ykJYR*>s8a2vubKcI{hV>*jZsf%T8
z5Qd<CFyN(4*3p{!D<IX&8X~Kv-);@8LXxU@W`LNdlHJ(#V9J_VqAh$;NY5l?R_YYG
zcHQtu<~aWVFJyi=K7g`LB$`xIl8@pBpQ<?Y%ymQ6q`Xe#7L}MSa}G;@2avSgJykPU
z3>tuIhw`}HB;&_rBa-x2)acrs6N#u}<Y@l@+>ep=O{Uc~3Mcy{imomUb27zi<J4qn
z{{X82-}eB7)Fz;+VQiF4kRRq_aum6gqK-=49>4wiH_=LawA>)7D4_<_)ohUV2L&#t
z)84Ukx_wLGJnVT{n#wIk5?eEgE$+~(2L8o$^h>KkW4mhU-L&`Hg`KL>!^wRNpdQUy
z8ZBP7oCu}<G=I||xJ9sN^)B@!iS&;@%+5b$M(eQ}O<FMVYC4XaC~ZR?+js1?-7nOh
zt6JB{EPRzD`c*YlM{JQ)vfpsCI-ZL97nv!6Xy*rnT3&%1l8<MlR2XXF-q$dnAgtwE
z-wfmj+wQTD^&MpqEs(g|11c(>sWl`AI^QTL`zb7zZAAX4<b&iQ8$5xd)B)csA*AY(
znFsST!q(AL)6EdvHWae{$*<^`yV@KDz7%bg0!Vh#@|^at-)o1}Md`-u0x$BYo`h+W
zvY?v>SfzV`$ijj+Pc6cfM(hU*tiS;HKnK5tXmid7?4odU4V=;uk<-nzIf2$w#PUdr
zc!9qL$X)vx#){bFcc?bx_Ewbs`)_T$j#o{i`i=D<1b4z1HnN@expPNimQm!i6)qvQ
zIz%%?>O&w7@KrTcJyjd`JB46tj^EJcxO||hbt#A}k)}o*e5Hz#3vrP(9djN7T<af{
zY;GOR+E!$eBrXjtx&4u}H8vrxeZK0*nRxbG65k1}dzf%YOomrj8}15cY>*4#27}P(
z>!oGJZd7fUx#Y-ie&sjQaL6|cgIY(u3JEM^8<v~dHRL#1&CisLX56sy6pbL^%UOtn
zJAxBST3kbokq&7Y7P5js2)(Sah-8mxCAkT$C8ppdEpRt$tW!yS@(H(aj?7FP2m!z)
z0FS52WMjemCjxC^a)E`n#g`YGi;Jbc4i`9FWA|9hL1HcvFz+VeaA*UR<^%l0zabQ1
zj&4Z3{w#%-JCZH`0Kz|LCfp{=5gZGJlLJ;&x;G55J~^B)<8)i05^?RajKErKMZ#+m
znJqEMBPzlvp>uY-+vQY{SnLuCk*;<(45ez&(I>3aspPxkyIsxOgvx4}sVx-0#gF=}
zl{79k$tpUC&A}y0i%hGMlG$q&H8pHkVE~@U8toQF4Z)$-{nIFBb0o7)!mS&tNgbO}
z71{kwOE`TE3CU>9KAo+7h%IpPp`Ic|oIhou)MTZpguXD}Dv~*&hF!B8w2WO#X_mDl
zRLK<a<|hz&Q5hd0+gA?b<!EN4jz)Tv&uJuZg_4cMq{zz?-C8ctjTM3xfFBEw(K;C<
z5__A0$}~_HHtlvoA7kT?vBNx}VWXXCU;HzBsHJ4AHhW33e9Z*z9FG_&Y36v4HRo`@
zCy<I}-HT69Vjv#nS+b@#w#0&LxYEZs-Lw;Kd!XM)TH+e(5RuSrkDdtKa>rQsRWmj1
zc?A;p&mG$4;CDk8o!5A{O&twrXlOiI>7|9F+*uGB*M5`xCOg}MVwl=v80T^2NY<CS
z#AP%vJ1sUo6p_8mat}jL*TVK>dxyely}iL16zq4k!~|O@Su-yahVKb^S7WUd*2z;@
zrJxX{s-kpmAlx4*%%*c2?-vNBB-kUV!8Zo~07Rj#VD_7QDa3mZxAt8ivrge;%-GQz
zTpjv_{%oEadk{inf3?%v1@K5dRN2=Q(5)vSD0v;R;dPDu$CcLZI6$vwIqYyB%6_Sj
zzU%UvEO*Oqbr-1i9Po&eM5T>)!i>}B+i+8xBV00`*W%Z@D3=sKeMWm+3BPpa+yJF6
zJ1j-QMmSiXj_WjUXEH(&ET{#WWNS!5?F3vLuCW(Ep|loQ*AL-7{{RIGG;R(fZI?8V
za8#bD&hd08!2PXzBt8@5aC!Y8D9FA8krLSW_XD_N<w|EH5hDYKp6Uj=!o>Ykn)`E+
z;b0Ef*Z%;t;65FN6Txe&dw5Q8Y0FK%si)h6e5@N{u#s{yrH*WK&y@xb0D_R43mk=j
z67t6j5tRXM*IMbJ_x&dJ?3L!{D;R5q&C_j#D>ge9u}J2T#zJLgv0{;p!;cC=#<<)N
zeu!xRwg~ztgXE3lX|O$(O3BEvg2C2%a-@B%06Fo(ikhLWZJr2l;Hl);;qMm*z4C*!
z$jKqFziX`FWZ7Z`+uDBZHco3V`X9J|N#!HSkDHHz5$s+h&{x$`fY*N>F9(nj^!2)Z
zXZuoma(83Rl{2bCMfTkz{{Syg+lK6T;H|>V%1F7L&b@%WhjbLpZv~_hfsUrG0%HVB
z&jl4tUdMYJ(%&t3LxYGprZmyD!N$ZB!9qz4@!h4KqX!`6T}3QJ*{%&I`Cb123RW?j
z?&G%pQ$^U4`!UrJQ{UP>H+UsN8#4wTNcmfOjV7L^ClbI9kQEhHk1acij_znqgtDcT
zGBANF2m`vAvc)G33P;D;&9}mV&_+2H@<tIENuY?OmLqmL?M1~_*Bd>yDxk7xz0sZH
z>bbRTCu_ls_qalnDIA64<BCv70_6)VTTOx<8iLVwI_hW49@H9Wv~mp>&GB@l))@(#
z`y1cN=MY<rp~QY;UuS26rHoi*wm0M<iT7}bjm{1B=iwNpiOr@<9Igb1H*ilZjzjD=
z@(PKs1=zb!d#N14a?&s4DkG9Y`Y&O}KiNeyM%y@96AaQY0P8q-OFyG1$F%)WV?tC`
zdVcQeaRZ3lGP%qVy6w-=O-~?c_hc!^?TgSeqagm06F;)GERIH!E%rl8N<jAJ-(;hy
zCIl~Z_Q~4Iq>asY2I@S6Ygu6SOxXpzuDG|tALTCc50#ldG)aOiIZObIl<S9gO><l>
zbDqU1lXg5jgL{K?@L1q2YyD8c-csCK3k}#^+DHUtA#M1u%7L!82Is<aW$tbhY(|H;
z8=I!Lx^rc1`MC1A)^G)-9)NKn$BU@tV@US$o*G-;>4)}P*^{tmw&xeP;WPgL;!`|i
z<uh;np)hG5N44O#*#p2$_qd+Gc3qO&mX^2al9(rO_A!7DCza57XFZa=z;4HdG*sIG
zJ<oEP8;CbNsa)cDeUQ=xHY;KW^*md`=h!#+U%HGqIo4<=<vcRhB&-@pia2DE_b9*1
zy{)-7{{R6bQU>Rg*`|B_qV`(CO$%Xb_e$dHco<KpsvAoq0fWzU7q|;qME3^e&KTzF
zGX*wQfnrG|bEaq)bAVaBZ>lt{F^&dS$tAdMSDtIVZ&_I9HUeT{;0{#&Py9wv`#m#S
z>U}#-Vf7{j<A%4Df!DhFwxaRTv(st*ZtD$ISv2q6E8OCH6LO@}=__lbY*g^RM;^l{
zD7V;LlzKZ*uB@t*x_O@WAL=NLA4JskIRsRYInF$ITD=$W%c(0E+JjEm+2!|J{+6Sc
zrK1taPaLz3FKjDD3M*t>ucI5KehqacRBe`hu{7{3j(6ci`e*Sfssq|Nz5?|ay0W~t
z_>qUZw_p`Mr>Irx6K|<~^M;NBDW%dfi+!2BH$sY;yIRKFce1#qqKUlZsQ_^p7)r~x
z^%8QmwldNtXbi)7PiwLT`zZZTMVQ+o=qTAaxsu*e(X0+aZH3Xe<Hwb8Q>V~H9^*FS
z{{YmfDr{Wg754TeY6^BvCu48q@`sX8U2(#SHdx)xx^=e_8+1)%&7WwoIY?!Doyu!z
zpSN?4(ekE=gMdEe0}W$I=Lm?H18mXtDLp$7a-<H}-*LI@g8s}yBVK!(cq^F8n_V`#
zwg@9Hncxd~SnY4Esp(qi=}3FH`X!X2nCUiZbqcsC8ceb@Tgh21bFE>8raEtXz~n3@
zv94EYa=Ft?cAgp)L*xw?E=f*b&}|~uSk~)no?R@21K1T$EX3dfPr`jX6V*Fw7;Loq
zFHCN8WSD<tNMcA?O|v_u>6JB)8zXVL+2|c4-)rV=&m=7_lcd2;*6m=wn=8noYZ?Pu
z6*RghRtcnOu+dn?#@s7sRa7>^)Hd)G4F$O+DL3H@v67?}7N<Kb3$UM4TQyU5{+8RZ
z<yW8Xp9yft324H{O4i(#i``APA4L=9dBM6?8}~%Qy~p`dFxcF#c{dA-o41vWERML&
z6b^6>z*4d&$-pHQ4IvgX3lEiy2MiKQ>)6>J6m5aGb8b}emNC`<02FogOboL?DO(*8
zI(L)CI|RoUJ>AgI$t;e`Kx&qzvI=O6<#StaD_*UFt&)Hk+ql_O>s>)hr^4eTt!=w`
zSx%<w6303^S6uORfz)*gt0Xc_D~@}dDe`jYZA885POqu1k<6#NBlC5amClsze2ygi
zq20Ofvo3C~G;Jb!nH#yL-c!aOLb=&p1q8D`&1;?X3suwIDCgQq#hc-2G>s-2W;gg^
z{q7cmni01E28C3pPQWznG75HvvOYVjss^?vUuZvM=;LT^0+KK<@pMc{P~$6h?F}9R
zNFiWuaHl?%tV*oZ>m#KE?*SuYRffqdP=Z`Q0cW+|pn{#GHNy7tvwca`O>12oZo7^w
z7Fs4&>XP0<TFazK%b}Z5EOmWqYT1Nv`-wc?g#9Z?e2x-Na!)AzCrOF`4$w*EU(&$a
ziveX=#YCHvXKC7dSkdhY(7GCU?&}K$(f<GqpQQbeGQ%}>NQeR=?on(BHVIi@Eo{b`
zjE&vTghdxa(9Gdes#N-~Jck^9%Hl0EO4Dg>*D;cwPjw7%wo+VXCB3qfgqs@TwnZg2
zkEJv+k<D*l07@#F=8_%&Jd&!l`KalEagD_A5EODgSbawV8{+BXik|i)vfhzps0s<2
z{6{ta096*5QPcWk!I7~xPl1)0)N32+IkA&&FplW$HjhxQ{{X6KxBbc5x1kii&q1Kn
z8>_d`qm(g+7Z_8`q|xaxI(h0FBhGS?wvSEHw9_RegM)bs&L-DJp{TkVx`%AJ0AC+<
zoRl<{%(h-?+Kjq{o}E2}ZN<hDX{n@?2%>~OL&^D7HFHol9g$UfcI-JQy&qnWOo%!X
z>16UkPm_rJ6GfQmF&F(+U;y)FpVzvIpG~|JuHNB{c23qhhgQ|4Es@TKA1!jq>!0bA
z4BYogEXO2UlsV0-dPAtibRVQ^)kdrH6UJSe+m)@-^+|O}Kor{;JK146W@t4Bv^9=k
zII#=WI#RDo(l(lgHN(N~l}qg0E1+#^u+!4n?=4^pJs(r)l&mqp!z85Sk1N#mD$bnM
zC<|Rl5CnL#^G!m7ru6+q^&YHEXY^vql-|&du8HU$scTsEn+#{NHlw6rfxfJ|j`wqG
zto3hG(Y7NVp4T*t0@UuE)(n-S^Rp7u{Y4wSF=;KJ>S{TluVb0+V_kdO3)VVwS&lk3
z#>zHswYUo*KDVSpOdAM`b-7irb%b=XlXmU+3UgdlM0|2h?Aq&Mwz5J@4Qo&Is%prm
zY(AS~Yko*k4xygDn(-Z=j4C(l6*To^PWQ;$_6j)TDEcosMq0AZOX*!YNexb;GfSPD
zIaoT1j*<4Er(?kGFsWwLsp}fh=E&Q3vBI{~CZ>)ZznI5hx^cn2+0T+mbW2fNM(S5b
zS?tCDE6=q}E|R-YE~1Uj7s>LsRdjS!fQMb=tnRBE`ePmW8gNs~NR)QU8vdPaJR$F#
z#6jR5QGFgXh$>I|i^H3IZatJV)LQPRR3B9Xgkbr-)`^`zNZ3cI0~&3TLR@LL$gG;G
z4C*aYq!~%+(#F{(BMlwOtm#cNT$PTRnt=LFH*LpcDbuv}R<V(~6D{yAGQC@;X>~|6
zhKOW|qiw~)cO<taBx2r?<o#bSRnUUSDVWkfq-A31AJvoU4W70s0~+h+h3cJIsXmgq
z^J;T3`wsxDKT>t|E2A{@F%m6eY`MNv%Di-3Pt>u+L?WIRdX}+J^!wtfk<yn*5GMdE
zW|k+_stk_~$>DDFSSzU--IPA7JQb67u(X;JUWO@HBaW_XyX2vCnrCT^^}S}ea&F{i
zw=HwyHqxHM<)Kjj0H;k|9jB?96UDqIjK0N`evL&JQP5OB(W?x5uV5~$YqfJtPkIUq
zw%px${CzW11mM$3=aO*Z6}$9KrgSzH1hftSP2Pp*j;~d!ua(A1X<YW7($RY(dVf#V
zwJNa_;hL5s{Lf{Sohhk*>FSazVf9|)ava`D-@B>mH40DqZ9TAK^=(bXP%YU@sB~2Y
z6&b0Psjrcu=I&YQTHnjL&5ASWi~<5PP}H2-v;L<x=<mhtWivHhCGh%GQ3t!e7cIEE
zY`rF`j5k(w3)w%W$2)&vWj=`(y;lgF4beM;b!XJ0OJrtxh+_`5_{#2xuc)nap`dAW
zVE)N@td5c!j~%vG)by~_9z|f8hsbi9OzCYmPN`s$SwOyb99eo>G^xKU>P)~NZ{1=#
zqMKQDNQRDxOxGUAAv=tsx)n(_Zu)aX>Gwj{wyBSB?Bc97cF<GP7RNr!SQfc?Oga}=
zLm#UiolwEa_j0G8q}J*lVy=p=8+X0Z+?e*3#n&{wN~)>SQR=UAZ~95X&+3r%JtKCq
zh0_DWm~OXXD0JFg(n?K+cXFzvuhgp~BTkk(59${P+@sSKr6WJn@z>199Y&Sl{{Tzc
zikdhguZ@P1ArU$3t!g6bvkkV>JO1Eusvx1Pi%=CBtD5G6a@Ergj%KN}X+P4a9~Y@j
zrU$$WjiT#A(NO5s8)MWo#!^dr7Zz<$Y28txQ_=`&;|-7tbKPaSqhHkOBypx`4Lmub
z$tNow5u?~OJv&OGqjZq!amLGBUBe5-`o~by>T2B!D+J&i*x^zzPdsjZr>Rr`f0uq0
zZAEUC1fm*dmmcQVx}OKzWApV!t4Qi<T{<Ax<+ZzAT+#JcO=}Vgdir?F`#);TX*y1k
zs>NqST`3$ZtsA9AlTc=D8)Sh008q$Ocw1KxEY#_j)f9SHpiLD_k+R%0g`A#_k_v}Z
zf2lTp;7Mhs^?F98F-uVTnkl@qg+;9NCX-ip(RBlWIrlUvsmeabag4e$n$D-F*1z)f
zaDdC$y`7c!P3RD^owH3}Q5>fv17UR?A4cjLbBvmHp$$+Rf{Ud(yI<*4z{`vbrsvDp
zIPu*Hs_L~`VJxSbN$th*vzm^f)S98&wnjzZFs+SFomn$SsY=!l>Ix|;prD6qs~B7{
zW7!7WS9S!WFH~i8?Gf@{^IDmucVO%yeP}dy?vqiDsP@WDN}@`si~R!jl~(#XN#yjO
zOd8|i$VTM0JJ&|fN7nS6Mi31D0GD~^3Vlt`K^b&fv3qTMU1g!rH1<Qi(#apts!elD
zcw>zfOyqcLiAG#jm?O#bLDc<4RRpgQRk_0bimcOh4N9_R{{R|dFMd^1bZt(0-LGtx
zzb*^Z`WBvxOo6}Z6zp*$F0xeOyEhjiex0qZr-iHxe3;L*Z76B<EnSRetEbcn2lD~l
z2>nA!Fc;~y5XUI~SE1Y0t)w1}Y_Lav=NSn6jRoRJKd346?Jc3Ydjp}iLx&4Hq*Q4$
z*16S^MALjW;X|&~(Q6EIBCnR`yh}WKI%3~ao_U{s?`Z`OlauV#OGxxu?L($%DNEX5
zbFJ{P8kbdRf~Ra$vD*1_TVjIKItNj$sdFW$bUDF!HdfVNhFXOTUbCvHr;oq7#Vy}#
zE0t*n(bVY`)ZxsZVIzW72E6|ON@q4Ry@P{pQ=O#g^n+_^<7}g~)G~DpdV9SIsl?5<
z>f3d7#<oUER%WYYtCDZwLgx$S!Ch$@Zk1F3)TyP7=lPoA6U5)^GMO~U170}*Sv~aH
z-8j8mO${DGKOOBLMs?Y9K~GDg$?9oZgn$f|Nc<~^y8fM;V%2Eg_{X%!!*zwKtfq_;
zEw@{csOl?((|T~Yv^erc6laAueHV^ql^;Usy)DumT}UN~_uem?Cd>GF)A|!hds|`r
z#F742k#x41)Q&8cim0)i-YKkqWwVn^*6QiDR`nfQ4YJuq$L^6P`Wu$E7p&K4noqit
zU`X-ELDBvtww^%7%=~y9tiH9TQt7vJ`jaHTKI^LbXLRfG$xo~1=~OM#4=PrA{+IZQ
z%JLXx+kfg}D_4$fQUfhEr4(k|HN+L+x~{JU3#~@~08!roE}PVv)myz7-?sgY!Azi|
z{fo`BPp|5|L#EXldFuZFH4!!!%Fb%Enue=T+07{1Ya3$gOViYIR7@SJ)L?LMR-$@s
zIv5M%u4BVT8&w{47|}P0wt19&D;ps7o9f0#Ad7@vj~orE6tx;bt-d!kxeH4>9V5%3
z-1dAmKSZs49dLUn+}F3enxQ<iQEj5p#~)0*>F$h*u07FcEQfI7L1krM_<60<Qo3zD
zje+AJ2jN`lU1?g#16@YTjtDBZsQSNKmKO*kYg_*SYnP3a@)_@niPan_?$0;sX7#-k
zPl~1NdpJJeRyvDLu6<Xi>c2`uovs-D*5*iM>MFgJdYkDbzv(W){n69@97<yki&+mH
zt_S=tSH)?^ldC!Mr*-Jf#Ok_s12?>JcAJHBp-kx~X_B0|x9%>k^eT9|d-zpz$2Ge>
zpo9COb$+4H#3aE<3njPy-Y!>6=TRdV??$_)dXd^}4GpGioAt8QQ}x6%$FxT1-)_ze
z#xyRbg1P3FyGg2ua3x`|D$cf>PlyTWbqcHh087QK`z}=#cOtxRqe<6&N2y6kBO-J&
zG0i^N8W)bkO;J}=>2`WDIp4}L_F7#+v63{#YD38FdzDKh)iJ;LY;d;(@TnN3(hse$
z$ZItnIi;irf$_pGORcJ@luY_~+yU%vs4KPV+IV)=X`*I%Y09qCdY+8dhQTECjy#78
zgz3ne;Cj^!Wh@{~B^im}eyH9501CTN>&-%i?qwZtBd{YOX5_4^sel-&>E&&*L9ta6
zQ)ya@{W^)Jf~NM|*W4AS<73XMLVS)L2G@1(UsX!>Q_3o1{{Xe5kh8T=>)N#c0GZYs
z>gV)5wz9m_hN03`PMVS5pM};Z+jXha`i7HVr*wakXRm7(mRQ|Ecv!J%M`J9GUd%?H
z)7nK?+btjE-Z8nR%4(jPsG*F$jm?@b1OtU}sOeKV#nM9he)uE;v-*assZh96#OWUy
z?puNPRL75t(9)Im2^*<fA&#Pzf&T#Z;dJzS!F@A!k-}C%`S*#QZ6|vaVS=_8%b|(S
z+na%VE7XKeB@^nk$U$KBi#!xGQP$5WbKLl|l0w#LnyqAVpIMA>Kh)f#D<h_zzN^_8
zB!4LYrTLOwjqzV)&r5Xkt2E~NQ%6`x$PTd|2rXl$sdTBoG3nG&&JFKno}{a(p{xRm
zSzvK@w`;P!Crq2Dt2DNX!wpkNxNOY1{nIH*YkdL1N23#6tkqUh8akpSZ!yc=rBldU
z;&<G;z5A_hx24p_?*9Nv^hNGVau#-Yz4mi$=L@sNX?~|Kkr{Tx(d&OHIhnV)7AUPd
zP>KCxRBDH*LsuJE1HY7uXZKZe!|8%RBql;z?Jn$BZxr2}cS@1z6^@>tOPUB8964q9
z#|zIj*3C35nsa)MmXMD2C2y%@{KlHs+~feU-B7^|Xn<SV!F%_*PCv0!=^59!?+&%D
zE&}83u|4<+(lD{v;BoX(NJ|MnaEJwXvq1vNNH)6Lc^rk$v)a-H!3s?tn9r$48E)q8
z_YZ`~5_%!3ymoiW^iRWjxTfjJ>E>`7B;F5!WlgU1jcjz{N?_TVN4R$iwkp5<Kc+sO
zX1~>$uDdP3w{#q;%$1V$j=xPlryVsrOW=f(;y81bb6C}?Yno}^cE;WqI0#op*hFt_
z{W%8a-1bQ;ONekc!j-q!=}`J#bbCB0Umx(uLohx!0yss+_uAZon&=&an655Y7KVf2
zO8bWt$21Xs>uH&2WKunb?MFdX8~*^@$Iu|!%Zu4KH*1B;)%0sDgW$E;;C>1b?`6r{
znW@0&BaU7Jh0ttpdABIji`Y93Y@k@5)5={!yw>UBiZ&KR-fzi4Pq;<2V)#yg2C=!i
zSvK?(mt$yH*iP2A!C40zV#q=*$0_l=v?CC`mULB8)5sjsY&jj4zed!dt6*cC*1y8R
zdW4Gtq@}2mo?#;$Vw<pR^zFri0V66dZM3Rg3tfh#f+^i+@U5H!TnlY)g*G~%fZ==a
zRME&s4kE}Fyc~isocUTCYoT-+50a(DwzyUGE)KwMeu^VAe4DQP*@`zcyG{F$sT595
zfhGahX#(o5StX~Ow7a^$remB8j&4e>*J$_0y`$VR5w{j?OGI?_@3<GZM9Dkd5!%~d
zy3V>sMHR{VAf?n~d$xz0kCjz4(I<_jUevPU<-n8jnG;?IwDH+f#Z^7<Pt=5LHBwv`
zxErciv{(w6S&shzR4rVRIFej4n)yteSRv{G8NL4KFrmzO-C_akq;uNQ$pr%0TE|%V
zM7pM#@SjrPfr1Jtf#{A#I#&x5&vi}IdL+<C`Px|hz+LSf(a+Q!6qaj?oAMV;t4%b1
zo3PR>l1egEGPLZ?Qa$w^jEp-a2E%p-(3O27nKU7?#pzVAdx8F7tEK+{qm;|ANej=t
zzw(Wmsj||?=}abQ{UO57XT|%jNm?%+iY;Cv6TL<f2*_8u6ymo}X%8)tyts0J)vY}@
zwldd&k>wAd7t_ghleOH1&yjLPVCdAs?Lm$9M%t#1#{?&ufd2q&u(~&Q4jd$-sgel<
zj5y_KX|+8!P>4ZYOBr>n90iG7PF#H*YCMeV9_BXjIDmOw>qvYMt#utA@~kx!jxLCw
z)6I}Zlt|mOjmnXdYSA{D&?uRp*pQ!xxH*n2aPVxIBV~;2mMz1vvS!$whP<)f3d|nE
znW$F8-L8<mpZ8@zXR36btW&**{?mlkvY=s&Y@^32GUu?|w8!LjQ{f+>?fr#{%DflJ
zyr#OT?mqSx-<2FPZUopn=vO(}z##<)kIqPJkV7rWir4Um8gm@;X<X6Z@KnNZ*M6d;
z5=S5c;FRL+gS$*?M&^<T{$@ExG!wanu9MVn{oJFYGBAOBDP(MpyRUGvv}aUdwY>^i
zTIV&kKSh*&i&Dps=8<me)vAFpmgnfHXN%lRoBfgHKuXNshfP-l!E;Gs+Ue3lV*rxU
zJgVqtjfTaR3DQ)>w3gfKqdD2p2v=pRgibhq!g%nYe034J?EWKswPrO9UGX@8P82j<
zPWYt<b*=K23S&-C>6<EQxfpi2zgw#sN|rS4a0GX{&B3qI)Y!jhBxM@eqIlgK`OTH~
z(ahC5N1$j`8f8mFTbd8f6~x^=9E>tk5KX%U<MY&1K<`oqIj7+rqkbalT2!JMu;(xy
zO6AFlS7%N<k*a3WxK-)$ktA;b9$G!9S@l|1MtykN@0N_KEg!D5U0xu{k4!j>-4Ruy
zXu6Ox(>OK9!A1=(!8~`knEI(;mBht+e4u9Mi;wWMwVf?l2qvA)mA!(es-mcX5i}2B
z9}A^4{haPHUVwy*E!iUjoAb(SkV05r6oIzvQcl*3SmiLahc>ZBnil@frLB?|Z9H+x
zxPq=J+5t8yjnwXVC7C`H4Kl*}5Ji#Eouf|aOlJ5YI84WjclcFQvlm7KjnS|IcmxHQ
z5I}Jsq^F4my~4>OZ+8T*VFUn`p~r#<+k2#QU29(HBWnS(zjY?e+&KI!1VicE+Q;Q^
zU}?3k6uTXJq;rM=3s_J)*e`K#QUFbq#9x~Q8=GV0V=<=S{3ilFL0m6;9Io4vv8>`d
zr!nETYnz13g!XN5K6%RCj68tsjD<5>ax8yz#xgzy!BPl_H@W~v7zZwGijD1Qx3m>7
zbd5G}y5|O*t!yAph!J($E-)0*was<LLP+c#auXvEv5)O^;7$F*_eHiK?2CO<C5y9%
z-2rTY#xr~1rnYGsEpYbt311!v0_luv<F&K(2(+3tv_$x+q$bijCwM$6`QRk`h;_S;
z>dt6kocoT$^i{R=6;WN#yyK4rN#m`e(aGtJqlMnB*)fccJS$ILrYQE!7?b|ystS6^
znJ1-J1Fe75(68tjE7&BZm9h`%cPS~4aTwAG+|ji7?4YPHhkqP26Wv(3!Ke7}Iy3!{
zl~BP@!?D)BY*gI0vWsfa9Yk@pyW8(=v2IX?7EB3^-r?Btx^XQr+HY>(DO(er9`=i;
zS`~{;QBw=;mjUG-Dk7NLKx22$bxiuXB9m*tExrjxHb%(NyW9#b3(L^8+gRZ6@aB{d
zd{SHs45{a$bN$f2>`-!3xEnkW;oKt>8*F={x!oJB@R}S!KC5%&CORph8{2mRnkpPy
zX&Z~Cpk0q72VJJ=!Pmjcgl*-eKOaS!FBUx7=NL|8(?o9*iiEnyISInV0u7JKS{c(t
zggTHUHg=0EP{?G8>>z?TSy>xnax8zbR{A+`k06hbZV;+gN>=nwB{*xY57?-sV?<|g
z$yQE{#lGflZ<e5|A$W|rr*Q5&g_M&HJu<zmZOCqI*(exH$aT&W!|p8Mf0QWigtRy~
zw*+J5I>6k6l%gj&h0GTUCt&h!J0a|MB)T7K;DsEKXY7=`oDpx7?b}7jxGPf!B*7mM
zzA&823?6%;EXNFBp2aco`N3MnXlU>fW4TTvXh=aK+@d2*4FCh=Te46|$00Pc!Ldny
z>I5tb97T=6NFGNkzPU{#aIh_ocGq&4>$GHCd0cqTQeTT-=&_nQ_Z_}MXmJ+_#CZva
z{^E)QL$hm-?42B-8$a9>KPfkhoxu?<f_*UWbVql`bs4_|Cbr`-yXvKExZ5DTyW1#G
zQ?f0h_$dh_XO%PA8=JX@_vJF&i(LWeVf&{xVk{kX!o*|llHHC<%D~X=(Y?M3iSd@5
z!`$BqBm`u3Q3n>A6Jnhbnh%fCdvJ1|8d`8kK(Oz2Fh}zaQ6cj(#oxqlp6IF|)pSp>
z;N&@{oQo#DN3;;(y{g8GP=Z!^RS}6B^MVr9P(w3IsN@IB9C8t9dJJFLOj;e7&Af#f
zyH9rg6tmOG43>Kw7Z)A2k(VAvC|g~Wq}7QO&Tbw9$8+2wp>$L5L&tD%;Ds=UW-<@e
zBQC>d4meuGmOrA!l+Pm2&2T@F{g(qXNo%gt;rtXEWq3P-w^<nlb6sZ6z~=m+vOH*#
zJwke8w1>2OaE_<dDJq7^hR1nBx6ylV6PV%Mg$q$lPUCpVjs3@DRKCQN11mJ>r*U*-
z9~M-#lyXy(zaxzIQ#PWimHBS=d=z1;imolM0N8MQCqmOj7;JX4To`;F6K7})0%*gV
z<O_u@Z5^L@je+3`$tHx^<==i5rP-{B)Xj5)sigGJf^d+@Q3fVqHtqs7u|X>cE!a<X
zrkG@mTK=mRv8|#QYGZh~Hosz=U*5@&f*CT_hWvn`k}0AjwbvbiLdH#mvHt9%7|`Gg
zPE}lTALkZEK;kkD)9B7jHH-vV%>^~kxu)?*fBH&wJiwbcB7|*_drp2)B;*R$IAQIv
z_zEeuxY@jttUWVp6LInobHc*ww&KMrDH0%D&U583+1v|VIES>I*&UQX+>0cVI`Ohd
z-uTVID4445-LJ==lo&X@*I=p9R;;l;l#RG>I6_oIVQ`_lqZeuZ>3=fr90~dq1y+a%
z%1-z2pCg*{ad4fqTH}rr2KGcRYYZj11DmDWWS#sh7eWr#Trqt7r&_})wi#Fyb(~HQ
z-63%aZg&C_lGh9qa<T*HZhM<|PY!c!$xPZtMp9kE_)XY^;&EWt70>q)LHi-dzDn;<
zwA&?MA?^m_3zrE;#gqM>Pwb7*Poo}M;BRyEQJBdY_Jr7*AvX+h@T7PD0K9k}8r+q3
zd4yICHUyLKrjDJ@Zs`bU2^i*sj0Ms>$&KM)oarKrY=~dwC#VQE$w<c2w=Oq7*)q3N
z)2JdZsg;aq@<q^-j8(H!lhD7#bGY`Ul33~EGD|C1-sF{q>Tkqac!QzSV=p{zD*>tX
z2BoOH`t?!<pXCP$Ik_*@4aHv1PuDu{Nue)}oSK<OW}GZ0wbojmqUV1Q!xv_>th=9o
z(%yL_<fp|=G{)BZ1(Z2|Et$ILS?6@_+~*fKqNpfaINal(3VIzPLt<~0q0;CgfQvVF
zGEZb(MQF)3Rnc^;^>PBwYkQKt6Qi`MZ4%O!GFb-~;Z?^{Add03+y^~^gZ)=il29Xp
zM=)~hBw3`Mkk1<SdNp@dYI8^EvFwR}Ti6vytc=K9_ZPhKN~xr*E{rwtI2&ZyGFrNA
z`!3>s2MF_a4k;r@%BH!NZHLK2PhU+7t++Yf0&bWz$3#7Mz0T~$i``E88h1N;U}R0~
zJCxtE_6-&F8noO~(~|E!k#r`eMsKJAzX49j<BJW6r{>AU+sGEMPL+EVk}=G0YpFeF
z+uGtj>L3`_<ma$WV0+D)({F{I!9=7N8@=TH*9JZQ)_&@EXyn~_Fxy`$XFai9tOM$Y
zLF^T@uLs;wFfozjex(VK&pz9al{GYX%bWo6w%LbB8sqObDXot0_KbY4sFDa9z3;Fc
z%FA^ZS<z6$=C(_?aMp5_$w#oH*`utgZ95C3k)qy8$!h&+O-ka{xINk9E6=)zs_XSB
z4V+sa0k>388S16my6!$oUCX@<X&OGD>T1nF<QX<H_zf#O`CR;mT;C|i=yf76{luGH
z6{Ki2H4X*M_MYW5BE14luF9yQnpXz3q>^obue6SsnxWzITn`Ihpy&}(fJ{No?nqi#
zsN#%as>viy*`3pL8ftbAXbSS0k}%r=bZcpw{Wnqw!#F{()e#7`j94F{k}~Gxr?U?i
z7ai2Ed;nNjlo&`_Hyo7bU}D!&G&gO*vKD7NI~*Zf4U%j;;WWE$0ZsL!Ewz_387l(E
zkoR()&=@m<kWJf!_AttLuvo)OuaTdknw|plcMAmJ6fuBLxP*?G$Mg&>VeBl_M*t0t
zyNK?imZi@GlrBlS;K?5)%dFoE7?G}X&9jv0Oe|q^ju!}RLs6%ofVxQ<E%LnMt2)fe
zT?HGhn_LwsOLT`z+clc+RM2Uxb6W7}0N`bLuTk|?UZEkg%UOO0bwyQIEb<pU#m+s-
z7&2KMX16|8P;am~S48qo>2G`GOGiUBT!D-SKMKb~&?+ik9OnB^do9k9qOzHz_+sO_
zs)cqX*<I5;2`s^~%t7yEsb-NK2@!z6d<>%LWu6%QHaIjT4JF&2>z|Z)J2fH~QxM;3
zo|XwO?sdM1hB=Ps3R3noVP_*GaE8splumnM1i9EBDV0^w!4WQa0?QTDJxbBJtRN4s
zDsDq0U2C071sg~Y7wi@XS?U_v`3oSq1gZ4OQ>{+vC)^v&$yYIH6cIQwCY$#?mQnX3
zHvJho4K`V1^=duND@Ui$)bDFzU=8_J%%Y{IU?2}EVwy=M+XGI)+yzDSh4c|mOk-&E
z9raI>P@<x@sViDX%8-bg7x8zr_a$em=yb}uupc|@PC|YxPDZCq)v4>T6^nfNMO4cS
zG3Hh?>B?_UXnH&}po*5qk0>2^{XIu6*H$&}z8iazs-TkDH#g|5)r|E7npmcojDdV5
z(W@%xTf0z&@qxg13rnEMO6Y@__}Jehqw6{<r(JM)n$R5kN>v$m5tCo`W-nBdn^kW2
zy|F~oe3TxUS5H%3D58)$A%{6@b-sz|y*7}F%EP!fBYl=vNRLCJ+~{OzAdnA`gPTsQ
z9BjX;r0LB%mwe8M8(%qD+P<gJsmJ{jEbi9Arq@{}yId(L96)il<HEVoe+TNOfwI3-
z4kxfvb8VDR`Uifgt7~-TDl=xBT~<TTI?Jau64i!+ZbH`0qs!9K*v`|p`>M%$)+dt_
zoJQVr$~@x#0I+a(vJs`hrNB(_3Eyt{RSlA^uCy`;JvR8VU2CgjF_u9YaX-55jHuLV
z^${$wJJLQvUQSMs?g}fi$iY!Z4*A*$9e_ejtLb|!H3MAX+_i7&D)c&POV*Yb0mbsN
zx~EZSBssCrwoeCYHu|vXEtuMlr=X*k{+5t6$HP{uqv|Ht9t)xtSlxeE(_JBRbkGm~
z08Np-CDqc=$RnqwEND03C%u`pdfjhLOEnl0R2W-t<ThB1SElq@If1Fv3*CR_kv~=H
z{bsfgLY60&yjWRRY2SvOU(^$RW_cYGU7Yfac{T}gNV?LrT`H-BQ5KtjF+pm5Fk+|$
zvpM(d-pfIzbY`Q|O>gFEOWWL8Tn?boDIzSM2D)2vLaUOJrpdUt`ZAQ=KTgQQ<lld)
z(CE4zj^Vm<&l{C>Mzrest+aH5)4w+CiG6h~Bt`Q>C~)G!={Wr}U-Vd3(@|1_X<ufA
zQ72N;#V6&>GiP|>&AD0af2iu}NrH-<;jYE(r0ED}q@VLOly8y8j9n|Z`zWeLj%tlo
zvJ2Ab4r6W0n`ND-pH-rs(loKe@K>bM>-BO_?4_b>MZ5P{&2hTDRdAM~h0SO<#n4h$
zpt!o&EE>k5&>ZPwj9b4d$_G|z(R(UdPs*>Y6fS@X>5m?5l~Ekh$0=nC<b)moJSUXv
zqG|@7N%f5&?sTxo-wiogo~r9zQ_*x0LPMM^2p3Y?ziD+$-l8i?(MF+C(=<TF4=ZDG
zdP7brEuLc^{-~*~6)Y0A&fGG+lb~z*j=GFRQL6f3qSn4tn$DG^P*E1LtVJcT0m^4d
zX%MzEQTgng+jWq5)ZH0Bjal7Q(z8{`{C!Nnan3LO)&BrRbU#i-0QDNl=RAi1NkM9r
z)U?elbgd+R+_O#VnDos_uZi2Xp2Y=^<LECZ$o6k~i>94G;XNjt#>Cu`)_{f6x~iH0
zVPzS7gBA_Cq1FEY73*v09Zv-`&n_1BwPtjUds?J(rvCs+e785bYDFhurAGe%P}Fs;
zNu`vuEs2NuoDekqD>RadirVHhjFy4|&d1jJ<!wjhe=I5Q-qu!C5X&_;sWoJ-aTl{)
zWkn0x7VEOpSE-@XY5g|TM(2THWCn}=w^;J}X^z5h4`q#(k&e^@<eFCi?i}t`_d?Yj
z1uJ5rh0bsm77IZ;+cdg5yGyQQt*EY&H*GhyfL1Z}evv^<`FU8~*0wyV?Lvd7H4D7N
zTEm>IF1exVP*v_NVa{^4M<m0JNZ&<IpmhN=PU6r{n=0*IlS<HK4y2G4_$5W5^p>$%
zK-no|5x9;TRTjI^{X-2&6|)z|d>fS+Mp7wtwjZeVS5He%=}$-Nzm1?>JMj8RS*gBw
zbm`)!al1y$a;m5(DYV&}B}-W*%;jt;zY_FqK9kWAFgOc-kcTgiY}L<3-%-}Img(Cn
z8$4#+g|fW*T~;sk6Ezgl$N{)nexmD&tzxLhO3z9%d9u9e4LYKt5jOUFx%f?rQpoM0
zWfdNa^Z1Xe)3@^GnC;_pf)Z|{*ClD1o+#bBHbZq6PSnW}l1jae1NlOx(;}{S@F=U9
zBb$p9-vvt87DrTRbcfe!lY^;Iwao6@t$Se5=qWcdP4u5{<tq_SN!73miJ)NeP<p#M
znam<>LMFGq)XpJ{>$63vRW`SCX@O^jlh!n+I#2q#ne2NsqxveYmWsFyTTqTb4+PnI
z<u<R;Qc-R!hF4pH0YWQXi#fLLk1FYIn1R`*n96Pc0Jv4gsnVLOpdq3t$D63ShJ
z8OyY)7e;#);4Hhk_fwE;mF2AQbsV1})JkLE`ykZ1cBYa->bi&}XCx!EYVMV#+R3P?
z#G{f&bm;Y67f^!LKBMG!IaE5Y`g|1yvFV%H$a96$;aL{s#mM0Fk)YLe-6{z;>FtfK
z?X(3ZmDKu;bY>9?i+H(N?Ih^WkUnZA#qtWeo2c|HIt{QmIp5M3Odqz$%Do}ln>85P
zWQr<%-}g5wH(dUrt0k=2AO8SN?6rDFRA?1{{#fn5{Y5vZ`oE{Bp+AxlxxixCQOzak
zmBhZ$sr)PHx~EddEp?pYE=YD2r{WHqr_s^ALh%#8!Con({w-^ib-tAtXQg}#E1h4f
zwN9mgHmJ3r^R-E-OVt#NlGT;;{{Z@nP^t9kE98=#y8t_~(@^v?Uco&70GM>vySE%&
zP-!uW2=~V%%y7-da*La*wU|JOlKPF~BE?<_B}|OlZpQTm4y#YP7-21pU_DXj`W&XP
zOI2Ftf^w~;*DK}(zN2mX9?F)dsC8D(B8`yB+uJS5E)}q;-kInS=rmJN5Zz)s?ZA6h
zCs%=*O<Df{sS>vQu;E_x?wM1o$LdS`Gu?v-ty`rip^oyGhj+?Z!qu8Gr%cPku15J7
z*kg0;$Sl3qvq76r)SlQXA(982dzpn#qflt@*8cz!VF?EpE7H1q{SG@9)kQCh*r{Zf
z2st5@w@hs(;l`U--&xbSt#@_{D?K;xv!uO2`HF{5@931Rc8ya=VFI0?kL;{o$~XI@
zrf%;xUnM`uc{0gLT0IzIhaQT`9*61L82<q2XdpizAhn%3I3g{lrHQuU?OGV7+3kg-
z52|yc^@s6Ud-+%SrTmlFRBK0=%=*U4S~R%ae6iM9{d-E*E24Ogj-{aXWA44EX_OnT
zVgRSVPNM_a2x;;Pq<<%tFLeI^^enK&{hu<@^xmOQQ}3mjuLnM?X2ktgft3!ThyMV^
z8WkkbH<Pe0a(ydoK()W_7gU<QpFuku%DPxy%VdiM)Bgb7L;lLY(Kz_7^v@Hk>b{YR
za`-f(M?aXb3HmDCW2~!csb3U2d7ct5=QAtPD|$bsnNn(L>8Z`RY=a-Vf^num(;xbL
zF*FQ0js>f)2jtY3>f0le#doxP=~~TZy0y%vp_p9oT5K1peiHPqq{f*mqKLKM%I1eF
z8mBrc;ZsE=IBQN@U@nfQ>v}qHW2&KWBbP?H{{YD4=vd-Qvrnt&x_vD-sZA6xJPer5
z)B7wfcA->cbV2TLX~8+Vxzlxh2dU&Res-dn*R`Hi(|S}=$GRH2S>hZQjQ;CI?$}%O
zk20&@Pz-O=MECEtXZ0NmSKq#qLUSYTM}_N?xs-AeB&1;;9ffzH2(>2cex(El$jDuA
zo;j+snsJ<6o-L&G(42!a*%ZIiCKis9rQ?mkuBna}c6JC`ezNI0m}y^86<r-uEpSE(
z^X)1c%GpeQplD&?=HX6%uUj4;vA5~YoYRX08kJ-+xB8g-5VXJk%d}d`aP2!?bWS`q
z<Txyy9SsdELQ1+(E;3?%RI~L?hd@M8x~d|3I1&_F-itM@mo;4pujv4KQqxt!-t56c
zI*NA-O9*R+HyJ}yYo@C-y1el;jyGXeYduk@Xzg^4t*5JRaPC%|GEIL#jG&l&q9zAM
z`Gj5xSxs)csC4-Zv?iNSfFII)AS=4k9cnj1X@qi|0>@zkM?+N^^+icH&$afq*&^{8
z-(Y@1=+WtQIyScpf7EDA9Osh9aDEk$pmv@^s5K`|8R3#T<SK0~)RMHq^4VwO7$G`s
zI6&?4)K<lu4VNFfq;SQ56lan9E$SmWgLX{8CHpyLYr0ado~!e4%wuRb^zXPWMw6$$
zsg|YI7}-CROJGW*>dhOiXqsvOmZAWETp1~(=D$}!N)KwwO#@fc;b@0aGC<%g4%`%)
z?R*Ud^m?QlJ2k_Vo6&0Z8nNlmC@vqVwJ}(ay6tmGtdJK+O&Ra(BFSNjP4pQ}E|_+i
zt7-CB*HVH{{^Lgos;xqepqfXu?f#S5Wc2+;vWh`ZG;!@8%I4i(HmQ{$56V-4+_6<b
zCq&%aR+$ZEu`RZ?mN&P(!aG3IbS-h9)l#-8yZU0vpIF-i38w+4!7D8`rKo!Lr)<rW
z%MWy9zKt1IXQ}GF52n+>>Qh(C2qTAZu-cU@x^-Q>l}zmBp2_+qxz;VS9ai^8{W3Rq
z`C4dZlBOHhY1D3#*>hT2Pwb)lLE9<%$!G&Y)U@eZ8ec3g9gDD^smUD_hO(Ze?2w*9
zuGC?n4?dkd&^yd-zxF9;^xBH12DZC<f2KiV6a0zxDu&D5JFF|}A{6xvY|-(!w&iq?
z$1{wS)t-qtEqiVd)crB4(mAy>hAC~!LNaJ8s@PdQ4#@!iQ){Gbbs9xJr&!8&mdMIk
z9p!^+5`$7cxNI`M662dY3VHOfCoHRmSnu7<$L^U`rqWWwy^jR{0NPbzt#(c5(Z5cu
ztfc-Nw9{OEqR<`tq=!TefX7<{nEQUVxnSR~R_TvEm#ws%V66vE>s4Blf9fWbT=~M)
z819X7mV?hu#T`_0(rON5jdjPUE-tq88jin510PeSGOiYn_aHg@g;PyM8>zRpKuI0&
zq@~oPqG64d1QGnV!ezz(06=a_p`At56IZ-b(^Ja`?|xMkb7%B{nmy!L{+y!qZAM94
zWpyxf$MX(P?1iP)80Kwt+Tr}J$VnLda^!<KxyG12p-#rJlC<5A7e571)v@iE>;$yt
z%Uh?hnv}H^&af|T=6n^Ou8H*Z4vs)t_7&^GN=nZ*QR3*?^hpxvzKo;zt;;U4y;V}$
zjef6VfeZ|3J`J)KpQYz*O(Am*$FSzhH`JO`v>LRPFMjB24&rTq<Qx60G2BXLi`<ji
z$0{j><GrvusicBP<n;C)R-dHwNcB2-;;M|W5r=mNu?gPHv}JVhEVha$%gyiyC13P?
zJh1f}1w}j9JBKwLL7~T@YT(t?#v>OjCl?C$RM)h~DK|6InnsJXGbi^$l_OQ?O@CgF
zjj}*o1f*Sr@Vv@nC1$B3=5aowTt)o&MAXkEOz)aPNhFbe!s;14lEo;uwb#O4KErjS
zRaO`O0H@ug?upnR329{xYf1esMApU`Q6z5R{12+E(mmB5m47UCiWRyyMWD!0InH6i
zyRFbGXy9#2B6Rex;zkRW{X(doGkj!lv(}hb*ycI144jqBuywMNPot@<t7R=TFP3MU
zHLV#bwalv1tDi|*365CJi(SY{F(?)UDCNQBcc{mW+qgv2QOi~dr-{;$&d{q8e#te_
zEk>I~=`^{|_J9<+4@}k6J<XklAl#d+1uQ?5(r7212M0n)a4kV~A6I&<eH{}(BzvAP
zP@IxsigZxwum)9_A{S(4*YZ>Wq<A(`(a-G+p6&<vk0DJgH@R+G=gOLYW3}`OP0tAl
z1G004iSVO5{HGR&UfJ%P$NBD}2FEEkX3GTyGDkJR(YUq4y3}Z$LHst;)*Ornd07@X
zf(np3!O9n5Jq7hqhKI&*e4#2UbM1Y~$x`Yv!)6y3H^M$TktRp%7D&yS7$$G0zDMNt
zMA63S<lHP84|PElo2)N&pwgrbU~RIUIstbRY``o$VGpT6dO|@(!y`6j4_@~=2a96K
zWb|mQn4Lm4`ZEDyM|GBg$MbHxtS+zhdVv&kT#ib_!(3#kesD^hC9$TR8(L>X<^W2V
zQ?UDk)_RI(SP)ML@jJ_Hy4YQcS~=WZhf47u4+J4(sC&-PMUb^J?O`r*2A->Q#isxy
za`ZAqjEx{<gY;3l#kR70UmNXWK8k4C*Bse017vhD!Rn3e4sG~W)9KW2gVcxGdw{Fm
z3}YeXr4Kop<+0Qg^hG*A>>E&w7Z}=i4hU7y>Gfium|WLJd25Y`N0{ah58ZO7kUF9p
zIe<8SGgM^+$4-FTK~)iSQohgZ$A7_4)1OX#u4!Sv2g)jrt>MOtP;o42{v5y3e!dZP
zF;mn=Sy>(B0`bh#&xOw8qS28x8;haamCp}p+{2KEqMXA_L!4v{#(4;;YM5qi$=X+*
z+T~2_Nu_8mhgYqHZIR{d{*o??mr$mew+z_-030fLf2o$`6Q@>fkP4bnG)D!^86Rai
zMxKXHkXe=Qh>gHq4e3VX?r>@OR<(K*RZ)ItPo3;(&6O2(H1zUpn49^sc)KMiG|61)
zX`gmo!?lW+^X+>rG$G&R4@&tX_PwOG)&&{)SY;c;miQ^C7C_fiJ@<*uW52SQ!NHd-
z-ao0TXz6KOHr#ITyYiD$yL3+b6ND%h%IPWHAT4dp{{V1<eHC0z+yS?hqKWYtKZ-Ux
z&9IDYY<q41H|~ufsWUZCB<>-uB!G>)jW=tt;G*iGg^s(xVeCR+X>LdkVh*TfwnF(s
zo9~PR<pEg8T+?hT8iz%+5bJqVdW4n^BG&SuDV;ds?5?X|VKz8GOH#lsbd}Yl5-fs<
z3W+Q*Y?~Zg>|B#eNS0XJQHKCR75Y3y+nDdNvx1gR18}S<=?MKo>!E1oZpunMAd(Ai
zGOsA8rikIj%Fc?FfP>G%(o;~-)WXomhD+QMgLEo0@Iqca;1tT8HlAQxG(g|TSCx8X
z)Zn-SZ-g(ZZ?WS409CAQnQE?_jgH?*E8%y-o`R>SbkqDghe`(km8C6>;@fY334)!2
zEp~hqvQd|4c)2czX+3kQ!b57QB)5AEEe$tXY1IR5WF@!fb5#s3F`s7B{{U--6~>-4
z`miIbqJ()MC`%fS(RgHUOgDc{*AiIfG?f&cGetPvO;7+lX6Y(=Q%R_4bqwa6{Mb7S
zJ*a6tO{9}0B>uc(HU&*&ciBe>y|T`3pR1%K#ywX2BB*rDI<3u$sxsLRlVz2IuJsy6
zdU}K|jPaCYJz+~!;NxQNBLy>*g^XZq<><I!i`0bf7RGL>Ds;K&9Cm_7a8=Jw^;Im8
z2#r9$79|_1#%k%EH8ibpwgM5!B+V>QYer44wc7Dwo>~rhR2r2|rB7N#OipZk1LYk<
zRwQUFetU(}9iy45VeW0kz{=(TtUy!0ID^PeWTEyB7AuTIy9)$TNxD-TTm{Nl#jto&
zHH~nyNWX*v2>7sjg%hK7!5kvw8+lRM&ba%nKm<2wy^X@=zbAF=@QWd@1P}pGzB1Fs
z<V-T)fwJUxTt)s0d`xSx`bt+tY~1{;WHF_};nyKc9L2mit^;WITEpcqZ6hMqKp_rs
zaJ}-J!`j@an`>Mfk156W2N(%VIonCWQ9aEGzM~7ff>d&n4tPv}OBpREYupL#boWT>
z07cXccL3Pix|7{&w1O|fBG93r5N<-^(3P^c4RdUMLXyCYSfgg50MXoj$?a%!Y{zlf
zsY?ebeKwx}pk@I*D@nOvztJ`a#}t4)rZ79V3fYl^+z_FvqHEiGEYMVm*&vcD64~4R
z)kS1<;zDBG8@qy-_@||la|v^PISI8gK33oLAEk<f*QRu1V6{<~u#1bKDe4~!_Pv&9
z@TD@Ay3e>u(%YNa!7WhkSJ~4?1ye@g)1SJEN>LP7jsE~^DBfBhb{(g}oA{-dz0W!B
zje(>=6w)!)H?o#VA(ZE`d~z|)0qnQRlB$)ZyW-EABH9X6G7%7N(BKb;cTAR=C$y5#
z#~;|HJ~Lt82wA0`Ct0U+Kcu3Q^lnSp6x6Pb*8q?3qq~6jBE>^qz&4h<xI8Fj4RcMf
zQ*YQ)A-LVjehBuv?4WyWPi4XUXDO&Q6%hju2<mynN85XNRj|F>+Tl&=1I5~YQb}mt
znhFZ|jhf@N-`JyPjv3=7z&hN6WtC&j502=FwF#re?iV|Q^gKHyuY|PNWDfR1w2N8T
zQaX1^4|Fqb9iCIh{hcY6G|~n~U`3PN9CI9UtC;<+9g#592D=&gT8&~&O!kvubq4ET
zoGk<_hN=#7RYg@B<B{GxqNV89V8CB3HcOF*B>}DdO;Z?KBQFbqKhxb8MsjF^<G4?a
zjd``~dnP%Liu;AF**5%?8W~8MNFN{TZaXNP&f_-hQ<+sGEDycC!BR3vWp*srcs<aj
zfz5j$*e`2YM)<%OMmzzD8FAz&-pc@4?g*j3SI`@Q8Sa`0CdUZ3FcHD}s2st3qhd5S
zaTqpDFCKDIxwk2V5%%njAs&t*_u4^Gp9l6S;^P)vN#hRsqAL-dvtoWzx0~c$F{}ie
zUgNP&7Z^DDgut=*BIEW=y^oZD<tTBrj|mzbF~Emlizb&5z`|Q@2Hd9E!vy`1K@rXy
zampRrk9(=#wawzzQ2v`-+dQUBoVq$7N4OH#1I@6Dj-(T50cp2AikcV%(G9uqP}4yq
zZud0!x}sKb$+W`+O?cic4`X!4`t3M-vD_OW;V+N$8+jd(ESMkHVSm{pO>|m2TPKH6
zcF`SEJ!W|zTqae=O}Bk4hTqaq^X=Vs<LH~&ZdQsY(7}$x6Wu@5Bw4@_=elKyHzvsr
zGh|atJVcb1y6r2QHU9ut?xbVe{{XtrxJc???{r4tYZ1cx5wCL{xvn8g`P+ckkVlj)
zoZJvwWXH6Va*rz}@s?54yM~bV_$lxFw3Z-xZdHvW9(MRriJU)Jy4Af3@shkgH*>ss
zDN7@p7qR4o*2>pdZnxb_9|IR33ARgx40RQT<{KW_!BLjX-`30da7DG&KG$2}7fk3J
z@FW{td-hXyI!oC~=*briz5FOPkn?;kQJ{)IT*ia)5H*@vAeQ9(A<aI_@wL%NS}c9H
z`zJ%`iwpvirkbJxY#sMdZzjR*+DCAhoduok%W|iJpn?gy3A2{iIAh8t86$t{u?r^A
zs>?WMYuaw$LWWUtNIaq65&coTeFA{hJ~wT9Ngh)vqa{q5Yk|TTkb79EJ$T*?oG;-*
zNG|e=*=SE>gE&dB_zAm+Jlp&!8teY9J0;>@o`xHNd#1kL6r^8*q9FJBAkn!DEjPHx
zU3UY5oofqSa#5DW4(vieFZxgJlJ+33`Qc+b9M+q0bgp103z;LDb7B;xSf1RQSqEmY
zXEflZUz6jqnZVxnzA&0v9h+GZTO$qt@VK}Ugy%=|U=({u8OkUFut&&Ex0S$~C2_lX
zL{YA8Ep*$v%5lN+yFLOb41FavQ{_4Kx3fkRTZd%FMk8r+$u{Jk0;AS?vrE#$nqJu?
z{+64SSxH3ml5D&?oNNjD1Qw^M(dp5j%+$ux1<1ZvnrokkT8%(-R722V#m6frSE$s~
z66vOMoO!vrn{$0=YKq%8`u_l5Ii=C*%pd({m4noEO3LYswNts|_9qAdEx{y`RP;2p
z6|W73Cpe!0G;#j`><&nX$mbh0A}FaQsCaB*<gGT7(elVz`j-~}0NUPu>tCew{1nXr
zkl6VnDylzXaxz*!NXtIgO6{QY@V2^lP3iQIe-1MDe^KtPX=s}pK`i?t+ansl1336b
z^+*-7D<+9kQ6-~mVvHWm$wbri;RJfFB>w<N3q)UYkz_<SIU@lrBr|{6Sw*8n#@+C@
z90I12mOec;W3UR$O&eNV{s#lf3R;shtk#B)j>rKpGfL8bN{UTB2OGJd1!oJQZcW^s
zDTshvN6>Pywhc)HFn}XqZ_SkDz~FM2c7eIV!~Ce5A(8u7EE6*zpul-4?S>!$bF37w
zQ%>drT3Qct-A*Ys-)k;>l(rgREvIRDH?Z<iG0hYL(6Bi7asL2>$)k96&HjNojCFu5
zLy%NXeQdG~qQm^C+S{LX$wWS!M9)%3w0GrEYaLBNrN-jtw{Y#rC^;qAc)vx{fMW}d
znmdxSy6;nI+G|efy+_*(1z~!NuIlUW9WnG`J@_SLC#afv3*6%3b8=E#rPhZ1QKr{A
zvcFMtwwFT}W`eSHbq|(8ONlq+rIuIR0*Ro~>Z@D~P)P5cspE|yT!2{=lQ=b?lYA?!
zFGi|kn<@5ya<sZ1OgcTXOA#l<mF-@g{2>D(b%@Rr$!kD^Mq(<5&p4!|jL7kaI@k+g
zqv?){G3sQL{S!=zk~>EgiOF&0Ts6%e+#w&;QVV?E#Eqgex56Mfjn8!vZtfFHTsxJm
znIeD8hVt8<!9-?r-Nk}Nvi|^8APpR%4#=h6TVQNZ&GtCv<rw{r76<N~9UM+*E_N0H
z95T7q!CfnjksrW|0l@fBJ;BE$EMXffTHM$rWS+CE(4eW0YfFh1?5gVeh7CX29gLqT
zWsyW^#?5Ump3pbQMZT(OSlzo>U<ZZfHGN@L_n&$CUkFEaZFTMH5%elgEBYIXJuafa
z+j#h~PKltiad7*U=M>#hJBalOD#jk6bKDpod;F}YC+IFIY~8cd8FQO&g_`Qlq=Qe4
zvLXxALb=YTE_}hb##R@q<n^9h)41Q1u1&hI#;VG_dtI!rllYQ5ZTP<mj0Zi~H%@b3
zB$gLBT5g-s1mrqa*`92z2+}6oY@?;5mS@;B-D|pkKxKrIi=PVii$sGSoLgEutIBFP
z;TCA);XTkAOoD=ikwybr09Gtx7~J7=Ikl6fj5vO!tO*g21F@AfaNK3cU@eeWKDCfE
zm$(2Hv8Xt}*0*tWf~D4VXegTImxAH)s<qyxYZzG@><4v?o~~_Ha@M`uNwvzIw&*%V
zjc%t=sMLB?`<`5E1@Nr2&V{L{YiesH$<EN9qUp5sFnWxTIzlmiQS|d`Qr(`gV?n{P
zDlI*1)|%KIWhm0xVra<55b%C=#1_Kf)85NTNvAQgdets6y!Uc$v#7;OOhi<r#@q&~
zRdyw&P)!|6f%RoAYPHfestrCJuC$IA7+J{QtZGxb)Dto;-rFnf3rvOzhRItQ4IJDj
z$1W^ME=x>@TGTaNXqdF!G_j<AxaQeW!_&H*4MS(tDgYPAUZp=&Xmm7YDtH(O8F32@
zCb2`QYe3B|_TKwX3r{3lt2ALn#+##8>QvsHBQDZ8xlvSfGbry-T+x1VR@#fIG(9Iv
z_Ur^VvF^OXt@_tf)$1Kkr$cD(&Q@=STQyk8JwvEA3Ns*M4`Q~I{YzV=>E4{vhP9&r
zEN@TMeohkVi+aw_D5|O&&0<!(y{&_ja*a90kiW(38(Gxduhe>bTv|^hPp5Q@4Uc?}
zHzMcVg=I%gNvAVwVG=lZ3eQZUtkyq-#+aCUwIncc)O#LTRJ$-eLt8_lNod1E#sLLb
zbe~Y_x}UNd$FZIB*=_3o01EncYs;!i=RD;5%7#vp&@@O(w6fsfJf?U(%vG0qGyO?J
zJk-S0R+n6ND;G!7?y0G>PV1gRwAHC~O3g&E^F6UN;`{}DNfmydL>~vGD}e4&@r4ZK
zCi(-W=o(m}6Hh7K&j?*suDeNv)Y@eurnWBDT{fRx)MwQ8Rz0i$+h{9kOQ|-VlI^68
zzz@_?WR|~F$AWkJ9wn$j)cU1abn(v(&vvaQi_#ja>6(8r70-8auR5cteOEd-SjPFV
zRQg?RwN)jlq;MYrO9n}|TuNkwYjQNbFVLD>s{{4P*#7{6aJO>)9&~dl1F6`?n_lf+
zX;RvncD7wYS7XDhh@sYBQqM-3zE)z^x}@gsp>f4gaaB#FXm!4{F9%`6NV?Ke{w4_N
z{{SyXN4daTb(SHzO-%3KEXHtqlB}rcBBCMh+R@w+gk>+V$uC8gr>pB4nJ#o&ufQV<
zKQBw_)zX<|k&v?dEq<F(4DGZJXC7B-amNfr)7OS$`AV+^R!O$Z{T7!`qc-wY2fx7~
zTfp~K$F<bWBeSf$`>8c5cU6{A%IV$?GNgy9HR?J*1t|j7zm!zswg(r{q1LIQqnq;$
zb0fE6IY#OIRirYEv(aSoG<FNmhM(2FS26UzK{&gt7OzG8GS{gh^(P=Y+4iO3DO>2)
zkzc6wCb>SO2Ac?iB5iLf-I}*hGLF;J8J%pAl-B8oO0I9`Tp9sdntf+Lj*JN&$2!V1
zqUf@1qt5GeuB6qZbwhSjve(*8l~i-p=~Z5pPT3#c*;_4dQ~cznEi-Wr#ycv?eHM7+
z{KW9@cR4Ac8}uZa`xb&|s@NYR3kS-Yvb4hv%37vGx~I`=3tn3h13i{kRFaw19-IKk
z?}c`hbct?TWbLD<)HOD?TBA8}!3Txtx-Uh%(TBdF;kN#(ELTlKB^->Ybu-1YmA9tq
z`K62Ua7Dex05vRHT49y{0O+Oa9-7nRYqwQNyZ->GWhity2Ul!k-6Mm$_g<MFM)elF
z?^wj>Sne*Mto$*q(%Nc2G}7^u6l9&SsYlTUlImS1kQpgrb3o*Ps<j@emacIQn@tU`
zW5S0~g10pDx$grW&J}b$IjEO<nt$+*H+nLQeIqGXVf99LM$<GAHRm@1$th_yhp_q#
z4{N{fL(faq4FV~>35Niw>0s&@GRT8Z!>*Dsl6xu1RiX;cn6I7QwM6C{asnqs)!Eb2
zS(1A09~VMukab;SJtoT5HQ48sebF5SRu8RRX&&s8*eh|ZtrBu_?3YyhO|7Y>H1zs?
zoO_XAu@9!|J#x6p?`v<sJTF+)`XWa_O(gNgK<?FutfJSnnTU=i&0~VY&)Fug_Sv|<
zMV^aI)Ead&NBV=AVT*+wcTv_uFQ=-=+1cIQ)n#s@)wMMKlW9u_0_v6?o7bvp#JY^Y
zMtS#L7ZmzNQj+#w)>L$^qRq@~&XoTED@jyS=ycKtNfwbYXgG74w%s*BrD-h^7^9WL
zox_xGQ1yj5rgRa|vOHK20&kBSTVPX?dPke-bd+*evX)wN14*^k-I_CW+Gk5gT5QpO
z)T(LqEilGpsfIVod+o6c9o5}SFqFkg=QbnQ6)B|^QDq}5{za~#s_PoOkEVvJXuYtT
zrS$f%Nbk&wvA>cxEbmQzVy>;5Covbhli7N;4?=2nbV6wLsE#jZ6jNMw_6{$WkwGrM
zs!|V5rcglh-BfCQc<4QnP_{wbi<P6P>1kk;!(3Z2AI#FE6xwwRTVJO#TYpq)af*}d
zq??N9rs=4o>PDHrArWovMXXk`hfLG-adKS)o&2&KEVSC`((448Y)z+WKIYpB_e}go
z(&}wZt?BKkX~A%6S$vq?#AtkZ7wy>2qSNcOI1l9_jI;j$&PL!?UXwtUCm+nzvv@ga
z8D5snJ3+38^Ey3DlutPfF82P&d1zp9wOe9)hY~d`{D%Jkk{&)fj^fO1JUVqGt#wV<
zJ7WqCq}FIDsN7(2CfLH&*VF0@h{s7v+UV{2He9bR>n%4}e2%`4TTgS^Beh!|O=yl-
zHug}()ca~nA0M=zD`V4inl`HDIzU=aYu@V#7e?yUQU@`lT=#93`=a_2U4hMzg5A0O
zR|`u03kcU{@{6IgH^2;3f>(F43cI4?JDUegK33bC6{yhab*&;G40Mhy?IA?h{v&FX
zZP`AZ0KNmGH&T?}L-9O=Qt6tyC+?3$lAgzcFq;#qDS-9pUl;=faJQP@R@Z7EZh+^@
za27LLtkui5wXN7yQ*9X}wk$e@Q^%!C0ejtmE}Y#PU#LE<PMbK7`q(dIXH068u>tvr
z;tw2=g135KQL)j8>1K$J>3&qDmvuwK7qbHGCu1@k=MUv@u~E_JKbW6%Y%O<_!rE(f
zQAq986yd-3Mu4Yek~F(ctZQ65J*!2@{{S$_MSl<<%j)_pezawe1HrZxCb8Ca6F~ZB
zM(yNV%DC03_4%SAsz`%48(qrJKBG$0?kd|Gr1=Tlqv%x$Kjoke52pH?s46$oKpet<
znbuyD(;tM|ymB&XjZO6K87y}T6Q%W}R8=;mbE5#<Ihb1k_@P{A_Wpl(1BbUN8I<O#
zIs{US-p^Xl^r`fkVH~nDKnLn+Ru8Fp!+7~$G-|(zddyWt@YXyuo&$=Wi?8de*|JLc
zV{u<OoACZjrrK!l$K>KmXVX;jFgJ6a(f3i*>w0Z1#PxBq-dw(0)~b4%XpFR7Nl-8R
zmna$@fc!@4Sp89|Nha)#(wwfZAMttp&}ZagUuV-b-EGs9;F&czMZfO~j;rx&q$#c)
zszz<$*IzhwAK_15XzleYXyvGm*WSqqS&D9*)hcB$vLM+T%U<ghT%U{O{H0&$Rh=cI
zeI2j<I`rgBb17;aBfD5HG3p=1%}-aG(xG$Wh@86lSkM0eXMITKdZLqaeh5*+)7p&{
zK#r!F@t^yGrVqvV@qe?w_D*^7Ri#Gmi(J$ysr}l!-0tlv89I|zf^h_G6SwyTSoC*J
z>C-W+)M($4`q=W)ud2FFOr{1(I*ARxmO>BrUaUM^QD3S!o@qYWnDytYaD7D!;U~Kr
zYp$5hPRqv|-rh~ZvD6IEL$((=u5Sczg6Zo0R-&!YR6V;%!E;l*afr(!WntG#Y8pQ&
zu!E8tV!aQfI+ljA56jiL>?B(%wxgt<Uf)&KOojcfz(NdY6<TxeB#_F%!=pC-$U<;~
z1mig%zP-_56z{Cl=e@E(e=8TH>(WxVFv{k*f84z<MAEu@QH(`jSyN8(KT}<RhSvW8
z3bg8SYbZ5HD%x{mLtMILi8aY0G05(u%=2XGooW(v`5iPi$S(k+`d3P<(<XGfg*@yh
zl0sw@4xnjtGnP5Huyu$~&(_+;n*RVoS=l^Y+aSIaT5D*kYuTyQH7ztiOJ;Ll;Z#Cq
ztA)>tO!a}`z~B2ST8^*MH82@AnC477!`%H9j)GlXHt1rW2*>j=+fVG4JfA~J$JrAi
zsETvz#^^41b8Nd<Z3(6(phGKd#^rmcME?Lxikiv8M+QNAFFw}UPHLSLbsnHU%-ki6
zoz#r!?GDhW^s1dn%>Y3eIPaCX{{TbTM13<1vF-Df=emB6BVX!4SXxhF70Id8po`Kq
z1<m+8u87H15oy^Z+9gFihNgm^VVja3N;(ds)~O&7M^O9lTPrRVR+Fd}){#A2vA4rq
zuWL+oFo{K5WZT$_5~VcXL&jC69iYptYmWic6vscTHpOdy()x;y8%GSzirg|w{{Uq{
z(%oC9Q2`m-8-@+Vzq+~BzY$=DpJWajh~zm+P`=fajMREF`rSma$?44uf?xZYVikPx
zYEwgccE>9ZV0M*NtMyG?Z9$S^=ds5o*RlcC^+xZZt04FW$Mz`WgO0<JX{sBkz+#Y!
z$X>^IArYd_OG-BycTB=^-s+-Va<WQ|wNbXHv%Re4q0ludTDb&q#8~sldsDtmZIV=m
z>H|X5n&!YNDW~i^EWEMTX_Y>wqVmvi{kU7LLrm4G1?lvti0tN^s`#|7q>L7}FHwh>
z$xDxl?Ub97T@`S3gV_*l)bU700V5;sp^CRv)+BJEjg182?yyHy^qdkqeSJMu6OK!x
zAMwIJNYgaUK0TBgvm|lkP3>}gl|o~TtcOqO?PPna*>Tu|xmh-jvVo>p3uR~-X;Eq#
z#dR!RlrL<qII|q8y=_jR+uquUiS2V_k-2M$M^Sy25cQPQk~%plUlAPmP*(M9RiL;6
z$wBtHrr+6CS43YMy+#7>>h7xOok<NqZ0!Q)2FacxYbMPMomH!vV+_!?SV-<NtEqK5
zNhc3|G_5ztIcmC&ni`1Of0EtBm3@5`TW1Z^m>ka@Q*e!Go0GFaOHrdw4XPoG3wIb*
zb=BH-pHLq~3pV!wyr3ORQs#*2Dcu~OJ(9uGl@cFOm8`#Jlm7sezZ+xxwWC#}>Ta)v
zu4OB&+%*3H!nu-zM%3YKPv1>Z{YTnXHiAn1GFFKrXaMpR-A__7c!MO2TnrxQG|;Kv
zpxUh|x?2Qde_k{FRwwsWT8^0m;xa-S*Pov12K5XPKhu^$EzSppB~5HKFcA~E{>v#z
zX@-+!B^6C}lc_}|K@MYGY<O2)Vkv4VqpyX{4t1|?_f*no+J#Xs^$Vl;%8H{+tYl^(
zC$w1lWZ_dEkg@)(T%J6#e#kGQt7M_o3uPCIZ)v*M>(JBBrOe8QG&GNEydK41DQe$O
zAoU~Nx3T0a3aw6ER++S577f6Qo>!sH<D-dVscedprTTqG<!fn~Ic{3x+;++}ol#XB
zuZ{>|V;X(7Zft|q*!dU<{{VI|&!2@*$+t)(BR1NaGEx>%aV<3(`Rm@#%n(a>`YP#c
z*EoZNl`Gx7w=K(Xh@{fxtYamMEI7Yp>L^}Km8FjnhwM9D!>!-AQOMt5@Vz&t^a^UN
zA(S=I+(jX|9nTjFC)HgmU879r0B5Eq@ygNtkA!NBotc`*#Eph~=Y#fEdY4DlQ0g&i
zRN>MxLc->ckS>LwqkUw;3znB(XUQ3|_DvIRp`g+^><yK%hRD)8fn~U-vs+4lbXbH<
zY;6~Wv{*SVxzc(zq{AVIQ%!Hy!E2(OM?4ST6Rg1N=df7rxaw->*9tuzrL8eEwqOsq
zpM<iSU4}4kqVGW+Khtu>Pg5)|s)Ul+F}laf&weh&r|MO3Y80|C$Xl`d2>TU<np%fU
z=Tw)zM;w=OnAx1u&Ie^DCi@*iwnH5>&3SJvUaR;s9V|1rRj>xhjD>)qrhRVLK;7o~
zw`J(vCg`-94@*-K!dvcZ+(N3Ts}ft$qw4tdI(A6b)>4T3w7gs|71ilun^2abk-x(y
z7EpEVKAWla43!#XM2u%9?ly7wLQ>0JM8?~5+B+PD%;x0FDA6U0O^8y%Q6mk3yL*C(
zhI$I|{6`9DZQp`abJ5EPHnV{kAv$($G%Lh1jnSWQ<P<cmAe)539M@lhxXO5Nx;85r
zeo|lT6OPAla=ESSv60OsJRIF28&4Tadz3~T)5nBM9svQaC{_&FA4g7HMh<(TfXfO8
z5(hT{Xte$I1cDISCY`hgKE-KS1b&bKsJ1A`GRuNhezjQm;Cmb480WSdjuvyNs&-PJ
z>O3jQ=%h?nQ&kpHypzq=K8j*q3O}uDgIFMGyN}AI(ZinbZl?{iOxEerNLViJ*b32-
z9hY;JJOgBHxw3oYdydwd;dCa^7eSRWdY5g_(Md}SK)%o}qNRc6&M23^(*Rs1OWB+H
zALuvv98~dBO4e@mG2uf2d)<-%MK#R;0^$Oq5waOsAsKz`;X@mPO^v}v###@-L^hHc
zhv~}HZd6va<H91C2ag3$Hk>1F;QV+fK`DjVX|l$)$h8P3h#HDlS<M+?7Y+(-I(Vz;
zt?BM){Y)RKGvs_Fp1K1OYpw|%7I@C;O7C8s?r0~Ln<!+Wkp9clNZ~73@o;}cgM;-<
ztD<}|28L}t?ZH+WO-pN|*&~|SUB+zJf8eQ$ofM*$wT@sW%r77F-E+<gNW5}Bfa!xh
zJ3k&&HH>sXz9*6LtZE@_PYr#VPY23^NLc>>YlasiMbl_roa;HX`F#quGI)5-92TCY
zyGGY(Zv>u<-Ghg9kA9O+A+(U#JNdxj9Zl2oK+!EFOI$n?kfTXH$}5r^Q1eYAqHq@n
z&I%%#^wPKZj&mK_+#%{Alst!kN^5psYlh#IWJ#c@<Jd0OhmRpTny-l7?EIm_#AEdf
zCNu(f7p-7OwA@Grz>kr1t=VtkzteyAKr*SZjgEbS7N)6y-Zy^fY;G*HlBw~VR7Tkw
z<RI!RBDwUg--1<S+PP>gaKFl^uha%hTok75ofy>?dWCo(=F2&#Y7cXbpM(`<d2_!~
zhAYnNIAh3K82-&Xi7G?4zITh|TItk6M|&gz-zk)o1O}TMd9t~qq_`Fvmqk*fa?5*R
z6g1MrTG`{rkga2lmIA`blu{U*>AYNgsl!|{&91+MHflp32xq!C5PO99WZL|a-;kag
z>a>6j)G|dZV(q)W7HOEYWo<}<Xm_a7&DCV!lemj0;*z1K+E4xz-lN_>h|o{bEi^TQ
zZg`T-c~dr55JSNFj#4?TaX8vkPie8YWIHK(C*8XMkWz`JkG;ox6gwu_?RGv<18bXc
zoBX1pE0BE_ruK3R{w|Alw;*r(ZX@e;L_ul0aGc3|I9P=#VT)tOETTVCcAKa*-<YPc
z@)aYrss=cgTwjYTiG*+cKz%|L%mAAV1XMVxL32_Bi%!`fbaJ}hLeprqH8jLtpuL_h
zswwl%3YTMv!^=;?4lRS4Oxni!Ek-cfh}!3QvZd7eeelR;q_A%`3Z6RJx@Tk;0C{gK
zMWyNwu873hzlcT}a8&;Qcn;KLR8!U#NMW1x1!oh%Xg9*7*R-8d8Qn1Vx08e(pQ%p+
z!zF1p<Q35uXoLM(st#%8amB2IrL3o@XxS#$cq&rohYQ$*S{liHQcbXYr?spj2Hyy7
z4fwioeTA*Zd!S|z=rM4ib4z(nWUpwuNk0WV%GpJn05-D51|V*|l&vjyB{Eh>({@;>
zjF-cK2fDzZnQ86rX(SXhgpSz0Q=2Q=-)Y=DBz)~HwSaM1gn~zqMUB1}8Kf8@{yU|9
z*PoRc4jAMuS}>*UkmOl3NLzw$;d7gD?I0Aw(lBjxkQ*gygSf#{!zjIp;RZnYNxX+)
zV9{eQym?TEy^g^)`B5@si=tyKlvsgvx-hJlc*CrG6yYnH>k)JCp^`1R93_q4)s=~d
zMKgBZ{{Uq)Q#L{x(lg~&01b#1Qp9X5O^U+@Ra21N#D3XS)sWoWg45WmNb07C{^s`x
znEwDTR?F=TaapAM3|mG*ra1;5X&dLbL0qxtZy!acuca}+_+sMuRh3$JdEVBRyS<d0
zE27IKmF%XG;E+qcQ>`>$wah<MWB^3q*WJDx5wd_=?*YTJz*8udqN+Br%*$>&kfv(@
z_c7+*RU@E@=IuL3;>by&k*?ix2<|va_7pl-mj3{`9olhm$`+(sEg|hcxJDX+VhwXa
zzjP$_aW4Hi@R}`|ub@9rG2f=+`>6+|D7#IHY|U{Q0FK2D2_8qvuVLazByJb>s03r5
z9gz&3&A|b~>6IO~l3R<TV<?P|drj?xL<O=7KFOjt3vLQ%;*5`Q&ya&?Mw%F7drz^~
z9ur9boLHh59^S#j%I7n9I6}vT*$W+Sl_)KDdld*480?j&;RcSB$%qBEDW*4H+HSd*
zvRjlo8SLolCV}^3i+{qgrqtN$Hl?=t3c1b)k#G_<f&T!d+3-+m#JVmj;D%OukdSby
z#vOxW^-K<uCtB`r$7R>QxY(ZSD6|zIp*yhIM)C8{?w8Z0lKWrjyRbP3P))uP+zTG)
z(XZ%Psoxp*40a=eqI5v^Q!=5=z#x1c6wUNyu)fFt0AxA`HS7uAt6PkZl-S<(jGhs5
zLSy6u^h3F%p21`lRiVOr;o|=QMAx~F$SDJHj@}bC*kD;>G{krzxXNj82FDjp1h)VS
ze`LvQ=U6t!x@03~TK(=*90=rDb6i?fmj$^NS?Jx6vvD`%*-9PQ<ub*F_WP%T*AH;9
zJ=W}2gd@9cWY;ttaDGB@YnzbkgqyB1GxC%uX=!E;ehP4T;EVkCNIAj#Cp0wX`$}Pk
zJYA=0zsGbv%Uxm(ydqx{h{4B@nASLu9s&79BugcQ(Y(d(VI$#KvS?-jvNfUHfA&>$
zH)plYyL^Q)hjwE;X2`$jhx-bbPXum^gY;GP5tzviX>ZMua8yeN^H_gL?xd-xilu}(
zwspIq$@>~B=%~N#*>Em5u}*l}<ITQ_4aPz2g`F#CM!O>k;?5SelS`}($J``taxxY-
zM-~x~xIOJSHYwhz05!?hYw$T($^DKJvO%^+-2VVjNcb)<8QeT3J%zWzMm)EJWvtFW
zLI(CC$GT&Knx%WU8}fXnJ*L<w@?fGe0pulYk7h^tO*aSXy5of0g>g(O8N;o-Sr);&
zEFr;G4lr<(NLWD!g}D=!G-xR%d~LfNN03o1)L=M}ZFhHeS?Ft|VHY5elu())kJRn1
zvJMJFlX1~!EG(NbhP-oyTUA29NG-CGBI<G-8_D~r+g>C)WMKNFryh*<R7pYs_(RD|
z=D*koSMH7{o3-E{1vk=Vtma)6AslF;WU@s2I2(Dge1Vd-<y#s?OMLwh($MU_&_P+W
z6ulJ>gE&w>){J{{2bEzwGRER;NKlrS4B-71<iOPe#aPYOln{KPn*RW3Eg{3g5=e!}
zBH;I39B%{IZk@{ZGL;83hY@6;;?6-bX&61hOv-@ad+?g<Jc2e2w{6rW?YJV|RIQLW
z8yu#|W9Q(dXlTfYn_}ym@IqHM=L7DL41A&Js+Er(F_g!*`c$z1O^M2v(GCPG2}l6G
zR%awBSvwrxb;Z<@z(MeabVa?hb($0;HvAif6S2=7lnry)-s#SeJDe0Lg|WovCh2YN
zz4=VF-GtzIx*<$XNwyND7Cd1$Xz+h^tR}0ey8i%C)LvM}n3#W+xLGNxq?DI9x!29f
zLqu-w0RH72OQ+RVNE;MR4f-m>5?vm1oq;sS=W>gs)90yuqidW`dtqv{ewBZ;$r&f*
zZ1jBsC|V1e)&Q)cy@=Z}nkPnIY}Jk=5&A(}9WP3Pn$g1mVB-DN<W!6n1BExD#)|?k
z@U@G?Z6q+TVW6Jn9ZucO0g)5(g^jy2eiN7;_g-n-7(bD?1ucz1(;cnIA1W=^2JH<W
zRSdH5*ub}hkwGNaxfc00Td=(qn(bt;vh??P9fHq8sCAWW{)|+DDt|8JZC^;%d!1(x
zx;b1hz#H;V<Gqc`K$>+maf!d1mhbKYuw*T0$;W`9bdGVu&($ZY2lI@r{)H!=Mzy<J
zW{(I@%tsl!S-kcIB(H!S(!Sp+wyIZ3<LDCBUnbp>H$h2sSs5j$aV|e$gdIk|OQyeQ
zEi!lSWt`SEn#f~yH3Tye!=x>_D<=5$Nu?+9)ea=wkkXNJpISq{F+BpOuH_HGvwWUZ
zFYDT=8L@<h`QqyibgfK{#*$z@MUuy*>eG_g>7=tpd@Qk9oY|~@SyesQeZJ`#)wK*a
zG8Z{w<)@w}Y<oy|du2JW)ZWc$B>W@sAoFJ2^%Y%pm}MY+R%@!^cEa-T3C>PXu|ufC
z?$|;~nrhnO1DfO8;ZNdrGLmS^Nha4=lYfMEpG{L#;Mkb#@NBf&XGQLiNk1pD*=e0Q
z4LceD+ix7Mn4&VXAEorzh_<4v-q|5&Xu67?g3v`mTm~)}v~AO(V?b~Y{{ZS!!%s_n
zzMC)d7IJ=_1yNGox1@oar={C(ELGKiiIg`jf{DcT!qHc0R1-GOYY*847K5ZU!1^$Q
z^g;4#u-Z?cJs+qi)lTypnBNv!Ds~qQ);uQD(a_TYurPQ=$5%|&k%Cg+5uVu-K?cM3
zPjCUf$xSs>_x(cQHcF^=-ssr0D@kd&%1Jj!>j7Y(j;*hFYg$jum848>rVarsSSSs#
zZ5dr|*GGthjhfxcM(OMslEVHGvouoFGFw_Zl7}$X0e?*0Xw5KSy9-D8Tw-_^CkUD7
z#Oe&z=DR6r@o&`Pv(;TQu1fPHjTb!JuTXTQuG?$<kkym2HWMMRNyQ+h&oCV^soa7Z
zLJqq{s-qWqVEQdrP<1UV0rAtxc{sS?VD)WMs-{ivk=DN#LCHRb>#}CkRNruJKB$UF
z=MoExD(E#wMB6#vRcEJG3W)#!-{_t!4Vp$aoYI2wT<dXsDmv;JCw-!AntPR?pr8^k
zTpX(y^guyyxJuxz#Zogm7fY}_K4}|&3v;FEG|@&q>;Nix=<1<1frP0kY4s-$<2!49
zsku7PX?rvz)3EGg+m7l9W`;ZNdr&dZUzr>{sfL>uCglB4rfmdM)Kk0lI1iOPuB9W}
zD@v=Do|2t}mntn&Qihn4#}RH8vuwH5Yoex%km38R9=p_G&U8$1c{~81)az<>C;D59
zBPW$@)4el7K$=OK_wqqOE87ddMt4r2sjrwxICrK^?Ul9Dbb1y*+sB)I7KRAvA&5rG
zcDUQO3z-8$_YekEReC1S1vZ@%9d-k^!6?~kDQKeIApsEi7*C}T1e0Zbq;y3ca|K4F
zQ?<P9B^6yDf3qc~YfPzm+XIV!iPe>EmZiV+n;1EBm!k~}K&FGzqmD2@=IhRS!$*=j
z*1h#6I&g9~V5WJa6-j|&l%1B+bvBnnLL-Ww*O)hkw&v>{J!Y}1R~Jo5H7z~vF56*x
z2Szuh;iqocTRfw^uB7W~sUJl4QBpOy#w~PYuXkWq(TtdA(NpcIsD-D4xa6v{7fl=f
zTmtjmoT^F<Cbp+rKk95go1fo>=#A;!8jgfZ1T7ESdygqr_RX|q4^C6p4d0!X26K{!
zsHB5Mr*j~vj#ppx6Oyjzs$mr-8o1n84~#2X%1)E0r#_`F_mPy6pVoqvv&-S0qO(%5
zb@Oa3lp?G^)`CMVU;$M6tuBj0JEWw7So6;8D;}4osMaKFA*kBh;_0!;Ee23!g*m8>
zFdomTTP~WarK6`3$x$0|!6;+Vva*!ErmQ$yvz7~~sc7jd83c1mUR`20V5>@1(LN2E
z{bQ{3i1!D$&PQe}R<+f7m3z#3K9wQxTng3nyE=M?giTjY!(n@ztgl=3{*gr?W|s_M
z;Px0(oat?vFtZ=4)%A={^(rY$QIp6`{{UarjR}pdE^!>)RO=mOsp~R&P9!kk?OOhb
z(P%5_+G{6!9D6BRD5L2Z$Ys>US*n;4``iRgZ&d1LKSb^Wj4xkjL22^Gx|(LZ+q%zc
zT^`ChtG+m1z;XvDJd`@e_Id7!4P|{$bDHN8SEA8_rcmGV<PtfuHkzkE(x47~J7XYc
z3Y(~U@(Cd{^i<98973ce7Oe?1;>=%K>yy;fIiSA4;>bRfq}OX|oB2q|xy97+!!3Pg
z^BHk-hw`sg=^YMeDVX-e&_D+K6)DL@Y-mNvf@$3|)*qJK-K_*=+^JpCI?YQ*=Ib4Q
z0IO=<UsRxRYvq(iIRmmUK-8hHlzO!;YfmJbBvR+mM!3C#^!HCiKm%$gb4B~Q_g58q
zJq24#QN|=E7bwk64HwV_l@EM_!<K%lTbED2qzMCpx}z%7M>C3VKsB8S4GfO0Y;0(@
zR)15~bb5E1YKu9*<O9Nws=p95NuqTuF*uWpoY`gcE}yT|>djq!*wSxxw<r3bts0sx
zri)H)?K%kn?2m8aezxe$ZH@jifvJN}pn<Gxjd%k$8B0g6blgq!-AW{vjxUt6QeMZ4
zi|nq{^$lNHsSc<cKsQI}RB&CtnUT9sH&RqoHlor~(iqryDxX*M;)J==?Rf2UkyWtC
zn<*cl>C~>3wGpwvU)n;=x2fjTD!(mA=7{fY<zbmK^$Oobr`vmOy7Zoz(sX?~j7u})
zFSXoBRgJ%7xQ~BGvr>!IsMegv5&A`fhL@(G)5*Z7BZn&fqv{$M<@BflbH+WYzK37d
zhycRy4|~}SSlf=v&03;q3u)nah#W0X;f|Rek5T!$qa9A;d%XqG66lgh*>$L!D~Y+k
zWx3R9dQj4Bpk<$I29&aVc7{>s*?FseC}|p9F^p4P;8+HnER6cTv(|4vm6epRo-TVY
zJL;)qWbToao}_m`={okHz*$QF0Lu}Mcu9&*Z}&#Y4nM^7n%x>*4kI;W(MkqM1y&xc
z(js9QzlP;`_fcxvrDJ_My=ZMcu2zGfX|D({HX5V<0Cy{)%DN@LU_C|D(`pl#bogau
z&9`i}75@NC$yUlXzNT&OxAQAaTTHDn68bpluaH0rk_{_UmEnR{J(s}>X~{jI)ihem
z)DhA@_|Qi7e5ok9<|j@frw@bZ(`84h^i_1M^?gUR!#OHWp4DN{El*QL9PVxo;4+KI
z{ezFuuB_?`pUQ5It&%v74i;gW-EBodBsSN{IY;VsvTHCCNue=<*dSR@(9&uURG6yi
z%q{GErEV?VP|3=w%?%UHT%nWBVrlLICcjM6pl_)9^7is<Y*j5)J!BDyDduaBg<Dao
z&cH=;qTAdA+-+E?)1vODSLxascQ{T<hi43|twyIVw^U-I)63&LIGZ9McS=s})l&=i
z&J^=hX;jf}(b+Vlaj~~ilJ?m}FH{F7Ny#I3R88m(;^;{_OGb_Upqx)Hg*;WYwQ}CB
zmaVY^!Nt+>>fI?wc27l8*-r(zD=4<RqbVr%ib|-Zpp5!DL##NHZ~Uidwf#{wK#G-*
zE&iLFEd%w6Nn#^UZ9|)H(pz<%)HSNQI*(GH)TWcmnPeU)r*C7&GpaXQUY*sB0zpF?
z$>-E|6Sb-xX|(P&+Iu3$>SKWm0?))AtcoJm)G|hPAZ1in^{-Xxm!@R19oRNi;f;S4
zvQH%6eFST<dbLHZtBIC5Y2_WG*HO_k_|%Zj;4t78K=ij!x<gwvElb)>?hV(Y^e;`(
zYE(^SWdnU?;^oDq3X<$9NbNeZZBB6<4s9%MJos9wZkuI1AD9}`CpNijiVnM_qS45a
z(Y>*Dv#(`YSFP#v(KtrQWh1a@!f3-BmeqmfoL-9<I=tw5hQ>7R2QIb3)gG;Ow?pZe
zAaEm{xn3Ep^(!T;Yke27x5zEZ*z}gWLo{uQnhBdHdvK)SqQ6!$%G=qXc8yT!OQL&P
z(r>hm6z~~z_lC_@*xGy)CaQH=pm(D);l>S@nrqbh^+jll{Y1%kcEyx=O6ek>+3T9T
zG?lbqn$}+2wf0#Cbk%J|L%%1iG_-Knoywa`>1{>O56sufE<csY@X*1dPrLnAR}y`|
zyCFNr?VIGiBS#K{tU}$gR6`(C9ao|2QO0D6rr#M}gV9xb6;ylX)JY?=%A2nBT@r$T
zmc5djSXik`B7+_&$x-vGsrAOzmc$%ielN=1^oEzMNww85O%4A5n1t;LyGp39eMLlW
z{a0<m(%1Dp1q~tmvyJV6byqq`(6PsFu*o#({{Sw1db<EPa;#>lrRh#^mZ`bqa<IKg
z))kdu>=gxo_6Ey6rBlhN)a{;kSfAB<pr<)^pvo|Yqqcemy{<!E?@Lb-J>=tKk-8R$
zCa3jlpe94wM%{N#^gK`q>Z!FT_knv`3hJ_^zJdot_eC(bE#+GqjCvuHlkCcMT|SpV
z5dxYJ^V|zrROlTsQ`FOXT7Rg|p2~e;!me=X?CkJX_we&j)3lgld~XoE41>W|gkw2=
z#N^yojJ*E<gxdC+J!+UFnS(b1_)}6hLZxq^U#G-g+!9;0!FrCn_^8TCM?g$&1-7^s
zUUe-!CsWkEtV>O44cyRdQJi5P;>{U3X`nhb^y{@K+G{1Hg~yU^0{5T8=V-LljC4Ak
zER6tUI0fMvk56cHE%&|Q<I8~vNMtmRYiM5Wr}|xseHSdJ7WDRC<CR-Jm+Jng>G*WX
z1x&EWz%#YLua|nv)9aelv*?jMkdtk|WR<9;(^+2K(#d=Np~A9@N7Er?qIhJ3xoy9?
zi*ioN#VS1SO4Ie|WDvJftBtNd)NHmiT|KBs#{Oon^M4L<BBV{YHI9+RzA~kQSF3`|
zsHXK8JBC=TT)*lY<LoV(YbhfHwajoFZb4PmQxak=n7{tT6?U{FC(~==7X2>^I9pj$
zT3+cyM4xN8R*I#fGTYg5>Po7BTTMYzD0gz(D5L2vqkO^ilunN4m!l{uI=@SWuG6cc
zc;?brg>x6;KT=WC`g)ZNMZjh8j3ajTjn_m}+9yy$2#%t5G>*x#MJ+YkRK`d<oxrL-
zpzGSI=In`^UhlG^8l0|hl4^JFKhM7CMk~5Am7`6lepQSwr-|{u$R^5)eRoia#y!t1
z@&dl;>WL?3sVx|+gmO1zE2m4-QVp`fB{ZGb=HWY>qtTRMBh2I#I*n%Ns@(}VH#Z9I
z55t=6TAO<{T4%qoy_MFi?KUt?BypdRGP2dW_vM`76wZu~=_DZxm!}X)JJT$*{)DB|
zDjWW-S2ZN9;ot`}t<IgK(bH0HhPpZKFzwl1b)jpzO?la^)lV;i=Nkp0rJF*edtX7Q
z7m|Ik?kKfSy#YORL)LXw6tEUaFnbT_ZNKGbG)Z)}%f5JBbIr&r)ua^_+HUI21+|dc
z!OQ~d4PT<@znr|3)wBSg(&1o{xS{yAv|eetw@0!e9bGF&&edwybWL<_6mDb9xWQDk
zT0cg<5fxo)VlEa1?*9Ok4y)37W|}`YrD_g6!E3h!j&WTvp^8%USM_F#roi(xBrXE^
z0m>Z?z6hagGtmOk$#Bo^qpsEFf+E>p>Vf@1Ri3Y+U@WMF1MrqUNB$)x<GAidp00kM
zdv_XR3(q8rtgg2e3(0jXg9jNwGgkiqP^-N=2#lN%t=pqg$l*0m+}{m0S>>Fb^aYM7
zYhfK7rbVd8-(F%^IRl^FYBdgohEOG-)}n?+i~4m8!T$jCg2%-AN*NsLdZ$CTfpjH*
zR%#No#6O76#PU^l=#;D2eyc++mp$vKV3Yp<-_t(o<EDCpOlR<)NXZG~dwt)!##7Wy
zR4(|Zj{LY>kJ%xXYHEP!+SjyqI4QWxwjz@09>O)Mcxm^+6pgoTLa3|iH<xZ3<2UBY
zi$>L_d<`_R$1H?<p_E(pDK!mFtb-k1m*^AVTojI<W5qK=Pu7gyBh;A`@s92pvMREl
zqqX+$ibhks@(IP)nQGc>wJ{l>YlFGlep2+#olfU$uKd+JzHV%?j;qm|G&<IgN2N?1
z6pVXM4r{IzbM^5Yev4&k`R=q#&}k!s)O~1`w!n5(Mx~{6+lX_o1fE)OQpOGsQW?of
zZ40J0t5Cd=M9PMaSU?1*^=&^&E&l+irJjmG<YMV4TTe*w`6|gT+rmwAs5Mqom|qMs
zH;v90Dc>Pi8rmwU^?7v3{VGY!@ek#A<!N+%Y6_Ve>8V=@JlI)fG`jg+HRqzHpK;)~
zkGj`V)KfYDAErJb{Y}V0+E$U4-C21ou{J+eARXLZ#3D3_D0P79TDlr@b8YM!T(O#+
zYw6i|1A+KKXq{y?nOF?;Zk%5Z7(cp#%PBgd-x7kmHr+|kGt$Cp=qf7AKwL4$cv#un
z>F$nu0x)r9>U}x*snhi|o{eiJj^f3xYN_h#K9koN>Ww<K2<iy9VKyaNGxW*IDXkuE
zDcI+m`+@Ls5p?lE0K01dKhp4wk57Y6cJkQ;yODO4U981NRKi&MKepT|c22mLRQiPQ
zLS%$TC&Nn4>)P#H!NAixIS&TPni{I=N{y06{{Tk#a=toURedvOY*K9^;M)lvD9dc5
zGPtKkdV;f1YwueV_LKVUaIGn-3tk@ATf(!Tf8<^1)zi4P_9oW~Z9_$hwi8*VIhGv8
z2*2#Qv1H@=vKcY*{gCLV{PcGg5;SM!RnHq^m(;PbHgG{lB}F8b7i*h>6_q^j*2Lks
zHeUz2=uWnXHL7CL(#u&fr>7y)5M0Lp09CsqdN*7eZCsSKk&{mMdx05^-c>{u6VPfA
zPh!_Z@Zt6=d8}wOI>Zs{6ixKxmA9FV;m6O_UM}{CwOVG!M0Grn0|VOjIPPnQb!hln
z_{&@x_K}v6g_!9Ya~7QF$FzbijtIe4RTWh+G&A*hOxUSkMF&&qdLD?+^+&=Q;UEob
z9c+`?X=o#-5XDhXx6ze>_Xm(x6Ru0O2?ZP8cSJXQ2XYotO<P>kVf?gpvbGlSw}7Ok
z_hmTRJyWf9+8sARsw|PenE-lCzDX;?CyCR_>YrG)NBf+9Q5AKQ)jxFdzGr!JuVgEv
z09bbHr7gQ<B9c^ueMM_PY>pGN!?_=I5PUKl8^rGp82!}jb>rWAo7j&DF!7r$VWBB1
zYUtiyODmai{Jqq5nuTR${{S^pESK!#g&-EoO^RcfNXQ2Kp=O{7LG-|BApKKm>uMr4
z-;W0<xgr32hCUFIQ(fDdZT3OX!C#**7m@}zj^hewH8;cl+hl8hruPL_n4|}>OS#4S
zNLUnHw^gE>6Gmfq^#GC0f?JqnV~5pK7alf}q-8Px0CG|3jz#$^DH+5$(YdD|*(`E7
zxV6<=%}{;eo$$194sN(sS4V5MDO=py#HUgb#g}2xJX>)Gx_GC1vfB`;nW^LWw2%J)
z^h!F1R-kTPXJPOg!YWAA%UT^iX&si4b*j<y#>ZzrKMNxdQbifHIGo$Q+aqJ@neF;z
zKYJm}JXyb|U>I*72*W&3L%LGdx5-{=&ZMrB+Q~gD_XjE`*3`ZGrk(PC^%SkPGL0Hu
zpw;H1ib}dlH`Uu9Ucq@LvDezARb+x{7@{pU3?qf<I)1EUXQ2BS+%gKzbvH{;>T{Zk
zKpQFKpDA2#*lnI=RXs+dRA!f#9tQzmXw;@Q2U%GE0O_eT_g;2x`2z(`)-i)<umi%Z
zAePBWOi$JAxgJrJG~l>ggd5#sWOXIOM&p%O_9NM1;Knxxgezk*NIB(52zD|`cyNdZ
zaEoS0mGra5z-?euWVyI^DOp(gWdY74c2i9F$o)A&G7CsZWX*ueDk_4(@~fIX_Xf&;
zP}<wR%87{L6Y5JNi6+hYP9`|UP0AcS`$JpLWF)?^Ht@3r3tHw(`vwbqD*Zx*&4kGo
zd)ZjS5x>0K<xf^)6y<>2+mx<48)%@>D{UvF^Jg^SdJc(Q4Sg}AsIhP!(oZ3I#bgc#
z*NwjRo=0_MqgMd-KK5|=;d8xqRX$5b-&E7&o;Je9kodn%$8QRfM#&S1a3GH>PoZkC
z*G3_!a1#tROXu#YwW>$OSoe}#*M7^NENS1O@Sh}C$5!Tm9mj<$YlA(_CjJ74(vDML
z@EzcxB=u<}_ppKV!CX_6QQ3|Strs!YLsY;VEc5%OO-lD=mOn%#JdjQ9VcPU-DqT$5
zJ=gJdFP@6OACX^DO+F-Rhtwdau8e+{3w$H>Ek%;FhntSztd6lgI3&R?*LP`89Gr=~
zTm$O0Mu2WYr>WL9ypZ)*G{xr5c2IJ{=?&X*nL)5Qsx6MK>R`D+G{!;gaX%`oQd9?i
zhknY-N^7E&85kTq6;1^HSJ2pL-y`lt!n)IFO~u8B(P=t={W4I|B{&AlQr!nns*F0F
z?P<0$m*!E^K=_=uW@3VyYeQ}Oqm3hW?rqrbAsIfIH5tpA=J^E<UhSj|gvv@?3gXkI
z4;Ugs*SLHXLqmZCTEn<dNX(bHq~F2eM;qSH_M`-VNlpf+HL?~y?KUU6os-0FW#`C1
zHg~<&bT&T<NvWiCWy}ZUByvb94VG~-2jz|j=#of4IT!g<@QI^vBKYi&0Kq^$zimt8
z0j>u9f^NXoJ&Pk+abf=eC~2WLy9sIVRId`>x%g5<PRmN$k3JTl0KLrsHfX><)DxQ&
zjc2I~gPJ~3-<I4%Mp%2IY5ID3qu)s&`UFkcSrnHRmNE~N=f!XwEbpgeRQhhAN`H?5
zb4PFxppF3}>V|=`H#2GOkVZ~h%6yM?^J1JF1~@BF$Q%a;WLVu3PT|29OK|4d!v#b~
zr2Wk}O2$;fC5hpo;iL<4pkdi4aCXTD^9&SSHlpG-NYLTfrKyIVp`@}+uH{Q_vYc0C
zmY=IkBN5J7GY|Cy4z)=H<JOIhZTu>hNhB}Y4<1#OG}AgemKP7D(o>H^RAh>bLnc~r
z+$(xXUiN~=+<4_fRTOgqLo9pQRhcEEoA^S(S`y?%!Nk&wxxV3JbsO0u4avG2P1IR4
zZ6V3*tQzcpQ29j3kTOww8~s$b1nvYV<c+(o(_`T9lJ+(t-z!n9owEkv%bwWexd;29
zo(RqND8z&wQ9&m$ZEfyUat3hW?(&|=&8$f&k`}meVzn5E;~a(AwZpEOLyj6Q60{qg
zw+M>F2JXKJ`)|lefJWxnr-BKv;Ra+gYe*v2Q9dUFaglUItO{=;;M+VPg2>nj85dJA
zr2CpmWr)h2C$zUe*%lGZkXSYMu;DA%!Z3ej8_REwJ1E4Kc29Mv#E&j#ZNkYz+Tb&k
zo}f0(zE==9{^0`?$0LRh3RoNgyl$}_knxenbJ(dGEbD<}dnOjyHw#MJA3c&x#*ucB
z_D~D$weXx8_Oz5ZjHC@cAFM3lZ<Ga9HB}+IUA{YH1#J~aq;|QxuAL)UG2F)wq8t+&
zn?`U<$DZvy*KC>I>)d%(wR&_CoS#kJM|E82swpH5ce%ZfWhrBE+AAEE3nN^|S;La2
zhh&W{Ha<d}OAEkkt=fEmqHQdUm({0mdrx7Mk7ZS$I;vN+-VFZ$+EAsS*{^QLcLix-
zht^=dn&H_2sM4M$kN*JDSxeA%QppJyJSN7+6JUvw8CcR-;Ujz=$~b+eCu#Xq^fHh{
zHryKV?ee9Xj_odm*B=S2%YE&?$VS4~Ha*d}ICx87m-JNK@jA}9`A-jRu5b2M6&{qh
zm7%WsAstN!xG!+Oj>wG%K)<Qi0U&W{1x)%`SkF<v#Ao$2b7FC6C8zAQm(b>Va<|%S
zdxDtemYj}L9~l{K?v^>8+&!hhc37Kj36;a1eu?syIBsbQFbj?_u-&3ZJm5Rr5^Mw)
zL~MK&8Qq+ejF17`1j0K)?;wEe5TCe^k;RV|Hu|J2a{zG2_)0WnM<uUgh0T@hcOk>)
zl<r0OOf9&z^YXAIA7M?Z_S>>>dn9NUu|O8MJ0{^fb%%n3jT#{qbZ^`MARZO&n@OeW
z(d-X2^&ozm;FX;cyS=QI2@51_jB#t4Z*(YYWv;2AS5Y{ZN4`JnYN(Nf5)M8V$4S@N
z=-VA(-HT+RYxJEnQjE(^;S`p>G7224u^jcY0$byc1$NRn{gsBJK_x83j<K;qUdGl>
zX@(<O-NM`-38p(^g)nG5VE0^b2ynvII#v$XIh^pN8zg1%xhtb-9@BB)q2C*r;zkdJ
zy9H4383!WC!N1)yo?&}RG4hTS?2(|r;7|0DvAF`c5G>PV_~QhN+vu4yT*I`2J_=X~
zFaH37wK8&HjD_tu2k4ZsrNZ9VC&eqrCg2<c%9nIg3l4s8Q90bUL>%UeOAvccbq!o`
zJ)gpLvHD6RvQ~>;?eI{O?cIyC_(7F`3wHyw=E*_Fgy{{Ad#0NJ2Wu=@Gmkmr%9J&a
z88)|Yqhp#qrwQ9TgKv<qM>;z<79-_HV$+KPm9jmT2m2{-@CgIzvl7OBVAwWRhYvl{
zxv|IzVgA-3bD8%FEu<TaB^$nuKGJWMz_s1;@|Su3cHcavNFzKPkKHo|DmeUrm|71X
zx=rM9l(%X6qfFLDZUyaxL@@fX`%Z1b;LD7FQyj;}?aU>mG7<j(LP-<aY+8P*J;kT!
zjEbZmY^~3g(m=^uxrg>eB5(U6hOz9u&D62gMC+FgpWz844q-S^f#WEdQ!Lv%Tt?Se
z__{uxtht_?gC11?$hFk4&m>N<CE+C|XBN6NHfS4~>vu{V$DOi!epO3r32nDoOxc`H
zc<z<sVq0B=%}o0f7!Mv06GO;zK>I5yX*;#n@AXZnd3Gg=<FkNEOlwTf%LpzYVF@E&
z7Xe?oiH{qiARh|0vYJ?l1&5SZVl)H3=ib{cYg$d(c~Wfz*ozd`)3_V8Qi<qqyaTrB
zKQSX58sTue)s`Ydn{YfNGes+W6jhqZTRTmyg)?MnZMz_y5Ow?g6lA_PVBCEc>~$*a
zvIGNu{gDw%VRCL&NS_%b6*Mydw-EC!M1cOFnE2S?kFpiB-vLU=d@Rs;qB-eYE<r-R
zA`VrfC21BaId(W)46W9Nuom2Qx^T%R%11?O_)M`J{^&8#(ld@bF1SuTxVLncZ;*u=
z&9;ltkV4?;nYj2{8XXm}un3`R8|KPb%*;4|-@sC}`lFrgfG~Es%IW6cN1eqW$Y~*g
zzT<zg=Qn$UTEk@ki%||9t%djs&XS5^-SWyB-vJ9|q=Ee@18r@kGiYWxD$II77RJ{~
zemFr^(@$dH=;8;nMamY;njtQ6HW(j7pfF&Ylq+c`bL{E);>d>S<}tcj&U-hMb{!8R
zZR}d#sZI4_2Jf67i{U5aqL5whkhkS5dR05z8qj&<<!fNk&ZuLC);JOMNg0Xm4KBaH
z%D<xN%`K67l@gnu<>5>J0OG0_ZKa93#y1TA0Cj=^OQ$kHc|nbz-5A;m2N1}q%e<Ex
zshu=$86csi%XYBb9~fC!G!!Uw$lLFMk9W%E)6mLnDVXnoFquI^>NpvnW_Sp#V_MMk
zDmOXuG0zRf&8$&vM{Ef<(FEFE3}e)mDBEt<R2t^LqUmidEr)R7qQtL0>o3Ggy6K+{
z41tlHU8@B(O-#=(mPfhH@@}Ik&R@qxR3f`J-AUIK6>=EqqYy?9Yh0?6)fKLX(lUlK
zy}3VClb!Cpi}UbP;DUOG20{o0Wd}x+Myi)lif37Yt-mCdai_t%-ot-|O`vq-muscm
zJlw7BkEX{AV{sr4IaEr8yDJ%{)=OtdKpmPps~tZ?s%y7<S{39@f;%;g-sLcwN0GP|
zg_=O*`URrXi)0?7fzDO5pa`~8MAqXjJfWRb#y4v+R8E=Fou%g8!X_eh8=T|5a(;<L
z4S=)UZ}N<$Z97HWNj<El^`p7==diLIP;3f4HKcpq;rCLrNu~nf&vEcn&z0}}4azEw
zm1iubd;b9a6jdQyfLWwCn~2;;fSENE5W8#I1H3ILs;_J&Hq%KR#l5Y{qpylqmq_|~
z1G~A!2SX-Tm?Pz_9|;5uzq|{0N@u&awZNjO;dFx_+sZzTyBSUya2pu?m5eZg0g!+@
zD58n6JKL9hq^@(rJ<@=DH48Ndwa~;pgdwV`*wcVqd|6gQJKEw6$Wu#D*SBua5jBhX
zsh<1W{{V$IuHtt{?07<%84Gv3fCp==uTyocB{Lrc0j_w*DJ41ziL|TgO(#yJCU!CM
zTe)6U)?H@$>7L3)h}p(CSv_N1s?;VfmG&3F2ePen%sjg1vK(bD!s&EM>X}T1?>V}a
zlQF`^<ftj>-B9q>0!b@h)4eq7wn>^T;HQj5vX@HIDl4W1u{&>KLf-WM08R))T=>Cv
z%Dd4h;DMWc7XHfi0TsXv0Y6JZ)Am==P?jHaZDd(5VX$Saj+ybt7&Zz9JJmJ~$xCA(
zS2&USE}9~9vPG_od=j$6Hwp@x*x`)tARh=_8n!w%Fbg<==IBc5h+%0BkX=*iTGJRD
zcLtBD#%mhwMO2Q4j1o>a5|PUK9;mnKEoqeGv`M}EZ3{Nm)@l<6$j3G_<y&;dl^g2)
zTGp4i<d<b?YAGOi4TJ`P&J)E~WZSbjL#D*WfwL;+hMlq6$ml5AEC>nJlhaYfx#J^&
z<x;-I<y{VjrLi{dHn(zvo~ENxs1#a!jS@K8{uX|&eOFhM$3ssnabGVjuuDt%odQ8G
zsd<kiq-<!$+3B4x_<O2BALeSS!^zFBl{Zs4x@06&*AN@nIa27l?zdG;9W8&Q4ZN)P
zSL=F7WRXoIl`?SS$hwwDYg#E8#c7YD>qthS`Fdx)_jR{+R=q_*ORQ0c&sg@Ixc6Gi
zH`4W5EOD8?EXLS!Mp4mL(rVShnw;7z`?J|JG1^J(i#(gPqJEOq==2THOL?}N2X`S~
z)%7zqR+du01~YJjuWwE1G&|%mx?6BSD-%AwSuE~4Tn%e4iv`msD5_f}7M{&Zw1>}7
zC7QfJe!|Gv>1$~r20G7PA@R!dhSPOUuc$SRl(pBtCkta1jn%YtL9$5{jkon>MlhFb
zGL&1SL8<j+4KqzV)W5|Cn=0tFX=@2}G%j#F02CjSgx6nHhd0mFZ}evL=AEbdyP#>c
z?YLber(0}gjXsPdv^CR>^TK0qk`>QMNktt)X~f}=2F@cEQtLXT`pmAT)7Zwua9zTt
zmX@1Eywy`QyyneM7TUTCNjg1(nvRjwfd2rh7h{6u=Y4%HpFt^i@MM&5dzD+I&s(c7
z{!T~1745j3pmkjeDtY}{nP#k%XC*s~(z150is)*!9bLkkbE1Ho3oTxg_;H~ce_pO;
z%>GW}b(5C5yVVd;(8}9jIJH>ErgddR7ZqNMUF6v`GDR(`1fbvX4cBy@kkNsVGA+&F
zqq?7^`irMGHaEo9kD|`h{vT>Jr`4*}OT3O!P16u*@a%PQF9QH_S2k>slP!lFm!r`&
zuBOwe=nLp4YcY#CV>C#$POGVr?bQuCL#(o=Mbzq~^xF5BugT$QdUryWhi$7|!tTxN
zhCD9q>@&&fXt=HD@5w!`t<=R#cgQP8ru64V3O2m@ZkM>ir>}~NDnjbbMbEI{n_Xlf
ztCjVC{wsy@fNfw^xHY6tm8)m2=-O{jQ@Fl5HV_Uysy%m8mA8(9k<rFKn`+KzTK!!C
zW2>lK)`6YNTsqgMYN<UZ#kN8%Y;ufoDKFWX<!hp{Du`-nh?i-37B^Yy*6H*Ux%1Su
zo3a`T6RTv@++8k@Lo?cQaoKtNl$zyspwm+vjc_?@mPsv8IXNDOCbtu#*{0LJXO83>
zEVoik)z4{>vBb#x0CKdHJwpbKrM4=H7MHQMzAjcHUg`?XTTv{fX=7gOHvB1M%aJ;Y
z8Doo9*<GT+uhi;5OAX6idvdqcRaMlKJ8B?nY};HZI!j2@XkZf7xDZ9v-ByXE>v395
zPtqg#Zn_~URVF0k6nSk<qWZdzLi<aK&}rQj>cA?Ec;0dau&3&6Cr;3rxuz*V;lWVp
zy+K(tzJ)2=3AL`WYyQAr(WBFgDXN=ERUk3(xGU-UbEWH`-%#-4dH2~=={-ALsX4OM
zKhkMeI-ZN9X_R}Xm^id^yCnvnXgz{abO%q$@-*2V*B}1?d383W_-|6$a_3dMU>F7K
zBTueR9bs;g_pzbem33LGYO_%jQ>%Jr*#Rdc*IOAzikUi6Dmk~bJ?|b3@~X8trGigI
z&oTc1VvCPobrYnBRv8K8xbm{v?x!}PT*uj@@GPjJlI%&#bdj*>`Dsmrk~!DsD&DVA
zqNR+AX^4Mp@`UJai>=hDSylOl#?mjhxmxGw9Vw;9w^xtUco`+hXRh=#FVW}vth$v{
zKBILev7gXYO${ESSt*Vewdae1v|Uv%M?Uds;#ke`wZ_TaEXo>2?~KUed)n$t`YYdO
zXu3TPnJ2HWQTpTLD@x9+=-N1hdTlh2%jK5>=(>$|k<plBiOv?cxvL>prbDUfTjGhW
zX+O#>WG+q6++vlRPM43UdY)kT-!P;+Uik~uw0@Lz1u%E4L+zXAD=qkcuYc*CIj}x9
z$rDEhkfiF5#d>+z=qM@6W#Zx8)5+w<v_U9I>~~nv>!);7GDRUjq!VR{rRZLzeOKq}
zrHz|%TiG_JU)N1n=1i^f8+C6UwbeSk2c-*G#u56B)`hilTMJ8;fvftSvq6jUtf!7i
z0I=Ayb$w6N6_tLgsHE5p?PO(K^XQWo>hLn9_qcOTRR>XZ#Y>y%&``OIJe{c&cgo80
zNmJ3FZn>$}FjI;zLFX4KS<;eK6F#F^j&_5EmFd=2>azN>*2>2daL}|GolQoaPqI(U
z$^hoXu9Y^H(ahqnKw8utH$X%!kJguku;`}N!$i|Zr^O>k_JVsX&q?XB^#xw)Z8@(E
zIW9T6^jWC29TJm!*w~r}99bimv7(WZ>kUs<xn!Dgrfuw9*;MrHB_z`sYMf+!{{Tr=
z&ek;jV!YDTR65(UVzpX-PU#J&^{Az5h#WhVu}icxp6QfT)wGlm0R=wCTaYk<h8mr9
zz&Vjh%kV}}U3X7d&{)}<6G2Ys9-(fE#{Pbd)5m-7Zft}V%l0#sM@YOq2}v9U{{ZPy
zvDW4{AMmIqrHe?ZyJ?>rul(%)0F~+Vzl$9fA`N_wiQs;j0?T!8R_R*AQaet8uLr%b
zpCn-&rYt2XX`;TGrmnUNHleI-zUmF*PL#d1vbE#0LeB~7TI(@`Cjq9&`YO7r8HAHk
zOCUeW=3ePk<1Gc_lvwRws4MC%5viH%?d?W%{Z6e;$4uG=RSt3hD$whiY}B@@(q)L-
zpG>MZ>v6|ZzKedwpVNCF;^OWsYfWtsbylk_M0;n@L~cFy3@d-by&<(RwrJ~MrIp9@
zNZVN#OR8uUkpBSJN@AMd&%(;}4P;PM6Q@jFoH>P4<JH}X@_$FBbsY|+OGe=>RWq4y
z)e#5#FEgf=nvYfzRMiLB#`g$KK7CH9_N%Iy?C@Mww2*Y<a06Kz+W!FR2I?vjQnpu=
zTy$Sn>e^@IuTN0I>v4YSw?@=-N}=g$8hlc`AJ$fGrmsr%c0o4i`&=UQ+BVh_>Nv!{
zcAWmojWKjxYL%K*9%v}z4IF}aKxw+xku_Dd3I;is##CB{n_R|iI%QaQ%x2%Zrjth3
z!~IY6dA%O)8OPB|IKOUGH_1wqH?{TsBFZiB)3vU*=@u)`-PIjE9<1oAs07fLTW@t2
zqej{7T+<sz>S;S%6z%E$m()QpM>FT_0l8I|>?B<?b)rf5S6xmdmq_<pA<ZgEh<^*<
zB+^h#PX5KMBrI-^NB)se8zd64JN}tiZDnhz>bg{LnWKaUfqSze{{ThE<C(gB9T9lw
zK7OT!iTfyN-#tHV(b+lGvTD%ohLj8c04Ny?Go^K4s+-X<h6~ua(crCanW(`_YKA$u
z&DuFeIQW_5QUj;bX_)KQX;ZlOxVTceniNObMO6_WQWg7u5Om2SH1oO;=8JpVWs&MG
zprxK-DP&<T{*s^eTTGj2>7enY>2>UL;+{C(1{)!@)^AnP<foF({{W^puzY6+_CRV7
z)JWe@RBk-mg=NundLFA(X|)=upqYpHWx@L=lXd$cVv>4b@bu=Vs5fcWVS7($FLkZy
zUWBNoXfsIJfbP<?)SWR&M;M+NMMNVbe=BLy@@TR`Jy?tn1I`LW;Jp-S{h0Rj!EKE-
zb7FsX$}B&1TdZjHRLnl3!-)Q9&BFApavdT_$Yb`Ka>r$2t7_(=d21RfV*dcVWfdtt
zkh=RZ)Iz3Ow=$Zi^mA~pTP;j+Y^Z^f{Dmb?P*KDSoufm0ex{ohov+qouaj&}l8-ny
z@BaWREk3pvwb;E!QvU!;YjmoE;mwSn@Tn<VQ!nvA05txG3oXutt5?xMzFL}UhJRB?
z2kr_=-ni3U8=G07)7Lik-4tQ33ctr~6N*yOW+PDQV?sSC;Vl-hEjJ4@{{X3VDJ$CO
zBY9wV4i^?%i0e8-QPi6wsHTV$nC2K;5A-gbG@_z`u(nHFGQn<Xu1L-l>6l2SZEY{D
zS)(1+{ZV0N<7uqa9RuGb9Cx!zn|0|_nyoZd52vW1V*tP{z$!gbk3*?%ttBCi-JZu;
z8*|+O#xT{DT4zgYbnR_MpRH5K!aE(O_EYMbPPaS`ZA{R}0Ks9pB9gbJX<6vkwqoDq
zng@{K_E!{DeK7cg=(WKp{{ZuIVZ;9bDsD>YhA~ZAJnM5b$+lO@LvL%{Y`S)vrfZ`Q
zkI<-j&CQZ^3>`C8!s?izlpgoW%W19YeLlPRexz~VBtM0oNUnxZY})GjR*1&#Zl6g1
z0RI3%WNYKnSyBTunJL`UeefHD_E+LvCDg8cKA>b_9puPajb3dP(HSXqd1II#(n=7D
zp3@AZ<ED*ffz-27MkA!DnS^$crplYCdbX|Afx3eOqAttWFOQJ36uoBJDGW6%ilAEC
z`>Ne{T>SQF*evhm0d6r)>Y2H=k3fe=(RzlJuB6o<4nNDgX&+*%tGW|k)0%2D?Nmt{
zP5mP7RJ{wN>2>rhbxa!`fA=GOkK8N$YeKBksr_9qQkrJl^hoO{%5qOdVHDBkn#EMH
z-aSg6(s03WIJzIEbZRYfrOXjBrMLY%?BJ8DrK+!aimEvn``Y0@MCdJgDA`}5)^5MJ
zhP!KmXs>-5QfbmX6Q??BN7D!{WY7W2Wp3a;;b|*$j-J%1wo{#w+SiTNUUw$7)iiJl
zJxQDUZj@*DN9kUrO9Q2-o(CW1W<XP%WVSpco{GJ5q-3MiT<=)T8@!Gbl=@vfQH{}W
zBd`}+JvJKX*kYEh3W%M<?T|h~ywQ4UCcE=RtdJa%(~sFaGTwxo8tBL9`qqxiP|rab
zBNhV1F1@E{l@W;{Yv5@a8$nxLXGrPqNz&BO#v}vvw*`6jp|0o}eD9}xvH%T*+i<G<
zs#R7;;J0N%v^W_kn@rUUByMa?zp~M2{YmMxQR^_$R4@xRQZ80<O-n$io7DA<yf+Hx
zN~-CJ8T>gKU)(rlLRp`5QDdz(KdEY|8wr<AV@M;0n}w9p^=6uaD%$Yd^3{E-(&;i1
zV)Y>hg2T$AW}8mqdTAWzcqy^9Eu%QIUln9=(3gVQVcUB-wks#9&86xRmcZ?jgZfLb
ziDgc)rhvy$nIicY1SgG0LauO%zeL+1;z)&$?h)YIyEUY$hxE>l((+{n*Yd6PPM9;Z
zbsVAQ-=)Yn;+Ide=$kX4Kg#|<`m5b1T81Wn6{g&f;JPC<RU#5kxRCV6NYF^(9divl
z<N1NXS_;h?Ej}Fk;~Wvfqtx}iFar8|r$aYplW<jKF2Abk0K*kmq8sfc%)3hG$!Y17
z#_vrI*Qw#EiN=wot{4Yu#xj>timbM1eOSTGn!OKCilUyMZA_6&-z+vlYK)R*xs=a_
zDLWUNB*xQ!uFA^lng-G6bgHO!M;wsNZtcB_BxqHT%e=CZRt`U@1ESaJx+eJR>02XS
z>zPJJ?zHi1nq%mnEb$x<<y~@rYK~;Rt%65PCugNGA-)b(e7z{|QPNU3)W0LTuGhMa
z(Z=IRDT$|nw&(X$S|?Z6QrB*L^AO{Z;G@QEl~Y|BX}WdeGTDysLN`a$E3}Bj64OUL
zJ9`d5PKR29Q>HEs_gjmsy<GZ)bxz*H>E8nVl@m=<6L<QWt!G-$YalFR1QL;u;bC>1
zhM3d8)rIEd{;1vm0E8^;ZCgFh495g0^x9|APCqMDL;MqPQpvj0DHyA^X<tmr%0ueI
z9KzXl!MJ>^wxOXICG{xkTexR!&DN(()+#8RO?4>Rd2<EP6}4SIUf)z*kGCTQXk?U7
zCkVD<TIV=^Ur~&;$B8X)eyefNvl@7fG?MO!`=bQs!3u(J$h_=@;r;>Sr#_x~a~(xI
z-i*x4E-nwkzCSLVGFg09){jDTf|{q)iw$wRz~LU#8>2GFK#Y6A`Y%7C>bieT(CUBm
z^$q<(*nh}geX8pE`yEwJO{-KsjLzrA*B)BB<(KH?SogB-ePW`0TC!<L_s(42-rnEY
zI$FqOzUJQQmrvDcs@dsP##<|RK2Z*)cEco3yLrk9=x<}@rHT8U`hG&Kl9oog`>>4?
zxwdIJDY8p&E=AS}Ue>-h6L5TwDcNZ*Zyr1;-D2Z_ZliEu1PmXlR$;gC+mxZr?R680
zzaMa#`}QepWJu=%ab%8gu^74#vQTaw55jKwZ?VlkWE&cZURpkWi=&P5=GGocmXZ;J
zVo67OA~^S(Io-Yxd(pHF4Lexf`$L`D>PCj%(l8Qxl&vn`lAb_6RYeLBy9KC(5=gN_
z7=`SNd9$peb6V~&RuzMKP2Ir1g~B!m8#F0RnsU1V8Zg$ho<|Abk_Ir85JE>e0FuLC
z;BCQ2y5)ga!U)Pf8#%Tm33M_V_YeuXT6(9F8s{622_zS|3Kqsg?mH=_QKHf+``Rj&
z?r&mpqO8-YCy2=b7x8OZA%oY17K=Cq1WtS}u{;$;CW*>6fSsp3mnEcu!B2`X2)egz
zOI+I#f0YE##V@&z+Et@8$hb5^7SYB^hOc|wU^z~7Ph+f~XMy@vTC^uXzy=Ms%9V$5
zhE|YHGNO)0HTF13bTeU%1UlfU8*qM9aXqIuPY$`tqSy(V<H#9OhXY{jc~G#6+@2Jm
zw43fsD;3dq7(&&!v8NcaD{uoR3OR&MY4;zxR%8JTVZfG<Z^%@$yYf1QE+cv4!nh9f
zCOZf!yIY0TciUk9017jWtrUae%c@6I#~W&4Yl}un8M4&Ds#EGZcx-~xF}A&zm(Xf8
zbkepLNLc3JgWX$0s!0V%lE5_cZWli<`m(g{(X8Ih#gaxGFUpX@$H(lDY(L2+LJ74Z
zqMfoww{nm3C8p28TpmO?v(WM7YR;&qiYFH_+a2I=f~~B0j?Q-AF?H4TQP}(Kg`CuC
zBp}$Ec3iQGXH2KX1WjDqpLXJ^>MbkFxVhn1Oz8v5w-r4T%dqR8mD3og?B$f)iA62X
z)e%n<V>|*;lyt0{0p-6{YfaPBNW%Jm;sA@96+oLqrG`?{_O?&^NLTLZ>PmrO6I=FK
z>TNc<2?L>VYsd1rUuoL?MJ1xIr#Sv=DN0hk6^vrlGI7&X(Xg23*zh<&R6$=t;zs8;
z%SzCSiY-PlvCTgR1y*XYRZ~J+PU3zYlp~ehFiRbDSI4VJeUdrfH%77T8)R#Dv%1FA
z&s7~+{KRFT_X7&&Osf`XCBS_bO)4Pd{g>@Dv)o~>Le)_g4a@^P5SVs67YsVsa8c7$
zygSmITy}6pSgodof}n?nJlqAX(AgD4ZQZnmjMORKS?g1s!<#8OcUYR5O|lZ(b}2Gl
z6voxjwAAz%Bw>;VY=3(!-BdEuJhD-7{XuA;)tNjO-<xLYhgZ}ZB(sIb%8W8J=@*_g
zC19SZ{-rx6A-3drLPYrLO@)K6<x2SFgDzu$@>f!JamhHngbIc>#5-Z|Q50I8MJ$3?
zBp`#rtddCNX#&?!dX9<r86DB$jb`ebs;Met5$X_G_O{>^cCy_%U*g0V2bQeKni)>g
zNIkw3jx#np2XAM>Pl<Mh=K5z$@W&mF+}_twih+EN*##pW=DUlI_X<t%NZ`juZ<Jf3
zDA^=$YlpD?ihBTZi}J)=#QnqIu4`N!Vh#L+Z7@9(>=^QzNIlbxQikqro<2DW7f3H+
zGj+6P*vW8jYpV@ARrE_+ENyT=8~s;BPWfcn8*)-gDq1vU#hSf6+FfI}Zw-0p;YF)x
zkW4qmLAQ35pL9}FyKM13H+CR@%9WE>LIjY`;@<?Qyi$wPIu=;9v<X$CRzeJs*~8<M
zH8!bJPVpShHXW7owMiwXEqEKax(0fBdY1nH5DngJtrq>FEid|qQECv>FbDF8c>ZP(
zTW-rMJa3_w*y84^oi9;im>T>P)C&x3t=nsic2T^y7`6MUCXP8h(U8;RcR{#H*I48Z
z5TjW=!4@{ULCuO|9@h&T9|?UT<L!0+3ML*}ZMc7A_PCMm7xJTNl0Vea0+FuV+~r}8
ze0!UF+WnMX<{McM!Ofj??Sr_mN(4t2@ddC7W1@3&l`)JD(~S92ZE*(T;b4L_#0{h;
z>;<=J%8;-g57?xUyG{j>vn62V#9`c|uy=9_lH-CtiYKrEaBNUDeU1%qKHQ&_<~iIH
z#yRaaCqF80VHvg40f^TUbCoo5=Ev%yXdAMhv~ms7n^q9g4q8;Kk=?R}j>iGS5Enmt
zb9IeGvu%{zfDdw^^xVeXu1IFJiQ~dgUNUfR@QsSaGM6^a2L4nJjn3>yM6?GLEOFz6
zOq~?9F_0~^k18rrJ7hkFehIR?o)AT>tLiCVebBnZcvF;99yuizPfu3UX4J-5@xy{9
zMv0q(*&D^erxh*(Wb7dJa79tcX9vXmeQ;D<8rjgYsUTfOhI&)$#y7C!fP&uzOKf(v
z*6tR8(|W$gv;*Ha1q(KV6-Wjx%yI4tc&9|%wo);ZLhHo)d^;eb;;D(^&;A6Rh~TDH
zY4x;Dv%!3RRdn-g<YVZARyt*b?s+zlHN*OX9p~CeH$y{F*^c_Oo>Ivs;BD<FQD{ge
zmPs1j%y9>WV@FXDJ7-~IkMjYAM+A>+zUuE!A=WMd2WYF>C!UH4iS*t9^4<!qsHKt<
za@=`WMxG}&@w;P_WNfA)9^K9CLJ8Qdv}at_+uMWSrrFImvLe10GF!7DK^uq`7y1<I
zVdzldwJyfITZG3rUd1{wy88$vY8#Shibx*Zw)RUC+}i@X)RB(O&%%3sIgj+XtlJW-
zdsx@-c9iGCW?k2@;mCOd;*f7?E&id|6$Gvf_P9N_@|0dw4*2{0@)Tv9TqBsqNaM8F
z{HWxMYsfys@{N>Db_wa*J&JR1+>2pK@Yb7LeUj4#xx`+_<q**mIJ-_!bb5tNB!GuF
z0DR#=G$cCU79Z@Q-sa)s9}8WRXuYVbgH(t%Qr1ca3Z!riE&$yl861xGIJMtY@kt|(
zxRQk=WSS#sDM`0%Cprf(V?R{Ok;t;ove9-W@N8^;tBbGtu#kqHS6agBSZnNSq7H8W
zq+yl^0~sUWsTv&Cl0W!Kyl~-U3Ctu_$1?*bV?pwjw6b4xBudW~$Uw-}o0goS^x59R
z8Xa${bcjkyf+7ImxLkiLxlzc{AMLpu*&iz-sRPvxYx_C8pk!@CPO(0t2XV@w2iW0L
zC>vdO0p&qaD_(AGbMS~`<B_At{m}EW<nWQAxY#R+Ccuj(y8Ijj;~CD}{3ep&f-Dl9
zDB=sQ6XG3#Em2<>TwZOIXwO8hHV4#b0Cx$k4sYlo!1hSVdti>>t}JEl%f?S}-3nrk
z5(i)%r?^d);AB}am&QSJcMl;ydmomY4+Su`#x=xpFY=V^b4`aUp40TdAut>*LA64b
zi(utOdC1Qx<l_5snr~&5irFL*77@jYEs{1-!mhS&{gdK*n~}oJSQ`qKoE)_ewn#|Z
zbW}ABIB>aB4UZmHwt=8l)Z7M4+x+)UpJw1%LHY#g;BHGVe+Xa;FmOB~or8@r;8<~V
zp`h>+ZE=K+aRa(qEf$4yNH|Z9cgOM*3HKGjpmU4)MLGkDVQ^J@t}YdwJ#$<(xZeDN
zs13ouO4%*m$l7Gy6ls{qB+D$ve0NQf2`pPAVc_sp6+KJX{(hNPlv;~!1cLrb4kX%W
zuC3FU@pfSRs?!va`$!~S%V9Gq=NDmb!UCp{hS+BOtr>a|#``nk0U$QP@P~a9cjcfT
zAzeNK(oL*FX4~MmDfQ@1Efpq}?HI^NV&?7p6>;eh+<wWAjyDT9dy=rEQyN{y<Lsh!
zG=r6KB|DgI%!Lsz7$IdQ7F8YXHnNaQY~Lu?#T)#66fUQ?xCD8D9LfGdS3egD7e!(X
zl6#wfm8>dM6xZJb;VA&%AVZDK?{zG4yEi2Gy3G}g$%wE_vGRXp;PByVuD8k*HJ?NS
z8&1$Y%EpD%aWIh+r<=fT2i*%!AwSH}JCb=%mr!H?vYx<yP!_uAx;*ExWgyOFnj0R?
zz5<GRgCPxh_Kq6f6arbQpI}A1p2}ez94saCZhw3r+8AS}dqtR86Mv|SsAPLzaM>Lp
z?&6&*slQ*Q`5buN!22kpW1jppxyOc%$gxp1IEAM28{2>qODhY(EZRE-JX&o_tmz!s
znw=yKrW=_Vk=@?%vl$%(CR-BSt?-YHk;8^Hq21i>RbZ-=-0#>pvs3A#hDR6FO7K21
zN(>zZ)zs6*EaU39`8ZYYm5zPQu6qRPxFdcb9-DlVcN7I%skG>f)iUe=a!r!CQ0ZA<
zBy$Gm9j)v;l*-L&j)D^;g^VC$d$PRmsQU6ImqS3(=W)2KU1p_OT_c|?j(I#>-A&F<
zp}0kMZF;Y-s$aR3lE@py!Lsw({YtvNZS@jJ>;C{#ihPhvS?Wk_e<ei7rhBanPJ6xu
z?6hLv_GZ_ijc5Zm1I^J9G|On>ZcZ*y6dFBUOSe6)x1G3Joijl6nh0aJALb!fhuE%V
ze@=8YW}x9LfHkK%?zg&UMmmZxKP(CI0*gbT)M=y+6`Nar9v04;O+k!q?Mfg#ZM~Cn
zYg8>FmAXujjMJQOEtFg|QkH;Vb4SQll{FQuit$hRi8}^1%A##gsbO`W3`Cw9c}m~(
zGE3|sv~n@GV|I?@gu?1}dmjDA;RPnQt(;Fp*Z%<6%ps=N>!N9Mv_oOy$$5W9;=aox
z9Xp-4G~d8VA!zsdZVmFY&g%V4zR_r&n}52V9cxyuEo_vAHXkV7!$st8X>b9hPc1|d
zj5Hj5Pz(<ZvyOfgasY4>Y+V*q`kYW5;vn;X(ynOw&UmcG(M4}7B++MB5J~Qdj*@UU
z?ICWxf$yV7sr996qS;SN6JG3YIkL`49-*pD>Q&TBDLgf}AF@AB5wHhKPSQNN9(9^%
z$EO4=ZLxH;yJKvvr_-BFV=HsmDQYHj8ZGS}0-3VDc|BL$jxe7jTfrrS_(s?OBAw@v
z^up;GbG_#%hSJDiaqS*ROskrThBGBiLtH@cgOZB2GEMYB6m27O@D(<>uF&bNb>wTD
zJ6&gb!>yWkK}O&k#lrJFOHq=hS3J4SxxLDoo1a<>ijQWSsXD^4vF?TmOmUvUWu%bE
z?apy7Cg&(<V|_%scM*Q;Ytui5+QzchI*hf~7Z(bV$6X64*_xx%D=S~Nnga9iuBo~o
zRCd`aDa0-R0KDaT$4>qlbxwyC@eB`latf{LO*5!O+be40g_q&HlqBUIkkL_lY|rRj
zHxv#4Z7*8LH1P`s?PMm4O!zD>xc>lGm7o-|mTr)Xce-_SBmRhKBW}ziTOW4iG8RJS
z*f`(zM8OkYLoRHF%tISrE4Go{O)sNH(D#<^`l)N14J0JA*xQm;J6_b7))VTVlXM%Q
zlCs-U*NY=_Sa22xUg`;bR|cKVJOHY-jdn?-FjEri;JGH5r#?a?m^s9rR#31xCD8<N
z*XnW;A#h<lU2A%GrT6VS*^!b`Y4lqgfp4m_hB~HLM=hJ+Dy3Zs{>vFOsHn!>%yIZB
zV=zK4=G+7oMN_GxE}G=5&abL#)$DXyPMI+s<hBrUOS351cdvC7JtGWs>@rM8wXM!p
zb4;h#bxl>3T8uJ7NYl76-NLTXbd6#f;WcXsmCoR;d*rSS0)6cqAd{BZTBk<F4QouM
zp!~EHcYUpUVP-3IX6p4Kd8BMiz4@}O)T<+=g3PSEpVMrhD5cbONqr|tEKr_E@R}=o
z*kwIZFLg?dFHVG0M^a>P7PAf2Ofpl*!+JyVT;5f~Xu5Yxgi9maB-Xhvb=5siy2|;#
zDW%3Axb47HaZCM@<WOtXl0po0(AwvVSzi7fX_Xp`qt*r+_X}OppM}->qnlNzKht5&
zm!eVhT^@~1`~Y0wIY}hpv7*$BwO8Thg)KL!JkOF+FLJ!=s<fAB5_)=Tz-8=ky%Vc7
zYW+2j^tQWimF2p}QP=7dmOcT`EnL4O??}H0*1{;9%_f*u&tGW>y_Jrc)b+Zn3m|)>
zXuw&ju8h_7%5PD%f;Jr6y3lkVPS<q(#II|w{Ka(gzeF5qjGITTudCfw=dqmQlv8?p
zN`!+`B+u_>I||2N)oQ7jWV|og{JvHjS?kKF*ytnEiFX$Q>JrK6BJoLWnjK=UiiV%l
z(}-_u9u|5=OH#ul++2CPle$WRt6P`UsXmK&vxTmw>y1K#r)j+gG)ngiVOc?_@?@ov
zNzw$R)+#6mrpLGu$Y@)Ri>QLNf?Cc`A<N48Ikg(LsL3T`gl={CzzgW!l%na%ItD&k
zGc19*+7ep!WqqQ9Rhph4Tc_#9SN1!3RJ7FkwPj|?)=Ntj?`!s3t$V68+6bK5S`D@x
z+hu{M>RGGnL+6Oc0OrTCPAX6T0Q!egX&Y*NH>csF5lLA6_Q?)aHJv@vG|zQuuXK;*
z(i@=N)m;@wOL~_dRin8%ST3ymOwvevI&Ckg-Y!CE#xZ)U6-l&dD>dypYLi1k#^Bhx
z$i~xYG>{saim!dHL2~ihKB%jzssai!(ogcWYiV>{V_J+lLg<=&-BuHAY)M0U7pgU=
ztDpILC|xdW2p1|n3X5B$cdbWDBVKcst=~m-#+Rh9yHE|5L;T9ySL!`0NtvRaAXwf(
z7bR+^W=EB4ls$8)`+X?`M{C&|(YjWlq)+SXl<u(2&R3yB*A(^N!>6KV<KJSe>Kctk
zu9?<r7!P7OO55!QF;B6Y_g(2Ulm;4C2D;o?d4*R}>h-nHbv8jfhOO?C(qEl!>Z)cv
z-bhzkXG=RxpVW$hj|Z>;Mz?L0+EkAstkU|UQD`Kcr;DPrZj9C<m9-KZxu*8I_F9c6
zRn!QIpHCFy`iEeSqv$HI&DAw-ZTSGK@;Cm27(~HAKC~&nEcaMi++`cnnhRyA50+^}
zm$?_h-N(~<RS4fvQs<H6pmkk;r}T!Od`-7?1?0jHTPpCmt(84d(=V)|FtV6Qy8*|t
z&-CZv-4>ZI<|?XvH(umlgifpYofE^M)1#WA*a3{Xq^8&FwQ7Re#!E`W{a}Tje6!qD
z8aSaI*|4tkDcEA9)E?pmu(H~wm0eIwlRBby{{T;AEo9X6O>gDq5=eX%vFV*|mRdm`
zp+@lSzo<0~Yb>40LrddbBhR3w1-_eTTnITm)D?O)EUzu8l32WMb`|$qOBF1SsMFlw
z3AwN<Cq+%H>(xz(&wE%+fg`eI43c_c%1}$9NP2&#qLeyHmp?fd<!-c2km#D4X3Ew8
z`(FEv)cObEnSz*4B~)`<Ud}@6x@&aS5gT0<x!PAta)P21r0oKA1#7eh7<9_g#{U2-
zN$jyw9eb#1_PU_R*Bf0sRfF@h9ge7x{{VA!YtmX>bTc$G%N}p;ZWdVW?HS6EXP|x=
z#Zk5Tjag~#I10~J&}e#Yn7*F1k~O1;I^|!sgHm-Xo+_jLK3A7@vt12#+Pcqg!>+pJ
z1f$W+r?OhjYNDad^r;&pXPY%>bTb~-UN*7E<AfJUojOQc7?r$oLe!p*eOm<dx{G|+
z5Tg}aMY%6wQc_VGPgV6qV~b&VS6Fp5HlI}ZAf{``IDXaW)t{ZyslP8MjzBSU%FM;n
zl=_uno~oFTP5rzhIH|tP8L0X*Ju$DrT{A^smN9%D%hDq18cGTu`e~Y5x5}uf&`y@p
z>Ka&OXLh}zR8%n5xy*edV0UoQV5KD1hl@{a8&lT5*7YFS@fGk@_L&Bp$ePDT9OL?2
z&{ZJNng0N`PUFT@f0VD%rS)FfOGk{Ri)m1@R?XI#NkIrNhLSjY*fmpirF8Jq5l<u;
z96HLjlDnw&aA~x<No6Ml+k{d4EbDzpi7I1kO+4-?o10o%65_iuIww-=x?Mw^13)C?
z$K70N9dWN}k$N@L6BiqJD^W-IUt6a~X=`JR<NBL$n^pK<SE)At0PC<u2L+4?B^wz@
z867^qLZ>^QNqLX+DXY4gR<ms+u8elGxKis~2R4VgN{vbirZ>12Dz=U)VIxE>5+4P(
zQ?KlFlP@}7Ri&zs9acjy{{XnH7P}`)wu#1>%!$^%EVFd9bqsr5E}GWHP4@t-t76jT
zrz|i4ZN<B;h)&}~<qCFXs6WsuD~oEH$w_t(3wNfor)i=Mj0S)|Ned~Z!J*L1=hs4F
zb@+5-ghsWg^!-dthfb?wWg^xAan4VbBdZ)&8wu)Nb3&vBN_Mr<kJGg~rn<XOs{jfX
zIgRd4e%Dm`KS#-1c`8ktdxECcs9mH)8BI|bb+MZjP6{sDB<Ck|YU{ejumMbTmdIc2
zX)Ox3OX(V#-AL*c=g<z$#tQ|ArPX!%DuFAcYvTs?BH?--jrfLYDVr5d8%uz(+EtVL
z7yTMWbbn1%z$21a{Z@<T3aYw~PtgyjQ>RB$Pr!V3+&)!Y`j_S^HqkZAd(Jl=5pC(+
zVzNE;l@9dJW}GEi8tBg&mtcB~dOVEvXkRR3@W(L&MWj*ccomH@cVn<srB0bkP6Pt1
zhjH#I5A+EkyzG+p7u?qb@XO8V3p{)fEk=hyrjK+Zcbi-)imgsMNo@w!JIh6pI<BoW
zOmqTcF5DaBstrD9C)AoMY25ZW@Y7<Q-_bQsv(R*HPg9<au8y_aPh*uq)Y|5~42Bwd
zvfJ~8aSbI56x*PhdUsm(BMPdvjr9&Q#a9%>d|gkQdPDF?$sUpF{-=@C)4mz@o8Q#2
z{ff2F`cJAlex;Q)5PO-M-D$crQ#2Zm%CF!H^51AHeX8n|FVl>#nkkwE?BSB7EUpgy
zl~7V3>0Ylhz}ihphK``x#7e+_;V)A3_fBe1x^MkE3@;+#^z!Y>%pGs1XC$@{Mp4{4
z$Qqqeq3tcBtCMNq2QH7Ea#o1EP=nYFRTXxTGoy-ylhSteLtNqa2uheIsRQ!hLVLA}
zNg&oAA(Y7^z6IABwm{$ds!3yze=~Vp(wn+%9T0-6qqOdgcB?3Js-STP-5i3%{nedE
zMQ9ZEHBGA1+&Ob!c9olxsRR;}1kSkgf{%x)TdBkOTFIqoaIht}2_8vBZ4JRm>456`
zB>;PyL9UISCGMuuIvP5-1ymZF9U<&RkM0!z0Qy{(equQtBY6Zi{{Y!dOIbFWJut@K
zi;IO-kx6V%jltR^)92T8+Oelis5r(yOI+*z#cV0yo}vKhYUigm{Y}ePpK7yKR!k;v
zEpvZMks4)AxcI#&>f?WF7bQw7v}bRoX!U6|T`pGC#i$C1+H!4teHD!lSW(x~eqOGP
zzM&QpM~tjJW`WfeH+!7+wD%6UL(}yC08nY~6G;=Ez-~)Qq+5d5MC7gP+STbot)=lf
z+fNHEtmuw{?lo><9g)=iMLY}<vHK<P?iEi`Ppnr*ys>~D?9J6bS@eW_qwHptr?REZ
zG3$}B?LY0m0IhukXeeRZSqvoq09ze!SCPY{SJYJRbf!BV4lcI(6f)7o-^}ijqqB{|
zNk&L`xUl}F*R+^n*$fRX>}|rc=xK(d0CaLP!0<|jdfu9RU{z2+Tt{Kbrg5Z-XHBKY
zJr>-w2YX6b>ufTnsUC}{(9uH~bgYfUi<_)YuU)6p$XdwU>m0SF;a1DlI-6Kxt%uf!
zf*s%PwS5((Xqv+rIH0MgkoPBZN@&lM(61jAvk|RTbp1^^d=8qLaoFXz`YcJ-TFS!=
zfIB|d1@zXd_+g=HbcK$HF~ni*79n|WQ~nB7QBG&mwHW4TKc+!r^tx#~1Y`8fYh6)N
z&|2q~__{wt(qw%=l(so`{{Zbu>s=KVpQ&h1**z}nV32UE^i5Yxbx?gxqkB#o6kAB5
zPRr<M`g2gF5LW2*I&_w>a|PH>n}wCvKMv!XcO5y>7|#xKuXX7Zy55NTU*l7?v4Q&7
zY)9E<^=_}Cf<nzUSxCPwWq@4yb50+{7srY-?DN@w3U!w}x;fa<{{VJX#);7yrj{>L
z3o04hf{D~R&suH$J(4%eaH?I@dfil)-y<!^Tx-bkXWB^}e+C%)HPld2Qxa)kB{YMZ
z8;{vqR_k@JQjb{0RKPiBB{QU3r0Z0zhJDdg+a$WglpkC4y!w0&bsVw-$Z>D{@VfD1
za#tc5Ck3dOPNC|JIO<{UrE?Djyx93$9);_TKADydXm9k9WrC^c$!e-Y>Pg@IZOXQw
z>FDVujq<UR#tvNEAK7$8sJc0tbJ@S@ZlUSjUWxmd(KWGS-Ff{q?qzTkmG7o&jkgna
z{>x15D@Le>^wlknOMZzku=?XgEm?>QSn@bmloM7(Hkq}39<5gZwPRet{{XuQxAtA8
zYduY(Rff~*hDv+;n)ZhaES8Y{L8o+bJjO@qW6CA826>4UlEUI{;QO1XxMPn<y2&=E
z^r`jeHCi_`$kt9poweQmi_Ln17$KfZmdHuDy1mhK%_-MplD&`a_PdnrZ>9A4VK1cB
znCX9_UjG1aif}?W$(c<jMW(N)0ge!x`NH%q3#A)K!7kXP7UUb1i_`S#x+xv&xHjLU
zwA?ELsOnVW?W=oR+_lR&KS5Dm%@0t%hLWAeq7usvKvi8ouhB&C*V4x$5A)kAsCH`b
z?Wol3<NUJb{{VFbet|_oclwTPyRh68E{tv2tLX-qxy@sT^p%S0O+k;S-=)AA{{U;6
zGE&j92wd3<tkaKhxJS(%n<Rdtp3vc+VZzQ$>?tCnP3kRbl<kt8vN!r2!b$p$qH2In
zpA!##yeTTR2pcJ58VUL;s@k2iJK6#ID15uxEAT3`%XzA)D`Ens7K?Li6f`=O4xcW_
zC3v~+Zl&pp2sJ5P`NL-0+qCkn>%R_ZDq}N6Q6zZ1`Bq!(NBZ<vRn)^*PE2x!$ar&I
zw5r)O{Z;HP{KKV>{_aQJ6#kE>raNM*Y{94XHQar<L{d`K&>P89>a_9?D>%ck6y)@0
z>T5MRNX$lA3lCy$66pGsd=g!cE@9<_Ee%~>oc4bn1~~W%ma2U=H{K?`7k}Ina^$--
zqT=q0VNV@>Kd8pCIfiU-fRZ;uC~ZVBn}0BBO*d8&JVPW+n09c%3tgnsQ&d5<@$L>8
z-O4dZ>4DnXE2v)sBOa!lWQhL&?!;_I*%=ij6rjEd97lG^$W~)RijaEr)47=aH$c`r
zN;bKzYsNP>2sG2|JgkO&5wo`v24gnJS?yC!nvKqL9ea0aR^;js4b3vV1BbULI@-A^
zSXo@c#`cxCKXlyd`5-)Z(<v!Bl1e%DNO!lxvbLIKMun`?G`)<0?#3~7iFZlOs8ty#
zY8yOc-1Z?_LDRMRU7s@?S^ofTROQ8w7|JEhZ%#!OQyoPn@=d@d;G<bbQE=L}SPlqP
zR3=F=MOk<9Vso-Tb*j^4)juj9Q%xOAV+31k!i=Ay(b6+LPo+~-LeUrnz<#lU7Akn<
zrGKY5$7fpwdRDCXrFrz4=+6c>427Pmp>;!C&rPo!>?c2E(~5MCe34C<ny4dty`y0~
zu7bL*m4+v@$sZWyS!#M@^rXuhT=opQGBV$ysFVpu@W}(maJo~ooyMNaC~6{=mIQ9L
zJddhtq`0%O@)bX#`2PTj8_Qka<tO@uy|Ua9-?A=D$$b`O&S=30?x6L{TtnJG<P`*U
zEq+78ll@bBTrFW}oAV=WvG7wJP|_?)Wy6jLNa#!b!PfdEKqq9aaJ7`tQ||XThPUUG
zG*LP+`ic50O*))P{kJ2{$}NnDh-*M(Sou7uwC`EcKh%!!17`X9tLj}Q3xIBXs~G4a
zXtP)_nh|N(Ce=}!siViK3EU8lVQXwwj;fK-NM9B|?d+?}aa3Fp>AZ3X<ykbzZEU2S
zw(OvDNaEpHR#Ul-Ah!rY%Y4}i*lxjrHunU_w){CuBYYBvH*3i3fsSz_8A#CQ8<j9~
zTr6-?UeMg-V_7s;=IH2cw<@|94Z$0{G*~2-kkRa#%_hmf18Zcc8Mx>BDWe2sK(b*F
z$*}jb>bTnWZeoO+_C-@Q=FKD8Q>UO&TNIlQ$M{k^BXbY;QtC9KC+-=#5-rS=0^`Cd
zfuNXVd3M(~D91Iiw{yl6aYh~*{0nCZ(p1Lg?0+io%GQ}FW3T|NKvKVYiK2Mg)--&o
z*`RT`YCc#P2If2)_$nX>1dytvq)Ux37@I6+?nOl?aJO|MgIq0a1ja(rJQP;C1(LGF
zUg15K@`v<ZICX+^8u9$d@?fHT?LHI+MuKjpF~89yI2<aL$swwAasU89x@PniBlTap
z*HgyW<A3pCYn$H+IF7-7$b#_kViU%ND|(MbWo0<4pg+ZCY_suBWNyhu*S7?Gt(0w&
z5xJKi^0V6g8%*Dtg_|V)cKKZS@!ru)Q)$rMGgOv}aK{p3D(6(F4vDivmPy~j$~nHQ
zHyA2iJ5rgkni_|0jQ*R2!;&1;9k82&v===?Lyx-U0Z}X7IR(E8N~jD(7P{<kxI#U}
zxC%=eL(3;22EhLS2--+k^X(vJ=qOrbH!8-K0?;gMi&_;(u%(M_fOgk^Wp$=%byQCt
zn8()&jyFup2^x0a2G~bKDX<?2cqiE0n%XvW8m66Cf9j(Ql=leN>9n;CKbELuzxKM<
zSX^_KpCJ=XRWw97uW;}|NbvsvWBkR{Z4;@aKBNv|>_-YHs-DJx=Wk&0n$32w#p%=^
zRkp_Lp(dTK_cU7PfVac;AC#7{v@^BNH)%i0Mi6mHO&AeAAX|JN2^<+H_M16ZR>M<!
zFpq@G9eWYvOucMvV@$Mjf&k2KIZ#C;b2#>Qg`JXJQk>>8;ql!`Nm%DUbd7Xw`9_?3
z2A@W@n%4|)BzZ>5rNbm;@$GfIa;dcXwuTMv`=X@OLl5xX%8cgvEsr0uAG)2}ZbGQl
zE4Dtw?)Xz`dXNk|ot2K%YovUnhY~KQ6y(cEsG~_uD{34JZ`kjJb4{t$(=;-nqIkdV
z$yj|dpb`jmk7cE#s&nGmD@g}}x?={8IW*aEFr%!GeKVZL_h~^nvqy&ugvbx4CgvZq
zv23i8FdhZ`s@)T436Pg%sF;hRuq3qq0A%(sw)<QQRMD8;ELuK=Yp{&lcJ6Q=P*g$T
zkGU5e%92>iMdK#OcDtXRP<t}baSRkSP>V=eFOYDdnvz%r-R}PYxGL~k*9SC~pM_-<
z(}r1(-Yu4uw9MbwF6mfzFqePAb1L9-hpfO{JSK|Q#Uq;dL1psPvcXSS&ConX{{ZQ7
zG!2rl(@O7Y+I$rw82C>1+z!P7`FFzmO2Xf&o-;PW82gV4QH>22uMClhH3%CcJ37}Y
zN{upxNKEuqAc8Jf3d}NRMDgkZ!Z;_oHV1m7I6Gmt>Th%&%(Td=DXx8j_Wjfilt%5Z
z7e>t-%@=FKnnx&RMAyg+w@RY@jO2#P2dp<X&IgcrQ3?mNg4VgG!aPH_F*twaS?SWo
zeY3O^;H@U&v>5)yO*5s74+hFtozBKp{F;3wLvI6v9&>B*sOw{vl2X}Nc8}&9B#uQP
zoE%7Y-P~k%PZ1T+7RWBr3GklaKnH}tO%aF4%s(wsvC+H$&;e06=Rb6Ttp{^(RtY_b
z;HL+;HpE;g+D|Se6B%TdxUwynVK>V!e(Fe_*sgRNMcV9kvK~$1-1B>_b_xo3X&iuu
zE-fXm$WZ$3Ypm=2QodmB`C6<g(CH&<#o3e_!@=i{%1=;-UiSG4K=!@47Fj9-b`B-%
zLYgZ)V5D?xb}wx5m<Gdko1y@WvDV}#HQ<qBpV>MW2M%ru=f)aEysXTE8)vs5G^Q6w
z%n`U<HaFPVa-<SB?v!FFcD=U($HEM@&hg<JD{q#C2xjMTWraE!9MS{EJffQ+wk|>i
z;mmgz7eq$u0I;l)(z_?Jf%8~e+^HT3<FXQ48-s;`bU`cH;zO*V5!n9#4aKMXCrcZH
zt_~AJt%nX%P&sVkW@!%GK^?+2i&K^oJ#lvb08>XFR3NzE;H0*9Hw6l=hEu-Fikisk
zA-?9w-quu=u)y|{w*@js4fhv~<C`vI^2h%4exzr(847$$r=qk`#@Cld@(+TUBST1R
zg2w9c+DmJ|eH`Jgwf3A8B~=A&KenQnybj}(8f&rPHlB+1w6yNM!my^QXs{y60Zc)>
zWZU{rDj6H@=WB;#j+xN1CX2{tyA6%Po(hR01<g2A)DI=wNw?R!v<`05xTI>CoBAQE
znwo3g&40oizza*5Lx;kKz84o4WOoE8spOI@I^=l@i8>Wz`y5!(NO1kq`X#5?d-H_S
z?dIXvx=|~d2yOQdDD*3r(APTWY^=Y^K@r=%zUHQh+UIR>%9blN!ObS!!Xw67*nsal
zFKhNHH_|zTz84ms>{XDYWX%#pKzDYi-X?<tTz^SRRA$ov6FIKiJ1j@@1WR5V-*uck
zrJvB5wkK=+6fuSIa7YUe2V=}ucr3{9nDR@q2tGnay}{QZInr-A2kMrJ+7*+&F=7Ln
zlI)WVc={CA*zw209qqTc3;hv7G?_4AWSgyGtf?f%*Al8*E5H}dRh<)=Gj8A1gp8F1
zJTgmzZ`lhqAU7>Px+)e(23vH=ZZBd%OSA=7qOw?A(~KxdBb*}Vp4f00LZ5Z^kOlZX
z(JY;<j%&Vd6JKHtvYJ6@#uJ+FHU$!ML{70d!BbMk;_sfsCOxflbNi%%S*hF(!uFoy
zvb0^CSu|Z!%wqwvv=E7GQP2L{h5RV#q=u#&w%72brlXV8E{xg7wbMNjTL-P9Y+$&y
z#CHmwce*(($Xcm{qB7aoPAzpySrkFnwSoBIBQFBD5>3Waj@OKjvU8%^?`BeqI}RC0
zbRcPBE%y!-dx7K}BBX2DFfP<S=2(M*eij&EZg55X1dWui+naVOZ$aBGE~9&MX9U(w
zx*R1A7$E!=Bvh=Z!yF@U@`W*H+HdfckCB9BWCqD+Wlb}z_LmOHtaMHo_MZfzVXhl?
zO5AuUWu>Q`yP<evye6S<?10#hpDH)7gN)rWc;|%K+l9DIWkJ24k>v_#);xxsaD1j6
z?Ee7aN;b;dvc*L3=3@9+G{IsA`;ie!ZEe{@dtHERS6gVg1!}WhmLbh>v(7w(hB0h=
zkdaC+@}+E`9Fh;h4Fxe=%M5<XH(KCudz46Ua7=u6$XI&@wr|RI@^Eu?&S7Y}X*bQR
zR_p}ZFP8qrLgtakvf(Lcw>DC?Mm@Ga-3kq|7J^O@Fv=Qi>x7<|$zcj752#r&w97au
zUfeat$jIx7!CBz>7;$?kp{f@b#ny2q;)~+uNG;@dL(3M&dwB?0<^+36d8i;~pD1k#
z;e8Vau)5E%C;KTKP3ku7;Z{p7K^&=R>s$!2BFdejEmI_W9}ByXk*<bewZI2?QyG~c
zySXS?soj0?<ttVjqAIFj%&`f&Mq$AI$j3eG8-G{Ta4|^S^Wh5n27x!m@q1XNx+~-r
zJE@rBcAFIwqLGa@%0K7~fze-)-8Jx#1&Si>1a1~w?D5$hgP<X~m^Z>)`BRWMEw|A(
z_eRE2X!;5`$!T#9YX^~K%#xft^j!G=0LodbX=E0e&y?HrHv{)fj%bC1FaSFMGP*3~
zC6Uf^f24Q{7df$l7z>ZiY>kGJuAqYEvIzMua_WibXq&Pd)Jxsx0DY2$AWC>DWjo|)
zV|x?bS;jvv7%gbs<;KdkD#I*=?j_`S?4>N4q=!i20LTFg8iR+eebZ0R4IlUkCUixh
zNiVqI0ETAB@443}#t^kK#TYL#HMZoQ%UVXZ%Nc2-jxEo9+(sD8lm7sPPghYaM7m9p
zF}_Nn*Lv$tp<|(m&z?(mIJ)!wTdK7^N<siFX91&yIb?tJK~dh#=C#(Yq+^*z<~if}
z&jESnxv%OvoW##i=Z@LHRnv-@Mc(bcepDM;!}^@#@szPm?n5_S2;I&%ca(e&!M8nv
zT`x_ltd*@~L<8k*be@)mosE4=(U+dXHdf>IFE67hN2S(Q%-2X<*zP&*x7uY1ik+}S
z0~pXOU2K$PE}KUH4s^ocVXX-GCXe(*v;o|$`t*&mT_%P&z%Grr<dCc+Y%!aF(e!Ew
zk_!?fE<S9Pk{7<-nR)u*Yi6a{E1by>w&KcYBn@@ECI}vLAZtPF6s`2wFx#Rp`U?Ep
z%WWCi<lQsZYjeG&-g~CT&s&RI!dJn!4Q0vjI9YaQvRG@OjimY>qx_r%C1kQypW<x;
zuxP+cmLU-?eouuY8{BRh(cmWR-2s?d2)j+Zkfw++pUHFP%30l1$6i1!{UIp;vwV_m
z@GOC>W3zw>`XOf$HP&wHl`pJBn`3EtN7GYZYw8<sgsp`j4LX*2C2Ot0;a-;QZ@Y7y
z;P8@XmPNJ@)(+lK63b9Utbb*+V75n5Q1aH606tQhCR3gAmb~}}2pGjfb7IhYl8vW{
z(zkT7w0OBkpmxLQHF)5P%%O?S91<`Pvg$Q5NM7Q`j{sN&1!Z*w1Wq+GG_(uYVR@%o
zb;BOx4wmA^@LlCfSv?|=hqGtYonsc8PUgB$Uv2{OKBnrr%|>Su=QW3b6$NE<)l)i3
zi5~Ohs9GO0tib1AvR)SMTMLzRJj*1GyN&O{dm|D!Hs56UH0q}SOivy#v^_tdR!{CR
z?6(AkRiS&>PJz?ZO@*~Ja=J6fXytl$LhG814$5sFjnfVR+ser4{WjxL9XzgZz3tg=
zbf3=Y)SyvG3?kpCjH2(*uAYxWqkg|t06L7!r375Ga<d&zr)h0-q>`<&OXbhGS=zeo
zLaD{GSIqCDu!W8`vD=O0cazFb*}EAui5m%YwuPp{f~=Uy+&_r#Z*WvJvpuKU&7k>G
zYBCW{TxPNGow@=-Nl^?Kuu!{HiMK6q1!k-DK~CcNJ-~Om#PtVM86IM!k;TOR$SGJ_
zNZxfGwFEFaN$YnIFu=U_s;0MDoa`l#-_Iz08Yfpy9jHC;1ok{Fe0psQ7#l_&4|}7>
zdl!*Wrs%Q8KzIa&pr)m4O#!yTCWeaE>`Eo{@<u(oUGS(cLcs~!bHG6A`o$iX3!gN=
z8*r(*o2crj!>MUtd!%+Q8f?3z{{RU(qpbF7RW-4)Cud`h2i0nF)KS0Lm#fwFoqtme
z)7c~8zXO7{^i`c*r_nWrh({LOlHSWx2jR_cNK=U<5ZR;kw1f<mRXXFHNXqjAe@S(c
z{BU}AWAdC;u8JtSt|~HQt7v@wEQvLm-%!SXClqi(d%Kimy$z(&v(%edWUuD#vJyvA
zY4AEIHFf|vu?T7_X56-h(DV&V^Lmxqlx?}Wuv$s9oi9$I5y`5@8$hwK$ysigjrz`}
zVUtssupY+CQLkuSKcvx_>Px00o$k6>PNSnn4YLib>G~~H<|;X7tCXI_Zhs5<3{gF`
zwN%>$?g?34Gg#AMul025Az*MoTWWr?)*Vh6`7N>Alwm4Y>=KH)HoEs-XgxPbe=}It
zY#afV<Xv6=0P7v6fg~DT9F-0j-0Tahn(+O07ctb7&U1!Kz$?l+qwvn9m2axuOdEUc
zW<Rno4CS}cxy5OAR#f$uQ1w-Jts`C{ClSYVPpMxE+v?Lz8UFyesP3Gh8e4#Yq0$aO
z%HH(egFjKs1$@7kV8=OBgkxM{E56tlOLYsNg`!>9_*YuLSLyAeKA>ne;ThCDBSE6l
z2GUoFr93jgm6L;{>$L|x)pUidC);+T9Fk9s3n(V7GYQmvUdgJQ#yIT12+ogubrL#j
zHP_&Bwv_(>gqlTc`|G9jS==;$il3x<V?r&DO`2IH91ZtLl9y~~DKjst*K074+8RmR
z&^coiS``GEyzX|bO7^%P{l=~AdX;r7ew{r$O~rwIvZ8R*<#BaeU~5iyHFL`(n*B<w
zX**-I$n>oyHnc?$0CweHQuQlhh>AD?By(kx)F_CI$pfR9_zqO3U#p;LjMIi52IiFb
zXD*nzVHMLf9YtLgRHki4q(laG`B}NO?J6s>nTAq(+k`zflzNV&)an|Cp%~4H0VboS
zXtXbE8ho<XR2*$+z1LUqM><#8G<`Q!)PKceSsZ7QLa)|(FHX`}4NTX6aklG0qes;u
zCbB9CX<`@!!4+TAT9ssbt7`*pGD?h-eIl@Niu*B|1L>)%K&6R}0QYL%H>l-~lrg$|
zh1Rv&!m{ns^v<8C^`z9q&*y5<X#W6-8e}_R{HtcRE*J_hX*z7vZbeblHR{@@Haa?n
zHux@S0cbQ%nU1bzNvu?CzaiW$4HsSLQ?v<bLkZw*vNBq|H(7|Xo*m?jTMC-{B(C}d
z)#y5JNYnjFdWeJCIcZpGexRnT)Ew7T0}wU_=>DSoIMn8Qsv{DJj&`}%S<O2^qtWX&
z)`nahf^4|+{@%{aDob>Fwu7i?K7&cDXg1)KeNR;A8hZ<*sbK@<c}}ycboDeFLtnnw
z^wtksn!3Ht{{Ty)o$WjlSDzJ{QlyTz@uh8^<6rp6)3i=^qzmogW;JieM^;`fI*HCa
zWZ8JE9XqJh&uvMP!*jsG)9BqB=#BL9N>7q5y5r%uxigYk_xhs4UF&YAuZ_<q^6fqe
zSmMn~Se*Km#m>L!aayfQr!{x9wUPopaI2_v87ZZ_!}yoYimY%)9_Uq(&rO=2!@7C&
zS2R7WE_meSdYwHxbxLvhibgvh%Fb7x^!|x7u(n53Ixsl6y3r1ye^1A4?tQ*FPs?H9
zT?=2NX>?WXd872e@(R$>>Y5x>ds`%Jb+dacd%BuVrkv8fj)AVm>vE*kIx>zbLs2H8
z_hSD5s@7DDB-O5o%1Jt5+SawBnBBebiw_GT&aG@Udnt<x1}?FB<EZ1RbWznk)+BqJ
zu6jMRPo10NWWP|8<G0v(){U(fQEK&%5Yp5DUx9OFc<z?!8kmJuTfKO#asf?&noLx|
z?Wb!T1;Mha)jG3OrH%2?R+caf2W3ujOG{-V7WTvc0M#_D66~K$lhker*>z8<ekSRV
zU6D{p^xCpAYkKCVskRxaqmi$5jk_;l=q`}ZDk#|fMXZuSGq?hpIV9KY=$x@9(d3og
zcU7v$VWEylOR<7cnjc0xU6HTVq?EbG0IyH$evQ&8Y0Ua#X_(=VKme~l(lw1imEM7w
ztqnXT#hG%Z8Q^uv8md3Sms8V+>F$tQk8&2fO6pA_>}=lA<XL(*Mr)8dk&)F_h~01I
zQgu|iW1w@5bPu@T5LaWz8EqWg++NQY)O3!Z)du0HMBn>KR=qF&p`@@uSmwRlG}%-2
zUZ)K;aQv*~=aw5Q{*%;Xnw_&v5SQs=Wz3U=i(F+8&0d>P)L4Bf8wewi7AIQi{c@Sc
zNOc%wKhwhB>ODZn;W0x@_dNJ#3j@?Y`i6P^XlZR7?_%p=B&6>_j90SP@b^frud3Oq
zJh8Xt>v_~Y4@(A`>FM=Xw#~lRX6pl>%U2C2sKP_Jus5;rq1SruXrO&OjwS6DKJFJz
zIpcAriDZPL?J{j2sB1cIcd%1}V{!L4{HrZP@y4)6>3S!|SDaF6`nIE53>4Bx$DVfG
zTT9cLrBM>QNFevP3KC7d6jb{Q)xQ(98ra<E;*s0CgTkiJ^`55GtNkczDqvwbEzOnn
z2TW8syCsGQvHZrxJ-St9iBb8ej814gwbxUNsnn3~8d0>!wN8)J>R2jjdWqBG?v6`@
z-49NR2?Ht1rIoyZi`DwkhKbQh3=cN7?ZR*2#<0jWFU?I83~oHzkA-}Zg6Nc7i?`P5
zEvGR_r?`uMN~LW`f~ZL~GufM*FJ7wGdVaG^aQ+CA*&_rmC+iJL2&XNlEszt1%gQm8
zCS5s6Y(4tF`h-TBDq4DyMTYi^g^iy;uA;3qv(Yd&cHv=VaiB$8ERCq9r~V+%w5zRW
zQ`Em8=qog-+%0Rhg>*tV-rTlIPHRbMp?_OVO-JcLOB<ZgYXys%T~}Mx4D&VZxx*B-
zk~%8)JMwdelii04L8I113mWrELx*zPC6bDF*j2Uk2`+`MwwHW*Y|=L0%aj!aRrJph
z$wxCEejL+vuYXw9Ll(#*C+Zb5HJZAeKu=R8v%v{gPEL{;LYCQSqEKoQ%GrO32p`lI
z)}L0XprkR>R0p=*_(ADaBC3(0v&0>2pmlu*^FW%NP%)>$vgr7t(JzssIn=t;4zJ$H
z0o;Af2MYV8G_$Nm1QpUmUCS?mu^Qfir%+Amvr;mUZb4W58`Sz`BU>9M+aq`dBF3?>
z{G9tYbzg_nRL~i!8M(k^*S*)CYpl|=ok$jf$F$v~Wo$K0ynE@4Op|somF8N-HAb&m
z>E7d$`=Kc}Eg3~t&r{HPr%kWY{R)aWY6uo28#!V6hH7dpV|5&IvL_qtJ(UD{T|`a(
z43aSRRytORs@F)+*~8?&wXSwk&n2yi98Eh%q;%u-y-t!SY9Tyk<0{un=}4QXIoq8z
zA^!l{cVy0y=}mpGuvNAe3t_>jdZw4DG*}-sJxmW{K|iR1qVfB)p-)vs<e!E;8Cu6k
z3+W~~uywQaUH<^2I%h|SyVq-jc_z!r8P*+JStq30nBKx|?imX~L8iZ2rSvr&W?FZ<
zovy-9mB&M@YFjLNi>SIPhViziYsYqFd9P9RewieNly5Sy_j6W@Qv5KEo=3>tRw~H(
z1G>%XogGg|!yvH5_LPstSsy0HUPFeG0McKlY7>V_{f;M#FIVY`9RR?<=Tg1a$RT;R
zO+}?cQR!FG$0TI;J5SiHvvlsAjh?odQs~`p_T+WP?y1Q`Oory{(dt@_9*)xJHn4VU
zNOMZ3qUv_*Q@WYjRWyygw-~~q)->T=0d#Oo>vC!2x&4$K7p>{KU0>y^Ug%yO`lN2s
zKC4nr>V|JsX6kRl`L$Ss>6~eA*|{IFS-p4gpQ$Ook40Y;;knzEIeNEGbtacBI}0md
zc(-RGHEyJ#hLz59y+(n>ul>_GA_+>*De0QcQ%qo^)X4>yEq)K~t~E_sib#uFD`7Us
zalusmLDYI4r(Eb8FQ*|k+VOAhx{i-X^nt3g!Q<U^mRm!pZ)QhZY;x*8xMN=1=Wldm
zbab*oc&a6h#kT;Jp|0tuY9rsLGi|Z~;X0C@YDh#{wu1R!Xa3|_C}WzFY3O;vqibdg
zo70ZG3Yp7n?oL;sP*Ui1lq?RE#%=nV?p8;wsXAh2I%*2KifKU09NVmqPYq^y<cgZ5
z?uZ)<auw2&(%H`Gn=Yr*v|4GdDw`=k%)^xKpQ6*>XGN*J+xZ-Bvs#vgsXc~QyF8nw
zbmVoE)kD&2WN<bu-D{+hkx0?3*XZcvgo$Kp0L|J{x<{>9)6NwBx2X`o-Qf+ZX~$Bh
z*v83ARc~t~z$faw`&ZDqiW-v?x^+ph{Y+sa_Y0Ohqb|;wML3^9%lNmZI+zAMvAW(C
zL#aO$8zWumJ+j||4VRtiy$`NeMh!8Mg!0KnmCX;~PPZh(^Q;luyA9CEo<8I(akc2I
ztm_J@+LG7q5t6ihJ)y&>!rGRGIp>=j5LMkL;M6q@7oMUg+nZr%v=73Xoi;$|^$8Er
z*!`53myLAFJPquri%&H02;^nQhYnVIU(;*lE*gHA<MJ1^(e#a)-(Bu;9nT8$PwDzt
zi1irPeUnSegIY#dq`jXp(DWZxYBK}qh#P;p^xlg6C#sA!)w4avzAP8C(`oe458=eX
zK8Wbu9AB!y1t*a|=+4oJrTi(<9~d&QhyMUuPS+2*pz3`CT<MsklTOtcQ%uqR#anJI
z;_KCC)u~}&{wqh_VY<tx^jTtkJ!Ml`9gadp<T$_8hlfApk02di(lzgNT9pU-ZEFpk
zEiM5+P8CkG)Ui>>BcyFUsRM_!xtm-*s{Q`}hJ7ok);_yT*1b6&cNRUsw*LU|fT-yh
zv^u|5N5fLaX3cf(y+79^ZJe=A5@|CbQ5^c5qIzmMX^A;teZl%GT5Tjx7;Qx{W5Bn(
zTl=l9ovC!)RA0k%bkc#A+zkB{4!zVcK{2NQNZtY9DSWOfqqD9)JYLzD)hJ!3%l`mR
z8_l`fn=6i-rH4|mo<hg=z6uD{!71PQr$Z_ICf9G>MN>YtNfD|v@y`I_Sct#un;YfY
zBb6omS*)+oe<cZXi)COOjzXxU)u?IQ=q7=a#&AIy3o$oYYE=y|H+cU5>Ii)*Hr3RZ
z*17TD`Iw#3+9ej=nX}aCGzzM7KA&48GXZ}_Lxc2LEk;Mi;T`OM%Dw*p(y`4Kt3#_Y
zLu-iS!;~=xY40&=ludhosAv16Q;TIBWK~e=l(9$X$s3Ems08=U$H>=3Qz6gjDs5hE
zDn@UhjJ(@}<qe|LL~1~*r+jSwt+xv~BXE9;dRd(*5lRbBf-Q6{Y*M<UM@kDV%ZCMS
z^vViq`Vi-`3EOK2H}xT;&?+J>G(nOuoV1*T9z^sq#?hB<p6A)lAH)MBcTm*P$?Mtd
z#fKq!PKnS}Qvo}wE?xYfjD42BOy~j_KQS9#K0@bko!NCbB}av6)b%mdvCM3c0B}bO
zZ62ek2!t&HL2F%wdPLnZMW?j5#U4HuPhYFjXal604Xtl4j97%<EoqZ@`E3}jS54JR
z{di(^`6aiyrmUW!jV-C(*W3Am*J(XjqSRIh<J64tUd65!b5*ZW^u(IA5uZtQHDqL7
z+qTHx{I0ba$~P08wxvw+iY+=FMxoxNWRbtI2H|LQ{*RUHx2+vhE!^d2t90tUHo4m*
zFv`<sG2+VKMb;|6*^maj3^+Q-LTV<ITL;v%S7~#4jfu<v<*MVS^}28a2`wWY<gsd#
z)JocYLOsxv%Z2{{x;_q>e1q4~>gnchCJ6$xl4{~fHk~rw8UFw`8QAuL=J!;3rk$#X
zI#^6|G-ksESZVW6Q`Cx0N{)Rts9+J66{CKW9Yr^?q*#lGwD7$AnHqXKamFod$mx32
z4Tw|JGtiV_&3LuY9Zgq6%5xxN9e%@wZL0LvsT6`!>FO{8n_>3)DXBD#3U-L5FQ<S1
z0GpTe-|ncgsm9qkV&g3{%xSf^(^Uy6H%4!ZVQMt)uBw%uoYdw_TK3A+OVb(@Qdq?k
z2|uZXIj8Kb^vw@TjiSwhMvm>Wi^!YNSjD7yex~`Rtz_(`F_P=xSe5Ag2~z3eZ9ClQ
zal?*6(2WyHmLawlyWox#+D?^Arp{)F298S7%AaOf%FdzFB9@Kj5XMSBs|8?cqcOaP
zTs(Ly*lOj|s^fR48GA1(*I=h^qcbTU)-)f|cvi!b^h$A{CeGqE%Nt~GVnyt#^)8>L
zt`3%(Q4IXxSRbmffsJ&6H#kJ@#PE!%)Abs7g#Q4Q^`W*Thaq&Sq)Jh<&1<RZ^!a@n
z*j&MUJF!8%jdjQX{I5&3J#;RPMzT)Dt_vrw=rPA5%`1#w9JDJbCPl`I2SH9CAQC1g
z4j;-C1lBOy*zxk-RF96b2U<wCG#*=(JQWbX+bARKvq>2b6jkNEprzd3EOE*wPK3!Q
zZ1nQPFUyV<rju4_!E_dq0s%3*u~t-ChMQ3LwyK@<u5q^G?r-)?k`>srT68Xg@wPXA
z+%i`k8`F2G?k?<6F4E><{LY;F#zoDt(uk(iiy9-XgtqwHI8>x1v_(qlx;)6kD?5?M
zR<zZW(~sf22X_YrO96&<ZjJ17ZEO@ZMwbkmoX}e!JdQ#%{RZvqo@j%?&9B{7)zF6n
zX6LaSg#Q3XQ>Sxwyh`5>MZr}Yy|Rsu@a!$$VKa3eq*sn;_b`7qbR_hwEDwp-2eQ>x
zQpYJIfnum@DBlaoivIvbt)o@+QA*!&2zguXR<g#~0S+4<;RjIzo8=$$00VGtm9pOs
zx_g>IvE?(<JlPWx#2bCUcSc8N9x{W1H<M=eRy6Fha-}h#gaF?H%63P7PE&3;2^`~b
zo>ZA{WWvqvq-55>LKB`+`mG5<ST;XhggE6_&cMf(_(W37;_wC2H5|NJ+2+XD83c7k
zBeussDP(ArZ)rDBdS%YJ`yy#uwcB06Or46=0zA2*+$U4L<k+L?XnjD}H2&Sv(?=8r
z@3-AD(-o}^6ou{H4T>G@bZ)b`2+Eq6M0btWAy!LMx#Mx=RylS_<F}$`Ue`>>7Z>F#
zBn|)qp5cpI=(-b6qHR!-$VME5sDaLu$iNNM?gd8YxC3)+Aufy{5;SBV**G|kE<O}Z
zt9)(4vOI)6MymF5#yjez^3dEYxTL7JwZiTBOIZXmHzB#~vyRm&rFO_;4Znbn(`S4n
z8Jt|>&B}F=%h0YIc2w$A(o$5H2LAvJ$V!+SGk3EDe`T<dl(q3X83=2S1!XE>mrtv7
zGG)KYe1#0yt7xt~m!>wFQ7k42$!Q!EGvOiFb;2s9owB#pjM>AwN=T-AhqrMYh069_
zIzy=A+Uu4Tb4?o@IkJkHF<>6ur{x(OKnu0sWCBRo%XmLz-HqLU(nldk-Yip`-NNB!
zjGYY)E*{f!;Uh=#l3GV)+rwNgFZAU~*T*LWU%}-r!=aJA&34!Of}3e}Vs-u#TV@ar
zM}nqgO($~=zKGo#lLvXuT3Y1jpC@r~<f5F=K`$5jDBkGW1&_^=N@|CWHW5!OKc;xW
z`l%|ZbonALU|{%FlT<Rwwx>{RM3y`1x#f|)9Wlm`RYL<Eb~u1M6ct5qj3049OQ^a_
z*n||t(wpCvp^d)9o<zDNt*v~-`>qgM9Pf81n4;rwL`6tkeTMh!x}yaXnp13sjewAC
zVzd+vEof=V77ab(*Nl&qVNXi%+wCXgx?v;OTsZ8AX}2G6Q1KGdF~?+GIgUqJ_`e7Z
zLi(-X+#4s;%Xfyj;HOJU;M?Bq@}iQO?e@6->ln2ZuOo8}@pJ_30mk<qWIQ!h^e5Qz
z_WuA&k?ho{>f8SSP}12v3@EuuFJ)9?CG^1G8FphlC8w5FJa2F8n^5*K-@|b!jF&k%
zR9iwcTgT~CL_@%FC|^O*IF@(pR58zM6N@4ZK(=g+uqq>wlDgM(vDwE7At!NRC8T&$
z3EbcVS_t__TE`pkM`e=(L)%;ExHh6MS~KyGttcodH71v7l}&7;n4WA^OI*vANC8~>
zZ%hfP+*(1ynruQ@MfQe_mrWLx8h)V(B3SH4YjT5oVgRyD(ZA<{uC#8bk|@L)tSzgj
zwYS&@xBmbt-fb^V)gk=F1dNrZCO2{vzHSfqL%dv-!I&35XkEFa+xNPY{YjEAHbJrf
z0Mr7xuG6A{#gT_b;maMuqphU(+(%>ND%yKQ(rN5{KBZd&t_YGpj#Sk;+ooY_noq%1
z(ZMr4)**Gnuv>HA2^<yJ%2Mc$^Ts)@%x3D=hQ1n$GDBwp%Bh~7H@4t_?*#ziBo4SG
zJa!3vn!1SG4h_PNClG81K2=7asy&u$zUKET;h~ic62Req2+@-Xh_JW8TtOTa17zAZ
z%+qfnOdQfK(g+Ap$&yDim~)Vx=e74FC|qtkE^o)(3Pxiljig)35=cmOu2Ihz_S+~&
zytJF&DUhUgH%=G=#Dcl91NTn=5<DjKD2;uMl7`%y9H|{0xWZuPizOb8jm~aMN+Kzl
zAlmErQ4bcnM@5~$SfvRofe$5z3C)tjIZ!q34m_zZoP=44Jx`PLNp`&5r9?wd>E$Kt
z?*#;4fzE7jmCO!p+ALEcklWq`yxWyGr+kBs%Lu`)TYbcX<uY-(w<I5sr<faA*h0wH
zFz#u;!YG>|B0w(Fap6a}6JiKHY>8{Z#|0z6c*y&w0SSz>+#DtlZVHgK>=$V+YDo6G
z1Q1HbLrYrk);{S29|*WR<MG@gghB1V;dh|mEYec6njS5#fq@Mn^v*1Q_*$I@Q*5-}
zjcZvU<9CIbk^(aEYj8qjbG{c4E-pC<935z?l6{(uTSbC)8L2=g<CT}KpnEPJ&~4wk
zGM8MQm<GrRXOLB|tp#;Isb;(Bh0iNR;$xc86Z4RXrk$nROa8~Qmr#hdLRip6@>P7y
zxZKc1ydt(UbXpb*TpiyCcQO*<&}?|ILc=`q3-T8Vh~}4#u0>h{b~2%^icl?OD{S`r
zn{c_zbMd$p8Q&4b$JJ{Nh$f5&V<9UE77Zm3LnUR)PuWLN7-;ebaD)DaQu{CT+Ba0w
zw!|`Kj9<E1mcBO_tD!gJa;npHx|%Jlb41a9{XuHzE9kXKdo}Hp9%FI$kFw~BjFCAv
z6FE_)nHXOIY>ZX&3E%~exo?LK7QE@Kh2}~(pP1dksj8Bmt?q)R6BF8PYbj3P_t9*B
zveBR1*PFEG!g&!tzoz^BiZ-iBb4h(Wi<{!;GS@TPBW!+9O+JfkiR^n0KYq!Zns9J_
z6ytMvDmfU(3yU<S1F9mmh$DnV1cz^g-1tKP=9^;5P%J@dvG_{RrJXLI0ofoizro<6
zo?@0exwbusR02@%Y^?-&Qd7w^Ch$AdkGmX$jgsW-p0W@Ph`8-!5oXT>e}r6>5zO7p
zagIUDPX$8h+FNN^kAx`bjK0RQ#h=6*hh)bxz>$!+w2QhY2M-A&kY3Ik57BC%w_`m!
z{)d11B@;umKWqO0Welw&+|l<6S|?-)03THGXC72sMM)dKi5V<%zR=(jH*A38`I@Pz
z?$$Ig+<c>{D`bh*Zak_cbJH*DD4y5}4G&_;>Qv2nA}~SlMncrlYY~QQn)zK@Nk?AN
z_=|UTAxdhtQyiRL%mlRZ#!0ar3K+>}?T`R`g{!Zko|ql%-qGI6HCY@*<go2`^pKO0
z+LC)jPPoW79zucPq?ZsrQUd7yKI&Eo<!!+YaPScaLnCvVJ&wP@T=y~fb9OuX6xWAF
z4aPj#F|q^gaJp&|L!TZnqHzF_;0RLY*I_?GnJH;*M%N}3fxs6KxO$N|Ij88D_Yvg%
z6WHQK?wY|?wii!bcKULQkCYu)j6ZV{Il#M%6ow~;?zP%c62684=8#%TPr`q!TsFLY
z!c5rVMp!|x!oeIF+&bYok8nG0gvJwl3@HVP%Eq(1<COL|TwQT!8EL{}$BZR=52ALs
zgY6^ep2=JVtZ;(`!1z+OVftJ?5NKo;*R|f$f`^(i9dVS$6M_g*$1&PBc0-`2WHvlm
zAp{@!L`h<Oz0_opf)=uZG3CEMRP!Tb`jpFF;BuJYN5VEMi0KZ(nBot`(mLh8DmPpV
z;W81nv`X1u85X`2f~Z=~7DET)DaUL40<|GiqH^%_&AwAXaCPpW8-_u`k&g}*$U>SK
zH2Vo;?ijxam@4yU6b1<vNq%jQgjU6r7ihJZ?>D$ZIi~l%K8gq@dro-nrgXvL*0Dy2
zIJ7ttEu8sJYx@wPYk{y+#zn^&T7a8Fy*A0&MEXk)Xhb!F#I)zaR=vW(z}O32CjAeh
zz3{jksJ%aha9GFO19cbW*tZ~YJ-R(BU=G+V<<3&a8H@d<G`ioZ#{oWBx3bRMex(d*
zBx$o-x9Y8SLXsttI*Glnd!K&8gx63tjRsbi9~WI4YUaqDkdNwjWyfS6u6b%5-R{6z
z((Er|V{_UL%2?xQ?&E*#q<EFlnJ1a7XO|tI{g!X3I=fBNcUU%AM_}vOdEU9!b-I~5
zNsXKjcL`kY_@i;I&DT_QKA)zw%#KkkhW6U)uR7Jbp0`nVrY9_q`dV#uQuFILx<|T4
z9|(C|)&dwTl`DG<*GE*4Uzd`5DIk1Nk8{oYA)%+5cL2~yC22H1nUbPF=dhosRpDqy
zI%Rz%6;-kZ#Th>(YqSoPV6>GWU*zFl&}l!Efw92@1Hk=6-C5FU)!ey_KR2>yq_m9p
z*##b%O#?uUq_}q&2*`Bs=WgCU{gG^D%Lz+y&A3xW*j#P7qz{}R{>-n?Jaq6zEb<)R
z0U1hZw(T_GqqW79rfOKm-%>r__KTGZW@L~46I^~sTab8;sSuI278CRq325LT2N3K1
zFr6D+zTt(=`6=^DGrg{pXdhsf%uFPT9G11m<#4H|mEo>t(0`k1Wiu$8cTZH}M`nb|
zffJ>)4S8tp;+ZNy<$4U3dMFqKCB*k6@`H7I+)HC2qvMn%Loymet?-bto;GAXza*>_
z6S4CPlYgmEJbDJ=LA&55!&6GembAE%mMST0AGwwS{GQ8yplF2DySdy`<B9TF&o*y_
zdo=1=dtADCJKF##r8ae}1^59LWJ^!!#6N`#OT4*9Q9Q19zSi*3g$%EBb{jAL6O58d
z%XaVulAwtlLs;#^7at_2$*4&2XqXr~*kwW~9lLy_kb>3qsvRx@Ugm-Z1@2PHe0vIw
zmT}cJjNdsn10<}^Qgyv816>s>L*L|{7AL7X)~2=YiWhoO{{V8bGt6djad~k)$w=Fl
z$5e}bcc`niIZ2jdw)ki`RM>Ic=Ou<R_XftpBadc_tD0Vs*DD$x$|)Himm6I?BV7wA
z6fKTPU$!RQZ#omED%|lcR6&v2;JHuJognz8Z>;tQjz#Vk@$VFr!Z!v>VPFDjey9-J
z*;A-cX*92A{X-;{-=rz%Y9TvX*xPkStyaTK*(HvWCOq=z9EC^I+Q~KKK2K1S{JBz$
z_eEtN*3VLF80f)hJBa79f@gYu*SMdmZl74^Led*xM|CW|;7gbat7K^Ea@$_l_)~gv
zyzY&d8BxO<wwHd8s<nMucp775fuqV-DjuvlqfvAXB0>e0Z&=r(ZsPg&G!FgNZ>YMV
zv~3_tCX}2GR#GFWYn5K4&2V8i4GC4tqc)@2X{>7%TD3=^O(FE}&y{V{-7NZ&3;jEu
zZgQv4bQZwYlOMaa!q;i~U0Y+`*0rqeZ)Ig3Jrlb+hooVr0rE){ZSU^7Dp)l7a9I<K
zkMiCWE`sE=ytw$j5Zaw(E|W@SsBmBc_U?m~cEeZF3llOnZjb@vDJk`>IwD;u7G7_x
z^=z7rN9E{YcxCKdO6X#!5eFU8N_#DB{{RqD_G`L_tSC*Qq@rmj0mXxrru;nD>wO0L
zT9YXo{R<7#{Tr?7(uYY0ro+K2SpNXSrs<U8qPn&1XvqzItez2+e`l~tSEOzAXNvg!
zO8r<)z%m^B1%&EurO-5{np$VV>B+EcM&{}^bgeeE5sOZ%uXV6btA(1^`eRDzkK)zH
z=g)j^H#bh^xY|^NrrkDadS9gvQ`)M!x=7=8M0@RpqN@Bd>DqWnacju#=@tv7b!ys@
z8%*c5y@NuZs%Gj~>B)#x?6zIGbIM;)D-_pkJ5;9AdUJE=C2UR{4a+e4Zn5h*Of&#V
z0Clf){R^Ts?xAPq>T1i_dpMh|PL)@vbT9DWh#kD#^0XrxxrTC={R8?#@V{BpqHC+k
zX*oFIXlpcDT1Hx~sO=xia4xW&LHNnk(=fqL0BAVegwUeZx{B4hmaP7F1_NaJm+?fC
zlI*|Mr7$p!8j5F;{QIz~w9QUqA#SA|t;i}aqphx@h*HzlhBV^$%6CU-6t!*q#-U#<
zk0g@O!qIL{lO9b)TSe_HR*XqB(6zE2NNO6cD%olS;*rs_;{|Bw=_%lQW2B{NZyTJ&
zRrrGqZ9ba$DXZY8aA`N%nbKAyTV+d&=_&+<N69Z@_pLUGt<_XDu}wDCafRV}UZYta
zrTL9Uzt;iW2NkiKtTb^<8xfI?1CV>Ai);N1==D8X3K!ECy12IEBI^(|S69?I`fXri
z?ndXEtW5gf=bg2+bGUW^#cTRHp1ij0hH}HfAcS8TJ)kDz(-wZ4)+lFfMQw1L197z3
zX*3t<HGoH|PUf?MFJhw9DPAKkschRo&$(iC%~MUIpKA=a9k+0UN;*SZleT+x7K!+N
zDa4VMhYsdKvORsMbdH-%BVuGySYRBL=Ct*5YBIJeN{J)i+&_h^(?1R&t%OggRJwA1
zsp&o(lj+dkEMwlx1TK$Rtb1w8*%>%%9c6!|=z5NiD{83p=^jA1bBJ2jbiRq9yVZrQ
zW1HMLSL&Lsr&+p_O{hC<Yk-~HG%DjJR_Z-r)q4ygo;ZNT%anATJJ-ES5t1s{*&Dy1
z%CA-F`nztb)g*L>hFg_$(v@9fqck>x2hA5_xg;e9{{U@`I7ux6&G<8{O6}T?r%(@j
zG?grWhY{%T?iHK1<lVMg${l;GDj901j3fT+s!p(>)U^s{x%z{mxX#=v%1}#4jAH$i
zG!s)X{{WJVM>My#25z<;JJVW|&#u~s(>I(iFX_)qL)FDYszlCfjrSGk@BC1WlwO2X
ztaHHRCxgc&`x;!L^j+&yR%vvuZBD3Mz%%48Fw|-^YRyygKb)FpG~BeD6(*z9^XhXS
z^&K{8Darm&N?HoOhYud5Bj9&?-~LpdEN)zpMVlj3&3=Jh&~s7<>!?`SJnaQLP@AJE
z9A8B3fbakTR>4!!ViIV`k;Gx4w<S{4QJU(^XtMej{d-GQ+jL1Smu{e=*PFV9yY2ke
z%B|KWlck}xL)&h^wOvrvQRuMR7Mgc~!6<nv<LVlb4x>tHAO`ohKXo2d^i@UsJlk06
zy+>1VZl436@X^XQqO{FMzH;i=UdN1`%hX>@()v9ibv~RUfByhV$y9X&&aH8wi`otV
z3UbeK;!$DZxmmQ)Xe!{1tn}e~K(M>4Rc}`VM+>E!OLKr1JAJ`ZR&`xuG~dR7?Qk5B
zqUi3qp0`&N6_E*}d9!zB$hOkZs+-x7sp|SzCq9)JjE>-CEWJ%#szf0(J&_z*>*y+u
zi0PeTgVvWuq<hP6xHJQQs9t5&JrmPfRF6Nzq|ayJWpGx_Dv^Mv=^9N&O~$p1aXsB-
zrKRbkp+MQ&Bvk+l-L6^bso^yxloLK-*lx*2dYZj0HH;FL_PDxM+`0@ntun@|U3Br7
zgC7{+=Y^Wo%|qN;$s}<n$0|5$XO_G+XdKW^Now>x2S<GHHdZn-e(q{G@u#rLevFoZ
z(z@H2+PGjY2RFV}rafDzG<bHp2ic>&)y%c?=+O{mWMFtJJpFd7R<CSrsAHI2V%sA;
ze6-LbG`eHQQR`aaG|*EG=NWaBOz3`~iO#F8fzhz!7~R73O&>s_j(}7afi16aIat21
z>K>qqXV7W0IlyAhI0!s3$I{tlH#N7Sh16Bm72=AIS1~wp*&k)9r_$onX?;yvu*?9<
zjF$_}U8d_b6(*vlLlmUko7*Y#X}Z*>(KU{ge?fijtp~+zY~{&PdU`aPwyUPkFs9O|
zTTvs8fhlxNAFAW69<3CVkT~2qrtPwaK+~%9rZ#Gd7dgW_fZ<%v)jH)=PNmYQDjq<#
z1(Hi5zKs|<?DhVQ>G~+B8!dO`=5ZG!kh5QkT8~ZX)UJ#en)`6Vyt_-AuH>&URvOAU
zoyl;*+-ZG0$sq$!bXA4?nLt0~89s5YjTqBBWu0Q}KUXiJk;RU89NlXF0M>NAp@2J3
z(xY^P{{VHZvHr_vt9}}3+l^Z^8ajqr?l3=N!p~OeS|u|?G!>FiR16sEfAYEN3s!V~
z$XzB%IyM0bF|=`U!YZ>^s%&m`Jy~e@R6|SGsvh=3EHky77Lco_(>1tc{yQXKzkB60
zW5rrxx5?3`(cCphIz3Wx@ONz}`Sh&<gZ}`^DyDQUJQv+iX|y$x#sP!WJ^`^;S|*)E
z4QV>n6t0UHCxxKpcUlb8VygCM`lC+imd0k&9W;_2Bip*@ZkLBxmBt9P8iq07rQ$qY
zdqo9b;nfT+dt;10xO;LH)}Pj0D&}mXk|tXpr9ARRdZKWHj_mQ*ej4?bqadiJ*%JuJ
zaUmAZ!Yz4>6I55hymH5Ix7}ORdXp(6pG9lra2IHgy7EW$w^vrzIvrj~;DY2@#iV`I
zYIjN{c|+{8)afg9CVFx+Ynne?Z^2FJy<4biCoOEmL=HDL_e^CE=2`iV^;u=VG01L;
zr`73nM}k8^9JC%*Y2WOTCpj<R&Abd`^vyM}Q<H4C#xk+JWvWqW!T$ikgtU0FF1PU`
zN2;Xs4I`NQTXPN<o9fzTrK;+tq`ptf-t7k<tr$C~u^i_w<QJezQ>|7P#RFRf`{8P9
zbm|x>3#MZmVUuBnTclONro<Tdn%4nhTA<h2scLYS)6W~D8QZ$Wbgl_dQkC73=-PC3
z?|hV#I5DTQh#^DNR4~%UOx4r1!?|+H$5pE74s)Y(O}PQt3qREzO<SrF9Hu}<4bg2@
zh28AaX|!5Kr7N3Ltokm#H*kKceM?8tG`PJ-RYfm?$7HWQ)8U=O9gZiu(NXE~Owifd
z@_cS8IUy-@=&m`a_N+3KP=a~H5P7gJD{Z3m#-UdmUL<2$ax6o?!pu`eLq!0A)a0Kw
zx+0#ZSAwms(&mwo+w_NH_D#jbY1z47qtSHgD74s&b?t&ist&BGrH0aJ-@|avwAi3$
zmsFmdI;tt0;ol@G4O>wyZ>J;=4jADF2R%r%bF6(EK9BrZ)O3O<^+{xW2Muu-+O)dv
zvktdM`Ko%h%*Tv|o<7UUx@wl5zHlnpyk7vVRa6vOO((4j9Kb)6928%S>d^<}E=8W3
zL!(s4-}+!By|+f~rE6p9$}vs7<@dHXa<Tmn)p{juYhbFSWjw7m-No0VYI>arqb3)E
z&@e%|3K464jmi3YJlCqFgGVLt%Hl_D#|tN4))bX7dNZ(Nz4Dv*gIs2;kTK=WCxuI;
z^zqcA5*8PEvKW)~(WgM}tE8=xMuO{K2Kfk@dODcK>Up0dJZ>t?bk!v({wqK~u}4tp
zly5)4s+Kp78f-#VoL<IM(OVX^Tc)(%f6cD5JxQrat5mSr=1ts{>)KC8)oPA!s>YTd
z(n!j&uKX*hrKkMBq-{e0x!Zyj9MW4S@iy%kUWL+idOej9x%)^5Yw{PV={m%MFGix8
zBI|Je6)u~u(CE<$D%jdKV$K#THP(G=Llm3nNY8`9gz_)?m5wLxMwhHK+KR}`@o1ED
zx1G_rZVM?xOHxkArIC+m{{U^r^#1CCldJVwx9o<c@rN5Nr%&h_gwn@e%~~lWc1vC?
zj5$B$(WIifW`n0Sy7~|sRUC4FEyaqq)ODHbAR?P<9!47e5YkoBQbJ<YXxq3C_aio0
zU1MF-+8o_Fuhnqnn@z$=#Y_7s3PAeSfmx`%&eSyb#(O?82tTr~rO;oZJXAJE2KEGH
zKTGPpUMX)*ECKx`+>fHZm#L)GVi4Bp!SA;qZ7ZW4#y_bE(|bi#eyrM>Ljkjh9NNl`
zj%_*#Z&Mq?@A`pG)M)h)T3sC!tclzkTm<Im_4QHh5wM>ZLnOH>mVp>kxa_t)b3>+6
zk65-?dji{)VblKriW(hcf&otWgRmT1cC4L0PS?`U>P<-;t^Su}e#+{XLeqe4M0$H*
znB@9n1pOD6lMFBRlYjd=;^z8PdL$ae4~#wv2D}~~%&Dk#x!X0a+Y|a;&-q!MAJ(R5
z*%@IR4#i#4YOuz3)ziKQd2?>l_fuXrH?$Wg(>5AyPv&F1bxe*<>~T|6S89}uE^G{y
zqxx1tU0X(Q{v>{zyGX-?_;qGP-O*Rd>u`4}{{Vpr^`bv79?NR3uGHXRc%r!Rbw^eB
zuRIR)<kRJ2{{Zf86dI>hIgpWA1Qjv)BF_EL`Zl%rZLUtrO<JB>DZlS|Ex*F2{{UX0
z+hATweIZ}?!BXd#<A-bi0HlRisD37O6y&y^f$lcsIcjyDkLX{^87TESW?XwqTnS!V
zsnkQ$dh~Cns%>mLtV?_+UL+;`f>~s?H&g1qrmdILma<w)n-E%yq|oYXpx-@Tu1_xA
zd;ONOlT+#KZkT>{mL|#t+Ur<?gQa$n9ZQ%h9|^y;z^2FJ<BO^cvdXN^{{W`{0Hr%^
zLu7nk)eG!GvD0car?SxM9;p6i%535Lsdb;sIr}Nk=9=yga<V-^q3U8cOf>fq{{Uwy
z^6_OQ`skE=n5X+}z1Fm?5}+BFe~rl4?Ee5|lGG_DxnrLu-T`|`u;_g=Qj%{_dXeop
z69Pi?X>{7RQg51uDaEttkZ!q_Cy!ERPt6&vBg!fC+Q+mAqAxyfr!+dfC=Yk8BL1DG
z$jyITc9*E^hK_1S1H*wAR(cm-Rz~K<EhJL4_}L?UrCuDC=#2O<8XYw1Q5Skqg5Tx<
zZbiYPG6xS)t}PtdYIP`Mnw;0SMX1x~w&3b#?rXlmP#tacP(Ge`-xJ6F;b{dkoSV`U
zf=B~Xp`v^)6t!NP0M|e$zwP>WTFX01Y5xE_=vG&}=EL1^r`IVYkQoCck*E3Df~4sE
zCqSx|rlP&@)wGL=xF}b)Z*+}5m#65SlSyMp{{ZuWS;Ix7H2bQc^vL+S+33_-FXbBr
zTv0KO77t~tRR>n|&XY&JeLdzwYuYz|kdq`-pCXZyS}5x1e=m8o$!-4t&{cdrO;bfs
z*3~%J9J!|DQfgYAL{Bk5=f~LC*>;K2^?JGW8#9>a8|2&+Y7J-~x$B)B)f#ltHeb$d
zBH3x<>KCf$eMzTPhP2i~;cjjh%G$3->)LPeSrhI!mIHD3RW$YeM?p9HliZ$KPxx9Y
zOQs1c?H^qAPvmMTUg)YCO}S%%UpaO2nJr|n4NykroJYZOsidve<^|@urstn|1S*+y
zu~}H>S5?R)C-pk!$)cN=?10))(<7&#h)1;2?r=BX9vrRo&Y{$FyGKn>_p~3-{1A!K
zwCepC?WkiLsM6x@jNG(+70pE5HLg=!?Sh~S8`-V}SDTC3B^4$8nQpArDm7CbM9mD9
zqbJIy()F1sDg$cc_2T#zAzn*I>B{I^FXk99H!8{WI)_i{$BQ4(jYWdwjdqtM9-#-T
zr^x8t{{ZIRI7<apRRvLWjB{*%mkPJ1nNu0`!#Lz|Wq(k~s$tnIZzIb^?4|rV9e&-A
z)@l)IOae*l_V8S#&^6IVQ~6nHm;p8(>?%35$=y@wn9Ev52?P}3({qQl@<1hN&4J1L
ztkRkpew~|*PP%5Z)QVR`^ZH!eg0cGMr>a<rm?D+Ep2KUa%{NMe(h<|v%SkQ2+Nn2h
z?z8<>Nvcpdx}p{sPxG<YX;Ff4mdZ)SNY9;ecGU=`Y>~uGt{g~Pj+~-=TWe_RT{Kb*
zw{^f?WvXhdV}ObxUEqtYPvP#WA2V4~x}N8jI>7xxrc7$B3yy7Q^}Qyg^0~3hHUq<e
z!qEOgM?@VQ&3*U*WEdwTI)bV^{{SP#3c1s3^?D}{UYBp)?LR`fS}%4B)U@?<@w?Tf
zdquxf7n;|^#?102FLRB}@Iv+-LsflEIrSN9_Bjj8`m#t{SNu9l3uVAyu8b`vM=jBw
z4lluQAS+!Ps4Mh`ZDBG*<CYwSUfA6uOPJgL0F@r+0$SttJg$i(`y(4&8ZAPzN!1wY
zmQ%Kts0@~16`a-MbyXp2Tv~hlrnVRQo0#Kck`>hxX(p#@Dq#$8{{Y@+KXhRlG{0jG
z_#6(`Tpq|uiZ;kWEdj&fZ1qhsk8}MdhlYNa0m{!!42^jXVFVuwrEKTpMN46+rj@f(
zy5YRA@a1tr+I>x~eKVTLzn%vikEfL_JS6_1WAYI7I&<3~o}I;#HzCczOqB}QRU<Vz
zDINJ)9TktcuFFr^T0^VSytXY;pVPiKuwB2mWnD+qGsS3iNPTF>{_97)eSE8!X(%;F
zeOf8wnWvV6?r+p8B)th^#*EjrRcSRI(~+>;Cezne(aHsU21brv-can*t2F6-O+KPX
z9(e%Z{X#koea-$Bu}5$J0D8uPKH(a!&3?-&O4=&X{5e~H=_bS`>KbfvMqWYsg$uNb
z3i8^j2egBo%sC6CZnr|+pnhU8#&WY^wR$W4DyncyPcuj1+=SCSQys4cH;&FkQ|oYg
zh8n1yPa)>x1sx>?HDqDHHQ@IPSJAA_R?!EL@H5zjUnMizEJpF!XliuIsBU6$b37q%
z(iuAo56TrmGmoPM*8}?|x`Iax3k9hBt0ZA8vy?7`v=Bv;SSX@`m(pMa5_^>)ryyKk
zD$&u4Udg01i&y}ILnlRBqc*t;7Xp5Y-dcUk+zJ=b##{ALaT!Rheh(!^)9$^|RV?Pg
z4Ax|%abs9i4z~qKJXUV;g#;vDJS!=-$wiL|2Cx7=Q-kboIZ*C5Qbe#>JafEYn~uq~
zaJ|u&w48TJ#(|QF6)h3$Ey89k8Tkv^^L(z{*I*2zYhm0=z!yVD9i4HM)(RtvDK}hP
zg>6j^_^w^qEgWU+KG1}%l3I5VE}k>uETdzlj5XH1!X53s)DhMfyWEKZvNqtWtf`_d
z4FJ@{TXHy6lEpKmuyD80U)uO{ZWL0}vDt1E+gGsDqPCizvNLezkcinS{XmbDOG#nk
z_C&SqdwB&`G)>woh?%(r{1h&wBdV$WIhr>&Eq8T!AO*M$L(NGXts%n5xB)XcLo4?>
zCuFyg=jBS$_DQ-Y*r#e#Gt$ZHLw(Kehoi1#T~DPe+Z^`6BMw|yG1EFBE9|$XmRT%i
zx%o!4*}n>z@>Ej3_T#r=u5{^JR|s{szqnH@Ng2Ne%3C-K@}rg)wEJudd{2999+J>h
zY-EM6{$IFAX&&}&V}pnH2))pdZ)^N0C73XK4Ub|J<&iFmtZ&)S-GgkGKUE=+Gu+aI
zlDVz~O5MlERq|E<O`Lv;Pa}O4j1nznuNE!fpeL-yBPbWlWH`cmU@|xLTHaPz+w3lC
zBsCRs8~8xJLm~M`$wvMFKPWk(^xbO^RhBe}ODkj|Cjt%ZjHhkQon(}4GdwW<>dCrn
zk+*;9YJDV5@33~lZF^iJXya(k+Z8oDWrD;9BO<0_#l^0BA^yUZi%jRX*|_Wqv89?P
zk-deE9M~ZvrFdn*2kxd55oXFRMlWQo{SOuP86zN=cE9xwP?JRHUTkhV6)PIq1;PE2
zxv~Msc<_Rkpvh6xl@c}9F2{sSr*n5S29;m8Yk?e&%6N<1+!W0TW1lN;XE*MkEN#oS
zB3c0?I~MY#3}I;6K|T;}f{-WWcUjHlG4XBo=KQM`Li3p2bNwr$o;F>TFkj9230#=U
zKV@jUNd#dyI1_9TtW7*MEiR>gf25QRO*FAO`v^r!!s1O!C~3eJ`9|%6W`^ajJ=H@U
zkPl=`Psck?kd{i`n9E(0&qnyN?{j>P$!LUo?IVe2k;qUsdD=*Hgtapymo(V_0A)zu
zvNB5aSxHID;37t-si&!=ls*|98;63Rg0@KCpK0@SWVNtM9i?M;_HbHJO;a>mk43Q5
zKh$9n)PcK#d#de1ih6Ke6TMjc9zq&9b{)((R@BmoVkNHK<akg~_};oY8(A0jRno@!
zdAHNLnpy~Cx!bk=RPweG;&&E2cO0Z;cpk}`4~KVEyILW|-7>PGlW(=-AYg@ERRoN<
zb)4TJU(~uM0z>x>!?;y*NcIzkxxXkOkxMj1gL4TZ!jg)%NMyJqc?xNE?=Ek*;R`Gx
zOt;$M{nZn(8mFUCL01i1Hj)F=p2tQ{0c0Skk_kgz2tHPmNz~aW5mX)5;GoT6ZFs%G
zu~Qd=ZNlFvlT!jW#_NwEGB<5INzckr$sKTSarH?i#}DE(ACQy-x7wq7NzV%bpn0Qf
zPqf^2T~8rlvC4a{&iP0~WVdUlLi-De?2uRydv{7=4&evxX}~2*6r^F?{{Vy-XmhT|
z5aEx6gqz$PcTe5CWML-ToN%znMv>ymL4tCbW8HRe0sEyerJ!VEx@iEPl_0ThZXM+{
z{8`_)M$9ZgfyL1*BzCy)g=5Qd2q6^<+Tn0=5EY_Q*1f*qf|`-QlNq>HG1!X~lEKMg
z%EB~Mh+S*AU+KzoBQ3ExX-5{@5;JN3t0y)s+*|6HS_5<kZszCV4(fLkacpv}gB=^M
z+sIFBY<S2QTE?Q7#Un@o`$~LInU4M|Y)1rejh>#)KicW71%TXcA0Z135$|J#oB<uw
zCYi4v!?nD4L<re?k8S%V`Y&PJ(~p9(7zywJi)}s+1uPEq<gpHj{{Ui)owCTl>jaU;
z1{~ePxF|JiW{kMK4g8^;kZcJUAy?H=%}sVr&u?e6Tq}s08Sa7B{{Xb9#DaDh+|V3(
zY3{kCoLSWu$jcZ**=9Hgk3G=yM%FkNG_?6wRkR_p5g7E{&eOp`5&`t4V7TmircE$3
z&@3%20F!a#B4l8DZY)}fZ7UrY@ZD>6Lb;N|lFPHtWUY@Kph=kMTpZhgR~HEyebzn^
zo7pG>2jHP<=@?shi<<6iir5$%{f_sx-y?*emJuXxb0irKVYQP>r-<57cKNbnWQY-g
zl*>j`%?6v))iFot*G4KC!)0zBKE6=;m0+rnO%sdHn^@UawlYVw+<Yz<Vg6?PrfsxV
z5mDMKDXZSh6Z@&Fr>B|`xHKNhvipy?XUItAlHYbm!i$ddS&b4|+2AMP!;C1)MZKv5
zyBmb|Eegh6*<9*pgSnh{NOv{cntq6yYOSvu#lBOCBn!bUk+?Wc4cKnNt=%0xLqH%4
zj(Z?#XrznW%NF=aWbN1+-qL;CmCZH)au*hoY~YkI_BZ;h%fMstnB8OYq>aJi(zosx
z1~tyl?4HQq8?Hw2^T<URk91CJ1DHW-bt79NvIt4Ia@S+ReJq<M2aklPgw=;e*{R!m
zmoWG2h=O*=J&qUd3L*zZBzA4u<NT!Hs3xWWlec5L5yG^3BUHy3FhRixDRml}N8TAe
z%1IpNH*4FD$I7g%cyY1F`lOL;X){4j)bULKj-+IHR9dUzndR`fIhViD0Opc$pQkAR
zEd&gC2@+n5s3p*$_UHCb4g-KbZkR0KlWA$V%E568jz+r8Bs<`yOHS7du-oG3M~gdf
zz3!hB?_u}kT{_tp79-gB`M*4-@3{9`$i2*&gm>(OmN&4FL9$_ekUGHJaFM*;<R66c
z0Xa7MuGxPJATh4b>d(kh#2>Vl8-)Xg%v|I4OB94U;~r0x!n92GwEnMY@}oB3=jf(v
z&2R!h56V#15<^H9{^&4t4YvFcN@-(&xFmg%4v60Te1yX58yu}>L~MBi#~)QD3gXtB
zwDMC6NH^hUv5?{c7{YCUN*+MU;6d((K|@%6RDiUM@}fC57%5s!`9OLfat=Pp;!E-@
zQy50#3A&ThyGZ~QhGG%mChj)m6~sBXvHjBt&9D%lSf<>9o49aNI{qvYwY!DxnFz$&
zgJl!92PsQj+}i0J;6{6+WZM|WTjUh-8u4yE>OGy>cwE<J=l4aKY;$)94|Tv(8`|MQ
z*Phn5%24Cmm4mWiY@E^v86w;$n;^~8ht*~g#Jcyr)RD?Txhfz}B`uPtKxr_@>PK^h
zJaV<?pR%eV+$Cg=XKv`)6N6nBBEulrcJcisS2Cy^Udmrwe^5e=Z`tpWM)J+l5(kSY
zWHCo_Nx$|`YduG&X>gxbVCN3QE-TJ@m+=OAu=pvOAd8DLll3b+mg*!_D{R^7y;rAc
zt#B^h@GQLdsygnXz0QUQ7?^Qja#mKZvTB(Nq<x3|$CU_@1AyC}=HK$Ni+!2Dp|d_p
znG2rxIQS(fB0tpOgr-4#kjJ^|!%OM<+PPZ!nBc?N!pgCWVmU8l8g`wlYZ3@_+DWGW
z0O?^`x=w@|T{~*}nyvKA;6%%Baqt$SM5)y@eLb{VNrD$2)h^A&OG%@>)j#T5r1Mu*
ze_Y1{=o9tOyM2=M$3{C*V0{LY9UU>^YMDLGAMmuV(=?qHAr|_2y1QFsZZ2z2%BS@u
zdD|q<+5HSQ0Z96Q#)d^3V;>xpY!pn$cSvM=n-Dp-7DmMsZyv`wPb8ZFfP#8JN3Pe(
z?+qXFi>a^mA@r$XWJAre5U|s1Wkgit5;%Q|jj`$AV{t=>p4OL0_Lq6Obu&F#a5sGr
z_BDqww9JqAaoqVRd6^@!UnQ@@O_bFQoHTobN5J7iz~JkN-0z@T#Ymn9)dpBbBag{B
zDq}ee#6$l8sD#!wS2pgDMm|nT=LY`(Ig#Vw*&c#)Y<ro4*vE5hp&wCE3yWZ8^Ziyv
z!|9jUu!i_9xlXUBdsrD9MUnTjY=xSNr&Uywcen>0Q=+4&sym+Ue3fTGM+H=kGL}T%
z?s4H0s8#5?bVfQ!WUQb60NqD+kG~5#G6JQbh7vc8$Kf9o>}+MM1OeQIR4S#PE-q*}
zvUHNwIlE$Io8X&W1nfEsH4ol=d9sc2x%h|@f2zs|M9x3Ojic_4_eUNij1J*vuEMqi
zVv+B&-d*sBsHtrYF_u6Y#*Ro-9YfUgI$K;EL*yNSUSHJRSy`$|V>3Omc4#;XeD6qV
zOS5Uz--uBF>UtJ>uHd-vyz^1jrmK*;Su*a#s@WxR;=}5q^$0zQSw{A23UF(M$retd
zY;#oz3CDA86R4>wYTaPVkASuvKcxzLI8!n2{{X$Jsvl(eSj{QaI#_I!P)SozKdGM8
ze+Hwi>V?0XA~>yx;}-tvdU|O$2RH`&HMUv}HI8#Okk*f)+*jCnItHO<roaS0va@5U
z_F3^e=n|H)A?$U}_DtMfZ;!B9vn8TxEgz@rrM{*%M}94JXy`g0OtUooAXLBloZAIX
z*d7h`l_TC7!XDco*itSf)wIV$vOO-IH(M6$sA{U9X>;81&KebcZl_NT+C_lo%N^8x
zVW#Qvk|T7}8~bmBj#kF1MgFU;%Ntzg$k>?P?kmo^i>PX==X4a4IsLBFg`3oMZC75a
z{$@f>8aM%J`d2^^wXcu?bjl6(E0XB|X!;zIxJ_0!5^}aWRU9z}h}c8Cqp7sV5Cm|z
zf!uJ34u*r>BS~=V6&AE2*lj!>m<}T<S60CowA1Y#E`x1s)qrhaia+W;7H6q-N?2d{
zdMnRR<7@JSn+m1bYt+3*`6_+XQZcSL8<ulS>CUg~8NGLHbU@&})(Xd_beLeM{{T_y
z6C2rUhCJK_u>SzoI#e)-wCURmTY%Wqw4VDZZLjF9)4vKeYDoP_swsgTg0s=|+FdTJ
zHnFj|gULeA)LNZX4|64zv42yrvTmBQSFSYl^2<BP%Yils#m!4d4~vai?-X4}(-bsC
z(^W?sfc-6AUHFI9)m=eQbo~lB9SJ#mfdOfHE2ZF|rfjvXj%ShjUz`5w^I95obdEpi
z^pKD+-~d;aNk8O9F^Vu9JUXXM(|tNtGBQS9;;<b}4x?GE`r6K;9Ob9<1H!rL?Qc_(
zc_^th64*&1(HoUt(pqgSRpM<;(@xTE;VW=TR`~@|H61<Fnof^I*yE%QcpQw~S9L#G
z*6KHoC_Ole*3^IdJasTN5W>fSn;R_7t<*gUr(8iuB?F6_gpIFkD_sfF-EC8*!RZ$p
zD@$tqXI1Ia7@OFan;fq=)q2}Zo}<&F)1wT(VU=s4^+iQH1F0JL9D9JYDZ70R=G18(
ztws1xLqx{SuU53QjD|T0)fz`h>6A|zWo<!}3^Au9uRYazv#4r;j8)9<iz?=8Rdh@b
zsC%6u?(ErF&K1!W89!uIR26d8Z+z0m-Pqpcvgvts4I^yu0aVui04U0+={caSt~FY@
z5-?;m@V52+Z=mUPzMU4B$B-@U7g=MCUC>;&LpqP~J6seWm!{B*B(=9}vh#|HuBYls
zzfQhMAc@A-?6!JeQOB!PnQNHXq8SYXfSc6X){##eMJ?J-c8~6d#Si4&nPh!YTL<C(
zkx!?(dFGN?ZF6FIRee36X%$-WqpGJSm>X^vR~lDR#8?|Fmyf-|xTV&*cpdF|5*(ea
zz11o*>qP$mXq)bx=njRTrfp1ak9ZgNAN-<f>onR@Vbk`y*a4w={bsiji~gDlsR#c6
zNmNx`WnH7O?~hH-mz@5|WS_o=i#FX(HA?DtHYc(mMT3uJ=8foKHEX5Rb*S7gavE}~
zHGaD4ZE{~tq`?`%48qxd9CSq5lwz|{)E%_vVRDr#vH3cprn^qj^fJ?@*G)X$IaX8^
zU1wPU6i~a;0~?Ks+1IzFdUV=R438c_DvwkANT7}<L#I-U@$DEvO?}_`4-+@2(rb>C
zGgYXTAbB9%FID_C>Ae~BW7Mo^BzHObuMO4p?OL+6(^bk@5#gi4wb8nQy`inAG8T6^
z7FkV4az;^d)K6dQ{Rd2;h10_%Z?N-~fYZ9RIs#)3Ynl!bI)1xJRQ9sD=1bs*I^kVS
z4@=2TT@@4$dF<ALQpG9lX$>VPX@}@q+jUsY-Lw(yS-->xH3+HRX(txjkmF#1t#{<y
z=_z8Uqi<_8fL14{b<IYir_gn5k~H}kMsaOb0Y6~08dY4Cm#a1oKV|9tAE9XPb3JA>
z+mcPz15J{hur^AW$$!JLp5CQvB``%$=!iHa7``rzsVhC+t4Pr)=&s4x8;HGymzec^
zPMs94iIBxHz7ETj9+fp_phu}+BcZlPD%e!$+H*ZNL@FmZ8?tVngPXgdRFd>d(RIB$
z3q4Aq3=((Ughy5WC1~1YE{2WK%I+-DkKI&O^rpGgF5VeWLrz99n<`4r!s;4#hgNE3
z#`z<J@|#PDsyv;8X+2KeS6CHwtPYCz+2wj1oo%AiY2rF+2>nnjFrU$%gc=QHAd)>v
z#n$6@{3dm0;fxwP4DiV5c8iSinZ{9wiKinaJe^O~ReLF@%rwOEII`2}T`NtaQu_7s
zztjTm-NK>My0cl+!KI?7e%AYLV<j_NkE*rkNuIPZt{2(`f`f(s02FmcBxC%F-nHtw
zM#yL=gJnEg${v^LU2dW6)M*54arXdSWt*R-CZMcz($tr}_afI;uysDWr$OjZ2R_^Y
zE|=rs-(Z$UKlFM_ddpeq`U3@IC)h1^y9><v(_7d2y0Ax26rvmQGOBeK^=7|6@#3gs
zJnbuK&`y^`i_@*DgbaSMl_{<}kYKqwK>Z{5d09}%-BDjHGtVH77T#~e(@jQP{c>y%
zs7o(VQ8aFjvJ>Dmu8v(pTLv0xjf_3PR)o1NB6E)y*@3R9hf38=Je6#z0P^;QtI~B(
z%u<0*QX;tQR9c7OjU(kX6?IZM=Qp~7PL6dfJ89}p-q$IVWf5GHDz(iTzPhZR^%qUM
zw$o(FZkg36OK0^O&^x23tLplCVjf#Iat>4VUbUA|{seR`j`$~H&-niUW{-4T=(>c`
zMA)h|jhjWR2m~t4eUy~)I#{*F%=aE0&CptQho;rH)vbK-NbK`qfYtQ<4u)OOxzZ4O
zy>2pU!_RaVQ%kGMP3uM@oq%%JXZBWIFVp&sd2Fw5rDMSfdPl2zdM37#u86dQZS8j}
z)3mKiM0GGUmJK5Ogd;EfjU>B?n4X%iP7M`KWQ-rne5-9IsybqVJINa%m=5EWmg~J&
zbxCAq{{Tgnr)HxpoBsgQrJ11L^b(PBlXNzc*|6&#vi|^3{uY<F)F#a!s(LxPoWegj
zGg;xvZ9h@a_L#K|Ewu9i$!^jL%=K?m)6kI(45jRGw#Rl(uqds&7v*oQ7n-K0)-<pm
z%S<JVj%=}#)^!bKU^URiD{ql}t1Sm#)n8#e1VP(rx{FwRPpC6CQeNZ5tU{N<qbs87
za+G_~yXk6uE=o39XVK4Wf^HC<L0MI%&KxUQEJKUrA#@&=ny!pg4MJ$#Meul39ZjWI
zM^tG)Hu{WnY=zY-ai)%FrlqECbd7QuY1u54tsnQW8!FDI>i7&UWO12aYc}1GeI3*N
zO$8tQ4y6%exq@aO^`4g3U#S`D<EM?y?HI5>WfbQXR8mP#W<I{ZQ=N}-hD`B-QT-1-
zq$?ZhhX&t*J1yT&(-)7+R7Fp_%D#U~)IKZ2=(88NuuBQ2{EaMabX#c^x@%}HHAA76
z+>RHM{wL}&jZwdqsS>x#e4{$1mtNDH=RJ?~!Tn6gSY1w9nyEI)5hnits@Yu+EM*d0
zB^PD22E0TYTnnr@9ID+;dYZX+L?8DG!$hNFST_rw1zy9Y)jhtYJs>R~%-pCnrLxON
z%jkVOscKaXYm3;+<l4*Av`&<Mn+qlX08^69<*ztZbamDGdv=i)J2+UXE~)B0esU?P
zwrzF?rgEzn4mCuirG1`{{{W|SjZP;z7eeW~mb<#o)$~rTWpq(hM+m+*1w+$457u)Q
z*HTtHd;QxzLJHDWQFV<74b)<&X#(5-08stHg*5EwTS&<DAK|}KLLEGMl{3dC&a%zX
zbj@?-BC2Y4I2_#C>t(F7s2<l{&yq9ql}|yXY96Nc%^S~lyx62tb{3;u7Medu%pq&c
zY-m0*tl!h@r?aGMY!78y1$AX6Ka9dZq}(X$^*Y*t@0sKrE|n<O$h7Z9pH8Hqa|rYp
z;5>_zE}+VKNer<>*4vAPMWky_pqJeHj^L{ub6BFTr1sga9tt%Ug}E-nD0-%nFj-pX
zG;j^B5IXg4ky6t%HS~@=>~m~ZF0N5LzKn189#*43{5+-9Y1uthYnb<cEwF~#3|aw(
zzMe;IjwUt3hcNP^t*@vIF}_mvcz0!asC15>q>ZAcFz(iMu7{)0B(8s?NRlIf;n_>)
zr$s&+R%W7eTQHhDIlen9M)jplGzOYj4AJliBo(S>;lQT?SgPAAZF1KIJY7Gey}~J|
znCS)yY0c1*Qwq4P9$l$wk=9FgG3+Gp@&5oS^QQHQ^v3@H5+@jsdt5C}tDsTR+zMdk
zj?Zcek|^M9qNFoL-GE-pC&!~Wxps9`L%M~({x1wNe@H{=RF#@#c@>m|gUeiPf1<ge
zmXWUp9WC*^WVwynS8F=M{Xb9Bdz<C$$V}R6U`m;yrRu2ks%H8!%MkvDjl=g>8gJq(
zb!_y*>@8wg?mo-N<eW;v*Gu+Ry(Og>YDBdlHa8o!&B#Ah8DmR!QZtj$d)Hb8H&Oop
z)=<|*>W}GjY*(IE^i5S9?UJr1PTpJ^?Ady*qXiQp^}~Z~FTIA#3$N<*^=xz>n|mI^
zW}Z`Gu7Q@q^e&p|D%eM(S0x=t<&QQ)YSGD}ytbcEe$m0c3Zm)isdW8I*OaodHyqm~
zZfjYfYZ`v%NF$Qpp!Qt}#<p|2W+}S1p<h4c-7DoT#jk~DOQ(u4a$ip=&7RyJx~HC*
znr(SBvj9gII98{qtC>jX=YlzIEDtI(m46gg3EeUsTDn?x`)HWw@+D#dpIy}Ca31Gv
z&9<9`QBeAaR2fW<u{Q&<(sb`r8Wy%G=wPU57P)BM`>8CC*<X&s=sNytRv2nw4;*A6
zt9rZCkV{9kuD=0X&mNDj)49#j9@(vpwgqP==|4%u<{4rmhLK{Zq@~#@M}yNhJvpp8
zwvD2xmn3HCy1cBUe)@WeV|A}<;bZ74>U68^Y?4MhI9VALc-N=cWc0y2D=6Y>sFyse
zZI7F(sw1iba@RB-L9trim+A>?npodTSo^W!>nEsmaeX_UZ6iRv+H$HWW1B{r@K##f
zvD~Swc;NJkJd={!Jyx`6m27l>mlX9K_MN2v0Kr&Ia<-#NpVDD2VK}}Df!$42EM^I5
z#H8Rji;?tDRB6@K)ZV0WhufIkG7*&GyEJjh^c4ABQw84gZZCqfHO&0ATVLvy5OIsG
zE|4Jfzb{k`H0&0=`B}cHiL~{ne7o7$qUC55q8%MflT)3q4#(<ah(EHbZ5>?G2XAx8
zH?i)jX4C^4wj*zlrqQ(u#?@|Xo^#)XBNr1&e37=(A5{!NuBLEs7$dr=)a9+GozEgr
z55^YnrZpWdwkAhg8K-@+=HwM+t!PopO6fHDp`Dh!k0`kNK~nV3H_~+)$z0b{)j6(j
z^19)APfm4P<ECvkuSpeCZThY5A9d%kRL7)hSE!|77qfvFvfSx0=o+ObtptLeYhP~b
zf~kuui=tD;m^V;rKb5I9+9)jDmqy`&qKB?xl9aY;V@pucmoxN|h3XiMD_y$84&#O9
z`sS=7k;23ug!wV4J7$JQ9V2h6bvrBIEUggKH^bNszUsR~)Fh;<^=RpRdUAd7x-IQk
zO){j{*S0r0*E#Kl>i+<T)YY1OXqA#$3uKIfpraP}lv0w}wdt*QN~@;;(oag^`n?D5
zVE+L0PC^S_6t#7&4g9pw-`p*=>eEoB(<-7hP*b)Fz%eujX(!}xSDn}OeN`o7v|5Bw
z&RXrFO`sF?T-h+>$17V$R5HSGu8&{o&X~}vsQ`$?HxF}05A2Ap=sur~ru6X0ZID_4
zUSXj1Lt=~7hCm3&X?F_Fey-GN*axcU+y4M|Z}ce1%eINeE7K3w`aYH*;iKx4(aHR=
zIrnP7YA@=2Hl@t04wfKnTrZHV^&L{aR~EK%{{SW9Bj`|Y^<93O{2I98u7L8%21n4R
z#l~HOCn)U#Qo*L`LC&a-SfoG9&fjGii%`&K6;u_im4iD@FZBu9o~NbO13sJ|Nh#(s
zaH=1vJUOhZB(R*DBP>+=1an`b&@^wvc&CIxT};>|wTp-8DjLq9(j74`Y!*G*5E=|!
zFI>SJ+*;x}B^{`Ar7STzSW7A(BKw%(cKwpLeGIZ+V`8n*>mDPHUrp!q*|<P;4wF?A
zH#V5e)0?zqR(}sqpL_&Q3po!N3uUBr9SvO|hDI9^Yw{3KOR!3E^|Q@Gs^EKs6;jhU
z<898<^-ZRwk@Z9UMi;m{`Qty`U-gv)k=M3*Sc{-`ZUxajKUDx|ilUr@<h4_@BbW3=
zP1D+dr~Jm3R~=kqCO6^Z{{Sjh(alpIrd%SJc6Kta43rRm5t3~BVOQ2_l+(Y{W1`$m
zu1)^{x>}T2Z8T@6g1&;RHemL;{H<S2)K^Nv=$alt`rRygZDjPN&wC|^kJE7AsVnF;
zDhK-7Z9}1df^eak?u+3x^<7g9GhGI$rUCx|bZx!9%BnqkO%F2DRLdAY$n1~Utn2!Q
zu4z9ft+Ei~fhQLGqCfQ2dtwz3#>(nfWco(r1aTz04oO<kbpEA)xH4GVD?EXe%DqO4
zsux8Jz=A(R)qc$_vHD?#Hw+d$ScD9kJWi8*6<(R-0_>~Ovz;~rs!&pg7d9Zrd?8|v
z7|3?w*A5)hYby$<Y9qw%5;S+Zf;uRwj_96Rdxg0~6w6v3u9l7_!uE-pF~9kO(&+tJ
zSmy~pFxlzP{@KYNWtXC%rhx613%v4ea8lK2)NOyO1m>0e;Mf$IFh#40TzOh`BY9QS
z)WxCEME8@(Z*Q`x)pZ)lVms+rSmEE5SJOI;Gb)5t(neYj`+$Fy=o0DLPN_^B*NfW@
zX~*_l*yB%ZzDX+4=P-uu4r{OE4$DD9rRmy(J@U7Gv)G_|uSov@OM6`mn}dywxeAa?
zDR^*^%y8nxcXqUK-pw|l(=~L1)Phz|7e65dO*AZbrywyugW#d5bxl#s^qW{n;9Lu?
zlFkLsB)_@0D=S@%9hOaWS+NDaLWZYLietJrHP`LkSI1h`dpSimptu7QtZu0p(C;54
zS5#5DDM&3j;^8YGwk>hpT1{0Wnj0$vfc|SC{b-u*00*+XW{!NAS}Lpb<~@bMmU7R!
znp#=Q;dGF^AJo!9+j`JE-KNBH6;`JlQ#s*)0DC8GGBnesN2c{XQ~|K+QGQ{Ai3jQm
z{u#8*MVEqR8~*?!`B^4J91KqvAlv0OYB^wVk_jB&qAE=a(lyM|Dk&f9Y4g4pbB;e`
zRVJ@r72B!N?qg5;v5tOhsWeWatfwLx#x`bK1mOPa_6=iBnfoM-@B(>vxu@>3$s77I
zi>vIP)6#Wj{{RKimmb7f!|a2o&}wNMUr95W-q*sOuSTY*kj)X=PD7Y%g){3~U$i~7
zF?fDWzN&(v7iyK%#79|9Uf=3sHIh)*Fct<E9zo<NM^Hl{Y*jjYn&NYOfQkH`om$=W
z@(A7k0BNy6&-((KNp|x3cbMJdu|Z2AiT;&LPRH{FV<UA6JBANhG1&8DJeBad)|xWM
ze1(F69@Zbxlq8HTC0qJ*(~a?we}aaZ2NvDK1G*+aOt}{A-9<B7wAfh|A^_MMj>(fW
z5nzKDuMo0M9bw$0nwlGJVY%+4mAeMf{gh?Jqa2~84YIy?gl5-Lwx}|j(%~$vyNPwK
zn++ozOW$Gwl;Vm-zhLYa;9*MK8z)H?)9n~hxI7Ekgq%mQ(ntWwNY^>%7*Xxb%5ZyH
zG0IyFga&}iyO4!+%#55V+QB#Kb%%r<d>aVZG2ZJV4K>m=$6>OK^15^GCg~Xs`NA%q
zowo$z<q$HqN>~1-ghd-3+XZ_Nru3}v-O8&_A~#+nUV+&x!Hs7(DUj2?R_+`sqb#mI
z;%*VNwU1+VwDO9OD4JS#Fyx`#c=MD%bh2g12o4r^bx6!fM#w!<aoHnhA=^p9g0ZF-
zZnfL+hjiQ<tEpKB9hQxevJXx`2wDAKN{*VSRW-J4@_ZxXm>V6|vL-p>o+Av_Amb@y
zl#!EYNN68D7?vO7GT(o)hAA6QC~TXVn_t4O71iA@SS5z@P&wIQ{$HZl(=$iv`V%z_
zqB^iW&A%&}QN0}ymVhcA_?p*l^%zCNf)ZNR=iDx#)aYwySo&9&0^TmNb(K{NmuVyr
zxUyrFospDk%`}x>5A24PvE&;noj$kJcF9hBtJw6}CX7B39gZ)Q7A5RwljyE9NcjNV
z;qZx#p~K$Wf7}zKq>>x%jN{=BBzqsU1yuyPB<8}5B0q3&a6SrqYFf-%;ST4AFzpt1
z!enl7a1IznD<;@^sNCCMa8TjSvxUdXo(fjYn4MyK6hk!G*e>f4@Q+4R3mr6I?}@~G
zD@r-#i~#TAGq_O2Ohc_~gj7`WG=s2@lidft%;{__3K?5)Om01wHGmvD=t6TT?$F}f
z5y?Z(P-4Zo_(<IaFqX@*+qv?IW9jN!XKg<tl|?OSDi&0hA5n(ICD`1kyOExo?7~ZY
zrH!T5A;;wnOR0$l*;)^4giF}R4e=Wk$%gEhv7}t(LR|Qq3r+KYxstx%9s+Zo1@{4C
z!hXbI5mZMo+VC29xlNg_gx#(Lc~D0WsxJ%u-_lceJ|bH7ACOY;8BalU^^M(U64!YO
zcS*cjaq2Yp?iE;Ua`0^L9ut`Qm>p}Ev*jA2a<G|c-x2j`q$RxDf)tFde2fg3?*p6i
z6C<gLMpzp=xFImY*ShwxS)|OHM6y8}z0teupuW;ZRDeC5ijCp!B--Clmxy_eyHB*6
zBs-bj;FQ*upJ~IB_PM#W+L-~3w%|zT!fRZ{k{xh<LYOe$b3#zYJ>%4l{!<DtO6LBP
zaoiOwHBv_LBxTKT?bxT96K_(L;n~b?<ulZX`)VUGzsgp=#!u+7WmOe>LuyausyjS>
zl7_2}dRJ|j2S#|2xdb65rGKVeJ?uZsI8nh-H97Rly+}{;JY0Q}D7f@d$xE=KxQ+0T
z_MSo>LF!!CwEYr^BM;pXF`n%zc;sZ5lEC>1*2%pUva-Muq66h#zKN1B`@rynbq>c_
z*#`?Tdu40cyb$q!3IQ37*J&f@uAQdJ8@@k#d=w1O5J=$n1R$iIhHz*%OVwWx5zGsj
z=E~b-brJfM@(lJ_BIiWway%4m1!;-l%yAw<aZ@h0J{N6w_frQo;9Cd6j-H}A$npVl
zN5tlzZPL)mitAj5i-MZ?TaAwY0O2cN*~uQ;J98Ws*^Xt~jHg&0+47wfj5r}kSl++_
zuu&Ttc^o7=fVmh?B(oqVi5V+x`dpMGA;b?0feyE4A|r+%?Xv<e+;F<0h1TB-w*=G+
z*$K$a!AZ5*vWS<)?Xt9v*Rqw4BHh8|V_1W+0>{F8PA_#JjgQDAd=#FWn0><uLQfOP
zZI3<^!`>Zz#>tEunh*C0!LDfL<I2EcEq?K5w*LSrp}RpWJ@`<y_BSeKxv%{$u~-6<
z9td^_Q4r>xz}$Q(9vt3(!Wr^8hrO?mv5Ea)@n^QdMC*ZIE}<_E8OOrlNCM}Tg(7v^
zC&z^}Ehj8^2e?tl$pH>)ZY;T*j~>z!Ft!^RYsH>6A1RVYw35;d{P$7CBd@kmbLCDr
zu*g^zL4e>KHlL0Zj*Z)IlWyaXo?>p_a%JRa2IJ)hlNmOFDyo{sZK{mQ&I89GRMoIb
z1K@a(qsJj#PS&_wjGu*5Q>T+JtptXiPR;`d>J+{&qN_HxEi-|PTI3Gk<xd^W#lw|L
z=BuQbeqt*h{{TA957aAKH+rB-(ky?SoGD5!J(P^o2B@d>iG7H^M}#{qCJDQ|6{8J~
zN^;o%IQ>9!sVem62a^N9JlLEpnCyl|ToCqLTOL((v}|*+gnU&pG5(EAWFFU3NfdHn
zuCuLig}GN@rRb)KvcU7T*B%Z+C`lZG(l=@H6RIiXg~Z4{jvdh8HQ6IRRTjpKnIqcR
z?AzgU8gGwtS2i(hT!OiQ(YzM$m5<1n(+Mu<oGw3<s0&GU$F{^G8uIHB%O4=A%#4wt
zlQ#Yw5E0Fyv_#?hea*U_D48pEy6rww=8e&iT6Z(C9HQvVayKAf{G#+_H6pH7)Y3eV
zZr_AOHmB_&*ZBzfnAbG72Hb^PRY20>SO`DeWhBL?dLJX<mgS&){2@(&Ao1MzP?Go^
zvEZKtItRJZV#R7L7ou-X+e3%Byn;I>i6o3z`<i?Vq9P0~_MMLKQ3e1-%RoKI;G<|+
zwhGoZq+S9y_`QmJ5y&JvhI}4UOGS5XiN%t3`A(&*sE7D<v3jlI_Q*vmIi%>ZXtQq8
z8hiYuhO{x>oVT&YQ+6^)_tQzdcsztGgxt19e(0poF3U$U8KN$Y_ZHz$Y7iE_&Gv*`
zVayw$amQr^Orld~`&_fxTy~jVo8N=wJJb#y{Cua&8EC!!;XpxX&8$+@oeF4|VHpPF
zvS|ak;WdvS`%XM51KR94wkuFnh}<)N{H8lR;_6ocYu!fscg7H^Gp04TBQ`~3w!q)W
zC^uaok<B<ax5{!)OqzH`3vNCN9_75E;hnA<Uu&h3Cde)<vSP425n>Zv9tmi;Qpph<
z6%izV%5rRPxu>7(mvyav6RrretQ2nZ$XM1D1mu#}40l~LY;&%|VuoQi=IUTW$2K<Z
zm4%``q;qlfPHT<*!s<Xs1UOtIc<#)Fn=)f|vBL(*g|;?N1OR-lEeC>t{A`ZiLU0(u
zQY?^-qsqfAb|4+RC$Z!awKO}khbheh*9b9@G;%Qhus*3|fv;&S${)T|)Z*^AaIpDB
zIu+XJf=JxakeI_`W9Nlp@(3Zy387&=(r$_+DSeS#aCk`QnBnq~;mzbGi7lQG+5sEl
zd}o7Y5pW{N!7w;}Q)P}fG?twBOr`cr6aqL;Yk?-=Fz#ju`dKi%;^7*wsRagt6M%br
zVM7eIA9O=xxa^hLPDeGwpLcZf0A>zSSRNAX2cB%ThNx(ME#Y<vy|TJUoIz2C7L&PZ
z_JPRfuz)T5rtXu^_EK-Y4=FAa1u<*&TAJsQ`CjXu>9IruH(Mu=xs=U`gBzT*oh#AZ
zOVrY~Ei+Gh+HtzpAG&B`zv7N5OWS5rR<OymFu3>~k@{whQCjBv3~fGFtq;Mv?GBJu
zYjyNg;0u<QT%oBbX<PpQ<kJGcaQ2H`R+7+`$~_CFVy1Il>3WiO+}s7DZkZ%)4wv>R
z@k;1kTE_r>c~de;C3fdOaUJ^wt%M?il2;4I76)^HlBBuP7Rd18Fl_6jb;~_7Q6qu=
zMic%N^px>{Jxz=r59%pc7J(V*wZH-h@#PfOi81N(z*82+$8D#k-tX$NiS-_nto^qg
zuCulfh^ZoA25G6{@X~I7vLn-_V7Yej-`YZ~ZB%Y`{Ycn*2IQ3Y&n2!S+TW9t_E~7(
z&{U?K_iR+QAJpuX1W`Sb2Qo{4+SDv{Ra437#ZE1JxzDium5ertww72TcZM64yEjKT
z%1`lsa&DIJjGe>eBy(8cT-RN`PbCK|zst0>qx-EvEH4;t@G<4jxAsuUQ5$SBTzny7
zw2uvBZ$CVhXG=!}f5dwoGyedjoGiiY>NusBF}3&eZa(T~`Vkz(>&Q7SI0`z7$;(7Q
zwULkIVaMGM>&o-Btvh_B3SVN>mP-4*#iN~#z*2_;7-)%>9lI_Ox3po-`X`uWBsuM{
z{+{bAT^Xdv9LLDvv^0GJk+C_X2Rs4wQa-Yh2LAvYhJo2-I<KuMX=8IJ#9{We`LYt6
zVl-1__Nl4R>ChL>ZU-ZB^PZ~fhsx(gMAt^nKUP*#Sk>!w2^}Mz=L7pHawRw1(td7|
zoVyLB&_<(L`iGe$B)Io3x(Ye6c92qtC8%&~MTf^FYPx%%b&W-=nUR)4f0@F{sVWu7
z&QZ}-*Gwa)jL7F402bpy{598SiL+Ef$RjzsirnZLM^E&P1FGwt3uR+&WO?AM=BfCF
zU9HxdJpw5tj`sBk+SGX^rM6Dnc39H%zxsF#4vf2kK~^;ManiQs+uijA1*G)#Ozjmq
zuCcyDlN3h4ebvCAjuEwwCf_`)+x9Yv6d)M^k)(mxBVJqp^kOY&<dUL}mS;E++z#ZU
z+YH{FwzqGa<z~=h*$ZEG2H?4LP)h8VhW`L{BU=*<<RE=eTBfNLI}2ld@!2C|Buy<?
zrFEYmaUF`G*LBv0;D&+NESFOCNPxZDn)mh#3sGOH>eV65dz#R0EK;Q9p{+#Kbq`Q#
zQ%2~hG`hKO%fks-Iz0<j)GB>is%nN@<T-_Jx<^;kG`e8NM%i816@50du2#11nx2|7
zz-tB3kLvmZN?WrprD+gSMjGhAaPk(0o=R$XgPPXhU|m5S4MjwS(n#kE<dMoY9WA#W
zrynZ2kf}ur4yRdF{5V_bLNG`~P5CM~4Am0ub*>tFs@-o~)AV><6Fu_U!L0~Rn$k5M
zrj*rA9Zvx`+=cPd7Om{5)OAfuRjD-ekNmwkId>RZ&Wq^{2(#Czt1?ucTpe`%Tcb4U
zHXZeo)JWguW&$&$G&$cU*y*KnFMu$P7TmTRu}V5%{Z*t<f+LB~k-dPqx}au+%0enC
zB5ZMtjmFnriPSniwMzjM6fw2j2T1T%4yU9#hf}C8)+>D|@4$8w<W%h;V_w-wuj<v+
zto)vvPf_Vw$74wZEsx=@tnC7WZAO?L?p?irl`KV_IYs$sDkFQX&B0Vv8fA8(_f=K(
z1a!=I4BNt3OX$-}*`(@E#a7do2sD3xYYrAyPN?eczON9%*(vEs$Zjy1KTE*aOy{Us
zC>hHvr|CYTtI=k4HkSS8k7(r;6@R|PcmDuW+4=+Uw@%V&n=NHCXPAq)za?kC80hqh
z8YwnO6b}O7t+C3?Y8`LZbG@*cO)FoE?#hm)eL9+(^IEKq)as6QxNgd;eB-SlBc^$U
z6(qWzqv^Ts5nkJmWqGLd-i1d`Y)?J13-NUaQuR9y@5|}Gl^uYN%Mx`enyUOdL%8zQ
z7QG^>OS0~xO@^7mR@1N!YzGT@_;VhSSM988T3UD^3DNpf-3w)vrdy0P?OW|1Ns{fB
zJt7vgcWAOjHk~v(ifYkt{*$BBY0Gq)IGpQp>@Pg({{X}NN{V9o=mQ!~HXDWLwHmwh
z>T+X$p!SXe&B@j8t(w)&mPWMV!r-CJH=xEewqYXajZm}xoIEgj!h%X&MwU-TSVOFN
zIkMf=bu=y>jWs0Y#~En>1jkg&@g-FtYYF8w(3P^6Ow(FNt0@5Ux5|94g|%Lk^o)Fd
ze5;4e2#|(SyEwqIf^8Z~+KAj5VvhOua*rm^IME<F8-rN}j_FOmm6t?%T3iwOtcEIA
zTZgvF!R)8${WbGJEM@Is<mGu^RB9UcP-+d0fZK-cz(?e3Q5|B7{iI!WUsUQeFuAnS
zLRdH~A$gsCwX5or8<)5f=IhjYJD_zrHchR;6X|&%za?DieLK-qvNe%1C?)P1?&xG~
ze<2c0=<}|Yr>_hWIAZ<6+3A|TsM%XZ8_Z2O+^t?TnkrJtH!;p4_Px-wv=i2YE43PW
zYoBN>%7d3LMdJk(*>FD#D|N<-x~+Awhh&03`BPH<7HKpl(&~Zl{{Xb|yF}^Dda3(H
zy+5EhEd&Czlw(Ti@BaX}RvDxNCFN2L-6cXwDy_1upNE}08$EiKOFq%VjuscL>Z$0%
zsWgb%%VUlf)2cegDwdjkDUwX*U^R`p#kZom+h3_OvWUdTALj^5#-2%AVTY3#DvB{W
zZDg@lGxNKg(C>A=tJ``{ROqkt;PzCQC20P0{{WShoA8rgf-hFB&1vph+l8HfOEx<1
z%T2098?R%0EAepA7cOqihgJ2ZJa2V13&m%E(Qv%_t@_5HQ|dN_k+7SPTDEjlnpaQK
zUROa<_kS~NZnN6vp{dPKWunt+1OQkN+l8DLc5ZK~2+_1nK3B2&l#YYRVO!lVr8+{U
z5Ygz)PxBFV<jtn)ZBY7jv=vRi^ATVcqowq2qtTirs+FxB!-`o(O<L$Mn)YuU(#_H>
zQ>N0j(D!RfqUsGpOAkJ^EK$ziu?pu#)U_(-dS9E3tRJXuS>MDueKtCGKBAqEseT&v
zyD1;*O%+R#Q>p$SO-oK`p_C59-yu@z)fL*^Safw$OkI!xRQh(24OXDo+6%6Kn6GgB
zJkT_aDwUGd2%~szTnNf$l(xi4ttM4;`RZLV2AX)JIKXqPkE+#my15v27QL(o+&5sW
zuB_{Q4@{5JhiuNa14YWj)oa6Af$tAA1F>+jSCUdy4UO?dZbrCuw@c}Co{eP;LBkt^
zLAu8E7g=d~jK!K%WsY&S8(_TisbZ&&vCK7wt>=Qngg%cJr6pSgbh}x9)!_vhKjgv9
zE|Kc`28h|%Dr%h@-OkdTuAMfTBG$nZBm)Ei%7aYMYM(+ReyHey7a^{-mUCOv>0+Gv
z`i#%9&%c#fx6qJY%@0r1YLmbIpVBb*xK`T3wARyq_}+?<`0-+?x@%q2wAv3u10ft9
z=o<QXdYZU;^$&&{@C~k`%2Iq$UNKSRz@7erXLGdbS2SPr-r-(pI=eLa86;8JfMuj`
zx;-;M(4f0z5|BHasy$~{cmz?<yfpCZVO!&rQ3o{pJq7(uqgGQ7UO^0>RhrZ_`XNwZ
zrl=AN=EY?+$@I$kcIwkUn4azb0F`T3Mbgm5(?Kt-I2bXy<e!wUm$2*6=o$`zqUv<*
zshS<nweNLR)b!MPbBU&gFfVJCg_WSzx{{VM*mU^}K>J(|WF&f?uc_)HI`%v={1u#~
zRJ3IjdN)eJqiPf%_2w&_9NA@h{{W=)nWqfVCM=cQjrVE_zB(#cfsOM;Bd`M;w;cu3
zdNn|7)lZsNk#b2lLMn1}7sYg9I&<*GM#d-9Woyqq$Jtz0(`fos9*ySQIN1EH&sNgt
zR1{7SR#d{~jxTV$SXUaJqPMB)#@F)W%3O`zA)^&mLtUyx`R6oCHqd>dUVpm2(|W>6
z2rOGIyoGP9SLspdZZ$LzJ;AsIqm|~hwN(`_bb4-{;(wKcH~J^XmyVDpkCL_-*8N}k
z@Cb9ojleC+$;+<N)Ru{(Yur4kYBc(pB->jAusr_&DHgKR^nXj}(?;=MP9ESc*YHB3
zZzB<|D6G>frF3_RuZ(uVvcAwXlTz_4mpQl&SAXi7S5F2}nmB4;em%_ugss#lsvql6
zN9Y6mfbgZYBC47!>h-Vmiam_QhAh0_P}ZvT4Qtlk;bX{Jippoz&Hn&XX(Bv;Y*mdH
zP4w$2_r>eR^UGX!g{MDk5rvv=fz+wrNgw7a?D73d`>N~o^GHjkiSD)v^ZFV}SgHgq
zbE9L8iCQ_jA@wxEdRpexMn%gWZ)8?SDAEI5UfGYL(Rznmul2O2Ih$SWaB|uWKdtnN
zFzrf^)WQZ_!(tUxJE!THjIer;?c^}rT@hdSxmWpDK<Ag6TE&ZS$0fea@=ZMzde>3I
z3@-P$ynd*p&6k_&T~!;agp{;<9MkR_ZVDq(t)|wsSthG9Q@TffxQDm)S}vP9cAD=>
zT6%3kkMAUQAuM37tZ7ZPbazg5PfBVKwk<{{QBDP~w*;*$8s3{kz{&~fsv{gV*gv|j
z>VBM>s)zG>M^45`7aJT3#_4j_!&+$dO(IAhO@S=`0F|1YUW}TO?6&Iq`s%5DT75n2
zXZ1DPg09gt{Z>k-YU2^SF~E^~6mF>vT{H#M&wZ`>R%%T{QjN!Ns}sDW=Wkt&!n-}o
zOxI?HkccYbZ0&FRavNo5DnAkWjw+cVsEQfl2E~Nm_FiqLRBJVJ10)ho&h8l@Xkl!W
z?GiPm*5$74`=FD(ji=F~m#Ap#8|q06l=2*qTX2A$wu#`8D8KB0cC7^VY_K*n@D`Im
z>FpO-h%{;elYjZSnT!2U_@bD3HjGVWTZKj70NOw$zb<gUW6HSFB=z7vqz)(SwUr-+
z^G7Y<d`&&AkfHwo()z^=!LvsXqHtcr{{RV`B$kCudoz+zQAr?dwB?861feT*dUrYA
zjB+;Kd#_8N(%B3|)Im>IA8~sSfYs{sYADNvJkgFek#IiiW1YHYoIRt@bo~Y1yJQf$
z<Kb=e@mEVt>Ao`2+15cvs#Dawibu3J#|2qMRWuQ9w&tHaDz$4wllwC|o{y+&73L@^
zDfhd8_w84`J<=Utq}%?TwGkibb?~#jS64Z4nhJMs9hrq;(O-#@Q$*St#@9gci`<d>
z6&Y9iD;D}ST7@>EBirjfie5e9;RB>nY7{jE)ox_Kn}@L66$esvWR)@caG7Rv$1Z6W
zRFoR6TO_>FJ*+*5QiR>;w6W`Fp=$M%a%ttV#K#@H+bhbZ)uq#QH~vyh@$UU46R&FZ
z@&^h>Z)bte?6IZ|S=BD6*j&<hBE?^CWTetmdj9}TYjIXUeP~+OcO)wQwVIifj(ba5
zO2g6Xm2?mXKArnVBn4NkbqlpCM%f$zHYud-Q8?+@ebZG`(pLt^*zQfe+!g6;6m(Q=
zbd)kc%YV5axu3UX<efiBPD5mrg6>1Ewe9K&Xqd=jt8r%qx42Vry$+gNFCC@Pbswo5
z6HLaO2gYnK^jT^8A^J^W{{T>!%L9+=XtjsPS}g-uYh~X}JZ*EiXci~zi0dAsWV&0a
z9TOchnnv#llz8+jmoCZ)I(JTE1k|#?_JRDS#Zc>%(LWFwqIke_zfJzCu6eae6TQ((
zG$%K0{{Z1SJ!9332&H>p-L43@-o=cn(JXxz)iTD~*{MxUEArVQcI+Y_K*|U|>RB{a
z<T<3-TJ*<X>Y6BQF~s8+am#;Y7hHA0)k7amM8?1Q#koRy=?@0%%(|w4)G?9He^x<h
zv0j^@Xu36YF+G$~ytoUH7CWUijXt66k5JL$adELAWG`On5v4=5)J(H^EOM7Cb<tG4
zvYKi=DvDo8o2lL~HykLcO+`ucOPefb^qX9dy3lo(`fRlCkg$4$Ud3Q^O3J!ArvlR(
zFLr~FmM&bVX~k8SGU;{Hk^W*PvOqtP>;x(uQnx}5bElv*HNVvuvq@X+8>=*@H}cxF
zA)&&;MirX;LFtML=$&7sRmD4b4B)HEEBPixOVNpUQ&;8)gMi>V_)VaSwoTI*A*$SS
z9F6DbR9auBPbjC90h?`iWu~JwG_p0+(K1#Ma?p8OoIRW4pQB6DT@j}1G_lV5T8%n#
z0R@iS+pQHxL~2xYw}e4j!N|7PSylAsQ&rJ0e+Bf!e<2ts{a3H5r2;B=i(lM~E=;nF
z-4=?;A4W5(I$nmp@zc*yrq{RmCKqeI>&>;kp4TZVzbRbi$kX~<({MuexsI!@2EMD&
zds~p^41_tRp@Krnh(r4l<8;{P$4{V69F?9`p!6j3N9$mZ1m#^bM5du=62uxuViw5h
zbh1smOx6W2^)bUAWJPC7)M`|g6-}A;{Y@DwuAJlgobr-`+2>VL(bKqkUe^x8D)*=L
z*&>U1yW#`h8ZJlKL92AknsbSs*yjAILtPG=RN1Me+V=81sVTTR_8m*I)2ga8O-hmS
z(a7IllG1rp-3z73tZK%dhIdCRKU8gfkJ%epL7;V1SBdVR)VU8~+8lfl!Usv|9bZhY
zZA&JS37G50Q4_O&D*pf@lF}FB;_b6%)Lj$RG|`b9?=hd`nYcgxlEGATok@}3oTid8
z4o@TOSJM9ghMj*wsL@5!-DKF^KHZF}+wFhX!ByXj9T!`nQ_HL9O=W(bebPcQT0Dg-
zpRvD3(mXRp=?ymyr<I~_4#LyN44PCSvXc-TIk^R6b-i{8NHnc6zWE$kU3AyxH5RZ|
z%_EpN4>t+EH!Y?glC?pv)nyTp9d5~8dpNZ1KloW4UqsdF<}%3%adE$>&u}Z)bWWC|
zsIyweGUJQjqIEu%ijkhe8)0#@+R3L3i2@RXXN+jtR-sK$$J9n;iKi_XHeQ#c={ioO
zO4i3x=%phu$WXJ*O$3G=LF5hupk#ejPPL`$?2q$$JdxGG$T7R#2hm65f5oBP7ja?T
zOQyd{h2v<Epm#S|*yqt}9%-uIB_xN5T5dk!0jg?Ry<3eu@13s(#j+ACP}I6rYbI;z
z;U$MVyA>rD7owf5m-BT00OfW`PhAa6Zpd(VKloN!cS}#GS&xhYco$P?R1}V+Xqlo`
zk%CQ#`V>_-pGKTbNmn!J#&$?<N7Kr9<Zb@OaZy?ZuIOp0+8og6i+i;H0F@@4OBFZ$
zJ!FsfU_G)Mg>f%kk3r0uA6dM6MpvKp9=};pRq97b=vjOlD%wv(oxaQ6b46@W$x%;M
z$w2H*R(gw3bu`8{jgJ2SE2y<9$#JyEKbUf?>8Z3z@wQO<T7lpH0EMRG>=8`0(rYDt
z*EVt*e^g{#6{7zDOsA};^(mtal#AN<C1hz^9-ekOp^`B0>!PRD<bVSNw(wd}ij4wN
zm4&{glodt|R+a2&;m41$QPtDvQiCg_E@A#=VZm2TsMcz7HX6uVQGe5(LI$Fh-m9U4
zX=&aC{W(RyWt<}V3Uc;cX>_%*z0-8&sw!B_x(Q936ne)|YH~(t=F^!RqXon&Jr<s-
zg1pNN(g|;ya8|ln(OF1;)M){b4{N}(Nk{(xC1b7iqZ1`9T}zC!v951$QF<n$U!_m~
z07ER$4()bYRg^E7k{cHAKd1iy2x`i)1MK*k(sPiWlaE65`z&k!06nWm9bD~#UA(#>
z{z9v*rhC7M5tI?lvOoAlQ_ds;N=ZL2FP5AivT)XF{Xq<n#K{jbH-~*x?vV6U$1B91
zocoCKQ)=nKCP*IUpCM`AK^<!b=o-l!Fj-;>2D3q_r;pULi10Z<IKG%EpdBYysHYyC
zQyVsaQ8`c4ogHLF&12j@?9G&8MxM4J=t<twV%0ZJxBWL#46JjZB-j^lsNWcfmCA~J
zHh05ShB$`u90)5<rRu^5+K#43WbVRo`xWR~Wj2keK*m+Y6VLL>&@cO`tNL?Hf-S}f
zsw3>;+>g5RrR700(T|NLk3FratF3kCad5rvI6^uXTJ6f&)I+4U@VZ#z99h^ZhgZ|0
zfO^!mEG@qca_qt6Lne{Mo5z$M%E&{qG6?V8PB*`6T5jTOE>uQSeX_K$jt`W_iGe0N
zI1Jo!7fTW{B&?yTfbNzZp!Wv|Mola)&Bc_G*492B%eq&X$<5Q`rw~CLvOKuEoAyc9
zWs~|1qpglsfd2s0eDJ!iosVgBWCE$3wX$9}n{s{>)b+#{GDlj&1otahcu79UB{D?g
zVr-fu-ZD`#%M^n51Qh{eMtKLqq+}*cQI^od43Cq1cQ!^-NF`&M;qGq+%DQJr*IqY~
zZ`pCJs1Xao$N4QNskCwA#8}G=WMo_91lLm6GCxuf*%|x)0Aw6Gn8RIgdjg85)V6T<
zH2rX=lHSp=($fyo_4z366;yi%V%&v#-E&TwJ=G&)Nc~O7SqkciCmWpMzx<&grF@Ot
z#<(-c;TU9^LeCso=rGYzR>$j8J~>&~wA~LjlVflTNbWGRT4YmG#AK$O@gBv6Ox~~5
zC?pZpwmP<Pkz@O=sCfykk(L+ew43wv_AyN2Kc(4C{{T{rtSqjhxj)R-rK0NH4z9wZ
z)TMF$p>P$OW772t8d~akLF^m>RZcIVDX!5^r^7>8H}EBNPCO0~^6Ax$VHOfI<GPvJ
zA&cJ=Y<m!$8}&*);#U6vN`4|aS)Z<Bpd`JeiYB%1U~^k=v{iMKb;D(3CI^4qFsmx`
z*Mqu_p_$JqTA`CGB@vf^<`8~VGesF6uHR%tf}$r{c=rz=U2tSl3xn?Pm$8c1#~A%Y
zlkldbjLPd4*`tI*>0TXseF#!|MT`IoVHFRvN$6+g<3A`mno>#H00_o{!C`gJkO5+g
ziZXOi%^TX{ETGzVWMy7T__mwms`(hwNd-z+>}4`I2?TDy3VO(c;@pKU0OHn9lByO#
zX<c)`3S4-UyFj7VzzN~xCeyIXcjm=R*udw6Qf9Hf=Wq&<w62t7B@#891mjfTE-V&i
zKs9s@U@o<Q?1gD;d;xWA`5!RLvQ>3OA!Cb=2?BI=GP=Mw9#Ij~%=X-rGbN4&lY&!D
zr7^o$FqtrDur$qc52`>tm0fi!d5P92h#ON;YZ4J`)1+=*ZWF08ZYFV!k&|qdmIsFf
zV<_Z*=y3|lx{3$0Xm&zn6fy|?t``^=Rg8(sAktAyB|D&=KT(by);@Tv`fpTiMI4ew
z(r(fZ_AAiC$s1jQ5SoP?Rd6~v8XON7?6l)xi=xj<)Zyx_8LX{iW2|Vfc*WKusWdu>
zDqILHw+^=|y0mIqHDB<haAp0ZE0{Wpdg@UPd}d1wI1GgeE9|UUnj&}z5=2W!cC9B)
zYTI1aHbCog*Ybvq(aR~0;EUqwN9mC~?%B1&`GB&MiCDU3;+m$4c)*?#$6JxY4^h*o
zq`R0ye#(M}{YsMzduk%?$vH;HSxGh?>8Pdd59v{ok<$r9=!og=jsC*dj{u`7^w_Ey
z?K@nDsG_WYzMgpG`WqA|)T$|F5mg69M{*RNT#(&aPm3IjL#9swxEJ|FQod%5q}$EV
zl)XS39@jmuZ^|LMwG_wsK`M~V$ege!hQwnh_>CbS35rH-VdKiD{M1e!$B&|k)n*b4
zU2mdmvT}khCxT{VewABO6I|Ss=4(5fwdZy5bTqQZBd#2>P4-WK6!dN{J8n~1K~UU=
z+;<jMFukoinCqVin5&ow1)-<sf{ziBKvcBW;8^%aMA;dOSx)Mzc}1MS*LfT#HfY0a
zOI?4IM&a~8K|FW(N=t?fh);R2+{+fGvPhrpbF6+41$q#Mk8^I<4+z>vI;eUtV0k=w
zNl#AK4a||R^3&ZLO4u0icDaNh@*r?4YqYwUB;FyFqqW75(a#_|WC!+Mi>2z2h}z1?
zM3M2hWhSrFT3)FWswie`Z#mkN<yW!(Jz6~GSi`L&IYd%cG!2iiJY^H9=~bF+yDAyE
zm&1Yu&<FdQa;Zv4OQ6XmcsrwY$9wRd9ZW<9ylp43;HdPrlP1$^99i5IX;IViNe`<N
zwgcMN1uM|Xm;<Sxm|3T5zNr}m(Gb@gx5^S)YMMC<Woy_w9zpx586?g3?<9A+7Q)gD
zbv&#)!wF&TG7>ewxC~u7k5hDJ&-RZ8f{r4FtZx>H{y@TYB5hC+7d^r93g<Y;(#hiz
zcqfpZEN+d5hYrLjN!|J%w5;0-q7AhWNxBD{cWL1!@lx>Dw`0ldr;<mq!lD-z{{T~Y
zP1_rpy|!@V9^oQmG!rh5T-ZdCQodO2aOP&nGZWYj!Exa7t~4&8tJ7Q?xJ?26M=dlX
zr@EQ9jEXwTeH96_2L(f;Hg_HhGkYa&<_!3{FJ0;S%`#G6#?2RJvp>41CD9N-{gE*|
zT9lL$<Zq0hbZ5G^Z8n{()B4n8GEg%SISP^H3Yhjf+pXOL=}kp1s}XZZ<7rTwFKL&C
zYSRtWG>0|Cg`_*R)iqTmO(d3)gg466X?o;!jr_i#+q%{g0g#BQU<@(JKQjUSE(0kR
zNk>v1SmQm!$x>9hH#D*25VRU~d~*9I0{(ld{X<KKGE%sK$!X*uqml7C$Fj1LeH`vB
zX_}|g0^RXh&G4fvZSGnL1IGv*D^s!BPt+@aQaJ|uVE0%E5?DBJvHB!qjkeo_P&OXZ
zxPNsU>`6R?!;$a71Yt(tFK}#8Ee&wm;bhrh7WSnu*yb&>PC}X)T-?OsJd2?m*9+d|
zD_^jG;b1b&veQi4O&y#NPKBlJF*?n@0ql@ClbrY|;fM7#U@ZvNI@bh!6WcA0*9(s;
zw-9XMWR?c^A9aQv3xAg%;Yi1uTHpMkOmAVkO@efD{{SofrDFt^-;5s#HtjgUO4D&;
z`=z!#g^W1OakT#cbdm-;u(FNK1Xx@5NWxfbMaR!5^e>^3!uGc8xoTuLFWOC!dxtG4
zj*L4Z;G<x=>~w7{JdeK$X2Tq#9@l*Ep@s5Chva!gvOVBBH|N4V0Rujr(YV|$40XMx
z#Sr(Fjj{qfT}N<E4UjV;ad<fwQZd26V(DDa<F(i)_FU#RJe!4?gmeMmmV<DForQ#l
z0DPlf@&@Mep_)cHmXKus05BO?Vyak!*|C-*yIubP2sk3Cqp1^7ytTua&jnda5&c5X
zZ;-eVYdO2W$XTS-Fk4$ev=vl(i+vfJ`C5Vcvw~CVblE9ia^1{4I1Cj{Sp#MP!wwuc
zV1!1Ut=G_xN~Hc`9xi#Z=awfOqVdapk?K^;b;jKGRZVlEac_02{KlJI9_Cq&J&D4n
z)im3U%s2T`Uqx&LRNbYIv%U(0(1^cuF8M4f8Nq?x;C`wmJj<55+%s^VF#~p5MMU`+
zWThi_^g9<w+F<+dVTwV^N`flcVzv$b5%FqqRBdeSy}O=Jw`N)+j)}p95%&riBN0Dq
znrwTkMv&9GHwUoxDU}h#<^ti5@Q7O~-p9t>@Q~*CQL)53dk)9=J<)PgNgE5Jf48v;
z5wM+;w%6g!P3T_5WoukEy_;R-D3Cd)`G;bKtfQ7T`hf3@_d`PWGs;?3Xn4pXv8<7#
zpZ-;QTIM+Ix%ov@Odi|u@`h#1mj>vgqAgHNPIk~GVI#>#!6V`qjoza#mb=1|j;<2V
zLaq>4f1ARVO)!@F)G~*+`U%Qs3tA^BZ)4c#Dq4LaSnFklBy`UP&uEr2*x-+$K@HoE
z<`z7Ch(~Gl1=fwu0QM)knsn%tkojmp_tUtv_~59$M*->7#c|oe9O->G4^gF~$l-IC
z$%f`QI_mXkkFvG#u(Y}t=fPDqZYK^F`mGD;V=X1NYrGB>O?)M{4jD-;9eC0!L3;)b
z+uSAtlZ%xzfo=PQ!ZW$QvfhVijpoD@<6~<nTFB(EKG**Ml^Kdy-D`jHvL|9@*X)p+
z-s3BUyYt<1S_!y6{GzBfG&#HwxzP(<w<>7y?0ZQG<_Cj#&BubUw*7#TL9q%*<dK<a
z7Vtuy%wzE3VxX26$HmC=;b1po-zy|#oGjpncq8N#xOOm_{mjkojT2;$#@Djp!u|?m
zk&tXfikg}6xtn-4?xiQQy~E`*V2NIC)9wT(4nevr(hejGeH0Qx=8KDug@&<NC9rZ6
z#fUa12vTfp;bNZCdszmJWUm-0jU_z2);Gwqh@TiJG2+QL4ZkT#`Y4OIxk??J`NC9+
za{C<SoD10_FyYxH&F`BfIc_kBNmws?<v29Q?gy0=ZrW@S7me+(Ir&&lRi-_!V}RYt
zW8-ia2I?y~al+=k!1!24Oh>-WAhzgdmX~7)x4Ez6XU&k+5do3=qM9Z%VX@k7lXHNv
zQ8Ir`#iZOKS?SC$Kq$ZLMh;)@H_g*z4Yk3=`zb0ZoHEdGhaj}u#uG>SH$sONl_MVO
zi&!Y{?zuNhaC?+m88E2kHvpnzb?syXME?NtjDUupDI|vsVY@EiqLvmsWA;)9hc|$j
z{lHu$+5@0zAuYf+OtZi3{gHwA%3ZAfl*nF2n@Q1Wni}b&GCPu7a2KWYhg4Q{<p<@o
z`e@#5hsaHb*;7%&r^f5d*E-+IGj$}-bL0(zCqU81a=IP0NaIvLU8~hPnzT)=RaDeQ
z+_os&=|%qll9jZ^HjR)utOEcH1tbisiQAas=XsMq*rIBgsY@N|YD-uL=mZP>f>j#Q
z8Op)iO!-($a5RC-oInHjQS6i*j(aWQG5-K6T6o=tyB-m8z{r{%>jL6GNKOuj;1b5&
zu|(L%cb-a-l~6>@v6hD(UPa0ZV=LRVyxaO(E}sN6%*)J$-GR0e)rQc0J4D$L$u0ZH
z{jL3ilCw&lSgsihBk#0We&q=p<lVkGMTZy4d)=wk4X-mgG2mD%j1B&uOHM!htKa=G
zkNHk)@YA>bnBITx_Y#-VWJdm$<J`U1PkD3NLtepe0>B~Jm^{_<NZUsPV;27a+hwks
zMH}4G=KwxPT-n`n4AC*8zT2gyr;@T;GG{rL{YL}#2<RP;l3>g=<b2r?ML^n@htBfI
zyt&p#L#EQx4c@48`<DY@^g~s|$H)sLnpY0tgft=kf?3HHjY$XnJ7t<ney6^|{{TR%
zrI5;f&n;l=J)oieIh^gG^1JETMJ#2G+Si+(Cgp2k{{TTP5T4%OsydP=r69F{Fmqyn
zhfJ1R7fb-~U1cprEEFxf>%(oGprGFsW=h#<Ej$lxo3<v7>YrKEblo~4O;99x<z%|2
zuHmO^sVJOfaJVn*yx&*WDl23zk?+riE^?C5PAWZ`F0AUqJg<(F>|yRXSh|Y0O8w4x
zc|KHIBXhue-bv&Izx+Ju4Hr^-YIQ2s#>Sua_gIu;1s>QXE9lQ?ng+3|#vMmS`6Khd
zQR?~@xk)FdHlHheZEe@QI-^I?sXs5KG6uDylPD`KS=1Gkb!IANwapy74`})!8K(4Z
zI<wCDdqJ)I!z7S;WE+6-V7(%YYb>T~9Z?yK3^AA=x_uoylE2h@Jy&@y;T`#Fyl-v3
z8s&FiME#k%zMQPrD;fFu{b<4V!qbns(a`kGE}YiHVS+Pm8*BdnWOE^kCfqg6KmB=8
z$t{JO9^3c5$`+EO3f{sUNl6nuk7;*+pnX%K1)>=Kr9#IsqY)Pq+}%jn-6mfcw~N>y
z>~%yjOFZtwiEsU_!kyK!Q?P>I){osbuD*tr64yy9O|aJRvE4`15z|KJz2T#?Tv9m>
zqFQS@>p*t-OIY4*-C#PKtEpuMnuV{DP79n=5uIbJW|A5=HL-)h7Eg<!^(`tu`prI9
zi{E(2D=1#ru2s=Xrs*|0g+P{aP0tH&L!{8@)WS(ycmDt@K;;vpQ~GQkjU=1E$tKoQ
z%SBT>q0-&08~~`D>1bA~Wpr}aRLolqJ7R|Tb+WFs?JptnJ9EdA!ZL$Sdw^pB{gs>a
z%9=W3FQY7^3xGSU+;OXHTa<xhjg;|jmQcn4`j2IX>i(>XCpwc#oJljWaClI4482LI
zSNaps)W<{*y3gc&miwW4fAHvO?R8#?=_>7)J;dc`$xo(coO?X$r#dTB)*b$*RZ#cX
z+ylbeX;pfJGaWhMf;M2C)<^Yp^J&!YZjI<e4-H`C1(fNCW0s}$8m^%$9OIDEo>=28
zM9U`=f2Y>zT75$wR`B-|!FB%t%HHYv){P}Nd{e~`x0^30n@Q;DZ7kI_QaBFs*=0Jn
zT<NL^%oLMVf;a+INT-Q<B`K-1-FkzpI#*4lajC9sl5N9UZ*si5Q`R+ZrkTS>i_xbh
z!S6XM1=Bi|TAra4Y>RYc<<HI+(!C=;LeS}PwxN(mFlY|<cTLBdw#>g%$n@@r)dRh1
z-AG7IZEGks{+^(Ph12RYL_qQ^y#w(NThU{tbF_(FBeP%|{{Slsp>)gonnO0BQzK$=
zz};mo4Z4YLQA*j5CKkWZinPu++KK|cou%4-p7%VD)w7Sf^&LB-Izvd1Jh75W-dyM0
zs~uZb>DmoB;gVCvK*m8SzB*fEx$crMT@}-{I)y`OwaT#w95kB+wyW1VOG1m%Z=p1;
z#l@F{bq2p*sdX#kq^o$QF2>VkuhBYUnbgdxtD2%&4t4=@r*f)}hS#!gx~Qbr!4N>k
z1I3$_58?j+;m)qwmen$ZIwPCNIYd@c>Jh!Bhd`-w7;YpY*H;=};x4(QMk(qj-Yt!z
zm6LGWv7Jju+B>9m80mwbRZmU_X7>10y0)cTqsHd5Rg91=V%1BiYkg_eXKtSp>7sXY
z%4{EoT~(=n`Bc(e@?1@nrOs~Zkw~bmHVZ?jMXXkT_|B}kjXkgm+ECN!W}9UM43L4%
zkoqU#B~1yvO>1r4pe=5n)3h2}K=qnFFKee$j1>XFy{2KcST%Tt>KI~myExfqYxR9)
zjxkh4PQp2BUM{^qtMwSP?K(pXV|$3j*UkMw7gXw+>#D^p%z(T3cp)ri=IJ1~sH<n7
zX}ZiZN+Ye1$Ku6o>8tc8D1Y3!0{6P|nm(S?Ur5=FJxiTz`+KC1LDlNy5w@^HV{MW;
z%SsMCGe;%*ChGlVwc3NBr;y0fY|s_YNOYXjwY76g=#E9)r|I64r(}TCh{V6wd##N9
zH$W%{uhdP6pnjI&R|Yi|Z)EaLQhGDpMX2f8JvX5~re-$%5xXk^QPny?sduMDAD`6X
zNmhMXPty8rTbSyTTu1W<EXn@>MX8h;Iz5NY)|8c*LSD^JPwMg3*2dVh@cW#D-EH*`
zMU;)*rb82jy})5n^d6r>D>um}qT$`Py0_}L>6DNV?Os_({!b`!g>2O%=+tzqrIhU5
zR~&4&^(t?~ZCgmCppeT~1hQKIexk6NX1k}=>TIEW^EIdWfm=OCp}JzXO*7TcE1X5{
zUP5ksqoga2_G5Z4sT)aO`G}a;w*LUkFNN;?C)ae<l<bVsG#gl!74xk?(DXe;)bUQ~
zVFthhm9y!$)J+Q|(qWZ=<X?*>Q=D{eF@2uT)V1}Mx^vm5#y63Mz02mlpwc>`i>e(}
zU#G`V*SL_@I^lX%L%N8=aZwy+uvnc&r>ZIS2TLrG)U<ZL{3*^-li5WW#TFW69Fnn<
zRcPW64g9X^4y9#0VvdFluO`>qfPjBlPQoLpp_#7n<wH}eiuX0K>24+8%xr^}sS8%@
z-}H4Zpxr!FKTwU^h1@U4!aA!~(%9EWTIinP<=iY*ouYMo&^6St6AOk0{{Z+_5q=j}
zYH|9N)e^w&O^|COwGA0Kr~4E-=BCGL{+@}s&w1gwR+N1at!n!!by-~#0JsOjFGJC^
z-iNPr)g)Dc-Qz1+SNNHwRnrJ4==b8*x}M;v_E(adzeav4K9uRNb!>4yPd6D&)b%Yd
zQKj9dMG$Xqe=3WvD)fn|Uo`p^OJudfgHQQhd!=f!$y6CfNgx2>pqrr;E7)A)U#aO|
z>KY{^FKt$s=_LaNtu9`FuJt49^-)Pj1hGO*j^@~{{{T;F8uXBcw@DYZuPbbX>Rmgi
zCugkfHi@OV_S*jdx_jNRX|<s`dqnBONZD$`ohfb0iBeU=q(uF+k`{Pb`grxJ52k3|
zE#rk1buOm>-uh`;JCM2^HEj^4omp$B8t+eRb+=)_1=d|b(N#6zR7t2t_8gEOb&sv9
zp5PfAJ{7M@>Qy3bjji<0g6t_ePSHjEo4OvE(<!1c%FXTrlI5G~V;+|-+IE(BAgvTL
z)XN^*x@VD%nYzby6&9sYs0L3A@kUMzj36TCeHli8nOQ8-2`6!L25gV1>L_BTF+}n%
zEwrQP^xYzc0PRXf$lm#}Kx%beAp=XPpnSg$H?pK>uF1*<Q&TZbc_OGG<lkvUbhOoU
zl`Wn~U9=oKZSaNEHC;8*TAG5#wbjmrs?@R@GA1>jIa0}zx*r}ZX0E%c&-#0r8(JJ%
zv4>dHA67|*Lf`5N#L+WRd*(8+kLJU=7;ACpQ?yA<6#3weQqz{$&-HXoM<qm)GH1EY
zV+b~0qoDpGXxeQXBdCdi?QUE-SxpnHx_)rks(N|!?ziiYEk9LltjW>3=9uXlM;j&s
z1*XLhmxip$Dn)-*{vorechG6HFOkl`aT!8%uS3>U$R(^YM{|2{LZ{N5OQu(uDK<60
z@pZeQ>ZzX#A&dt&-~e*88gAI_G>2<_1wh(T_v({v4Zo&bu^;N1S58$nH$Bpg+#W~W
zX!^n)u&JdoLq#Er<C`p14@5(*O}?*Dd=&uYj>VCbBKpvZa$9GqX*F6Vze?ZX$57V}
z9x@SC9UVv^GEum~4s7lg0*6MErKA!=s28=oU0YUuCRW2rVG*)>3k%^-6ga-h<dTxQ
zE4r7Z8w>qfsqVmUxrc<BE{QJRQi@?SK1G&GQr9|zQJK=YuMBax0N^XWgp*!vM#_0e
zX+GdPeU&99y%UN|xzw~>Z*X*U!OiYk`>VYonUGS0RMN+Rl2(^Z=^am4h(3C^L{4tZ
zA+@i<9;26Wpz0>Mq<)E7NB2p|KG4*?GY`}nl^il1lLkC-WmM0^Z9_~3H!+hlvzS$;
zulP~b6s~jYDTPx(<{2-4vX?~Z4xV)rskMDJc&b0H<*o=+0MmUUmW!x0Ua7AX^sX@n
zoR=IgSm?fy6cIJrg*-KEIdQOZ^Ec^qeLJf+{W^EPGkX_{7OSeBtJGnn*%eEe0OhW+
zSH$5JqEn2StLxexjfS1|FjGZOGc&fr#IH0xMWx8c#@#*5c;W2fR%;raW~sTe%;_$9
zwop2EPHM8qKQAxpI5y#C<k^y-$$H1A=?QL~QMH4Hl+8O@>WZ4-HGMIZlW;?Bi`0J(
zI-6@}l31jNl4CyQH&0Pj=@m_Q)LtCJ{@l4r+PZA2gR4j*Qmm|=ozck)p(py=VzV*o
zvT3q7xvZ6!%U&)D^sQrFq^Z*6ZDbI=+i_vtc!s$+sMKBqwzl{P%M4?&erEJ~&qMVU
zHEjFoXk%=kS<C|kX!?d~I+`-tjV?$fBM%L_@s5_J)FGTcj;O}t-K%^xKBA40!CqM;
zU)JHs`l&ll`YRX9{g6`WEqz6rT=rl3a<|<&Tc$$KQj|*8`56kMOo9HGsHZtOHpoO*
z^)*hNPDMtWB!Cap!F705Ssa&iY(Mq(nFCBtrD-Fv!3v{L>bh-BrWSt)o&)$^ORws+
zTHNk+6n>M3@|+Ytomr{GL{%}raPps&p5H|2dhEXHDK*VHq|FsXh8G-I+$#6=Wac9c
zY%Q1^1AMDlD<Y|*5IB<JG907OzYd?RRQje_1XsgH{#0H}clwp#lC6Mgx*dM11!NL>
zEGF&Pc>1kwl}TGk2#%_tJ)ie07JeUUIvqKiPSqrBh07!t2jNwkJz}n){&nqTkN(<t
zWydWp#FR2eZIJ5|(nQi)8r$IbRXPrdMXu^Q8(L$M{?Kecy4Oe1G*!&J^EmuD%1C-E
zOVUrR1oA~AatM9WJW#ts$1Im-j)$RZDXAFQ<`YM3dV==*s;zscOc1;_NZJpU?g}^l
zBh+;4KbEPPm2eCT@)lEH{6TJ^Av8t6KlxWY<4^T18MoO5CXpZdledua4mO-Ets^wJ
zsXaQ{aQs*}w(HI`&2&dxC8>enj!Szj9;4K{bM*c2RJ6DbJB8DYsKk~@N=(l6^+uVd
zN$b!#t_0l1iu^d#Iy+sQL0w4NN~3_{+p)_Zu4~b1Q@R&M!`k*wqtoFmY_$8S-ZQ<K
zAF|3kwl6*`_gzz=bdg2tL8gkR$heZ2<b8tks?L{!O83W49PD8JVh-m0mvom}b#9w@
zsON1<Bf)F=D@XqT?LF<2)YNolM^Zmin%-0-q@A;&N(~u^G^up6xzWh+f7SwzSgE4)
zcRufu*v+i9nup>qPHK94qpE~c&f#mcS$VFlsZ-A9h#R<E*q-4h%{a=aZ;CTlW4e2&
znMbHPo_B)H)&coe`s6w_OsuMoHbWuJ*Z?20#Z96*u!&<Oj=jZ}x25z`SQ|xOQ?&Lc
z0H%^@^Fl|iEV$FCsB0;UcC^@XGOKkCo2fMyrDJ3R`A;ijrgSB31cF$fD5oR!v)l*S
zT+wM2@Js49(y3>boc_tDoxX#Q0$rYWq)<Z1_D>t2nWus*wz__y9UN8;81PoA4w%#R
zXzb`qCnFoUy3chtN7ZPI{LMrX%Mi}!fp_*w^2V(N<7w5E8l8NatfHNufK9h}PO0hb
zT85w3g{`iHi`agl_Ey~+t@P}-ifCKy{X$0AkFwQO>b*SrV;wDTrfpycAy*zu4O4q3
zIAvWe9uZv?ZlPBsZ+WBxhMvd%7fBwsrqdAV9V9m9_X}sLQfcw)CZJ2|G2<_{`B3YE
ziS#dIRZ)gGWw+%fSty$oGs(3Is<+gMVj;vHJgwhIYGz7N>oe1r$CZ_+Wepu(;U&j|
z!oH%cgVPUS3<HE=2u>iJ<rkw*SJv*+8d*~tUctj&+@HFrlkqR7tEKd6borWmv<n2-
z>msjnVXUQXOamEbA9WpPL-fsa{aP8NqmtJxJY6rt6z;+D$(oHDsvt04h0bd`HRAsO
z-3hJgt*Wpsdkc<9<M&xuXzDa+%tB_))|&z_RnPjRSE3jpZSDNcO&oaM?8_wAL=!?-
z&s0_m^R?&v6n9VRdW+rZQ|g8WoL`k$Jav_9Kf-0ZfE8Qx+WL2isb?X>`BfJf^u>Io
z+BceyPHTFcJC3B<yN?zt4Xt$C)Ds`iMDQ=k{{YIg(t3whiT;enNRRaag&$GsTFqTE
z{ZjeaYX>Et7WLTCPPReQ(NKD=CRR8D!>~f#Lq49!16wEu<l%Uo5Bi){F7|8};l*w`
zWwTTbm2Ep6@~H_Z_D)f@6V>{}R76V~n;YAfxutt|;73{0^`A}(Ii_#sp&MjjIU#s9
zz4(7sQrA>c)tO`D#`BT%Ky-_B&WY9|)wHL&38OydyDfO|R&LC(w0dXbf8mt6E~5Qn
zhKtmpnb(ukAMKwuR9!7cTS-pYDXHSrDc#FheZhK<P5wFb-n~KonblP7ps0IxInEoR
zcm5U*s;5WNI*OtC9-_z7x!ao7J0E2gHkn#YTMuTa*w`BzpGx7(atm1{R=cPQVjA{N
z-v=o7YWhy6OKIN^scucKvRy>sMhuklG!HB{1uk6qVzh${aBQL1bva(=M^#O<l5!O^
zdWNe?0i~=aE9Ics!5-ST*GgME8b@bYB-&@F;6p<l+1-*tQ<D9WNk$3jgi^^}Ucn>d
zinWK3_WRrWD;jEVL8Z(O1G^q>6}Lt7+|jwOsga@N+*snv(3{hmbnxw~V@r<@2E{)p
zuEmpnnd7yU9)LcO13U!Cbqz`&C5{$N75&jm-{`hoMbH%xRGPXe8$CEVjPj{VApy|D
zHocg1ZX702jL<Go6Hcq?ZAxbTdKXYl{LObCy4g{5{(|V*Xx#;5L}ji3-Feob6%(Y}
zA#-K5fgO<gblQfQH>nJcY<IobO}^u@i^Vv-GQ8l{&qS{1y%*FqI#Cog7R*i;W54jT
zI-ZqCBz!uA0-i?kBX~bIM90*PsD-YT?hdw1@Tj_<Sc+CQHoTX+fKC-2IV46o6_xX7
z_ufm)klzOP!U$;_33W90Z+5t=o|e?aRbQ0UVRUgn0q2El)cO&Mk=3*hY^=4;)mY<v
zZ4-GF(?(xQm9*8ZY@`8hZ^2t8Pf1@+)=L~UECSnKhd1a~n#C`zF^%rC^S83Q>A7m5
zlhT}SY2nTNK}p43*;u(gjU_D%RP`jWrLo@N9G{}n(j6|MoW(mpz6zpc9Yf<1iAirL
zTG23N<8cokI4Pc09WgjI&et?3X=F3$^-@OSZUycYLuX}c3>Eb3mD~vdMpHJXqT!Wp
zj-Vg*+<E#UXtY@8swSm|3C>HI!@i*yP2PrZ*37Jw)6q^$7crB;$WD?#@(hvL!;luT
zuS@*7a64shd|_10q{S)S3-&wudnc7X#a5n(G>X@={h3Y2@{+ZbdW7>p1oW+V9l=?u
zJu)#cF8&k8Il=p_zJ);)kZq1unJvQM$po3zj&`W2)EY#sbv#XIJ;pzDEnPfS5rb10
zbB6?u>f2P)rHDM`q<B>xuIGSVxxMe%G-GPfr2fkt7J4|qfydD&xIWYW0EIPt+QkH=
z)K&3I5g+YHZ~GNPT|i}UeJuM)?1h#}h(U^C;w@_varP;4VunxU8#FRY8~s>Dvsf$r
zl~m>@+a<XQjw)xvISqN)d}R|2VQoN(?k;bK1##&!(mNR29Gr5S$HuW~4WA>*wgGoC
zEw2H?u|oQ<YqBl!mZN-c+`@UwNy0|Ck2%3zuV)HW$Gn2V;L#`FC@QIHq+o00y8+<x
zijj_HTc45HM<k}8Z6Tlz4U)80GZXVP(NhhlbcWpaLB3%xxc1~(KCYT5n%Nss8_SMb
zIS47-1DaTVp($HL;!A<I_9@JJ>_x@9gd}(0Y}lfqBoZtLDv1M|K@i3zxDRIT!N$a>
zDk5QZ%S=)ZNZ_deX>Ma5Ug{}Y?pW+B;wyGDXq*Pf1;=s9W8!m0NpSeVQbN+=ED1g@
zYpY5~blK0LQ0Zx<@=efAiAh;R=9XoSA0YCyT_YQ%_lH^c$nE<sujzW$#Ac#=b+KCh
z!)F2XOVTWSGq_60BXD<dVm_f3(?r#yS6M+#B`I-_(U+afz&~Z@TI)cpb8Ifv>2<Xr
zQl1@Q$X;8mO5<GeFJe-yGolf=m31J1Y%TRsP}9!m7sDZIyoV5*T_cN6e+nuMYA9q8
zR5i`)90D?v^bRR4nhigxI-5vvV=E0q2mai`>qn=4C`Vx3Q%Z9P<<aG3e?3h*16}~|
z;m6%UQ%QF2Ykj0(jtY2YlJ;}U6k9zVy<5^cxY+8}!sGn13t2syWd%b^=rsu34o2Bm
zlGIScC;O3re1tS~byTnQC@ZFn{{TkgVyXT^_63LN^}3o0*xFhpxc${dOjR(u+{5(&
zWVGI;)oDl*)H%hzRn<RTgZw(0X1sScNBoFB!|=@@*sG*t_PMSD<sS`YJh*uoRZZ$$
z4y=(ZMTB_a7aO!{){n|nv4^lHg+(RWWZK;_dX2lijs-(22^YuFHcA?X+`}l44);+R
zYFO(@5k5#p+W<97fOU{kJdyy$QS;hE?QM^ehjkp}Z#J?P!$8J8*adW2b6)GX6P^ks
zu{oIApPtG{gV^hmN)*^r`Xpr$WO)9_N~SrOvOH9{4F3R?9J?kLJf~?;skPZw0Vdto
z5#<_b+71dHScp6%a2ZHQ-)j&Mx|EM`AaJJ`Jf_RF*EUjUrRb~??)^$=giOu~imQ8H
zi)AEDapa(Y9~EDwZx~X3a(T^;KIkSeB4e<(WK22KbINxY*%M7p$eVed9DAlRa0b$F
znNaa20XbPpj7<2%kGy9eRFXpWi<K1{9>aG&!{rfB_7;AlaH|=KD5g~E)bZ59=19<d
zER)|;rp@WtJ}cvJ;ced=qz2;!RBF_1m4%LN@Qjx&h@TR&Ibf(~tq2T}zp1xZ`fu@|
z2H=s%Sw_YwX0hDI57O?=_*U9QZpmy(v0U<tMN_i)F|9mUr@9tAS?p`a$WCOT?F6(q
z6s-W<wbuA34M0w#^qsn%S4MnZ;Vkk<_`N#%Sm$9D-Z=`xXf3hjG0~m{?3JVyDI+ge
zr$Wc>rgNIp{HH1hP|PgmZU@TMJ_z0Vo1ZCSg^d<-Zr=-1LAK1JU0D`R;sPp`wn8lT
z5I$Co)N#Fpv;sSX6x0#8pJ@9bNF1NAM%lvqw%rvRO>-{S<aS*hFm5||M8{6ck5279
z@{Jf7%`7=29>q-@t#fwBH+-q2iNU|bW;}!=<8VID?z8@l{>jN`9@BC1lrwvMlNP(M
zC^pDi?XS2evY0r1ehO6fHB!+$QcoMhBq!j4jxagkIl#1@{few)t_Ifxe@lWoj=aV;
zk-44PR+aXR2EC7KYAN4#zXP}^*mWM$Hva%B4`iUemHSPy!cfl3vNjR@(o&aWJBe;}
zFG$`A2tBXCMn$Mr`d+LOT=!^M#%^gL?c=&GmRTc^7>;}<_}8#}jIgWJbqbiA*V*mh
zwDJ&CVEUFe1LaynEj3u%DD<WB1;2DPO*Yr<b4y*>?ck<SQRqh|`wOSjcRWhR+<)4C
z%Gc;~GB`vMv=*FYVyPKfO5pQw4+M7$L#Nfk`0p$BJL9^PrS?%r=(^Q(F*FX6pKIEA
zW0oGik_f5{A^wD*<&NO}7OpK=z(0ol_UuZj*XpSCCp66$ry$|>OBB09HtLy~nm%p;
zT~9Nj_L~;}0E9(EE{?#R&9@;}J;koR>$d8sPxf3=)a}2tOB=sXDER1MsAs88MUV24
zk@Qp)?+(jc7=Ow#8p$Cc&3&!mHHy;<nvS9qc7oyHp(SK5c>tPuewZr88u!!yBe9dd
z<qn}FZv~YQ?32%AtsurtXs>(^XX+sT0NglE1;91TcE^l@3W$fseT2E54+&!-?ZRmE
zE9^14&Y=@MIcgoW`N$|qWpmzK-~c(tbjg8ewY{gY$`rlPy3N4;l9q?G!X${Fb5}L;
z0kPiU;PRObN!~4s@(MZdM<5O#!*|LJrPx$iSoSbHIgZ-z?iGz5p*=fxmY1~)Fxt`_
z0Ump(*!RY7%Ti7}knwIT(lTl)*vniR$B~hH6+^1&vqd46o!+B6w)sX=HX6vbwC#V6
z6mmsfO>uWh-=0F|i*R~6Toy&Lq8S5?h%9jItZ6HzioxFI_(9jUNg8AkS;N0{9X(^e
zOpQ41S5#%l<eYf+YoL@!-SN7`O3B*uwe0|`>=h<59Mf>EDdlA1;lMc%FYK{&dxhh0
zDkezg64&827rB^q!SWQhY=DU}PXsIxg~W^P9B@-bkNyftA(4Q&xo^Qx5=S>i%<PrG
zw309ML_;Ps;WnC9xDfX499<CFVBlRD0Qg45dl@Jtw-$H8iLcsC`0%Co$IDH^Y@j{2
zI6hLFuEh@y9#e#Ec)M-%LWVuBxHc+yp5Sc$e2(bQ#PI+PuVo=`Dgx`D`A-r!5qyLI
zn2rQq$ynh092F~A*S73%zl74pgSFT`Rsk7|i;;BpIo9kFlIZ^c?rK6CAh<uWU|ot{
zEoX9`#~XszD2T>I$CT1Y7Y5;Df1szlmTh|n)ePrsH|29Ca5p3-$kQVart5iF%>_Xy
zBP0-r4P)4CVyVcIBa4slr-H1T2M00Udn^VKEJdd6!0@9Dz8zqDsf9>zv-$F)kpBQP
z4`q#D(!=SSv)kbIDhWpJeXjBmeya(y?ALfa6q7J_wU*he1)Iqs;CwkF*>XSw9|)a|
zX*SQnO>-l2aO1f#nNd><n`cBz9pkZ39ZIqbHQwMm6>B6#!25Vr^)R$v?A$wp%ABC2
zJaRaU_35kGXAsAzB-7-kf2kX;IW|zwMjY+*?{ge8amt#XP?nf%oEvs`WjR5j(UN1S
zq=si~aN6*Ql86^wt|3JrrK=vJUFpgFO-_P(s$v^Z-SPH#7*l`IPxd|&JvI&Y{drQ$
zS{wYl^Whf9!!%cE1RidKsizHbEFg~J={Z~3xcw2CF4Fjq)r6rcr7dtfOMHSC0cYK$
zf;k0BY9n)Y&c>gg3W?CJKSL?&4Xo>yp2_mT49(pefOn3_StDhSrfv^)17wyr+W!DV
z&MVL(-p18Z%M<SAl02@7fRVKOkwUP!n<gJZqIis(vkvp+EuAUQOhg}SjVP#FEGK<C
z#@`CMIm;ckM&rsYk{lKs6}EvUnRQE5MOH*Qj3KTf!a;%*8kU*)QR_h~W{m#;Gfqd<
z3?z<5*}yg3lbT-AHn_Bb_Dd;WWRm(D6>GzGOJ}pe3E~j%;?hh(<glo!8rS9R*#7_{
zgZ4ugOHOwO8+iu_p)+v$EF-Np^yO`&9sHo{Cvd~rxt>x!rYeSQmAUc_iU`RgTv+#S
zXgEF7J&zp{IgvbFhn~n;VJ$xF6)Tuex)aB1DBUx*?UMxxvYe=Z-M^~m!kQ_a7|0Sc
z=dy&7PrE)7g}4~|tOrb=WD~deSU=KKE@ZG97Va10xJ>k&lEPYisasJaTeep29#1Hu
zZH3aho@m2gcAmu$`X{xZjE^IQUf)gkF}lb4N+yo7T4xKL%{;X5v$0gDbD;!#nSYfL
zh=cu2R`AbDR4hM+{{RPslhTp;oAf9twb`jNKP?!2-5ImIAkOIATO)qz?xqJu;#zJ#
z5OXv<5Jmhau{r>JVZ(EA@{zBRxV^$5tT7T>ka-Cl*yPJywf+waSW*%>80=gEr8lr?
z8-fy678^aJA0c#8$j{Z5_P;2-ny6XY3y8K#A7hv<2|pfGvq;y-PZmvMt;z||MPu$P
z;8XpjFxcfF1RI1d#z<KsAn>CjB}~~nIdfVZcQjoT7RZCFc~2H63GzY>j|DSf4#~32
zDnfR+!cFcR3?~uV>zvWy0J>w_KLGHbhcwvb3|ZV1#<|Qny2%o8`X?mV<#ys(Z}OTR
z2q1*VzSs%LgH*@vF14<qX>@M8dm}Bl5o-kl<0AI`(;zZvs>v33x|z(1X53opxPlFe
zbS2DwI75%of+nRbKGhHeWTT>&b8O-JsO4i_`bIn;rS@e&>?XtNrDLvaI0=r9#^5JL
zEN^sJ=rWn^B^7UJK|>%0#M;QVNC~kiSS&{~$N5b6c|?Zp$SMAdzolz7nd-FjHP<m?
z=n+kTmX|rfzkIIzub?hm(t9)|GO)M)re?4X0YC7%KckbqlT*QB4&!s&o2lkyI~#d7
zO79IMs;AYtm-GSnA-tj~>GfK+jgZf<@<6al*j9tI$I}Umok013{zki>s&20|u8<$e
z(@{j<(#Ct7ex*6FGJ+%P7rE!Q`!p)~CW=>=daNhp5&~=V1cTtHbdiQxtroDlS!2*?
z+FesMRZT;`k&Y3xebr{j+(;8ne308Fm>B^NbP`+3o05jW5I-bbT^qIz%ojHLl9oxE
zv=3eG1NnO<K395nWh_zOyRv^|jfIVF`QGdH3~kEa>}w*btue%0@&g<83Xp1ArF8y|
zm8Q)t&-;${uq{TNq_)0h`uC@Y`sNq@%JQ+=MwLz>(`pQ}aOXBV1&oR<BS@+Y57eH?
zB|rOY7z)*leL1m)-UFN(tG_i+WG_Cczu7B@x2W=5<Je^_hKng=t(fkHo}V1;1pfeX
zgnQ?i<&&N}HOO-5ogIt)CZ5L%NIe#`xDfvUE(n5=Kk%ZkX>+`eRFT9SJy!-o!JEA0
zS6A0*)DfAgC6Tu54VRzwUtY@a=yc{bDERdr>$y$O(j7qD>)lzR=}@>l&oqPj8Daac
zDeBI$n^JR`4(OviG;*_guCr5A^7@I~{{X2~Vp(J-V;t|YRSsKYIVkiLYGf}tB>bj6
zQcaxV(eRka>Nelef7Z(Dr+RZx)TiEP<duVv71Rj108vFG*n}Ma05z7EM(NK~hf4Xc
z$+0VGq-Z@qO8{+EHBB_Y3%Tz0g>4p>Nnj{78hIPwoTB)nQ)NbpqftUF=@|$dy|-FT
zI+?IPbdf;j4jUtEKVZ5lIqB>}pl|)nc)FSNZjq(?oa5xb32#~%cd_-8GNM5fOb|2r
zVUEQWNu^aiyXhKU(USRG0722u6(fjersw%By_E9QR92B2<&ekyAdo*`g&N4^cF9X5
znisfp>AP?V0fgt&dHA)}g(K<dtiv5S_<VOl>sp*4q(vPoNaJL7O4?q-vFwsIL|*0q
z(frN|lT*}UCGCOEu;s%5DjjdAs_E`zkJo4Nuq+<GsB3z)+Q`i`Byh{6ZpKKs>dvlZ
zJB>X%{YiNCo2+@D)OEUnElZvm&52X#+H)Zr-p9*7Kg1RnQaZP(TPLGJ#({i#ZM~By
z*6PJ??V8?=*`U<LBM80yz@AsNQ1yO|QKvPv`g>T?-`4T~UK!IJ57xTO&8V2ZHlAH5
zuwIj+bQY1NZK&!EU-K_+eHM54Nj!~v3=&?84OXW`te7`Krkbi_!x+zJ?xv#Y=K?Bq
z`kHDn$c3E!)9X5}lS`&CX_RnL)3koKGzSp8yQ_NG>JvITTDHq47Y7TS{IlD1hy7bU
z9=lg#YTKst<WS2wHo48dRm*y6b4V(BgIaaSzoQYbUK!IhdX|?|?M5kmN!&6!E7>~R
zQk}!|&vCa67gWRJ;^lHy{{X#<IY}*O)oS`(1L{33GLiDS{{X4Pkgs&D8dzw+mYz0a
zCe~O8e-X_CElEsX?;u$|pQ?I;s3i<7mYxEA$KiS~_~5E2<&&JA*=N;|=#iI4Q7QFp
z#Af6y#+lQR>JBD1Y5|@@EEk|rY8^MBQ15jUDysS4FSy-NSM_eMsmkay`hB~w)<qUl
z$*a&{{>;{)(O#Rsg{sWJPw9EeveLf~I#x<CHl)W@OfpNQAsMIs9(CrgRx0YLCZ~bf
z-665J(OBzU8>;E_9+}h_(ZjbKsoRR#MHMcF(oy~&X^?s}^pP@F^X|X*Nc~p;)j%r0
zr{jo<N+{%iV|%Jy52Kw`DJ+U<WGD5TmX)Wb{4myo#N$z-iGw=;HwpO3L{}wcB_B<7
z7gSVlYsDQ1{^4wC=(=;JsRT88i|3J|#5CI~zgMl+bjS?^HPp<-ufSCOF;5HiF+RH_
zRV}_ib;6RHZkE5Y++vlzhiWcnu;(*K(#)XnP5%JO!*vJY*HOA>Ni+fo`TqcUdv>SQ
zeHWu?hw@N1DFbn|_g*`%b;hgI6|SYz{YSOuYg*HEu9URxfyviY3DdnNPeCA-SlJ|i
zgJA2e{+ratPl!Pdi0K?K52Q*P@b~chsHc&&wU=W~c9rdVK8Z_50|c=LJPzP1DY*Nl
zO~&+jV=4N}sfNfY9YX`Zn6v|Bqv@Z*sv1WMjZSGQXE}Av!t|J33kK0<j}~1$R19zG
z0Zv&P+hZuD(U{cd(0X2p&-570qWA*q!v6pee;c*h3ft*4hBzARI!4$zdS~LsmmaG{
zB$V}n8G9Sye8JSQ6IUfIZBt}1n_%1&k&4ON8gg-3H?%+gvHH{4BCXP4eeg>Sl)As-
z9Q{K@dU|Q$k^EWf#wMnTvVj~=Be4M4ZTdS-e%8w3>kAtdo*3TE9FDYWx;seJ>Zbh0
zrBhP)!NVL$3(#Vx(_@GNIOI9DSjoDMO)i^dJrzuk0~;I4&eio-Q`Xi-CDN;zPq<$3
z9EDzKYA8y5wt7aVtiw$SikhACp3IG;s+||6x|^vgiH?z!5jfv;tst#8N_BTm>9h=V
zntY9`$NP-$_gXR6(oF}b`gkIQah%z0J;{fCBQH1L-%=0^Jx2=(&d@*kS?z!Dr><$D
zE*h0BTL*2$rD!z|#CB9_Vv|k}6%IDs9qn4`R@7Edij7}a5l3r~#|$8wYT{8wKF=8G
z-@}?}%A(z3cSAc)T1~=}syaVS(LnUJxrh0fR)eiNpFq-Odnl(BGK=T`04vOOzP6U8
z;lLJlXyFH%EpbZBu(bJIBSE6UM(gaUb9-1hQgxIXd@kDBiOb2g!>*|)b^icXtTHwL
z=N?8Es`O{!?H5osDy?Qow!0uO*$BbOf>VmWXPxxMkjUm05gBH9$UAPfRg_&}s?wNg
zV3pAkz!o-M>!I{#PH0pXqlvC)AN!32s$EZ2jyk77MI=<@ci=9LTz^!^RqdWL(|sL5
zMOtL)2&ZH3#Fzzo3pJja(kX)=s*Q~T-I3bEX)2&6Q`BHL9#@`f)V(Pbgg&Y{Ld{7k
zu*JkTsDBVNNZR2|IeeXf;d%XDxnHT*`h-3xuW(0nexnaXcEh~43bskKHr<rf?`wah
z_9`wdKe5!44y&ze;A>2!&H~pxlv-r9Ub|aP=e(XUqNdWn)E#OXhR*9>Yk67@o0Xaj
z#kKH(e$qC_?5T}Kzt|I#OZ6{w1FzCFO8rJi+6BXVEj0&URZ_e1&uglQ#ui&!>KbaQ
za>_Vd*B(3|G+jSbeMjaYb7FUwD>%VF)QWSGwre_(wOagJ+e&HgpK`;yOFCt9TIz`8
zmB#_ND%YvC4yB5p(>2TuBPD|?Euld>bw+9xH4@Z1H*U7lKvAE^bc*9s?DY*VPu1(_
zL{Fx6#|wLf!3rvG!o5Z*4Qwz%<9*n{TfUI|LFww9J(Sfhj-F<=*RrzIy4OsmrF%t0
zFUB4U(on9$8?()2)$8<Gg)LM}8*ne#T<NsX>-7G!Um1DLw_E!!A^b_|_i7rm-XyzP
zeYQNR-5acHDA+_sP!GyXO)uoEY_I6`ty-2%E?Y3PSmjn#R7<ErVr(X2dp9L{?SE8O
z>MjA&%HnthX?hn`pHG-gvPT|n1=XHp^g&~Nup0i6)+DO+8K%Ew?`L6X<k58a^uhVw
zlrc=kez=XV^L4Wyh+FBsDe0LbZJp5@s(oAWJ4ucQ!#qrLEo&BJe(G(coieFx@~Aa^
zS5MR&+BylyW2_57Hdp@u>m6&<Q3@faxWw!iIhG^tv-*!$%|)&n{Wb@P9P8U{+P2yk
z;<Gl!WTT8f84cw}lj2ici(Z-hA*rr~vg(y{7M!{_3@G}K@UKkK>EBUFQF1b4cXht$
ze!6y{8+}$XHl7PgPOsE-$tjPiQ4xP^qYh15&?Ut)=Y3LL0-AEkBQ24p!~|ZKTcK20
zl#rIc=Yq6#Js}3asd}!W5rTi*X#GoFMfi24&{8$zL?3JWll**@jSl-f#-mNHaWhds
zV<Upo%FSz3nx#cRih66wdj|n!?Cz(gqN!^g8$$u)93wTMpu0_T+~_xk-sg~lbd2%a
zJg-L5wR&h;*3r~5<N2BGD(^<<+S;jqHCO6WF!5o^3O~h4y&kpNf2S2yBTbvQT#vfe
zQ1#VTr$~P<=*Ao{-c%cJq)|pO?U??o=~&>Mu7<wPCmFZyrqVQex@Iy-Y7XJUn&m8-
zUazR@9=$}YEhhn^vf0yg#BHSyc#)>ujumlYn_UyjI9`TRb;U&;59M7{*Vt_$L3LR{
z(-l2QJhlG->Mf^yhj0wSs_K0nmM0f%aJF|{71Mg;`fNfdfRVQClzufAbWfipNtK;n
z(wgp^_Qw5EIT&$wn^{9a(mJGYiiuxOR}dE^j~588xBmdtdbAFbj*v{<zsl@|is}0P
zpwp@h6^yBkm$7T_WV~g44y78|rK_uLD_smRfZ>Z3O-|0HW}?dNCOIQ;H@{`*dKXN;
zTBH>XjyIPK4(iH_Lf7<}3t@zqiO6ucR)SK~B|A#dpy*z@*C3#cn&yxk=72p|&58Rf
z9dGesf`x^}kH;-MtiGc9)<Sm{!0TjoD*@CracVU?WvGvNHYKLXXNDJ}MshuuM(dN*
z(SP{98JgqW&BfIxR_Xm(_>9o$@k$$=*0D$a5{)-TqK+R?jv!>YdIqc1`YUOi$GwLZ
zxI8XwnBg9dtW$o^o6Bn^tSr^3T*m`qSnCkA6fkHJ(S}sD(g$*0E~D$MUKZDxXerxL
z*B^D-vsBamZlR8mvr;nt=8S;0Ia=0(lfSa{+7^pjR2!$uEHCY5-KhGWmg-6vn)+B{
zsAp$1FGBo2(ln{48sRG>Hs=>wxv7N+v^Lw|s!B}}jb6_Ht<*Z_Po;PN0E#D;Ffv#!
zLc|EQO=D3r$uyMG6OkiqzM0o6n+y&oXup-=zlc@UGF6#rJr_J41_}L?R%r4{NVgd{
z{;aKcPU=zyLi(mSIDv3*wUl3l6fx1Zq3sg6!sNS>SDDdj`p~UwrQ9}~hLXK|p}Mw8
znA=TK3kViB;dMD9n~go0I{g}hOsFu^Q^;i>(lDmeD@Z?=t7MS_$Ee?F{nq~gQl_S4
zj;woHE-nhm>-|ef98QJQ(aGSsMp8?%i+vgm7Ds9H!bvpGUYzjeWPfD+TV3h;m<(bk
z#Nt0gf}!XxwKUa62gK6{^qjR=_00M$bPlVA2Ei?_?HDCD`3)*E#H8$|r0JS{POH|Y
zkVe-Z(B`crA4Wh!TT<4Rx3M|<6_e@Sw2w^w9Q5A10p+718>@aNQ&<`Z<dXcxMXmdz
z^0c%oh4yGQtp`D;r?m0yb4DG*huu~5$6e9%%}bz-;-a4Y#zLUft9plDpfW*9Srdm2
zD=Q9xQpwBegpkS&$Z)~>C5_4NLwfr?qh0(_>H6wJ`EW#pSc_qKezVqw3a?U>*b|Vo
zT{WcWb#bw^RPnM<IRlivN7H>a_(+llf(9Pk5&r;{qv5Vx(=+ll#iP$PF1gg|h!m4K
zj~~*bq}DpRt?d$4z0te-C&{7EM_TA<<Svk(X#<o{mHJ^Y&1O6%<6EG2>^csG)Ov-Z
zWlW{#B$0JzrhXgMX_JRkJ<<`IhNAjEtKC5Mh~~IFgUZ}jb<7gc{{XVW@-pjWC6wK1
zQyws0%wDO}lwu<xaE?ZfJgTiXrut&Nu4bd^!!b7A*(?^6%^tKLc|%`(4=XvY=@pbM
zGL5pue1Xc?<&kbdmN>m84XXYcXz(=6r)#Wm=WET+?x^F@>M5l#$5L&^=H)tCi!_Kg
z0C{VQsCK<krPK#Bn-lJ9vK4tYtr2lcOx)=mD_aadnf03TMZ=^20FbHr#r1GPBB^Kq
zaNs#sT{-xH=tke*jf7bDAF>;+tF-N2nAB4;(h-uwa8=hC!}}uBjE^^xv@&bR!1mo<
z=+D#ZtsEiDfAp5zEd5Loy{;ah4jqcK=vu0J9aXNZ5A?5+(YOT}H4>2Ck4WkMot8*i
z;zL+}buPctI)yp)>1E#^CvFH^8U|9<X^g4UDkFK@{HDk57DK4(wdT#~`YsWU?BU54
zSWQs>036`#PMqrQpwXmkKbUchWB8ut{leT*{vgxD(CtG>ibCwVT47>-p?UoWrB!&U
z*|GNiVakG{7tl;w7UnhFT<!%zSpCH5jFVrn>TUc<=~p(*mP&a%NWwq5dp{9ldmS7T
zHlicsTrUyUsOlphnte0f6SKXd;YX)x{)9rnv~hH@#-gkcxjOWEeydxf>JmCbO$<^y
zCCqJ>M_kqDC>miO#&f?(X~<M{I<cs<P?9%c9i?=|T}W)=kJgO-r(X6$9ycd!e3MaB
zfNS+xUq*cr=kCYIS?1N&8O&}k+V3mX>OT*qlT7^1n=qB#;CQk9)>*nF@KyR%+I+B+
zi#RT-M=s2zZiiDmVt6JJ5&Ww2qA8hCUmZ4~6QHrNzXe=W>4FAco7w=r(~Bz2IvL$w
z*NOI<^6nA1wV+d7p8o*T9V??6CWb>E(mPtnKC$UN3-XR6h@J)uO^8^k4y~`zV-1+O
zmhLjrg4H_CeOiA-@w&%{wBZMrRYs0CcVjd<JvUC&WrnJzDz-V^-%{Ixz0~xr8}g2-
zr>GIM3zibH6}=TvtOnF+)!vms&7ABiJzqlW8d!}ql@G=Ma5g_h7du)j@wmGWW}_Rm
zLj-fSIKj2nsx2B?hy&v-mgAP;c`G!!*j!C>B#LYPujMM|OzM4WMrWqkcgNT`s=_HP
zlgQh8Hr09y04|nWJa#;)nu+3~X=7vrcLyqtudHiphS?b6einYeQmU4qF|oa`ILb1L
zV#U8~)lFALDFRrU>l_yLTRw}a)8~j%R0y3P^1Obw{nwOf@Kl<X`t5s5z82<#K&*5^
zuTGq@P%pQ$l;tFgLJgjUt@QnUB>}9`>IGdX{Z=04{Z<aVR6UL^fV>;u86Rb9)7^Jf
zqtyORt<I;HhX;>i){1>^r*%=e<~mxF<Mg=*<-J*@7aq~%=ce1K%IC#900-R5<b9RK
zm(dOpZ>N;F_hX8+>U}<vA}grm9-~deqc$qPPU_m04@u>&kZ^62`z;)f>6%bYS_9N{
z3F%4P;>&UgK+xU_ma)$gHQa)3u4mScs$Uz3yLmq-eI{{1R9{g>Cym|hkgFxDB%4gV
zq|@l-hkvBj5u6MZHla~VPR~kEY<qyM>9rjycnjg3k>fGH1!Q`jww>F(EwXm@<SrNF
z<WG$qQNtIrVbWU6G?0iVnUye}FUSbKuh;4*bn`x&FR2$h3CLbWLh8>_<9rNx_CDU<
zy0MO3N|sN{>M_b`<l<KQnpGSd*qXCL(w~Sm=CAmV-vf`im$?gTS2mBVQkj|~Wc=@F
z0pVdNzYn0T0>4MB^kgRIX~Fu1s?hXV;cua+v|M1w%oFmJw!e!j7^b#W&!f{xG?K_n
zmOrhc-?&0m(Zc9m8zgrej#l=crrH=?OI}%i&+qkF9<|Y{sADqvaz^3$WQ&I@!<Ai<
zpBw1N%NwZOusZ%c6wymXQ(;=u1J4iSF07QvN*g|9Kl_crK?*9@i?UMocDkautrD&~
zW|D(Ra~K;*Qw>CChMbT5gsz)ZrI5lJV?X|G_;=A|psTCXYZ)Nl7;A>%d=<EmS69<V
zECI5M0tgujcRXxw(nUY|B|fE9>oze*P+jhg_yqhO%VDN;%{@FV1=g61Za?y~Q1x4&
zpYj@|7`reewTSww89JhnwXwxe*Ae<f&{p<WNm4B8-8P<fRmW(5{OIHEs5Naylr)H3
z*Z6ZvO=7!NuBI)eX87&yXwAaTQ^P4Gu4cz~1Z7b{f7pzh?FnBcV@Q#%`Z-HU)V0iL
zj!7~w9D9A$#+wOjVUn@3Gx}aIfAE{AX&QW@@Q*>~v&F~Qr+imPl5)PqgI|)VzLikg
z-p(8-Y9cRo>ROSWLI$TzucVIRJ<&TJ+=L`fm4rKX-1FflJJD4K*lm49Oc7c`f1;00
z>ME)!1dJqs@{+qx)hcQINat+rwd~QAoBXz=6+^BFw;+xZN+WV>qtvwisgG2qG0OIX
zZulWnYLU#=J@L2IjN}&Ng<aFygbizA)M?t>ThtBz04qxj5ysI`MNtrq+_dBs2)+_J
z8s!@)dTUZFt88^wEhfV2YW|p$REyQ1mNRkw+5Z57vz0VWsgODtn%R5p;FLy>ug#>$
z*k^3e5NtOCwEfe{Ej~y{N;1$ErPI|kb$*pmaN2kx&L2bFNlh7nrJ?)V{npN>s3|on
zU^NPD?IOZfjE}m=YI`7@I+|9#CmRnV>Wn39(poFEHnq;XFnfhoKp&?gy1a7?nRe1X
z6?J_Z24j7Q?7HG|$$`Z?w_G@oI~4f~C2=g~-V`mk1WCtY6X1g2xsN1xAsQ7ip@PH~
z^W|38Q_U2G%*gH)q>gcB$F%M5WzO{E7r8%PP-vo&L;07n*aziXXp9w;UCv;(c9UzM
z>mpzzv{<2>{{TpfgS7Vtg`(-%r1Wgrr?#pW8hA@y-beK+dYWmXc@i<rJ=Vvi;||lB
zZXIwv!52P<4A4r)7Z<!-AC=bNq_jazr$?MSb6tX*YDodIv`KFF$odp+v!d!6d2^(R
z&WxNs%8-}7;C2h1aci=+%Nk8ewvGGgD<zJ{i>sOrpscEO>f(lX4jvn|-`kbvwOWkP
zN+Wo+&A3_}9q%!+$0`XsD;U|VsjqC2JjElUco}K#vQ?nD?sKfJCUb-rBP%<oOiP{m
zigxJgSgIh-EiNq~w)!SXrNsXLeVT`Pm96y~`vfG~jDXm?X&sU{$@Fu{$EF|XM-{+z
zt=V(yOi`8z2p&5u?Ov=ewazy}x~cMIuek7&gsc}5_H9X{^*IYJsLPu={uO*}jz;92
z-U{PR!ICVG0CPbP)JujNbqD5Vej3{)jyAQ|0^o9riLp7h#nXIfSCO5h$s;O%i@{e;
zp%|7IIhW0vY^oYs!)`!U+D&_1Gb5Aqk!zLHjn<BNt9CuI>a^$hb&eo#4pDGxI;$}A
z>JOE4{Vk>uBu8*?x{jYuX5t-SRsJ@%Nl5{-U6B6(xld#CQ^&8;j7Thgwz8Dz?GA7(
z$l$8#-8LtIW()a2#f3kz;tfuUTl>eHsUIv37i-#n>nQpShuBE_rF1i}fXN-7B?V#8
zru4(j!-2nK$F|1TvZ7^GRWQjV5gxJ#+VC&(k0y=TV&^%$C?uS4Q(02UN3q|!j!lH;
z?zb?}&v<u*6XdrADY3w~OxoMs#Ut3nPiFIU^A(0Lq>1g^0Bwh5D}xV(k^_?iH*RnH
zCi<iRijpSwP{|Fm*eyonFu0R<JM5&2P}77ngMr~Sj?WfI)em9rl1K4?n;RrAxqcK;
zNYE@?n<YWLqZmpO+BOZBE<n~s2q2J3992vOlYo5LCxr2n5vwU{*wSoU-?{+EV~{s*
z92Iw|#9GsEsV9$j=~R+ZMAK=SEeff#w`Ilr6>|7q&<FsJg@@DUl8&XWBI5ZAaYIn^
z6D5f5YlZArG_=b{Vgr5;*%wS{XK$ulW0$q~Dkq3#&-+gP$`>&9<abEjl&TMIl~m^&
zFc7)gO;;i^3L{AB3W`0kRK&?6AEeubuF`eAGO&i!MkBxT1sUa%?GB*3MiNavvM>FY
z50S#HsoxvzD;*oVTynj(JvxeL_eCUbX;pgPP3hHf7DyT$*!WXkLQi8nZb<SkP+yCD
z`9#Fai?!KSdf!adP!i~XmLPcwnm<w_adYG@sLe@QBP7$=X-e3D0!Lc?*HvllKK76=
z{LSE~X{2P94;Dm4Q1~7}1<{qAu7hZ-d;zZ6Ge^}*bl+z9UA?E9c12am1kAeyzwJZ8
zQ21O62@5CoD^<`O)J4GGa3LfR5O%rw?5_l|RL6HWWBxcmPY`RfkCeb7Y;s5XfgT7_
zM(a3wqjP+zDdySik-M0DsVXCjZur4i!7#-XvDvN!e5c8$$qPiDn}d5e94f|dY26d-
zMr^F8b(yKLAO)Sl7YU3N10$J@Gdjd@M<HG5kEdfp9$PbQZ1z<Jv=!h>1frf(*zi;m
z$2<-p-M^WIPD#+pjce&Cr(ra&X&=+vD!R=&M*Em@6*DynsT>^~zM=3xQk~sS`A4TL
z4js1v!sT$4lu|<tTyRQbs{|h)sA{z#PT=@MY8l<7MNnH-T=|)Q1R+fmT0vu#mNdHu
zGXDTdpFq|Rq}ku6)p4>%dr$74sdSZGZQTpmBYPH=nv#klEh7%@Lx*K+r0SZ^l+f6x
zHB|lMeryvfLb_nC(ktP9W8m@=oljE}Nqi3t@<Py4>-u$Q{yYz+m-@RBi>K8onDM#s
zNY9>7bNdR3iZYnwC8f<bR#EDvb_lEE^#!aRISXSZi_`r<72=tc)mFoSuqWkYHSV9(
zbSbS<5qt;q%F%FEwIgw8m{KxGw^2?cZ+OZG0ND#%$44OK6&)*@_wHlNPX3^Xl+?!U
z)gVt7X&cB*8(oO$^g2co-_yCiY=M>*IP-*OuXi`okdRceKqPMe08YpHf)*5tp$>3<
zms7^)fEs<kX30yoJhn#QcTx?b+|nL9`Aa8gqR`ev*;!!Y^gWQX$0S7B?icWniL7>6
zU_w_zAO_<fJ<=z=m8(U4Bg175zQca~maj{Zv&Cmw<FQmsr=*namhnI7f}Yws+7}7w
zB-}a22kMg~d30#DjU?Jka)MgGeu|G$&_jcZS&`vbXxj8{k+9W&0z-@TD@W)<P|KSe
zj5(?bP7J1{rg>!W$w?t&$Fz4{9FL5LMshN@`o4rFW4A}Sy_^EY>UvF83(MHYIxmIO
z45~yYjmKy<lTr1U8#S&tDEK95wnx=v*!IY7+&j2N(o}(FIN4O4noE|p<1O+N3=zw6
z(gE&(r>cBsAi0Ge!r58sK<{^OwFHIGIfoZ-bVWR*ayzF-Fmc&17Z|!n!dvc)tYETQ
z_Feh;QAraVEY$;LxdR}nuIp#}BF)e{p?qYMdoGCBA`9?A%7#W*7e;P5A!{=o$N+xH
zt}ku?xKT$no&my~OwTy;WI6>5yT`eP-wH-f9N-^teu=NK7iszw(UWOfTJJrRAO&s%
z<Sr~>_cVd@LmyHz&Dx}6OY<AE-D?$+2R)~R;2S46DmFOAZ1Kt_7Pa|lx58kifoFy6
zZO%uKqHKYN#{U3NtRJ|3tc!DGB+v(Ynru?gEt0X#dvXD9keM_WwY%_xW2BAt9>e{L
zHYo$g8(sa1JsQ4<3mqSl6AZ2f<a>OMQF36AMT#11o;$5(9t3h{<Hi#%_TU}E!BCsG
zkJ&yqwZrGQKphHX{{Zj8jl>h;%6GQl8+PSD@ne7RiVcX&p2gl$OA{P6ya#u>;gf#p
z41j_ipOhJZ>S&F(Fp@hF$W@gQNXHUey{D1_z7fbh(VLHj1FYljZJazUc5S9m#}5vI
zK-2vvf{cc;NZMkM8=vHG!Bfvh$q6FOcaShpt`3OosEoaxlFA8{j!GEW;@#|!#P8@g
zvYtAZZnr=3nkZqbAHj2F@W)}p=u~1UASJdWj255N)d@hfa$iBsWHk*p!~AeibyRX~
zC7$o{rEJW37Js|@rx~STvxfHh@RMkE?4@t38?BIhc2fxn!+_yiHIU9O7##2JqLv6`
z8*OWM9E9niDvIA}xNrm%$FpI(O~;Q2sWkam()NPp`3NURD_wUs-$c)2#z8Q=U_5i>
z5$Kix=$&u-Nypg_42^Yz+hgS!6I>bW%X@^VGg~Lq-yFx%k-Hub4jlaoGJ10u_FUhP
zc~#-08-Z{;9#PcQq0JG#&I7UK2EK`_K*rz@=KNTuJlTb#gV|g~922x{=df|g3ciKm
z{@mMyx3Y>wB&>5CcHnqSu{`0(s;0fTaLv%{eV#Xre5YF|nnRczGn?B9CA6d7EPfH*
zlOGUtP7cOec?f66pDQK_FcK`{*AZ^s7Y4M89z3G`684eL)NqG<WE&6JHH*kn$r{_V
z2RE`n=D2a6l=x-X;tmRPn8zE8JNp!D66(;g!qZ~TQan6hi>47QM+V2TA{j2<du)7_
znxa-V2=||7BeCTfPhC6=G0Hcy!?_9zG>}-}9oa}_4sO|)E&V|+W@NsrB_Ocg-Ml7E
z3nT=L6%nUz>Zg<fm}(?zw#?EGk-{l`0{+1&B6My(KgtqYwCA58Tsh2@rr;k4N$LLp
zro<k|jSv>hZD|JK^10B0H^xC7$8?g!T6`um)M>v9A(~@Iz6h~MJ-8>~K395#UA8_`
z3k|yz*Jeo_#g9G{fx=C;?6`Qg60wDFy_Ar&lZ%3)`2#8Oy})+{%LeS7!o%J^E}B|-
z1Q3<70@HEIa~e;%mIJ~UU5eEa7Tn{Xo)a9~VH8+N$Xw`soM8|-f*TGEly4Z?q;Rp}
zAZ^AlienIu7)@}wz0>6On-SeGIj09F%5=%JJYyGJN4qHjvvZX8*yjAAgkbMw`wN90
z(mtrSv;lP!!0xq~9Spd$hxSvngOG59a3JFfNUja?5NO2Zr<)`(++N{H8`?;^m@qgJ
z)H!{a7%{^*T*(~M-A?9~izv%M`h|^QH1z-xaz5z4%(u#?AdV7xhsi^YjE{YT(s;X~
zl3zPbf{vn<n}m+0h8FfOeaab)bHE}}-wh7RS!gGCxof_z$yQp?$o3mc3{UqqXzV+?
z3Dq;s<FU0;$kE$%niXlHovs1$HNOQL6X~OmWRuGBF}61U0Low@Du|l<da^!4*{$R5
zolY4@3$`*N*aq$?t}`%~!A@fxjE>5K)Rsa-gcJV&Yk%b}gq}LtgvIT>&vKSZxurQ^
zbG(yuJ1LBg06q8mt6C}u*wAHvsDGuV{{Xp4!U0W1RZ%tB8-VWO>j184VuqENcdIXp
zDCz|E*w7<j7-%_NO4h>>FJNIj5^lF<B$|4O&eARMe5t4?Zqp?1Y#@0dRn$uG;#xO@
z+`7rJ2RWp=5(mLdv<909t(~5;qJ~G#2kfWQBC03UZR7s{^e&;Jr*x$M02o3CauAyC
zr9-0AI!e7vy!LBe8kTt!MvNOSUiL>Jmbykf4$lE&def~aAP$O^tR!O1AOZU<4^(w?
z^#{H<XW0$--fpr|NXOmb;CUs<Ey;ZisK2t`UFr$z<Suz}AJf@TK5tVli@HNA%kiHG
zh&0-Y$AKGNG>+kn7bo^kl0vyQLApQb1LaLhC6+)S8+%+WPJ{Sw)RoU`ou|5*FEgFD
z`*OV#Oy~#E(zTCu7W-w)jJW>gMt)`tU(QI}B`%SL>3*88tdLxXU(aRqcj1>rwu?*^
zHCq}jy2ikM>j6p9^-#C|o~5n&G=x<8PO~gtl}@QFkpBSrz3#G{zb)fcDWI<&e#^ha
zO+!zfr0H~Rpp;(HNE{B)_E~u0qNaz^rHO&v%SF`e(48Hc$HqQ3*&7y#T3KezNY)RV
z6e0N!9k1qtC{21Po)|&jxF3ZyG|@UO=B8(OU}gd?T^*uJNjqJh0m42i7~_lr=Mp>;
z0$F}f#e=6bABJzx6)v41i`8pm+B-SG6jV~WC|q3|Az&GH{FLcp0h?MJ<L2tBr$%JO
z&X#G7`(D99f0*%CQvU$^AN+Zh+P=8~d*i0QKU234^1S~5srt^AjJhEI09IfAtJ!ZV
zbX_&)(UFDiwrulr_fk>xhfFozq<Td&r1K!$f4bzK=RA1*zx@<gW_YC@udHg-R;Fam
z2Y}X+w3Hn))%Aoq?0r0a%iU${+J27r0Tm@Ybj%!jYz?x|X`MF|1WQvd<|ORiQIF+v
zWMA>Zm-ZvXm-3P29XI%CQ&!>miC-!HVg<+USD@(~1EXlreqvg2Bib)_y9;+uN9e`s
zPWHtUavITPm+E~&T}Zl<O{bP{-hDC3>c^WlPuBLy)DyCUQ`f6p<4HjraYEdCPYQ~=
zRfd#arGi-x^tnl`yHwNSbZ1AXfLktgg7eCqag@4`sVr@hOW-{2vh=X{@q)j9Wap8~
zNc1W_FGAOLn%y^0sB^!Q*4p3fv^1ZFT_|F^ba*LA&B-r6+^m*?_>rdRG^T2Xhe>V>
zM!{6-e~o=Zsnr@?28tG!8wVDyn5gyH2Ic74bq7IcbQG>Etd23s7upskT8^31<S@xq
z1Krqxxo0)_I*(PoM!&BzGVJ<MoyX~5vnQtJmZUlnSv-B*S!5))r9;KH+32l@O{tl+
zFt`zWfYtyOw^8b?GfmJoO4!T8O@_?fd36M{P%uFSJwu)`mX$4Ljje0G$z(9bdpOw`
zw@n~7y_GQQQ)=3S+WDLdoOb86*S-D})@Xe*M9Qk2l1ppvc2|;Uy$<>ZG}uVv{K45?
zo1k>8Y@sz8gyrB1f!S!|oBld8oL6SQtA8GJdOAl%3tIPqU>Z4IVMo{SYuc%wRfzsv
zoG_?0sA;OTAxo#y!}_g#forsH!;uXS=c{C=APbO4uu8mXKiRtr%)g4!X-m{POjPZD
zlIJrYqzkGZq3XV(t6_$ROqR$00C4+4s_G7_(E55uK@eopHvzG%Wq(=gy4^>kM^E`!
zU5lKQT2I)D%`GOoKAH=)T2VZg{U**;x`w0GI`p2GPxS1JV~%7IkU#LYpM~8YrcW~`
z)oNW;P;7R)h3>jt1tkSDW2A~W+Bglu52|Grj|%9o!J(_d+K#K9vKd{>ZFPe6E|~l~
z={}q-I&A|VApUtWO4H3KU?s#4s;qXgO%#?dWyi{!l0)`gLmL{~1_qA-QgwVfxB7IC
z(p?ypqToE)2dwqZm8H`<YO0u;){Zv|uMzw~{A{k&<aV9Y5fTZpmBRr_Q&Rm_*wIzC
zIp2&Lzf9_KY28~y;{C)m@W>r;*-ff`HRz_4$po@B*25eZkn7q%P*#JeYBbSKUT$95
zE`Mch(VaD>)NQHMnAsTKV|R4_00Zf|73KDk7f}8u>$?1}r_)=qH(;LjSHFgu4u?~E
zo})3ka&CQI5^EZdPw8#+^sO$Lu5T{eb(oV>tFD|F>E7nwhBFG7)N#Mn6O(i7^}T;f
z>DN*^4H_7Xp|)?P+pjdD(skH%g4)`L(m}ffvld!Dp4MBZQ-WzGYrEaNqiXf~3h+*)
z1dq3ZMUj){JQFn?FGEOUX_r=s<aaGvjYCk<sOSimx(%%y;e7qC^+uUVJDWn;<7n*S
zZnM?8y<Vs-43!z<aU>$AN~q2)GtfHAt~B`S9}O{%aeEWl57Je2y0v_7bWL?N?&cTT
z;bF9XmaD6(W9p6APnGni;bw``T3sAwr_+>x32TZ~2)A-(bCOh%FzFX+`e1gArc=|@
z2I1~-3jx;sE!MhyE2FQ}V~#P|hXj3>zUmt0lS@M9Y4nc-3>FM8o_`ej%Br%p)NsW!
zo=u3_N?Gx`O2dv)`#g_Rqp6Oe(YkH!zaXZ^)B3EeYmGC@9m9tU*7`f3#-l<jt73Cp
z@o)%Nlzl&>K{2M9S>k(tOPKtA#a=ihg!xl@JoBT!4QuNfDnWBx4aVi`oj=r79V197
zH4j5;MZbs^Z(FI=v;ne_?Vg<Q{tb}&H%r%beM4%is$J>xu)mOml3HDgt@;k?{{Y2`
zxy$La&4Yd}-WE$wt?D}I_cESY9U=Wgh3QPvv`&|6WB&k8ibLOU4!Vn0)pU~&tw~KC
zB*0^40+Ml0?5`J8%1Tav)oNh;=Bp%(1Yc#%m!9>kG!(UNrKLWkjk`(tTFrB-wV9~j
zPBk|&J^*RTf8qZCM^oz6ADF9{Navl`deXVI$3sQN5!vMQdKG@DQRzcZCER~d7Yj>G
z_(8AC!6RjegXP&@L$gKGG>9)85f?Oe3mw&+XH!DgMNg#8;lO)Yf%jBtN3vIa7;O)s
zbxxhBZCR~|7G#U9O@5NjqN8o4W2I(qZvOyKh3V$Esbq21E2X4q7Y!fst!fUH(#-;z
zy^}EK^<^&$RyR7)U#Il`ujzV5j-O+3az)mwrMh|;F6!Eb?*5W^SlxTBXl18xrIG%%
zvA4?4QA^cTq18~$BQN@Q6P1%`>t?95ZT|oh^*s|yqjOudzSskm=Uoxk^}24L=;5V?
zsu>No%HQx+Pf+L`Nm){4sozj<du0Kp)9SiyOGLVSf-rL8&JwOyY-ZI`K8Dity%VV;
zj=HXzDoHln?7&fLT`SWiu48JNPt=9y^c__-B?x1Aw*gXWomo)%9QL*CJ&%P>YpNl^
zt=V<2bYDvfmc;s}M<dOe;UKU-D*I0SC~I`lBSf+e(l*X%UQ6oN>otHq&Me)Ne6Mc&
zJFJsP(_@eQUS^ACH@@ThrBHHuD5uA?P|MJA&@s|JnZ<+ogHtqJV^7iKF-*qZ`6O_*
zy4PLPQU@{hak}^|=IhP+kEps*vR6$lF4<2dn7Ut%OW4kFYN)r=`qNE(fwa&YcP(yK
zKdE&Zy+$+nZ9YkV{{R}j&?_`ri0@6OO@7V{xc$}knXExYTESCBV~>w}EDzmk-q;$}
zj7LS(oxhdUG>M@H0nU!$X=dsDC_C4Qjf@<D*?KIs{V7#J>ShUm`n7pyS?f^2JEEqR
z?Y}MI31i{3!yK2UhRdnVro6=i+SdFOJsz)DQ(D(mJV?NCbOi>XrBpDssm>Bx`I~~I
zcB`gQo5vVGQ-oE~la1{3tut662E|7X`49A)SsHZSs;B|dHSB@h9&E84E7i1n+UC=e
z;o8?*hkhqT1t*~B%LTA|B$h|hL$BzLlc(hT$cs>UEGHzRb+5wSp0CrM@u*7+$mOrH
z$-As)s;YU3+v6t|?1-0IsjP^`(>So@rr|BhNDb4o3oqd0j@KU)I)kQ)_<gRo8du?L
znq4Dg6*0<N*qx<nx*n14KCDtYN80A+A$M8T)_P839vI<^+R56IhQk_ivo{rG2ANVI
zmOYcVi{|Rh-Dbu{U=%WL>~`R+R*O{wdX=u#OXk{aEH9PqlyY?B`g0voO2XZ^4rWy_
zWtu`|#};_ETGi@Rkh#%muG`Jp7o1b-H8j=RWn{2A{2X0<8`QPB4IMkoGPR93+ueC{
z;?Xr7bN;Vypm;nGn>J6eapU>|(<?QasCLoEHP3OvWp0Di^#nR<Nn8)}U3z|-PowEn
z&61v>hA=obMNQUvEHRckrY1YVvf-DKuSZhC-)0A-w63nx>RQ@5hRDN_8=bf8uj@L?
zT+yCJp+`|0hd$lS{nS-Dq`IA8cA0h?-+X0XQ`2gWq}x$8;(x8T1$5w2Yn@TgmBoIh
zV_Mg0dXk8mM^hOHw$}cjyo0Hz^_?!a)Sg1z+ymKrey{mDZ+mq5cxncHNWg9X0A+*f
ztxffDx*znm%Kpy1?wV4QcEK30MHYe8by3rXIq$awh3I+*O-s~zc&TosQybrq&~CFI
zhT3!!Y8KRKVhrpHd#_@A4$!HEexCsm2H$H%!j?&>l!PSA%@;-LI%zR}Z`HqNw)a)q
z?@Vi@z(+>izts`X>`}Ux;<Yqnz4Wp{P}6L;1yO2Wj1H)XvMMV}z<XW)019eOUWRLl
zqv#5X-4401*EzwXjo2Z31bX(DEf_TqX$8HGSIru4RcjjEP>Qc+!g(#R1M02nCDdr4
zbg)!DSirlO<G}b`5R9v$QgQ6mekM-PA2yL!Ew6JM&-h+STI!m!C+19YUo3wGY4obE
z{Xr|K{{S@jO~0Ruq56-eYp5bKzhj^o^%!mvyfLe2Xykn+GKQ*=v4&OC#^b?oT`f#7
zOX^XA!GCEhKSik08T}dFHiK>FveH2-DPa@DVVV=>&IK%E#SG=hIlAq2RT-u-fNgA?
zER5Ptr6p60n~O=l)7@xWRYmGHLq_<6k1^%Hw`H=?pwXXB*=_FmKk%}s?VwjJBMU>N
z8hA-|=D*=pYYx;!;$=gc)5h)>r0ddYal%X!FuZ>)`B|3K=@oAD=X0WP<8y8TdV|=n
zlF?Vv`WtEhb!4TI9vs|)tTkN*7#`P<**2fl&VJz${+Pni=}hKCe@w7Ddw%1Pj?=U{
z=0DYvp|uft2eKTmpr!U&=^CXh6isI4jia_WSk9u<buD9BG}>#!Tr$?2U1&9fOGzI2
z17vRnuEG7#OwgjP46V~<eLUkW^#Qlou6Em%v!XFgX_YZatkFNxuBDxm4jdYP%6z(x
zqqzE{xONW0-)S1IsT~L8b)7Yp4FcYw&HjZpS}iiQhA5gG=YQ==EpMSu9Mb4Vg?lhm
zRg~VSl4vg|&Tv+$Df)j@)66x@WOG{&AyD-WhBWDKF8X+{a0%Q$bsa2J^4ZZ<#PBn;
zy2tFhu{M^@Ii+PDv!k6lsnSFYkb`#18SIMED<t(AW^9jP?pCTA{Vqy>LFPN~TK?&=
zOG8dWXxPvX>S@R*Wl3!fiMeQG1%@LmGB*Pv_9};{^%sbUWlNez0F>^k)gq%L#u~>v
zuvzxg$*NiAKu3$^K}(U*C%~&3q_3*?7CW&m36+$_t>N!!E$0gQ9TFHW;~l)CDd^}V
zC7aycy@EE8Hn|6MW{acOQhHSnbP{$WAqmyJF&>-mf^s8w^Rd?pp>;hY$b5yd{{UDv
zAxEegD;n6Kua0<}a9ryUi<0yXEp}q6^xe`B%8?=Q!CMZD(61YA%lRji`Yw@lRV|o3
z&L<_uEnB@ZmKtbUB@GrFg*MceW5qbTq8Q?B1R=1D_qHyXQB_*ly=qcRhcUY#rt4az
zJ3)=48~*?>?5nihMy6Bg!qVnnlDTDxu8yeWzRyJH2lV$+14phw9VKTCk%GXW{{Rs>
z8lyyk)s)gUT2YYUkg*zzE9t7^si$+Jc*#dr^_I6TktGd8h3s=nY~%6ry6coWrgFJB
z&%FR>+O#vj(5V59;~aj<_M4=%%9s9OrZ-<ZZELSDpoXB;?K1jcyOY^_4@Xn#bhL4L
z;yRc}yJcs%fAF~YH0_;gYN-b4y&t9A7t%)GuPWjiD0GWDncl(tg+r)S3TT9nbM{++
zZnO0rM@u`sII1mg<$elwrRbfd*|V2cF+d(7j04C5%7<I08oT4EqLde~+{SoK)9Ry=
z5(JEpp4YvQlS$}S2_vZV+Htk1@uuFylSyc<)-=keM(xmTHpuQ)Vv33fPUcqLp6<5m
zaJ?nf8<}|~-HvXv{Y6U*k(Z6Tt#C(m(BWG|6!|(Ssx&=Dm8J1owv>zzZi>-#+9p#I
zF>G%=h_#gjTK#^NRp~@tSa4fnK~~h-fYc|9R77LnlIIH#-A{|VDSnA6DnHZeJxFIJ
zG2r1^Q}rWjq7hUzj{sZTuITzhOV_CcPMAdNV71oD%5^tMYP~chbE##krR^+2<b6U5
zk3p$FVA_NbSIFq1nW9hWD=(?&m4ar&B{BCKG>#F}MecE#t&-R9K?>m4R7p+gx=VrC
z-I6&tKj=JEyC^8Mx9M{1uA}z4->J6;?yRQLbg3Kb)9u_d>AU_4w9>0;9^cE=#@fh7
zEpf;nRLZ?JFHp-y$5W2XF1TGPc8ECfVSP0HIszRm4JEt>fpE8aKT`DDNNrUtFx&a<
zh2>IBQ3QdrF{3}qRm=>bt)*-axGolOJ=B~prcyJm&r+(N@b_0{%E3V)J<YDGE4mA!
zwK`cNp{RfoJ-(Z);q+KGbpD@7D3{URJYMT@p}$NlV;aWB@Hlt=Q)9t7cFjETN1ST?
z390C{GMKfYJuY^!*A5?B^0HN0HlY;lsMuTqzo^d3+&ZD!M6|Aku76D18?*Zr<=WP>
z{*YYSPfoI&n>ajX-vt@qly+!lOfRSCH2qE{wzL?kT5%%|(tf^G?QW4v`Cmd80WiZ|
z*!@;An^n?vD1AyA!B03I=wvoG_)$yLGqsMVmE?xtI6Et1oqn=L%NyKT2EU|g8f?e&
zakfSia6z~z7$J?v{*~ql4>3uWpP^IBs82KZNjZ`~=_iC>rmK<`)KXG<vA5jdIU#J3
zgW3i;Oe;sL7YuV78^#M9F4Oc{IQ2SuSj06{PB6G+hVE*i(<?OkvFO!AB5>_%8?M#=
z05d`XqL|Fbf9<<CT-+LesnFW3n++@d9!Cf1b)Jif;jYEeI)<?=2>$@9Yb9X*cK2Rp
z`H5(fHa?D{leOO0C~CFZ*0a#4b;YbMs_|cHnH7<zr=!v$>Pl+)#1wTNg!~4`a8b22
zT7zl58mV`<ivny|yhZKQ8z`&V?@s>G+^gL?UDe<hmC{QA8ObChX{{lWZ)~*Jw92<u
zdaZ|RUEPBSe?q<z9UM*#?~FM|2U1rVw$o4PfNogtb4uH2+T9&x5RR^yk;!kd`X+>B
z4T4QQ88byss8hf54J>nUVa?UIO2Mh=u@6UdjBBthn|%`MTAdz`UfPJ-*&{9++qVnW
zI$kXwU(y*<K<2|KXt&iaOs+#m98u?*)Vdy`L$w-6>FNlveXI#tNi-cgT~IUg5&A&j
zhiCU*m)E^7O6oZy)Cau&nWMoUE6A$pU8c_Jc_bB3_H#}`XitzO`ku4Wv^sqx4QzWQ
z4IWWi_L-tqu)bJZ1cQgPTFcJ5S5lgaE$patu#e?Gsj0nBt!lMUxzNZxGmE#7nZkc!
zDWcA*D5970&7L_20l@zNlm@RwSq(9DITJLG(lSEF==#&Ny5l8Wa!4F~#I5e0A=T*(
zUY#$dTawG+XK4m4HfD59b@Y`+Iqv3zXGY<|x~Ydr)Y>M6t*4aoLBabcJZTlxAD7i=
z{W-W2w+YofIBBEbr%YcTHY$*Xt3h(&>4SQ*(Cuc%kPU;GkV0DDN_fNE#uuOFwpBG_
z^&L6o?u?fA2O(F<t<*X|L~UpsfU;Glg_6CdXyDV~sAK&*ZXAz4WlLQ7wC6do63}^J
zI8BdOAbOEJwncfPRB2lLE~C|BY;xMocs3<ZB%-@o3?na0tI&1FMKGEvcDNj|*#&R3
z&ZFt=U9F|mDaAa82XMO_ehTxgccJwiI#W}nJ=G9$M{p6HIZqU{{*_By**k;CLJ;{s
zgAAp^`6JSurRi|6{z|LUY2l9jC1$m~CLR8ubEAJZ92HktO{vjZT1uzX(~te9A9H?+
zMpj8xN$N#kyB2g(jI^YdIYI1b&N5nH{{X~=-kE;zdydJI2W>8MOWWjf7e(u_#7YB!
z?i9~`&$QV1SBudZEtL{MyWGcP;W3VqH`oh-;aSYqxbC*Y<RB(&jF8#8!STvHnu#Nk
zu5FwNB=A!tYaU2$2>sK283T7WBgb%%A5!-O5roviXk^sE&DtHf+q$i(gVP11eUbAz
zMq=jw04f*zu1;>1CYgfzb6=NC0yl!_LC76~^o<8qq1B-eq@A)6$nF=9&cY7nlk!yB
zMNMr5Yig(t=>f}Fe^Rt^IEdnpZEy~2qI+8AI|Mi^uD#Ke^#RospTd7OYP-<&X6h6y
zb!2X*n2sJSQQ*Ema~>QO)RflBC^UGUtJ8Im)E`z2&A&ER8b+78CfxdEqc>iaRLExp
zOAsXdD(Z?TV`1AEw`CbYC8F4t?8NHv$qZXZxu9~gHF8=|T;XNB*P$Mpwu=ty&b7kU
zImaP$dp!w%5h@-H%YCQF?y9v9Nzu5!+Tbup1r7Q4MB*GtZP5CKQzwiDl~pYsW<|21
zp@(@O++B1<?ckJrbfmX%8{6^O8AnSPa3z7m!COp_6fZ6uB3mS`0@wYO+cer~2I_mY
z!;n<;nsig2NRbss06X-%?vb<_Gw{VMkG04sh_v~OhpO_%o*Wg-+H>iqG0Pj6{=nk@
z07c%b;>O%}1TA6XWHkCbvAME7R?QdvsE6tCy3eO}#}3Lb&AOe%(7cZ<JSBFo8;CxM
zWBc2Jg|=l$n!cE?{tx8pMV;E}!mcMo?@^pA7}Vu6$0HkUrEWBO==B<Xg!}g372Sg+
zs%JJxQ?x$e?G6N9*+NdhNwSzX^79by(z>mpz_;|3R)w;rraM01s0E9M2&qlnMi8<B
z*NZ8-3Ob>!*n6sq=vd$^Y<nwOgJxY-)IW59S!Rv224tzHKF1Ohf7WM=kmi%*qGT;M
z7eY@14*(R7Ax~kH+WZ_!Y>$UhqL&VPM~tkb)WEpd3n5)jcO9gUp-D_@H;tZ^!tIbI
zlXrVw30N0PR|&+9x5{*SwRB_$IFa>2+A=rI-U!N4><~^CN|&gf(Pz81Zj5hGM(_oN
zzNqpTyprDtNi5z98ZAy4Es^`FT{LbN4huOW3A~O|+bARD4(S?rAvVMuSt~&c^=#x!
zGl9Se7K{VgHP6{{O2+JyQkLyG!laSy-Hyol=VQgMY^utPKLJuC<=EFelXHTv`fpb-
zMqryPIcvYAXA6KL`A(*nW5cdMzX(nWMvS<-H%^t)9nEke_#rv2kP8f|8X3$?5=Q;)
z?%S)XdD%Qc>_1WALBfji3T&*9Y<RIvaeIG6j%e}<OEtsa_91Y)4T%nKl{Xt7kv$fv
ztI&I?>z?L+NjD2cr}ceYk?g66Nbmb{R$0IijtXpVFuQX}7Vf7!5ua$JayXhA{-%Y%
zjl_9t@TpwrYMf+;+nj|YZ=%!>rC2sez<L&@mTf*;wB9@6!?;O~9~-1RpEOL!i*oLK
zr6JbAOG#8F_Q{WxGlNCIAzI0(pgBFJ=LgE*;6;efl`PS=Q(*6Rge;Lu4<g|*c1}uy
zp?1UYoc4(a>QO-ExLgnqf}|kW+muo@gS&eP&f)$M)UvVdv#^AF$iv%V<vpS|U=&yo
zWYn96_<6SqDA*heBx!4t>76uq1QGJ4ab&o6wcH_e8n6e`O9Q<|7h345YPWD5p9M%;
zBse3~VNp65<U6Awr|OS;HBeL^mYw%;5y|Gs#6}!jP{4DC1Q=lr_k-|4b84L#5y@w?
zt!6BsWKM96z4%hgr;A;N$NMUWKV_c-i5%@GAsa=jU@}bG8SIs?q{d1ML2H@~lVO#N
zcl6&M1s6NwmAk{O@T)3W@3T${+7I+tIu=Mb1~%uySm|lyjK=aq`(K4!1x&Q=v%Spl
zj*g}ohqT$=3JfZUC8MaKkUA+Oi1u)Dw4v%<VxB+C)Rxy%92Q6}Y@?2<%-JT_H~L(g
zH|4G!4(1cfPak51MfL>bfwc(e<$I=~-4Qu3yRrB})6~rk$T;A%=IYGB9L=;ie{hFv
zLKhJ%R~`y6)_~viMkJ+|+|S{>@;fPMDr8~2ZU)?sE1O3f&iEWIf0W>;A58YT;1;{M
zD@rMuN`sy$^$5rXvB*BkvUsPZce%J6ICoAypf|B=hj5rGW(RBXJd_floUfscnC{%e
zp6Kdo#|Gu0?L2~jd*PASX!PIxigP8NmG^rAAK0aoENIQ5)JYl3MZC14DC%}P&2`6i
zlq3?;R<Jd$^rq|`i=b=Zsfpw{#2&>-N7E~Mv}mQK(<|F{kqrL;(tD}&s>+QrK?P7Q
zi}_vQWZ=|ffQC-e;5cyPBjeSl5th$thz}08xGB#YLq=%yN@~W)&G8oGB&nvRtA))i
zXmJ^BxmcY$R}tn3NgvX1e`REKaXU9P<&GW{8gXTo%C4g6$m4URfbDSb7G1JBH<;%H
z5N&n8gHaVu^y&dWC%U8R9U4oS;$_D;U0Cw^XFgnSv{q470NWP=(ygh(TpJ}jtnu3G
zEH}jR*IlG`Mp4%~Ck(5c>6$i7Wp>${vED+Nvbry8h1=NO2TNBCOF(`Pp6H8);8?XD
z#uiY=jm$PHqm|7zep}@-;1jePcwE=E_PvQf!C>CS)*&`Va$0Thx(2zqZ|Sy2l<66J
zmSFf;z*0sYNVS}r!uB|a65ywO%Yb#-e5Bia5o5?98U>AQ>_|B9o+LR3Bjqa^=H&3D
z0j?Yi_e2b9W&qScE5CC`XE(u9M&?Q{8QSj(Cqv!1N*Y+;K(SiTI|^&DwonRjhyl7I
ze~$=u%0?ZVshIHQ`%coB6h1i#!8boCNNe&e3FIhT`yY2cQ-N!+ZGS5mNnzX$GN2K<
zG8)tNDsp9EvAJ)Qk~y*f4i93mXl={IoD&}t?RNWzh0Y~|-fldnGEnB+8~lZUL$#z3
zFnfZcmJ$y38x%y_U)TfXFv#`~dqdm6Bb25fZ06f!8Ax6VmR83jHw%4`l0@Jx9BuVS
zp!7&cv2#H~$W5<%t}>PjI_?TsizL4vK(zwM8!=;s(nrP79@&^I;vSM(a7Fw4Ajy(9
z;cm=K_}||r;SVr2+FQ63K%BT(oc{oI6pkF&{Z{A&bdfc$FNl`A!k#+TzR}f3xDFgJ
z;FhVab8bbCA<aNY9LEjf<NB7X>?yQZ&qT+MS~6Za-F%O-V_pFC<Z!oVTl}c0-y<^D
z`+O;8jnaTwYxnt4mMiGIa@Ls?k-3L_P7OcQI4W2sWTw?4(~$oFJA3_5tuKY;rvv(X
z6kB3tM1I?DwYK*ADb;pT{i0xGr}wn)j{J`4CuKEPxDgw>+k`6w^sd`yZSDv}Hl7-o
z%jw=@e|XP-qRut2S^%1zf#hHIOB3XU!`->5`z%fF2*Cw5LvPh^i0C#KM<K(r%9dCo
zb;$v)95^b-$rf-HKM3kdt<BpnWFPbd_HZ*qMoIqwxFQ8}pB~wX_&wJP9JGQDZpj@8
zwm}#3!ba06#`*)9;zC&G2lzeEvPKwAE~cxdEq?Y~9^Wc4DRWC?ZJpSsOIC%pyC7?<
zeXiT_bvq>_0VVC^Am?qQ&Hz)zBZG5i4+JIym(W~8`PkrWn@|}h2n~1Fl?ZS1Lj8yO
zPX$3N?-E(<+VAXz1C{n9u)Jgo*)w)_-q-Aofx*qO$nc@4r`?uf+4)<L9ABYgl!lPu
zy}k<I;6WUZ9uyImv=DRkQf_O2w>{GVh#25Y<96ZT@|-8!Hs9UgrUFB<G2|&*7?(B#
zj_7n`f#jM<ox1kAk}BZwvR*%Q`C}oraNHGq&=5DoZT|pjHkhu^V}NU~3$S}#FjN-4
z&jr6#R_PqlL35gZQ`u1QX2>@-{P<dii!5H~<QE`)LK1LVEHc~jnBpyVoF$3w9Ds3U
zkxLnC<Yi4y5OcQhkZpO!3X(EocyZxlP;?qeorJO0C|d0<s+jxZz~qIa(C2Hmkzy8(
zKSAu<BU<L3ZZ5gynZ{HyN0zmOn}21_C70Z{nzu|rP}fUDc0Tv9?y}XCb5gv)R{?Lz
ztTIM@8cXP_X}<+b#}@EcK9bMh6RtcZa|pwQila!AY??WmMV)UPDYrLe!9Wee$J8#|
z;tiZZ`k>G*$t7rc<MvTDG7bB9O4$zUJbl7=A=zpA-5!yyh$H}vi=m$x2N_04K{mCN
z5?Ew^b(0HV=Iu6Jy3WD-sjzzhQzVZj+$te?eUe7v;gN8az!7xF4%{Cohcq}}{3T-5
zY#Gf-kJ(SO-;5@{I}45xOmZMx(R^E!O*F>#Bq3Z+Ckf3R+H>-Qpgk5_n(&5rEh;$W
zb2+d?hqb{Dgs^*yq}YBG(!|gS3LkQ0@1UngxDX*XV_d*KrA{iJ>Dc;!5y>cL$59~N
zJihM){{X^)#6u`)^`7I#aH!GDm|LpiV?$ajPjYTh@6>6aeVo}Ql<?N3dRMdNW3A%o
zih6%=baai{a9rnQWP)&X^@G%vzJy=U*Ib{vDwc|Ojm8Nggnu#QsrPzp9*l7{{{a4S
zKuwbyJ$s+;sdTOQZGc<Zmq9EBHrhINzx)2`dJRfiFkJYdVeRY$BB@S``D6LIs`=!%
z=#85hf0Nx%)|z=Hb6Dvb(tV(`<L-?lZpmxv<E)&`Jfh#y-)R2IIO-Z*X0eQC(&YWh
z=xJey2M0$f@WK97o}ErzAeKs6P}bxJ9G~ukG){q(uV8tAHKX~94u0i6rnZ)z66aRJ
z#<%%Mx}obXv!l}wr#(DwaKmC_>^|$s`j@OLb!i+M8!6!I);IoCoZHk&s8-py>dw3n
zxYN>1#{rA9S$T%Hs>`U(WRcHydz;w=_6bhr&9}|dT=u{$Z!gdwp-$gmZu$^etlal)
zA0b7WleK`@cT2bP4*e2e!QozLI$!Zx`7L621BGQDvTc?f1<{e~RbbT0V~BpQC+HWx
zbnc0x^z|!aprMX80hwIexT+qApy}Frb`c$9lMp@Lm4N>1W$9@}g4JP;J&nm;2jr!e
zPLrfx7ZawMIT&(2$Oo5~5Z*pQvZsSc2i;mOdj^tGQh%jG9oWfdJ%aG1<G1{zb$p3*
ziU!LgIN?e8ryLfQX7@z+i;NM*J7C=g%3odQ(1q^#b-+`8F6nG#J0fh(d9{b#MPDI~
z6S6W*xd9b5Jg{IkGXDUn!V%C{OzSwbxBk|XWMkt>I-!$Yvo}3;L~{`4y2F4`^jf5H
zH*3jh`XVc|S!XtEZgK8NvM)&K;>Uj)F=5$SKaY%)lNMQPMQrm(Wd01L!1f5LS}jhw
zzMBTnd%0>L(_@T+%68!vV6A&Y7}#QGz{-?-f7+U1az;X*q^e?=KC-GXJU1k(x;-wA
zGS)#(>0jiGD^^jmG6^q{{{XO7RMbK29;A(9d^F{D!^eZ^Q3p1?fJa3L0M*qpFZ&oW
zjAdS*O3>PHT<<)Rmb$Y{(`nrIz5%p%Hzj#DSbi&2L00N5D@KXM$7q?y`>V!$WT6>v
z=w1$Mm1x!VroTI$+8RJ#G^cA?7KfoUs;w@7RBE+U@opC_HWvDokLVg{BVpC`IU=6A
zQM;Ts=$+L%gmp5PYL#bT;vpyvA5b}7{{V~Q&M~*!IcGTZdIwNebgfMj#eH_4EJ42S
z;)V0ySpFk^9cX%tl$}4*@K)4={@`dW2kYGv)zkF-Zk*`mbE1q34^6--U&2qr4HK!g
z-_5!+`9?qV@3DI9jwy2fLOHHI6!jfTuk|n@lc%>ZoHiPAK>OKQ=)Z^kSz8H_=S|ar
z;j+JD{{U+*sbiz*?upQc<)CB`#@;P*yhHI5@h*<Oq_&QQk097S)>M;>HQ10&TQKhF
znYwRK6Kaw{Uf_MAH*O!@TDGbB*%bcGKA-u3Zc49qt4&?DTFQT5$@kd_t#xLLPfz(>
zD@8L*ak#v@`vfCxSY*+*rmN|WmZTE7jIEH4WH%@{`j%aLbF{q;k+UE@%mJZbbln$U
z)*tzqGzo-Y+-GRF+^s!UxvXe9Xr})FNf8FL+U^$#`8WK8ucEhAn^n`b4_dEKXFu&m
z+bfayjZ(@M(M1QS;w_btG+L)rIMh{4>UQ6j_C@GjHzXC!Y%)z;@N7SZPxnDeQRpox
zc4_)%mI~Sb05M-A(7n#TwAd-S-lmG4fzW@e)t0*+$%r8lSJGWYH87Y(9U}nc&#?<7
zU(p(dwNPmy)qP2tY;BM}>0G7N87TdkjT=p(n^go<&o$k1zbn{u4LXPN(Z>dp0e^SB
zxm4O0;SQ~#L@I`(1LU>rMbj&)x|y{fkfe>iuLaTeTH4V3Z+3fsOb(mTG|^FCB|K7w
z-NnRT?6dtz_{E{pOz5;tBEM9WWB5^>zq-k29WPwQerr~9t7RhlC3mzd>U~d2p#`;+
zQB$>}hC0_vC^!7&K~9(IjJ~b-&D7IMSniUnrikNnm~f+us`TpSiK>l65_f4Ne`Nlv
z{6N#`n&xTr?I(+qb&b&(UDaC9mZY_m_ZJPt!dNJ$OMmP#wzg`kwH}(Rfx=2DYhTy~
zl~V*%OmUhXoiMO);mY-WBTLh?3Kq>u*hvk@b%|N-sn&&SNN%4Mt!?p(D!ht42%%?_
z^&YWNQzzwVshkIJRi25V(LYTut<+?saT&9)5M4)2H7tg%5fh0&)nb64(ly<3R>T|V
z#_nETmNMr50I}S7b^}s0$Td?GRlk{IU4li4T1sxAikc=tO-~iLzRas=zY4T%Hh}6H
zjd_|&T$V@&_EnTD=~}9zNlwbKAT|!(2wNm229pG2r0pAimeMr+Vg}DwTMHaT%Uo?_
zcDDwJqf$BIqMg7G0IZujOHzHGL94lpKg!^!`k$ip??}G0Q;fyk!N%Zy6;@6$q=~r6
z?#$0ubsn8psJb}mVRJWH`$F`8!dN<fNH@z20`|Sa!O(sczQ5C`gI$Hdn~>&^y^HYo
z@b-=hR<f^A4mPm>*-b)H_BSOFdc#ZUvlFJIu7;K1V`##|X_}+WSf+}oOzV){rq^Dn
z)O{DywDhD@(@!WP^$9FO@-16L(sXTUwVGzBW--_F<^4_jpyIKQ$;{fh{bf@^=21Xn
zWv#iuuR7JV4ye<0Z}kezuJ>*(WS2MkEuCNDr{r|A1Ws&@Xu|S-qw4)bR;@2<-rdK5
zN>`HJfT3NU!=(NsjXz6lRd7W)4YBN2OIPcubxOxFikYy2e^tpVAJg<z8l^*GtCMJP
z{Y83KnbK4`Wg}%0GEVA`ET3Tb)!G}Q=yiI#SSQxYLC(uyEta3qmGo3bS`MayH-Uyp
z!CCz(u8q}=jt4Xmf-t?8rCrmp(8n!IP`Tg>m#O}_6B)_lXUso|fBM3Xw8vFd9PzaO
z0J#Y^P;|8xp{c>Q^DZXYE^_+vzg+2uQ#vQoQAofzbYTAgmE*sNPwA59$)(W8O)36r
zakl>evdR#LPQvEq&m-14dZLPEx_ZVCP8c~}q4;T|Y7U}gtR%3DjCNjpDP*3c&nsqm
z2IF<st3d1dx_T1?E-~1Chc@7<W0X_2ER$!V>as~s7Re)UHtw)JPt-9{#PH`dJHc6g
zv;0!lHAx)Cmc$QsjH+Iql4|O&%+<Tr9G1T~OF1bTDw!K~U29g<3pD1(V(Vb-E6{Ww
z!a23-R?n$wvcn-4Ed^7Z8cM2$O{HnfYubIzW)`ZSuBPeQKSH(x>TUflIr}AtR?yRS
z=@c5T;f9;jH3p&8vP-u)AcBXe>bPm5{JeV}Ta1e+bv~iidZMY%ri0R@2izR%l7-g?
zPt(xuu7RzpAI!&D-*AGA`{@IedM)(+xP~YkC17#31DXg_TE4fb>eH4`Q<5FvVNmGt
zY5JtQ1f~K{wZ!A@y*HxhG~F_vY_c`v{{T2Q1y`3Y#N)e0KTOc;m_2Itv<^ri89fa>
zP!ZG6Z+G<pd#%M*g;TB01tHr7^KR=)qja4%pH2*uv94&~l&w0@_Y`?W288N)0iKA$
z)BMdATIxQ4q}Hheozw!B;{(F9>bjUH;CoE*7J<drpHu2>HEwHUdt)Z#HP|Xq$dsv#
zDDqZ=^>4y9LpT2b^vtLP_7^Iyf5PfIcQ#q)e9?pMEjBCA`feDG*T<4Y@`&pi_^I^g
zHb5F}%SS7r@k+@nANYSk(-gFVmX5YC=Klcf&IQU&wbG-So<Ri|aJB<-KFi8<KBS_8
zy~47U&O7cUX|W$=t!LuSm!<<1OmaFghPZ{xIZ3XI#U<?X?P@K4f}zZcg0-w9;4qM>
zCDS^aQg#0T((3kqP>ip0>F>p^lho=3JkZJuupA?}TUh#^rD)nEWXxx93~5$PY-bC0
zkDBzVC|d{RwMk+QZUJ+4y}x3lk3iC9E^p_H@A^ny$=7rAe^t|%=h8!^{z>9y*AJV8
zmeKSI3I-UYgi9DVYoGdnRD+Z3S*Wd)JvF64r8t&d!Nd8RkFsTa?2}ZAF#vQV+2Yn(
z+M2C8k)#4P0f2if7Qe1hL0TOj=`O{O2(`NvHAk@Yo{iHIQ3;z!=v`})!E{!mL89z)
z=%!<21GYbP<=P)mbrl3`tD=a@PIGaQ_X_rYsHxSW23iQCmf0-!-8;z|rYv#F^ip*X
zSL(Vxsj`xGLiS)5kJOK$)jEr*X@jbt8wd3PlCb?zO{mmr0$GGYAb7vHEniCYBs5e_
zf_B}_7H%@92NtQ1K56t5K8HSyRLxD*4VBEXu?x_8Z>wl^jWpA`2*k~8ufp@aa%zg!
znd5o0$LVmwtkbnRT{-ruW1@KB>{>Y~(&(gNf5_DJZ%@`sQ0j(~8^~$lVKqlOn3&{@
z2aJ1F-A`0h)jUB>s0m5^A>~kO8W&Z~Ft3)E)`Ivko1~mmdOA5m5!qhYI)<=qrhA(i
zILZG22>O1U)h1`Bs8g8<;n%TN-8-v(PuVjJau4Nruv)Drs9=&%CXI!+St#<VBgxZt
zQFO&UZjAB#IfDWIVTI@v-BU>FZIw@J56=qDEki?=fVhS=+in5KUOV`isnUL9)1eGx
zmm=+5?%^FXfvC-z4QjHBQq>tr6=P!(I>F%KYBaCIZ%K`sd3P}6Nysb1beZM#n=MRs
zAl~DGy$ekIS=97eFUho-;M;AE$Wx4>)wDB<Pe#M2bSga}ozlK0RL0idbZ2YZ^L2=m
zt!gN-r`O9>N>0}@L2}iQ>W;V9wb^84G;&kLCB>O_U(%3OP__QMcbA)x@S{JvEeGn&
zHBOaR))lXkkVOtI>k9>W(|rr4Hb&EH6wPF#4V8xlGo&hKgHdnfVBFV!unN$1e7d2c
z64OO@vnOvVNz$?8?o=Hw;lva){=6m9Mn(%w)=R3i$!RIThN$d6sh7I2)4vfXq@fh`
zkCBozSc0&9SJrQ-s&tKOcHe=ErgN3(oLAUZld26eVJkL~{J@S;ddF2$YSjM#lWXLO
zr}gbPKV^iIU1aVj(;%Ke3!!Y2%+pTN*E@hy^7O;SzKt|gQBjjo18M4EIeT6&f2c+_
zUY~dlrG{!rPwHTO*nWVjDYTBF+Sd97t#z#Sj1^_3=ruyjm6nkABLxX0G&R|}>3ZD{
z*eaMDI3!@L-6ao5*3zFwv(kASJ$UmpTFpA{m97mU_ijQY8rH|U8BZToSmf0cmO6G9
z_=ToNrc?>zni=6Hz{c!^{+grEwF*Z602sqkMt7VP7N0>&s8qGOquq1erpn)0>Dpa7
zgwIV<(#E#<IS6oRS{Z)MnO~|hEh4kiYk`#T<~sx_W7jIFq1<AZVI1u?SqeJ%>orjn
zk8p5xn(oWhw1>JaIjpK=RgjkOLYhgSwD}%ktZJuNs}P4;<N_~c>)(bQIQGy+O<QGU
zzf1FFh3eXFpZvg`lwO3L+{0@qw4S*C081NbYR|Ka@~3HNcOPf0^*t!k;&ie_{68(>
zd4{Fbbmq7Ij&bS(mXTtsdWZ2ozfghn#!NU`{#9p6&AM|ekVf+3a!9!gV#MV;eFAgi
z6IW5xLV80MqfhEJ!rZJbvmGmCGSNNJu;dNaA!z!dzf6jWz;E^Kz~OmDqhC;Gb(}@c
z1=n6lK9LBoWtCNQf@Zh#Zn!>Hr$yCS3<L9Rak#^Q!og8R>r6i~!=B4!rAJRsPqWl(
zqqpgPRB8Q`<xB^u<ZSYqflwaOa4(R7(H}T|=xPgGIB7hqc&W5mD?=)1WR@o!n6GfX
z2c|j?La6lQrKoWZ$c|xR64Qv^$jj;GvZxQtJXu&zMGGS?Yi!^$M=NEibWBt%^%_e^
z81PjMOz=}~WlSuQg9iMmIn&ul#@3mD*N?2%KpyX?D?j;a`a%qDE^m%ku=MRGMAuf9
zR^Q$Hu64Gn&1>-MMHG&!(yF5Lt$P<;8+H1IqkBBZqIKH%DjQ1qH!;U7lRvWb*J&_S
zQF`>!80B#H0&u+Ir$D6q=?$!8Q#AX1*d=K+O+!)Bnj)(%a|h{t@Iuj!tPWeCX|(Ft
zs@&f|Paf+!_*#u8O@atS#ilo(<Rc%t5^Y?u?Wuw72Hxf#91!(Ae?r*Z1L$7Ij2jEH
z_EkzPe`Mt;FIo=PwVgGQIv2IAcowsQ^F41-4VC4R65h$ZO{!FD72%Y&^zVCLvboZ_
zB9~UA21<v+DI9`v_Ce3n0*>@%v@Lp`I^fFDz7l)(UbWKN*ZOpAs?#b-rz70bE<WLT
zf#_XFO4ni)TPi7>@EZ1<eb=sZ?u`s|&1A5E+hkiICQNaA9usRt!0SB@vut{Vall+{
z>NTF*{{X@ZU(o3#Z|7;L+an0LdmFi@_E2j&4w@o#l%z=C=4XTshpg3Tqtm6S-A+%s
z7w7g;j351ESDb(Bi8Ok68#pWiHv{~*T4SeBRKh)C1Gx_Z#ZpyuE}Kx|=hC!4`k8{O
zYI>=(_ia3mb5Carsz)6AV$N{%Ti3+>J^P`Vl`(g3bsZk1Pb-T*D}OC4SWRoHDw!ad
zMCP}+>{YKx^^Fxpi<o17^9PK6=;VuCu^`hna8u|tG6v4(K;n3GXz6sl9w@dw;qg0y
z8iM}-)H)SSCfbHX;zw@F6V!b|>LTN&%Hs(q+HyY15tD@bvaj}C7y8TVG!SYunI9|%
zJ8ylejvvK+a-8~dM-<WUSs~?RnbkEf+}FAGcOaZ9O-1jPS4hS^_ct~RxyBM*9K5F&
z+3EB>aiG`9x}#1s(-ZD!wU5zgp@*h5x;xUp(Wvg%3oi$u6MEQd$ACqamrSmzfw?ah
z{lZAaMem`Taz+0DQ_xgt5|=>tH*P@(loprP5lGL<S4C;K4;&Pgl2+G5*Hk)E!NDnX
z-7bz<f9fL^{-*Z&r})!irpUEwIchCY46ciJ0`~{#nM119(Kts_7;^^>11j#eh6-3Q
zAd)e`2KN5|!piFP(X!$@5CyDKPaPDDlk{t8HFwJ^Cu`he9l8D1f*oFhsvy~p&n|Ce
z<2qikJUW{j1ckfJh&&asr>c^u2Q~o5aN^JWA#yhuwq11%Tnrl@P%0pCu+Boj^#waz
z@^tBoL%TTQ>g!X|WEYw@IPT<KRKG>4VG}k-4BTBRwD!W%Ye>$sLDXL-s#sd!a$DVO
zG=7n(tbwyV_QwRG`fpiv1xC$EkWCrJ_KpJ7imF<WCDJMy)5&lA5Rb?O8Zp%!D^U#L
zt#N6-E^xgwptPA80~sxyjF73{EnP%oY%C|elIc=w8f8(aif0Co<x4J79xgF7eQEe{
zOIu88^x_**J=Pc{U}BoTPIvl#p{G3d+(t*;Z&}tdO&6x<+}VKTz1CZ(I-;Vf#yRPl
z;M4rvt&O<$jghIX8Le2+(z|$-+fHoZkXCNGp_P-htRKS%Hs;F5U9O{=LfHeXdyulu
z6aH|DQSH7kx@9ZroXR^lT1JPeh(9x<%-Z-Z?~S>0eyvhTIEkZV9+bR2t`;A%qta`&
z-4>y>bZ>N0uwUE5zM*KQ>fJY~zk{mKeos-b0(gakkH|{YUe{*jHLpcXl<byqB|LV0
z?%)O$_M1#(fO->JLCkL!Bj`|Cb6-g_j4o`Mx4{cfq|ZY;UF$*^@%pSdQ=4TVQcFo&
zG~th?YuZhmx4jb?(%Qij-5Uq;td6kh$MJOPhRD{UbiS;Xm5pwrN?zMrb5xqO(N1k>
z^xmnej<-qmExhfqE#~XRX46G}uOu&jrd^*4O;grUQ_9IH%bg4PYlW<cs-|wQ3pEO7
zH*psdGoPVL57p>tZEU6;D)<0!d!26M1v#{=h9emw-R`X+)GKKs^r{181NpA9{X?!D
z<TA~_!Z|U@TZ^MYN;+cI>9jW`<)k0wArGW6l-hubhON;DAJ9+sS=sd|WS?uKHazCa
z_d}wjtzdIzcd9#+kf&3|zh*z_H=^HJF&G>tiR_qg_KSxqY8`5-mHSyMfNv~!b))>Q
zqfF7c!nT}p(mlW|=AtMnE8Q9PxF2nWoD;)7!8|%9tahVNH@UB9aK6_J5UDBvr<6a_
z1m5IZ3vZy+w!)gYdeMPk`&q#mt>`*sOn$5`8=N^D{le_GC1~XSE{q%E)9Y9t8=Ff|
zI~+B|Lr&<~Q~7#_HW@F6e<}JDMz5qvM)CmNA958-;D}h*$~(8ZoawLZXf~gEJr_=r
zvI;Q}l*-#<H~#9Tz1u3AB#qcf<PKDQD^Vm+?WdeMwz-Z@%F4XMRyMnAPaFcd;M88U
zbxk(Eq8gc`mXNjwko#nJSqj=+ZW^;yOkP0bTc4`ZLsJ}c`ZWM^U{$pip6aQZ=xTO&
z{{ZABmR9ryi6Vzj)P+qT62j=G9N1yVgYE#^D_u5%(+%gQV_p4Gk88eu6;%2_cyOnk
zfzAF`n-pO%P9}Np+Tsb%WU#%zs^fRnOHmZG^13-=$^PhB>7McY6X~C#yjjmA%L*A|
zmZhz*1mJ~bK93uNTpBsO$7PF_da7scEjz*GUFbbnW7`g)8@ArT;a)is?3W8Hr_te&
zyIgF1s_Ard8_3um-yvRA>U2iZLjCM_g#>zyGu>}e!1+(gGAS6eRa5CL^$zA;r?CoX
z`hFJ7CW7s7D?tpjpbvWrA(K-VUwFFDjSi!1q-_;Ps2pc`E%I^|%{HLuVhnr9Aq`zq
z8yrhV+${d3sWE_^%2JwL9dL%WX{Fa8U@qL>oTa1IC~I!O@YjqHd@mu_bs42|j1m^R
z{Hi@WUeu`dINc-c!faHz$*?)XC${UfKBOh=Bm>=fPgm2rCpeRV@VzgmHCNYA2DpMq
z$T?X4xTl&u<*_#X#g!!sRx-_K@~P!J$W4jBoT)Wf!(=YnSo`F8LsL8l4b8fmM;zs4
z)}Ko&z>)|3k-%gL2d3fP*h1;E?Je4De1&dghIq-4S>1})u~G+$Nh3eh2XLo-L!|@X
zau3}M*9J&M@$#PF(`PhV>ofyFrfV?E18B8~-8=&glzzDW>Rm@qbu?mTmR8U^^v=PS
z{5UMl&tqbzqtxqYTzv@$Y5i<=TJN%1L+Eucu-Wv;r)K(TL#^8Cx>_L<?JEt`&#tGK
z`jNNt(sy7uKOs2PnHjLz*!zU4!stfn@ktqVG^cRor4gjoO{dnkcyIvoWnUq49vvHt
zPn9dH-7I@58XS8$JY>_fD@mS(QR!FEwx%Qczfc{D4w>7S=%0IxDjt~D4K%-(mB-U|
z75!@(TkAsWgOGf#_)Se5vQ8|lu3?HoE>N%cH<V>-y++(}IY4f)vMdRWt3UMR$L^`6
zf4N@H(E2$D&A-abz25%-pOm2_G8@<@1B;adPI*thELJlS?YToq72S0?aY`CZu!UKZ
z0h%D;Vh~P*ZnybY5-?p2Q4QPe?2(|^S1mB*K<HfF6^n<I&AW}erD!%+2TIfJbBEnZ
z+PZ)M-cb*P6T*$q4&0$ev16~9oRU$r`m39le#*GQQW%N>G!W}7x4Rw^&#6Nw=PNp6
zH|EKtI37@-rdia>cLLIF%5-vi&DweLtC;g^5^$d!g{}orF&KDgW4-Mp1q{14lE7L#
z5~pj#tR7Tlo4FZG3LQ%`qJ6=^?5*i49}yD7>>fvzNcIuNLL!1^G22fFFs_Y-6=ZcR
z_WNEr2!Q6?gUZY_yf{8GLxxq(om$y|j$1NMK2&Fpwu;79wj3OI2L5cB>No!Yg#E29
zv%iNY^(bbE#y}+&Cx?N8rDYUbIo5Z%ro?ckin37A6yE0eCgDZ-S#7zXxcn%Hb;};o
z56DS6DHPCb(Cq?Pt^v)8jyax47~?-Fw3TweJvl66J&KvoGG^|la1Q3lp|K>6&BL-B
z6s>uGwn2OML$XIl?UY~2A&wRWq&dIcW{jAUQ#2d51GrrS%U!hlhk}S~mKGpAoyD@a
z#Mc7&Tpi>dP*NGB`XmA=8?o&lTOp;Sd|vqS)cEAi*NY+?*AN{G^WgVQbS)rw9Pli7
zMTUnnBH;}8kn6pm6Y+#p0nUuMmNpp!lq}sHzhDCQ2@7f8axWXasHD05Cd6_SEqUFy
z^q-W-3?#c@vCsHTkTP5xA3jt~c^7NO7YB37%mi;^;~;kJbhve{EKw{CfAb69f|K+~
za=_+;+;Eq%lc6InZML|P{nLzXk)+1!p9heNV^~J$ZT|q$o9rauwbtjlN`8u3U~O=Y
z?45?kxI{-l_qTj6^#^UIDJ8R-TI&(?LqRP?EZ(Iog`^%k6x(97OiYo#)2M5Pa8U$o
z7<T6T@QI61rLH0>*u+wvUD+j8ocO))NFN#gR4)551am$TBm}gN*%WJGs%VaXWBWVG
zhtqQ#eY=NtlnkObJo-R`e6XSKVd54<l+s){xu+n6R5P|{?Ju}_Rq)gnk4*b}S;<?u
zgp+F?d?!{-hRaMG!sw3cat|u5U`4~5WoH}xMqFTo*TcRdO`UJuFl*?l{Iqk8&5*I<
zx0TR2@wi1XxbBKD0R7GVlf5wP5S6Pkb+Rd-1KiMd9tiBEZ1RW%PXbo<zDP}t#sg>E
zG^rgBf4V1Fp2;iI8vcs9r=8y5e&G>B=-qZamOHT=AB04WY=E)t+TeheDIk5@f1;%c
zZp*4#T3=9lptPSI(KQ-0#inXGeNa1J+!Z|)OWR-#!R3xW;aSt_CZFFE+|oH=<S5S-
z?G}zz(*_gO(;GY72R9ZWUFn*WY9kGC`zMP1Cst>tS7>T2?UW0C{#89~5v7!ty``u0
zy{6$o;w-XKEVWH4hP8zISpLpx$m*0cP|RB^9ka8?3enZ|48c2sE|*iMsEEN@&tc;E
z385*&zJ#13J)<)POW`1bZR9JO4O9>V{lP)2=>CZO#TYU|bBx(kw(WN2`$+J*BGcMA
znsMyg(}=2C9LEAvCZ}^w>s&0|1$>b>7Px{Ij)PT(a2Y?f=Y!ccf}16$mF@QOJR&zT
zLF_g?!fcT?;p2|PCN|gS;_C`?!(4W}+rdoq%x<~MdnqI=c(uj*6&qh9Zrb5-^TN!;
zj2I+v5+7+K;Yi)D%MFi&js%Mk5{z(gBR{xHV{Su-kf9*Q^zfd?2Y1@BhDnYvS3>Mv
z#@{LKdpM9=<ut^0lF}R#8Io@{#zN+}41xjhR6AY=IORRj?ie5yj28@nz=LdgO`0~A
z-M6wAbJ%^vpOp4YLACGoN^Z_Rpyj*S{lZ{j2Xth7f~77W%0<!#ZFS9>Qzj^l$m|nb
z-NccHe@R4<9F4tzDhISQ`@y%BnlKcRxum&-wcWwsq}=0R>=KT}t$pMBsHBV$f)Bz`
ztO3m}c3Xtg8NTSviY$xV9FOjybao`<4=L;oeGO$pnl{P^K0<!@<ri?xu<^=;#O0DV
z2l;?Z40AovxDUF>QdiS}Hyne(3Mm<2mO6q7Ypy@#ImYLVcv%8~WD-XG@sdTj?4f&v
zy@Orf!adC*{?qg-7edFIi!}E{YoK<pvfG=2h=#=A<#QXb+W0+>3P!}j>#z`fEDp!I
z80s1sAQ<o60aZghE-#J5x3!gvH;kKoRPf7VXEYFd6e%#K<Izt`T=?80sBY%=y1S&O
zr>u(bJ8YgVhN_~5W|G0~JdY?^C}pOX_;R_9z6Sv-hO|E`2-Ik0Yi#E3w{gf+@<%%w
zMYp%l{#K%&P!hOBT^`>LNnb+W_hYk~bGf~g9=j@=W>%ha8|>kO<yb`(Jw=Rf*(Za+
zLh4W!yqgC!_XrlcNSq8rk>K)$UqdEbz8Z)H^I_o?NnX;>$yzPJy04<ucx2y86m#RJ
zsgHC-G><7C_EkS<T9|h>@Vj$)+E4tTB#0B<{{Y<=9{8JX%3vEPu@*loFVr?x2!Z`v
zC?<rq{+>tGT2#|GH**c_fU}(Ab7H8SlajuOp>%SzvBzu2VpAk!tu}i^jQ-(1crZ)F
zyf`T1o$)v}R_-2C3P~2x`W=r264;#PU4WC|q3RhF%npYK!iGAD>Eu4*S};LK)r_Q;
znJd^GaBd16>@0RkRx!^@R4n%fJwsbg_{GJZ-ozzMptPFMBMAq{DB4oPfrH&wHv6s*
z*%c5E;{`uxRiNj@*&AzsP>!K^c?S0K0&697Zrd&G*py{GLAD$m613tSNCKvWOC89$
z9o1a)Z-(RoTj6RyhU+<mgW(TS)<{T@0OVscaITExL&x`1#K#kHWj$R3n&RllKScy4
zMjfsMc2%qBH$<g?ax#}|fVi`Qk)%C<8x-Gj4cUZ_&|NZGD!)QNTH+R$Pt@BW0JvV<
zEScFM$RPH@;A$z3<{OWNESS`Sn@6Hk)E0naeec@pX&*^a!pf+c@JEcSPM57Yt_^u0
ztqm<~RSo?{>yg4xV^Vtq);f8OCT%)jotIhpFB|<ji1X!NYBe*!ZpS*`RY^Xj9Y?li
zjosH)DNEkOnn3S`q!%;X5YJ#Yu(9}48;2J{`;P@g=?FJ-Y`POAO%XUbyrjkmHdF3n
zf)=C}i?v|bu9TnD5b_dlVt!J!<lz44EG^1ps2}V`y2m^xT-fB@G=YBq0A!-TSQOL;
zvA&=N<Yw4JMJ>ik8O<i-eUdWm7FnwTECq<cQZcP}dmy8bfDRPxmp^p08ffXD1e;{2
zeK$1yu#Ic3KK;`-4cX7xV^}fIDZ93{7WkU{f`^(H4*VYLCIJ~Mh_{?6ap3;wV12-M
zQ+>iFv)NqI#$G2saqq%xaLp@&8rfxW@xWGeR1-bIO1GHDJ3z|N(zc$C8^aK5zp3Ko
zQcj2z6q;2#2z_*}4j;&^W2j|2cT>p=cJR_Nl19|X_fI1mv-+GZf3ga#_jnNoi+46?
zK{jefRaaM4RW#N}*2WLDp}0rdhtb_5-sg4=lW0IsR2<f_SsRZ4Svr(ydw0nBDkK~Y
z+gd;JiINqt`ma8bY+&)Z_bHOl67XlOxF5>c%ZWwCCE8_*oz0AYFm69}lIq^IhK@H!
z1depz7UIUmPE$x_8#GnArkAEuA6}XPVaxA#eXhLosruYhi7E8q=rj7GZLYC8zfkJB
zgv8X!=L5hYRn08V0gZ}hljLm(ag@6cB_HBTS5*1tbKfT7Pu!uUb%DLcJCy$bNI*Y`
z*2eSOlC)h9(R!CvR))hLrA`f<Bb8$jTeBv?B$9^4OP$~gm7~+TD_@=_)lH{Q949`c
zjt$4quVrqH(;tWQEs^xpl2x=^%Q0zjKLh^&3qMy|sC7+Otofs(q#vhq>`&QcG~FaC
zjV+n2C#4wK2Imdm)giE2y*EXuiQ%-&hEe@Z2mF+7mq|}YP{9oDsFY)K`2Cj7hf$}9
zH~mGB7LMZI@T27UQNtUMVHrzEr=y~+WL9%*;yW7vv>FdjS5!DYNm;b^V88cA#noLQ
z2G;&!5dQ!MGD5e9sHkL(zKvxpkstlIq9B#v^T(Qe+q0#qMN&e=pi@(`{-UM`hj8gY
zDEbOL7T%mQGFNxocPS{Tw2Gi7Iy51~ez_V+{^<DMPfpuGO$;O80Ik9ceu>*46nb<%
z=dc0f;R#u*>2&NYf}F_y){fy%U0+Jv%-JOPV^D`tkjH8*IjzPE$OR<yzhD0Vp^=l;
zwVi#hbLey<S>SBi6^~C+>w29imr&EcB<~TtD|%fsSJdS%uc>4)c4TiP{{U<&YCRf?
zjozVjvbcG9x9pc58TTVgB4%#0K&*3vT~92{J-tgKXgYd2Si{{-ByK$a01&$0y3>Ag
zD1ag`gsawCPQb%*j!ZDBv2DLaCaWzTpAV}%pxgR^AK_L%RMRS{%iXEAHUV-N9Ifi2
zrm4H?ViOPPwbzz@F?FOm9-e44+IV7?PiWdQ3geb(<C4dZZJiLtr?;YRsOr53OeN91
z<d5fcuKxfFE`JgrtajFFHO*lDSm4L*7E`0Nc=fusR_f1^pp$*4H(PmnOIV$j(i=^t
zz~AQCcOSC!aef~zRe2=u`p}Z{vBlI^{{WyBJy}Um+d87D?H|`0f&S=rJ6hIQS)*v-
z>>vBG06)qiqolQnnq4lU*_;i|_H7D1KdY+xZed7Y84cuvb=Bj3BL|BvZ8rY^u`+p6
z$f<Nl-7Bo%fVQHFR!3~PkK^vCWudNQu92nAlKjZ~t1Wl&hDohSPfhu`U4SoP{gt;$
zbhl7-ApGTgals44#4&)<2h^`pKfg;yHK_Jtb$ugM)S=&3G<#c(tRMJVkHbwyt4F5|
zrh8)zIV5B)#J`8MQBoGkB(#kJ<;G_J0Lfl=)Pq3KrhPnmyX2DO*f<~Xg{Uo!T>3A%
z`>bZFqI6Sgl0EkQ3^)tTG>Qt1b5d(tD_apcFLGq8pIo2Q)7WGL*gD{?ri1uztFuo0
z$NHlnlngLLZ~LPaPQd!4Y4m=T>1rxQ{(d;6cp2X%$Lyi4)OtTiB-6(X4sZVenuvdu
zl|2jA_0zeAt~jCw!SX)azEorIwr0*BtaTkQXyu@itmQ9Ch^XwmXI@1tzLgy;wFk3W
z%iU3RHnpwl4%#|;T3EO*k|ScTX>0mRqUnf?($&m6+>)Wvwd$U;)*BsHrAMW=`4~;z
z_eJq~<*}S*w$MLDGJ+rajc!<sP5wqd{H;vCjD0Vmw9;uhWJSXpw&iSFN70&YnX)=s
zZQF87ZhyM+FT^)=jIunonmyx!)_{Mqgz{JG$T7vsbPv=$d9L+cSEme(rKfj;n=Q9N
zNkOAfiDm*v@?1|Pc~4BsM+Hx)B7dMeJC(Sl{Fb>Oii#<t0>F~|CxjdRA$1<hZoK?a
zj6(Wa2axMni>${-_01IpL#iu*bnfm&*P`h99*aRr89tXBu0PJ^2W4lv&rRv*>EAT;
zura*hfFu4hhWTtCGLx#&Rn(t|de*S-%V_knOb;HEcR$%-bvSz3NgXWOKA`WHFok{4
z+Wi)rs+Q@Y#rv>1vh_O3j;PkC!y?nm1BM><TkfO9f3{PfqvyZ$?Lt{Y>su^Y%O27S
z(`g!;G}yx#xw}Sg)#;jN;iIZ*MMkMu>18JVp6dX#I*&?e)HHXiqKasmG9PRH>1T0^
zVT(>wc-2=`)zp6m6D7|C6lR`glAO9}rDTM2b$_WImJ-^63RtCSw$gH-boAmdT*laV
z3&qdoWXbyDRCYrYW42&*T75=p$44}7nmgZc3fDsqp>3jMppMyA-|AX)H9(d~P5%H(
zTYIDAmcLYBi%ZjX6a4Zv)?T-QrsABtIlPw@(U$5Oy?aoN)REdK-TcqRkex9>7LQih
zD=HwJ#DaFam3OUlE~;X5)tbbQkmu58_*sF{`n@@Hj~<j`JLNcC)3og6k5qehl@5Wb
zP~I7RDL}vzSyF4AJySDZ6m?ZwK1SxRCXT9FYLOFlSlb{x#!B>_jy*+DOL4Bp7(9B7
zy4>M4v<9ahm>mwisq}P44^9f0ZgBPte(4$bvjLXx(j$rY{ZZj(KND!R#?)?`R-v7j
z;hxg7x-N}ZUe8XQqM}p$tZ*t^?dg@{_Kn9_eke~<ra6?d5J>JWSC31r>NPdQ+D8(9
zNgS_4py|${(q{b4S5KOVhauToS}k6lrOj-eHBT1YIJtu3`z1={`v<7#^PMk8)iqMq
zhzubA05NVBiVlu_6GcSQQ%P)_8$0{2LaLsL^cRMvmYLzc20qKpb=r#e*R~(dwpKXu
z%waX-x=&*M>03shrs?3WoKr+1550!q5BCexbl=0RS@gnI*2C$XmJ@Ki*P`i}O4i8e
z$d%XyX!VY&>OCqwvB6d7+YVs3Or;gx%~E{@>)ky|p;Y>{5l0`FwBc1&>hyvOQtLnw
z!$G>Jpwxf$Hlo@((>r&ccJe`6dVj$^EWkB7eL_}B)3`U5{RmTZH8;B{`g)SPQ*e9g
z9_Wvb>tP0yr%}gwVq@MpE=#3#9*?6n+GTW5`q2w+7HKOh)qPSbUiN9QO({GEi=>pI
zm+ExGAJ}(LYMN~vPAz0i@nABrhf{}G)!7VD#?Txtc7<70p!JToQ+80#97mGj*=#y<
zpeyw1cFiN3>H%}Pwz6Dtl6>S0vyC{TQ$^6)HD;P5ov^j!bF?gWx1?w~JjObTiD^hS
zYuEv4`zPzV-nF8{=DE?jA&fsG?5VU3GJd$LBC@6MQ-hZSo35EnPiW+fTuRMLt76i_
z+ox&-k;9rfSj|GGs5+xi5<YV5;J8>2y_&1=v!-+*>(<qpxKH)+-`Nh`8$i?KZ2CQH
zFK6@~LU?}O#F}<c^lLR85+HRt5j1w?rsMWd^+u1O^@gDoR1~vPRJp)8;nr{5D{iRN
zs)ZY!4KrLg-qUaFvz;YTJL{bDCdcz+l3%u%@#|-_bRXcRfv4%w$yUQq^4solQuS|1
z^!}X%ppEf4ycWNOk3Wf;?uQVkhN#Zo(Y#$(yRSyMHr+yI)41{-fTfd^oh=oEj8(82
z?xoc<DPQ?FNh1di0aSnM&Y;yQgh9?SI{~(`+`&_$z9Q3AOy_@4a4RFPNkvPji6ama
z4ch436<#$Jw`A1ql=|Fy<D}iGddvs2ju4b`#>};@l!K7dm3uy|Q>rvj&Rptub8&lp
z3c5WL($Ar7Of|I>RX|+1kGQ|ku6ZQ3b;c>J9nqD#y>IYnAGD6r425;6X&p%UW1CV8
zbWI@O5K6_->Jw?TrL@|dPL?x=I9qbiOZb~7<v%T`yJUj_z=t%Z`4f*s);g6k&tIQH
zt<&8~{W=F#hV5mV1A+R5iJS13Rjq_odiWyyIkL{`y-77jwd==yx5Js;ZgkGHnCX6$
zl@4RJ*cSwml&CUMPK@0Sfc+9zGVFA$IR^z1KU7q-nt3Um?G_-5pfxQ<s(QCLIJ^^r
zf~`86ft8Mk{{Z!Jnw?yj5^qpO(@XqF{FOJOJu_qgV3uSm`StyCsOsGwl}_i_T!y!R
zvU*Gv`jt?M@HYL=3(<Nf)alB$PgP9F+-yBa-EietPW1XCENyg0q;$<)VQY0iP#0mq
zgl50^Ij6dh^VIbd3ueuB=KkD;>M-@6PgGKeOd$0@&j74PUVbL%)Ku?^iblRnji9E;
zqZQa8ZS;Bel~~@Loz#t~-qxEK$x`YX<srPW4@{GL1?JTnteUS<KBiY4vOjTX<CUh>
zXy_)>{YE}W+z08p=6Lx=+0z*`=>l~ottC`tu|ISB2ArX~T<VRfYp0Gzu$&i+D$N?2
zX*D*8jmr)F-Pf*ZQni{`6%>tqhjIQAs>E;GC{~N9Q5d~Cn3`Q{1=YXkj)m8yY>sz!
z;lT+*6(sdOr43YWH}}OR2>L6@I$j-Cj7dvZ9CZ!lh1MtNsftcoNS;Wfw#+45G||*u
zw8q0Ne*`P76IIt9-^)=-3_}}TloqK*{Whr6Y6OBig=e7CQL@z#RD*87ttjtii?mr&
z^krVFKjv$|YfmA#N7r;^1qCkl$mTQ){-k6bOv*?$nKB0p8`j-iWr^*IM*>G;i)k$x
z*;`##9CePSj=ABjHp%5lRY{@CO?sCI<h9H1dzI!@x}@^fIlz}2_A14)SJhJwNOs7&
zcuq-doYHSX>e{<#r*w3K)QDo|f}N%o*SWHt&2Tr^MZ$`QL)B|ueFzK9@(5ae7edx3
zWNebqxtn>gzxG3tu(-10NY*JSX+tN|TI&u&GOKl7qGeQu8a*(V9x;`+q^_a-n_F2z
z(B_ZS8U>aks`U*w^CZ#6BXBry7An)k+U%TiB>FU8hPAGys4l3C#`j={4i=NH_1b!U
zEzXGga*^ADymh^0T}t0g-kiX2`+JAoUg&*ErR$9}nuCloyjib*>0Fs2)M&I?Zp@Cq
ztD4$^9&T@vmq^juskdup_jo5OeM$I0b*h)kO<fdi8EFo<ayl=<`t2Ovxy82q4~*cT
zrBTsE8<xg?A9Upn44~A~#`!Uq3)yS6$T}(U`gQct(@yWxEKRrW7CySJr$lF`Q8wm(
zDL<?CSYEN}Nh$$ka)Nlh)8mtCV$CSM9<igv`B@B5YK)Sc{{Xk@UCp=rE6qNdo|dD2
zpw^b0wc{;bC(wGeWY&Ud9@ZQS@K)%>sWpRfaES0&>x(C<Vsf;4ZCUBLsdm(n8;HZ>
zH~rRLr>E%Kx@|hKuLC=LtYuXVYaC>zs4g6qIo3lzsivlc!7ayPmR0Cz+w8T}>LHFp
z8`>KqRVJya);g8Zwo^1@eutd?>XNTiZB+Zj_xL9%rf10+5#8?W0-RjYMxavDR=%H5
zaWU<?xH(&G6RI^0qMjN_WO(2(Zcy}BN5`+%231uGCzD~kex>d`JNQ*krU>N|kuVsM
zq-9pLM(Rg{YmoI7Y=%LnRPBF#rAyNvhdSn?FsXO&+H+?NkFxrjnu?N^A4aMOBy&gW
zumt@=uCA`rw8H5dPSD<Nz%ZrqsOh5WDqS<f>wgNXsHx2Ci`Tax3lgZL(CcZ56zzO6
zH<r13tw&YS*Ao;D4jscrRSu&JbuTg&V0R-ap_16MibsWN)Vj4xj8YbZ$GKH${Wqwy
zQ;ta?_49DhIbN^S)HL(H%nf6J!3#Y=%|}PnBC8W`V-4~!o1MC`R5fO!M9_3P+6Kp{
z>Fk1V+in8I2UDSGI&DVR#@V922^j%tDK&~sT8z3zG8sdEQ!#R|okZ<u$s=0A=z+oP
zp^_OB{aDeQJ({{0G(oh}%TC}qYe%>(-jk?ka?&;j!q-UN97Tv;Ez)8JO6c`CoYy;t
zhggMot3z3(!YV0i{{S%q&Mt0S^;N{>9Z8yLNogC7rRo}LP4v$o#z(U2%xfdmwaUq0
z(_k_Je^+7mLDx;J>J=LuO*4q#+Tf3Zy>sxKXo8ir{+ptxun%j+v)vg&GIqpG$4MR~
zK8vi-)D~4zO&J_K3x#V%t7{Y#{)_j?3$RFEL3Jjdr^ia~L(p^G{I4R*&3cbWjtXbF
zku{PWkkNvh9sdB-6G-zdW=2)}oOYYxUG!ySCC#R*sr6cTYxxU3uT)12u3@uX;b)sy
zDV?GxI2+)E(~Dw3(>>OwNTr$Vl0eqRJC6vz{WH`0gg1?>+y#lZE6#dnQ`G7n$R?IR
z({I#yT5m&Er>Ar2r*IiJ8Bc}qU$FT<Zj9GgboDl$R_D;V&Tetp38VE*RU17ineK1t
zkShUER%+ZUcFF2so^G3|X%tO>&l9ZYe<4osMoQ5ql1b1erPTFRSbj%h-d3-qe-cGK
zJ81R#7t0m4wyH7i1Lb+;WG{!@+Y5GDUYyk_4G5#Er(>G_ZWNp~M&#Qx)%vYAqgux4
zwapBF4;Vj8s!dNz))^_9GG%W#?xU%sq@}21sbhE#>|4jstwk29DX4up<0ZRn*K$7V
zV#SU<jXaZo=*6-M+Lzi*&9@+O6~3FHJ>+jYhbHQ;TCI|nv(~0{`?&H7xX`-OO>}K#
zL}8B@Il`@_p)IoREgG4y?V2{Zy}?;6Zi0tRt2Hzrw4c=<@|CZXS){Fp_!6|^fL0Hw
z>Sbik42|+<uu;jq6o!?C!A+;?u?mU_ol8*M$pelL(IcXQNZkcSE%LIlRmr<_jdW+R
z;G?LSs8_pmOnGJOUPbPw95l*2tdgfl0!zSd%k$Y==uUo{GfkTIcg4r-h|_w1Q`v7&
zZ9mGBQ`75cqr7n!I{C%|qe&qx*{`E#PinN}O2$P|&Dz`_vJPz?hBuhsb93!*SP5OJ
zZ{Hi<**pVfb)ofKv09T_jm~Jmkc@>ilYNwwn)GbqWH3e<D;inZ!Dl+6dOCKKO*Yq&
zlGJ5=dtU(jtjv-pe=t0KRdDG^^*G%;b#c6(2IJ_uJ~>NBhsc)Mj&{8>cf|J_IDVk3
zD%({ncd?|j_*eShP0t4AOA%{_!lu)!TSq_S>K(jr4YCqX9HZD)M9FjwE*h8a6A0>o
zxNG<;Yokvs8}?Sy816q<7%G~X+H1h|TeZXVyep_@d5A$If_UxhcW}9<EuC27Yek{d
zDE$-aZFn4(@~T;>)5THxSv50{xsK!~I*p_f(ira^Rb#YCDynYRnBF+Q1#0BG1<|Ie
z={D+-3Y{9GV;nAGcW<H+pQZIGB3ub;+HyRpdT&v#(j;tCwZ*s1zslanT@_t0mMa$#
z%2wJkR%P_6pGb(OVPu1wqiX9OY(!g_KbR)!L9#y5MYY$%fKWo&+R|D<1F`O@2IM57
zkz1%mD}$<NcRoS<t>tHDI+ba2Dk&vn#xCJvwiK1L^m>q<Vd=MmEsL#dDYTt#4^kJg
zuOpFbAvax(6>RzMS*NLnLL`ar1HHIbT`u^+XRk}^M0s%KrFw?3qUq2)vZHA$J^q^w
zJx{BryVKpvZE)q!^7=*AG`1ZMpHEc~d}WTu+$s%fi%*WQMKoeJo*Xc>8hit7<NgzX
zyPMek5SrZ-Q^4m)(0-}n+*Pq9Qgi^@KqS9a>9kS88@cxv_LVNBRA}Vg`F++FHpUe!
z70#xpFoH}?IBDc93`{!4pSZC54&B3*(6UBRqFiMe4Wsnyp^|C`?I2z8yOmb=6Dxy=
zVFxWa1x-ywU!~XF5L)bjN9rCF`mHrBbZ(lOZ$_%wh341#CdUf*pk<#gTN6#IqmE|B
zSqohe=GhBnp+i9fg+`Ys^qu<RCkN=fh4a+J>lQeU{{RZtMV`F4npc*e>GG$NE7LSN
zKS#1^T1*nt3bsNW1I6EA`c@}j>Do$~ce<2^KE}YFQQZ~Q8kUhbk5FrBD4u_b8;7~S
zAzpRQM$4$_r>QzBtUa%8>1nrP?ck*6II2uMBHq#AFVgCN)y*%XBS<-Gh8LmqzfL{z
zw1cqQfUD@|ox7pc>D<@<0QuhSD@Uf)%|{S<A@TNmauQBXOJ%XeN1-(xGgE=2MN;Ai
z^>V0Z)9Wf_63tH@@&5q0(UbLC33`SB6{;a6r-!sEO3g;3ILi!8bRC=r`3YeN4>?Ps
zI!ae=Yi6@u{X_m#_0*HV!y_HM0edv6%DrIhF7#h<;Z`%Ls+llu#|9H@@Sakfe~6LA
z7yN;BR_Zl%1hv4la^L13WD6;tBn6{vgRu(Ude>G}G&&;#$@a(vn&o9(LL{dXIu~zi
ze_KXU{L<;6z6izXnbAWbEqf<1$Umh^Qrh?_&4Z^M!9Z8)Qqs!SwWY)!e5*PweqT&E
z)PT2w5aBs7{zySlpMJ6gg_SW#1AlO}{U5Ew`C8KJxA|^zsCBw{H8z=JV;Xzgly6SZ
zMJ#c|@EG>~mjhyqpwgx!ax2m66!kJbAo^Jv^K1G~@AO%{Zn}b^M@3Z`rJNsbEN+j|
zDcs204MVO64!%*9x;-suwNo26huho|V{JW#btP!X7dg=w<N{WX3Ix5e%eF?Aw0~08
zR_H8+fKu)@?6O+uk`P-oZpJTV*%>O)%Ou9sMFgxQv^}L(%R>`gVgYYpP;lx3DN9T4
z(s;iL$d*;bx+z*mj^Q434ghjfY!`*@X#Sg_$Ee5d^(=d*RW_;~+v7REg$XZsu?VRF
zCWroRrZaIVKLsS3#bbX-xE-#c^vMJ`l0f~`doFpgTbRi*I-P#K%_DPw`YLMOO14ap
zY*n=I5tC(ID+{jD+Y!ggOIACa%J}LW=X=4wl;^fN96d(;6vmi190t4PEHs<03#{S5
zJ=HlPG|l%!Fc_KX$%AWHtB$JEA3Yg%&EDLQvRw@6sb$(6aCrDzs@nU|y5`mkrZP?-
z<l=ZoQc%7L$u~JvTSn!(>j~hJSA!El@)kNsL3ZGA*r+`-OM4`tdzeL)ta1m7IFMCU
zFxWsPSw_J2{-6?arWA=otO#;^a+Zr85as($*A9EB8p7l4u}m(>OPcH2;mO;Y_UwK<
z8z{sN;ll+fh4GuXUB4Wy$jU5=SV%d!9hWubrrpst4sOy(9g2oX_WX|_4nsH&GwvH)
zGNW-Lz7t%~N{#nu@)58P6+10skbh;V>CI!+i}Lci_C3}y!AnCU;Fo(3b)%Duu(;Yc
zbzakU@yY^blHf(GQ)p|OQxjTFQ8BbgLrybqqV9|3vyw}TBcqkB62$Y`!Dnh&vUdw`
zRo150QdJSf##KF6xy9ovGa?bnd+^m854}2e*_@ze_A!R;;Sxc)utQV(opa?B@B+aH
zal8JBTWeT^%h|-IvgC^dtiaVU4c7w5e@iCA3dQ*aKx6%opx7a0xd{juHu@tyE02{6
zq9cQJD99YM93>0{_D*mqTj#<J7>vR^C|?e6jR4=mcFW*}j8^(&1BC_b;tyqR=&WyL
zTU`-kp~Jcz7?PdtX%0uUHdgKg0uT_h+7U2rVNQ)+$=c9vE|KtF#keX~w{v#@ET&*S
z5u;huj|6Qzr#P0pBr%Y8HA}R(WLVi_7W!tT8DN63o8#a-ex|D#i=qPpSY5+{%R+1|
z<Ah};RFOKslHTnlMtD@VibE@onRx|6*g=igZ-r|V)RnPpsb~-Wz6zp+?2uia)8R|W
z7rp$hcZ|Bp^c^i2iOy&ZmM`vx{IHDgfy55u!gO;@81}f4^++mQ9da%TUNT(=l9yz1
zhdBF*T-N;C#gTG831Ti~fwu(;1&%L{$>S?R$}~7g@y>pVb~%o-ns&T*1w`2+bA8~0
z<RpAxi?G~z3pAJ$XfiFby3-4IcnIjD4YOPT@Ou?W46?xM9Jl2e4xm3r9|wfA8w;$a
zk%sMPb9;m=GPfawwd1l^YHoxQ9d`F=Rn?k}Jo0agYaRyxrmF`c*hv(Q0(Ow@H@E&&
zGr;DN?hgc95Ky!=jhEXcw|7L!#|svcNBCOoDG3{%J+5dV_9=F^J8$$Wm<_IT*(1Y&
zHaA33<%OejZbh<|Iq(C8$CTDMj!nmvC#J{beZs+La~#{=H|06A?sc9;#~xHIithHC
z6(i}KS$kNH>l>nWOxF#M029ITp{arGJA+TuAw-Udox<b6M^n`emSNo9?ROy~i%&x-
zC)ooUB>}Pzp$OI*x;A?pWRBmmfWA2$aNB(p)b$Qv+HJSNMZd9YdLIpD^KqXcMJp-l
zZet;j<b#FIjgE194X@cm@Yg!|4jt0yb!0NKNZoC@{{SjVSC{)ZKhjq@(lmRUxxRcZ
z^u(4T*Z56hvR0jvTIMs_{3+b|7=6QO?BT)~xy|;?AFAIckevjUJ6P~yJh8!NOcu#Z
zk>70p0K+GT4hrW383y2k!5z|6zzln$IR1iv!moF$8-~|8w*FJX)j@8{H##S?Y>fn-
z5JWx+3!`(32V$KKLrJs!j{e0+@(*Kg{`f`g3$Y@aIe%S&@KlV6uRiBn$HEQq?)Nm0
zs8Yiv{gP+ymFRS~bo7CwIfw2OeZ*~$Ty`kNHo%7Dcu$RxOg8Tfe}mmgWN~F)H6&KP
zHynPU{nrUx!L+!6{Us4mPWa@oJ6+(Oeu^nh(Y9!>@;M5sNs?)z7dhLn%YVY>5fgzU
z+I;YzBQ0k}eMXUgqKq30SQek<D>Y_LgY@}KS9A^zY5h?<gY;2qT6-#5>WV?>N&L~f
zkFtUo+UJKwCf5#I+<g_z2HBbz^K))g9l_ctnwr^@+(Wjw7Dx_oiKn04XB!^M`%}<;
zR+nziA;2uvR1?z6vSyohHdTz&x+N$$vhs&gmJeggoWt0oqn(nC(YTD>%P$R1%s6gp
zE(wcWz9(M%gyN$@CfaQAWiXQB#?HE{rK)Vr4L052lvF^s+{@dzDABAjg{0uAnp{Q=
z{t%3igLe<@luU0Qsigpmd*GyVNAjtEhb{@RQ9kW)1bxt<h|7Vv!SWMY{iGHhr@>Eq
zaecS>0YH21<FW<~j#fxAEac-DKOZO<o>=SQ&GL+m;qCUECKZiyT*3pz$CT30Mib?G
z*f`wY;Y2L+c+I?mlq_I7PbutsueIP2<SyDDa0m|YQ&<aJM=kk90GrcrZR2r239Out
zWP|RW*8n}FE|Sh3;gy)A4&*tGvS8dtyC(dnn8mC(NE+rF8<2aVHH?#RxAT1yTK@n%
zcqq?FgaX$B5Yxcnk>z6%S&{-<izuBQ+_2l@vLTJJvBADnj*IR-5LyO`=WV@+PmQ}s
zBL4tFiF7S<O~!czG&D5X-r$<eLOqel+~EA6rj5-c+T+MYIfwZT{;P*}kh16v6~Xtx
zYMvr(#r`-?bWPp4s#Z0R01yFLnITxv=7J5+ap824-y@WTlE!xox3LOHq->aYu|Q%b
zdW~=Z6Y+HSIg*P?(g^N(Pm!;V*aRLFcWdzTW9Pay3KE`H#Qn23d}q&PV#Bn0l#(^f
zJh956W|4avj>(Wc@jH7Yb5D-NPEb+|X44C;riQWZbZ60*yIp`)2BAqT5_{t;cVpPC
z1LqYZWWWdZa4C`Ho|C|tgMj{2lpIT`CbVSVCC#O6h~dE-OLu{_*FA_u)X>D@=R^Uw
zEO5v{I+gLrA5P-OUoAb>W?BnnT#>)howv7gh>EG3fM~~XR4~fQi$hkz$N5pqM=UaL
zh5n;F6OffxOm<zg$1GO8&yNUdia<@vK_48T<DBhj1dDd=iTuee$v;#nqk0<FHG^aF
z50zVAOd9Rc@!?o{jgXM%fqpK5t!$8zN4>qmbz(XzcRh~w{>YI~*SBQtH@7#)T@Z?4
z?KVCXa>caRg0mIaj)B>HM(y+6Ney(cH*5XOP_W3yU5-UH(Ns3Yqkrs+L5rq6t*5Cz
ztS4)`{HAW$?XMeLJNZM&46vQiWPeJ0Qwcq<!@M3)NM^|$Fmbevz5CfKT3PRm-M#{j
zSe^yj`xMxvb4~@m6%({g_n`RXY^(!^4(d4^?1wu36b_M(H@?UD9n%b@qzN<f6!=rL
zI-jOW*-Kqw2_3>@<~IxC<son*19#CuG$$@*M>b5D?b;m^<2PcG-fn{}Cxd4M_Ebv|
z_kvs97Aqxq@R(#RyL&0(d{Z|D$HIbmi%t6_q&j0C=}0aCVH_vYRnJQM-r)*x?1B^8
zNh0|RaYKKi>DrqrS!W#Eg;`Mx9R1)}_EDIDZQ5*9ezVwY{D8C~lhG+!CSWW!JgGge
zY2E^4Z)5XteyU>D7W+<B8WzBx83y2$1g>`l9_HX&WkmRcfxU{xQu_eCxx!7u>Zh6!
zdxSHXT5V*?n9P<k3A4YtB+~;P=J!Cbo(i5RoWsd0H2ngEd~R=YqZSthrzqyWIh$uF
z=BEVRr}jd{dLY|!m4t`c!wKzaYqON30<pOhFx$1kT_b!8CPM2t0&a=H<HisJ>>N46
z1TJ)f-s@RP@o)hc@>Ei@7(+&~H#8iMS8ezzH(kFaC#-xA-4i3|ky{6;?`x+c`L1je
zD(YVH3>)450M&q{qpYHaTY62My~C~oDxvY!yL%Z8I~q7(0a2nU?5>h(p%vzHTk>;c
z$e{I&+ff-OyRfB|!Oz+w4+Dba2CDd};4)8B91Zf{{3LR%kH*W|dObQiV(HxzoH;v*
zRN9|aX}U({G6;zrU|o6t08n*&?PK7fd2>Jf;Wqxu5m{eTJDm9?FDJ%QNy=eKF3mq#
z_1>kbJ@7><p@8FS4VEGGFF16LdGD0w`p+)g5I-(Z$tZyT02s#dcnu1W#+Hz>orK0-
z*u6-iU^eB>8BL`%l~pZ<oq_Va*arDpK9=b?dWxLQE~4s7e<NcqD#DAT;M27&g0^#G
zhYDl6`;_S-du7K;{uNaEZPfanzM7JhdyIR5c?(lNTj{h=4F{sAH@%~4stb0pr_KAU
zrEg3PLCtB^by?VXWUchu{#DME)0DK4wx83JX#SZ%2-B9ILux&CHk(Lmt4(gDKl+Vp
zvuo}R_yJu)_#y?9(rsn3*uVs-==5EY7eO2#59X3%WCcVOCS9#{JfIxxb;8eD7x`>t
z-<6VU#Y`#3{nA{Yx{j)ruAm6u^vEW|+!9LKCONIDF)_s9m*@6Rijo-~3^dVO>OlS1
z50&FX$c;$6B;mAN={*T%GN)6nrj3U?L%qd%FHC8=UY!$N1q0-;#I6`W*?B~Q7C0B|
z^&7_56K~x*tEqaD7=&~hgs}$jHxvDr0`Mh^_>||*v)bzQYG~VMInD6ai=brICzNcY
zr7kCjIi#;D>0Z9on^Gg{DS(K7?#UI0+=c6XIn)|1qfQQ=snE^;0MRJ_01G^BKhH$l
zu7ste*6NMqsfs52vex?|B+~X<ePolnxMOyO9;K;>8htYPkN*I>0^hpxo~i4~${8HU
z8B`sA({KDGo@{v5m6|b>nd?x}mqY`q3@jh_Su#yeO{PAKbNa3v*xh&~CZX3|PgWU3
z(+dg9<lF-EK9%X(y(BhWcD5O&JT-)<{L_-;l?BBuHf?3p*ke0s_WuCf;;LOBbcBf-
z=M&{v!vLyg?Ym<<e5#J6s?+o;2`Vb8Bc@;&xXCFeDM@TFRP<2ww_Q{8wF~`6hf3k?
zYjRi5I;=fe*BZ;~Xta9Tz31DuGqt1Z!uD>N>5V_CHJ|m}ed20Xo52hJ07>~FZzk3#
zbfU^_DUiVvFc}Lhy-y4Au*d%ZEdKzL{{a0PCU*Y-NFE{5x*u2cqZ=(|hfoKA1FidA
zYi8>nr2M|<x_+S8VERRR^$$^LrjyjHnV{SGmz{nib<G_c9O?;y?QfOqJc<iU<&Hm*
z^m#W|>-}+F9^<4>6ivPTrK<%7ovZ4VCH3<%nS}oUJC~vd^?zANL{Aiygyv}tfgXNP
zHTnlgbmW3fS6r7<tOqeif&G%E+O|7UPLlx9C@8dH`J))B4bJw*Z2i@pPvQjR`fyZ9
z8yne#g;}a~oja-9N7MRLlO6+hZzv5q4PLH6CZnXuNg2s6fV3c_-)7@mEauj_yIwAX
zN`|(qp3QM9GpqDZS-JkMrAH+&CjS7%HY?RM9dl05C`02B?r7nywaTf~wZ5Y33h^6v
z!9>?&i|%q(lXQ^VOJ;wfTKyHj#0ByX82<n(RX<v4P_t`2c);TX{{V$?Nz<B~bYK1?
z={mhiqTlXJ;cNZYC#bZ~#L7KIvR8D~O&kFK03=|ve#(l_oc@BxQuQ{mRLVM0P+uXl
zL#{5iIw#@Yt6Lwbuj{R%VdbFT?6b7Gv;nZoQB_phsH}DvfEPsTU2CY;!rDe1%>vjt
zO5f5Aw)+k09+dn((jB&G-KfkDCPJvpbhq@h4JGjp>)hY~`k}gRhL)>TH5#GV0pZ8>
zEsnX=Fj7(q9VRwSAsawrK_xtJy5%ST0Hh?cQ>rLgOxjp?YE_fW`(M)%8w4w4Wl27i
zanZ;9QVqpLRibLuOm$wNQxz)+y_{@+Wt^;)kU!Ikdb!)*(~OXsqP+`myDwQCMRjXv
zqLs6>oVYWE={+%_3VL>Xn-`m#FE`LN{W6B1_-vK4cP?QCL#%a1p;#RqG}E|u3{3|Z
z>=NY9OY07;(mHaH(aBiZCIby?ua)7N&bzAhhN4*<#yWCr1<|y91=Jl+dYWpQOW)lb
z(w4k^iZA~FOX^)d&6CqJ)F06Be`TdBcFdqVr=y|ihccn{d*^R$psgiW;|8q2Dd}o<
zvewQQo9cRYwLHdFY12Fm<10B?1!Jmq%^Tu3$aWN@)QTk1J$iq|Jyq?$szdzlDyLNZ
zO4VwhbX7HSox;Ow%E)OtG?gs@^&x}g60T|ba+U{gsHlbQ^3^wvFR_zrWF0>Gik(CA
zvN}r#Tod7KwSKYuwv=FJr?@u6kh5}XET?Ftq=lq#9tH}q>CTOlsU`mau9!y=$t^ig
zNh*jo_RP+Y))GgldXllS5bKMJ_g;;o^><ck&1`yY2xLR~!!ECMf5M)P(a4@hnz!?5
z9tywz08!Jl76CyN5V4rYWX?%0#ZhhaWh&@8;%iFHHd$TH;_wIEW_q(j>$>`546wsa
z&ga!1@Vx_D{7V9r(YB{??i%Ig+W!Dq)Xgk}O*7iz!8fvllDb<cl#Jy+NNV(TLTZ_5
z<sj#5ms_r#n_Zh`pG8gyb^#{9EEO)VQBhlG%428B^e&ax;L{^%d&xHBDn7auHD=R9
z{3VjIX4Ul@9Xn1-TP1*6O3s7n9V(nlK}-2*+A!d3Rt~4HYiA-FI@t@38p2k`qO?7G
zU5&Hq6%qy!dj!9<l|>C{ZL=xW9Yv~8#A$s|BqIQmau#Dpbeg-~(L16f+jBEz?V9gI
z=@j(tbx?`+{<Y@%&38#?l0WjM7^fYWIY{mw$&8Yh@kV!2=#5yvdv#c5i1{U?eUj<@
z4e7`wb$D?dxd`nyt7)}qok-d`my&E92)feHbe^+V-SNXKBjgtg6?|$OY@FM=1=2cB
z3dsagYp$eoashRLD88YVewn9jElq57Y;g9H@KE}PP8w!A)YYE^qxoDgyvwNc`s&R<
z!YiKkw}<XFDO|B#C9tKFyDw`xk8Ax#Ll_|3I0Ox6;%87mJsN7cg9ZR)@QLZ2Kk^O&
zyG(YV4`G|AI@eIpXaSZ!ovEXf`mAiUl4{r^7FqQ7P-(i<te0D$mD8Jl7k58p>$(oL
z(ezXz(Ll#EcOvWOO&+qpRg3c!5ku&MVh8G4DtDTiQA<-z9Q}>%96sSH<iC!B`1?Iy
zRQyxZXr(Nnh|gohY`^$f{a5iuy0jRn=v@ZvUPjm~BwBS|j>lF}Nf-d-j?KOmKDAlY
z+QIaorVJbs!C<q;C#PmkD6s0Wt7=blvQ<U_&6waoMs#fM(;6CT_Mar!6`9le8>y#o
zmRgrLzFlRbq3L?|IjpLzYqtLYE%{Fvd~2XNbJ8yL-Bw!ITqb*+i(ENH(K=-fRa={0
z`8FTYLE!wUX6f3t)9r#rI1&0zS7}u((c1Xy8pgQy2Pxv$bS$9JbJZ@V(J2H_nCjtp
z;lm+dqNRK49aT*mw?6w=+^q~0bM;MI{{Ssk*jo|yhvXG|qUmqx>c-Sp80Ok<aFMw3
zvC?iP4y&j7!QfX%)3uL@qb_S!OI(_|T8~0XDQV^h+#b@>zO&Q+02TUvIzdeH7?2BX
zHp26Mxzse>b5m_pG?7R_$qgKRlSxIt)SO#Nq<J?_^uDjE5FwOB@bhb}6Tc1SWF}gj
zMEZbU#nxJ_LsX-u)3>%3#_%jHg+Wb2tLyU;{X#(qHUOO2QYk%Ao3CYdj~n5vG%!Eb
zAll_@q3I1yzA))(wls`13?^xs12i`ZfblEFNpjIs{vgv+#$c+WVIWu$g}6dL$jWp7
z0I8d)=sg{cBDN>8QT*+7uCX0S)0$;9K@n8US`Tw|u<D+@hG6JvXyh+Fo&Nv}&NUi}
z`r7dM0c>vO+=VGuq%>T;htkWZ(ZVBmWYLc983?^1T1jUwkTvo4ZS7^F=)RiK>h$p}
z(lSX%;mCbcr*wDf29BQe@^VWZf|W(tMI^S&?^0@7brAxXInojOdj%g%>9chWK>XEH
z>7hT$-stUHq$w$G`DHF~9nJp$x(c4QEi{HhDZc{gqXeaL*k_%!QPHcPK+^hlpYt%+
zG=MK>9F>XJ`nA$XSp&VG_9&fGPuBHVgu)qp5-{U?DhiI4)HV|s4n5n!PdUe~h(%6|
z3TM=6&<9fL4HF;aaj{jJzfWsTX*0n2JKd(}&X&+?TQ{l$np$j1^(`){DoPU-V_M(_
zN#!Eq#-@)G(R50~QM>)OG~hoMS~ta5_<bit;O6`*UZd9Zxay2eg^t{CM`b5XQ@XaH
zrII~>_i{-$^inhfqUe<dqB$Q6<J^B+o9+G9+E{9+;A<z1!Xd$Dxu@>7{T-!46gy<8
zjqM}c#|}|i_K{2JIBE4%@(<>Rb(}tlTTN3#Z9Oy1C!=$SmS{a6>3cAK>9RXeYXF8*
zjxKF~y4yAFZ9k(@$j&WtEJ6=Oi>G9-G`huS<(lVvU4LmsTzVE%`!O@pYE{xTv%w*M
zW4m|vM6;*0`ZoHo(>?6u*jao2gVDV&3{9z{tA=)waOS)?6mF|mrRmhJia^_1!q&1$
zNwJ`p(ergoI=jWBq;p8Y&DBL-i&G&x<H78`UtF$(^DlKA4J>zd^0RgIAnp%^+j+5R
z1q-FLJA-dVJ5K33c|qM4*K={%Si{jeq;71KZ;9i#WA|E)ihT^VQbgLw!;U=}yZsXN
zl(o78nNvY4;4eHJu&r%71EsHFdKQyAAPuRf5KPgRH-d-iI*RHzh=*x&e5~6)6Dn!Q
zW}{5k_AiL@_Enuh*3|l>1(7`Gw{&F`_J!vCk?I=dT&;Jh5pf6HS}p?4&rMreKQP*P
z40pA|R=1;cky!Im9P9mm$Xlo*f(Gq;aR+w=ysm_$TOiVI&m5)ccT_#HJ&pi&{{YI;
zQfPFLwW3&>2;f@FO{r>d($*J>Mwanz5xqO6Qfu`hq9+zLw!^puXxq@vqq4I}HS`vi
zf$~OM!*^h-*t(}$sx6ADLFu&nqkAuZy4}+B3~!_LBB*F}v2d~7QK8joyWb!WwelA>
zd{T#^xbr4g^*2rF-A6~h2gyxV8~Q=JPuY2;4@1jOtr)ck%cE)Jj1{A%*Jp;Y!a0K)
z59x5_7p!$NMIn*Q*(mOE3K*2)tZb5mv|dp3{*g;Y*GC*|4IJ52YSq!x63S@_Xzkf#
z<?CO}#$arlAA1qmK>6!j!7QwCW4ny1$;s@JNoclyviC|iN04#><ua#9r`97chGx^r
z$!qa-UL$mohd1?)+#{%DWlLL6y|KzWxZt4Mq2ht4`dOkvDq%MqNZf^IMbq>UR0j%!
z>J9=E^SaF?b7|m^xC3u#xLRmws;XcTO-ManL)(IpDbJz5SoU2(S*5atu~mrMD@B92
zDypCH7gp2t7g0f8`RN*LBb465;Hx?~^jgXf%jz(Cash8pV1lrnNufbST4bb~^D$cC
z?KugYDcfT5QdE)cT2*}qQEAtgQ<{#Z-reTxC+pc`daF^?bQxV0WUZ)y-=*Q#4qkCf
ztm<?({IrGbZ!INJ^(R!+S4Zhc9@pRWo2pVHZ>DP5)s(bapsA;Sq~hzA_FMQm??<oG
zy*b?2<|FkE>*tL-Pp_|=b0d9;<nXi+X?mkbr*uW`99Z&((A9k-P1IWH8i8dzw`n}9
z4HCXOnEeXBaCi1tIA|&bab-hgidLV}@K&yZiQbz@bE9|iyl}a)By{3TGgGIRPnFVB
zx&D{J=z6852SP}8I4b)@r)1QxhPqKCoDY=Q{{Rf>btufV)g~H_Kp0PsTG=_T=*Wqr
zt*I7v#@~f~Nly4<^&*rsixYgb{Z(~OP3syZPo-M}gF*JlI3W$FPh0tN$lqWG1G>G!
zwnfHwqj8}1Hk|j0O2HK~#yv)5g#Q4-zILmo#?$Oze`%sPE5hiXQTc<kyM6Ks)6;5_
zQ`7oS1d=R4?4c+s(=Q1%rfaqBZ2DWEk@Ap#tl?*Cy01`eGofrQeZ_;E(p5|~1=E5m
zm>qmE-Tv!Qr`OQBAr)jzWB9pmD!x9ISv<Ra9!sn<Qmv?b&y1UuYtkAS)X%3IgJ%Z;
z*j|rUq3N|uCIUm&Zl_MI(x>&|1X$pKm2SHt_t9xVrq^lj5!TX?Z|1VO63S_u$euwX
z7vTd%*5TBxr_^HgK>lvwGP9_(^2^hkgUBIjPo`xiy%@fwX0Zine$%v@k~mgc96F|_
zPD4)O!NsnC*Y)N|@X$rC!7EkxWvl6;qhpVv_Z*X!l_x$05>sV7+8(ViaCAFJ;jSG0
z(4Xn`v@$W%Q#=523i=_mnr&SJ9_Zt_{&pg%x?@VKrP(7Rk)&j}VN2(1ufmsSjp$Xe
zO4ixUd|+lbjD&q;)IqK>H)GE&IcZuhq3B8~3bQ>s%rUvw_V9zL>9+n~)Pg}J#z^5-
zE1u9CDV}YqRhlaQ0L;Tq-Iw>oa?-A;v@Ve9+Hp}qEShz7zlj$BpQ4Xn)1L<6EMT=#
zXw%bE*EOzxrtR2u?4>JS%Y02MeHxfLO|&m$QMlum4(k5^{Sty$171Lu+!4wOoW0v6
zj(G#E+}sj_msNZ<Mmo#2-JA+!xql)u{dzjHrD>#)weZ`)2(1zsdVRZF6J>;-a|q=!
zqPDS-er6d=k&O93%hm8Y6CCZ_c)-edMMtJ1l%?7>@oODDGyt+jK_UH2a;?=XDN9b*
z#_)JJUT0HZO+9z04;-}MqS+{(G9h)_-G`sDFK7|$pI5G@Z05~iBgPeNRb(}c^yFYZ
z9b~k6A=PRNp`5&fa?9i^S9HBZQ5~S%c~e;FSzdPNrl6w%#f+Xt2XI<Z`dvn+pw@{W
zBcD!tjtUl9cThZ#;v6||VuG&LA2ec}#DTyHxbrT(lgox(n+~VfDs@dLwY1U5!rO<p
z^#$Y=@>Cr~qG;W^_5>}B9aU{3N3OymKc(#-<yLDYt(;F_;B#wonprt^PB{3MI#m^9
zwBU%$i~}|qANg8-o1%@)*y%3Nat|$0ejnCLGuaEGb6MHMaJ^qk&?sg8KET;rGT=W~
z)o@Bm>77u%(TSf$mu~1~X<_VCL9^0;M1HGVgNu;0`p%I(5OlF!tsJ+q?E(fo85|mO
zp5Zn=BTdPfN7mBRQn|4fx=Us^43DA{r?p8UoW&c!BbGaow0%#~aaL7+YMH{CL6BR)
z`mBDbr%y#Ap8Lw?oVlkX=(CDjObhCbob@qOL>(hUZtaX9q<m(<k^tf0s=W`WX`K(D
zTG1#N-~7Ys5Zyrdqi3y0J=$|?u8eD1BR5@yYE@L_rIjtu0q8w8zN1a5j!IbxiO1Xr
z3o}uu%Txm;Cz}IhdDBgfCJ1Y{JUHO+RI{elve+84(xQ%^R-nAz^5Oc2WtP>bD=1|@
zmywTPQ^ilIY42?Mbb;_3n2&S^R905aN9%|rrgMK$<S0TMx<#ihAn|Ihh1PiualvY^
zZA>+E&JK74aefNOvS!x8?^K68e=y`IT|Gn$0k0*irZKHEnojnF*I=LXE_bJ9`5n<6
zDby3_wGL#l`qc6fyUSA@s8!7l#zbU40^};GMMmT5K=wQ2BP>v@0y!mTusW|s)iiTC
z0__+13(tD8NGaN7VG_rGYk{!}qK>|3N2d3=t#$|nHn-5IZ>HCm1N@}$f`eYe$ubQK
zQ4g&xsEzMq@DAJC<!yADW2MXMx&bT?AFOs&Ju)e2+}2G4Tzfj)FG<p2rIwRvE%e+z
z$<`$&Yp{H>imydINP@1B(o&W<+W73Kx?}MItEKg4K=(M)Io5o4#k{K?q0`-_K1ryj
z+Q)JM!t?E315+t+kK7IK<s{&f*kdOodq+{nq-)eI)u=Xt@C({IuQ=6e<)e_((Yi*l
z*A54SKSb+NY4d(cXO_VH1N|re00_Raib`iTrY3HM$3F=;uVIXx25B|VbWDb>D>l{+
z?2Xh~+E`lVJNRzws=9Yorj?r?XAbRmWpP-_N#VUTfxv$uJR<yfy{0sLhaSo|)>6Rm
z=kfiM<eN{Go5LCb<=mn52qN3GfI_E*#+GkjCNs+pK?z<ax@A^$`$nFIu7#f02;Uj7
z+Tn$Nr|OgtxHJ%99JSq+9-fvuq8+EX-l^uC_WBg|#ASj=oaaR|Icu;`h8aty8D@g*
z8lJ1^{U2V9l^S%-rmAjkGS_?%sdW7!N@>L%Y-P^u=Hz`=Z}U2inOMmoo$iMBaQI%c
z(d?wwshLqtD`b|#a}Oa>E^yN#;|c8<onNE9N^i{2N&~>TZMjrBbW+mP?5W(sKFil@
zblR#`x=5OS!yk2m>iU>KaH)tkP(M&p$u!DFEe63={{T!FBq!t?t~&J8gf;S=y@^=;
zKU-r(i6ma%Pn1mcEUIa<!6&gt;fv@_Z9STg{Z84g)<51j7gYMbqcvD8k$`;LD>*AY
zH~#<(mX#o^m{>Tv{z@wdK2pC>)2}HY+1^5ioAVUz+na;U)zFq1TWeX~P*pJyN$urZ
zg`!Smk=9IF8zf=uJ`Plp{#ot2FnkqS$#%Rnn;yr?cHkZLOYzX_Dq+!7M8^7a#3YRO
zx4Ehs$^p06q?Ab+?c66(PRI}O7+o3oxd_?X$1~QZ+x2e+PD_g!OOhx}-?@&sa6_6|
ziN4FLXVfq}i6RVlpDHQb@^?p*+QAw|<@Q%kLhnm)xd8=d#_PA;Zz}nfPiqh6qb(NZ
z*98M!DWnESUIU2z&|gdss}o7pJsE?Af$r0VeC=`>;Cmi6lG_E5EREo9Xt?f@S3Ruu
z5^dR9Ho7F`V4Xo}BzX>5@Ep>u>YC{;9MTZtn1P>gPb*?4K(XAO5g?Y14Zey-Q-V0K
z@TZP4!Q>@z8<7TH+~qa078?RWG{Djep*iqWMlemD-`ND1T`|zr*a0sdQBlsu<Twy~
zs`tb#w~^SW>{-ad&NgK--QI+r=D0E5J0az3hXDs0-F$GSZ0`cZ+<c+JgUn-yBG$5u
zmv<OMmbP4jVxy6!K5~dV1(0)v(2Ea+J(@+^pM@hKYuk38vJ5JTB9qhF=HXn?RtXx{
zU)<l-@~E8LTlCpQOH}%Ku1*y^e6;C<J}Zr*Rn#O;40AU)u~Y-WD%vTTQA2}!4i!{@
zwZ*3yUC(D4L`AlEJ-JS+Z?GN{*g-i&*T796dvjp7pp}%o{{X@!XILR<NAZ42o~VY5
z;SWG=fy1(L0-h|n2-gDSTnE2oqgm1m6w)r7P23YtHbt0I*rt#QTNCiPmT9pl7-5CE
zz)?Og2!~wXut*#abhKbg5p?Ui{GuHgBMF8w2*(^DK|(d$2L%OeLCwZg;e><okhFti
zm4HJ8BX1p)f;$^_PmC6uc2bu6IKnn+Ba9XwghW>RCNZRht-Bp-VKtbrV;bgQWixGs
zhy*C(lWmQ~kvrKSw*_l51Ck=wZfa641I5Aaq<gYjZV!~!xEq6l1})udptWR_^Exu$
zaU%YBR`l|=W?#CXjF5JpDC#*J!Uz}aeiBVuu*K6Ynru0^@VVPxz_CgV?Yj0#TEhFg
z1IS#(hzW3Yh7Xl24=--l;lqN7Z40Gt=w2QNjF6ig5<w{SVn0<mTG>c%Oo+6DVhF!<
zQ#AUPMkS4|Am;7JD#i*X)eDT{j^RE!ddfG4MC-@gUj<F%Poj$+%E+N?#?m;(`}1sl
z(UItzop%f0f;cM3)4^4n2;@FEDfIO9+I--;7rqn7<)uzpAEK)oDysT!N5y!YZ~Y}@
zb&V3fh?iKoz3ez%)1`h|t)plRasEdfgzaZZr<Rzp@id<{%98SB7qI*hXN1u{Yz@Za
zi}JL3eOt=}H2}5UiaS~9*kYK;3EJVCTF3}q*xl&Vw{v{=3h~ONvQHC^gXNYskR<`0
z9ymroY2}TrnXMrHm$g>O7!eY}C5Zn3FK~kOC8YPjeMpZnyO62LHK91sb5%s>#^~(!
zd=xA%7!DjJ(d$gTt!DoKPlWo)nrQ{t({stX%O}|16MY0UMDKG>f4YC>3`Wlzhm}ty
zNsNaz$-`1(o3-cevz-BBvf4(|N-oy`O0TJ4jn@Z12nnkhbLq)q5R&RAhd7m-m{dI%
zl+(4&&*~rD9Oelbx;}e_lWlW(y{*Ex(e+lz{5iPn;ew23V3s=AYs|6OJb&<_Y_4nf
z5Kq^YX}URCVnf^6!;~?GH#oJUKindk6KHf(HSD+`p6RD;?$Kl6Hhn&5$esd7@VEl;
zVhbPK6_t83364PTYq?O(6`i;MJP?NuEPb3@iHboWvrg}VjS4y`HXn9Jf>YfTRUnoS
zNEvD5A?5bqrodX~mo?_?<FQPI=!$xI7<t^^@RB(sh}q4%d=yZai7g=i0Q7+W04hm+
z7c%DA2r<zFMkz=w_PI&vhYMgIC`qDxM|^I-{i*b|v6l$s_B+WKDssNi@oU*UMpoIm
za2$C=ifHPG>n(R6-pN|ly3PGAJZB0i47Aew!D#I6LWe6l6hmnYagRc_Gb1<$$Izx%
z>1DB*sbA|w&cc1cHMJqk43^Gnk}2H-iEI5xyN=`Phc<)76s=)0{{RZ@csJUXNZjH}
zqjMd5+zc%N{{T;&zN3f){{S<4CkSG24Gs?;RTg4T4$Q_cwczuDr>B-!ULMyH2XL+{
zC_!!+asCx#)TM{ne0I90ILJ;77jzn|GBvEI_7i~a#T!*iOHl!At&T=Jf;m|iZ*7f^
z5meJj8v~({?Z5JqaFOD@pmS@oJzu8hiLRc7-n2mek;qgnbK-HqYlk4MOnR+Ea*LB2
z$Lv$<V4&35x>&z0Qbr_T_PhT836z|5A$Z1HMs}Wdxx;bV<!wt?>@oHy%BQcOnvPpM
zdw-~Kn@>@;!Py)tt?dZyc5365r`=+Sk7-~rkPmg8qOG->PqkXbCE6Vm!5$L;H-3HM
z-}eO}l!3L^a6A<QCTxt_aPI{=`&+mB6r)+rk<2#-3HORtjO{)=s0r|JdnRo+yl3jv
zrew~GZd!Zs*>fFd92SteISqh6WcPsKaxe0>&DkqlNU>1N&>RRmT%N}4Hy5&5OCAGU
z1&;{Xs9=6Siap(&IZqA_<O_LG7D&vu-ox723Rw0%mLGIXHNdokY<UUndtHmA*<q8)
zjq%u$)AmA)ERm3RFq@=f?&~~Qu8v0ow%78f4P(YYx(4WG(;3|u`h@nqvSRi=3hz&7
zwn+Z~3Mrz<cqa=Qi6n)moP4B?H?#iX{uf6v+i8FxU^sFSA-%!9{{WdVG(uxz#ljAF
zoYHKpfM|ES+ItYXNQ2vu2=W#R(MI4}ZZ0gHxw3ws8t)+!QBGq7w<F~NGi)v{(y}n?
z5y<<5(mv^}b5H6vca_6?NxvPFSiZ^PlmlaxE8}c}>>xPyK)8Z&gy`mbPHs}rY?bbk
zGqy&b-A4Zab8g)K0K!+7I3DBWM~0MA0UMs?_uM<&WpM$(Ij*vlhP>O41w!_695MA;
zjbosGHk%NM4SvtzfcBBW<RAeIb=vHOJQF(v64xU@wz?pje)3$`I1fC8+co0sJIU@p
zP*#nT^A8M}yIy~oC~CB~2YQjbgZ)ka0K!KEQDiA*J6&#m)+zMWj%gm^=6Co~RL3wS
zwGo0lNYVaPbwxapJ9BP+RHXvSS}#a~t()3f96OFsQ-?FzC)vSOLp4NF2QZL)BHO43
zy3z|fx}8wmlO-*6@az1j<eAKN(oMWB61L>C7wn^{dnB+pa8yiICdNPB&ujh@!`xZ6
zPj||WGFS!j6ybsG_7i^#HAX;AaSpYt7d#t>f_|g2l3470;DqSdZ=MmMMS^z%8vg)r
z{-CFPOn<$kpO6r;Ftpv6?_~OUi(Sss{gSbh3yyOL*&{=n=en3tGOeZ1I3KbV?rf~^
z<sCHBQc1a&ZczUKMv}07LYktT<T<AZPf_Gp=jyc3)xlSZ+5t_UMP#1%z$3zCB>M$X
zMHb-Q%|B&4QiJ-iijz!yV1|MS93bR{;Mk9HI<V|?f+yG>dk}?}*!`sL9g2{#>^q1^
z?XDi{Bg6_sAI-Uj$HIGR-Uiu5JgD6pnU<ewVR$~*01~*4iKW>4xu)eu6N_D96m21<
z%{=x}-*B-<q3o5fumoVGA+mm<VxzILb4PNpuVV~lnHNnny|}r!;Sfm&H@C`)SlaxI
zeM)5PlR65}@wQ7M3qywHk!4pbE*}JE3Cx;E&Mr}-1xQOqMmt?X?XFWcR!rL)Tqq`q
z%{OK3@PUxuO60DRG6ok%Esc%QOxWgwy7yVOhD-$9Tgs9uhctk46!Jm|xV6ylh=KqG
zWX)-XH`A0`0H~*p(eQ2*TS&F8KI%~7TVfFrqBa}2BdPCf_COfT_i_IKDC#GGZ0rKF
zp<R+aw;Unf2))57$i~v!wBO+iD?Hr`vse_Cx^C9|DW#9N<w3FE)a9r#K81OLx=|*<
z3w$=#QdL70JbS}r*asz6>Xp>gFuq?_2<$E!dw*r-T~pRoH4c1G$nrSBLQ`^e5Jo90
zX1}QVwuXWyGCHTpH)aOlFErOWj<Zsg+oTrp#g#Pk$tf>;y~h2}#legP+Z}&Aqa1$N
z9N(a(dXl`2&XE5AP1EKwL+o*mJa8Ryg{GcA(G@dG-HpY?S<-aXMNsv>GfXZnT3vf8
zG?!u~<<VXFnTguc9op7fy#(m7(cY`4TT?y1S(6t~=~@&~%V)i_IDbI6TKy+UVcWVe
z*7g?4r6jaXwhhz%w9*j^r=x_NLrh)$%GglG`0)#8jose($v?Tu>IzAsZJ7h1jBsN<
z;-4!ZV~gu6qKZDkSxI;761h<6S{9-@hdXF{rI7b`2#S3lQE(1mY=g$q8b0Vju4$A_
z-AAX@RzCQWb~%xM<fL~~YZI`xDFh|h0yy@uzrIRdPtqMlR@rG<+Fdq?&#H=08aQb!
zzwTCGYWkk5IU02>9VH`wN!?=gBQ#gnOltKisOzQ%<JOSaeHt*W==A8?1)+_g9vft|
z-|{k&T1Xv~)zZ0ws)~x7cbuK>`vhH0BLhQQsQSS3{{T)~Z@E)d#Z44t?x|!X4DN0J
z0Oe)%Ek%M-VAVy3^KG!Y+^a@uJ(m@MwD9_L(YjZkFdKhml-D|rpGb-3rkWEl&93JE
z0Bfw*Q}v{@<<LP|`iVHZUO*pZiY=<us@*+&g~0F}<Wh1K(k!}*tM%P!#unARklzew
z#g%0QI*cw7wt9%)<*p#B+8PQt*gZHL_x}Le4T8I-pls25+!!sz(Riamsk1p2sjkx>
z;Oe!FJ_N;RI&J>|h@C@N%1tJ=rlIG8cyH8|&C}p?{**C?JH7LibXr$YKsV9qXHRMG
z9O0+-QGPBzaYOQxJwr(RGwOP37S#1;;t|uuu40Z$AKwb{i%;o|DuwlOYkJ*iV8qUQ
zgHO%Zj?w7Vuc&2ZUa4JKJ5Ac@<lNi+3e)O3A6j)aJ7JQ(NocKz+bC;K*dy>lJw+oX
z-?HTOF11wz)tYXzJalX)X8A5`7oW>hRo43Vp*3AqLt%B^eM^SfYKKM1qv>WXN_x9H
znB$vcK>f0%>0Kh0jyFT5z#!gkUJmCUx@CtSD^XT&*)G8PlV7Fjni%LKs;Kq0hPLuv
z%AZBmx`Mt@`36)~mm7h+5Aw7+&raxcvOcQ5hx2nd?k}iuIr?z2)qO=tq|JRLwA63C
zxWal#>@7b=>OPq3-Aar2($Q(rICDJqAbpgSe}x)NV+ho`jMY`&A(9Zm{gpRLYxLD~
zGOt(EUsyl<+h1Y(E1t9KjWS3ZMWfO_nn!y>nn3>m3se^CU{aIUqNlBTUbjWlpG`~E
zG%!Ne`(q^D%gwYdoT}9|FxslGR+t~+J}Aw|@0IKwCD74oFbzjimP)CdHwMV!Kv%Qq
zTFfl;DRlVT4+CjvR8ebeSySl4$<#eF(Ns;N&@^eCT;XFRtiRlnv%O3@t6HZO)e~11
zI9v*L0?<Cn_p5qmT7q#kWKE7Ta!i8@L(^R^qcWY9G4%yQad*aC96riX#TP4+wlt>V
zzf=SGL(w`Vb6Zo?lg%}_iOnE=*Qsh%e}~!xEo2eXQifZY)>@-o(scO6EhR?a2f5Ax
zrBQ0~Q0nlQsK}_5!y&{tD#^a0MJ?Mm^&gDgA*IugO0Jf0Kas4nzp@FPYpQkhex8%2
zh-gW(rh7?0W#g6q0EZPqPtM5<FoJKi94${y^+cT~r+!+Q-jjv^k07BPKi!Phzf*e`
z;a-h9{d$_3s)<O;T+r64Zl=(BH>V<To*FRrkLGR4%S-r?)fKXlPWj~B!*(3~)=#Xd
z`omd>$x-=eT66qKEKr=EQASJu047D$okye1F@sN`h7wLCj^q0)zJz@w9`eT2RZ0BE
z`A5R?mURBMD}-}K$K2m^a)K7~Ms!*QCi=#oShxC<!SU^aO8PxgdHP~H7fY^EzF9!K
z2O)XJv(_NZB{r2t$l~2*-Gb{UtZVw_qWK1!1f`i61gh?q(RJF*TyFuh1AVf)ZIEr=
zjTrr#>P;G|x*;~FsMAul*(A2^31>PEio(ZMwz1CsU^bPc(fS6iyhkR#tI{%^zx#2?
z&(%lxm($;e+IER2<YtOWwzJv|$tU2XaLVIyq*gM=8B*DXqp#8`wHGzhSHpfC41sDX
zYI;vji+yM3s^uI$LzRu_%_BjrW4%p5)YZA#$D1_x%Gh-8LQAVw80)oY;D{Rl*8<`e
zPP8@qVfqzTpVSo&h|@Y6V11_cb(WG|i0BC6bk#Jio=aSr-E;e)^)JI|w3;C<kJNBH
zf%;_t8~s<Ebu2wsb5A~_1ERgLAVN}WQ3L(9%bikQou;aF9+eD3HVlkz2+bp-=(Qjv
zocbhZ-z9-q%_~RLsHSYJjgr0D^&0Tty-TG!a&1PGJ66<Wjkf(QuvEt%y^@{(0My6z
z?M|7~)MA;C(a9~bv;uy(SS<&swFxKm=;M?UeY-`MqW&WE7fQz0O9rK0*~V-R@K4cE
zbhe!9wkA=^-G|#FqP6}~Q{?P)zfdh%{bu;XrlqWgGm!EysodV7o>s*Azf*CxNnWd4
zORiT?8X-F(YlW_Re(Iv1r0evX)X!H<HMlk)gufiF>p@eEQ(=82_)Dki6n~i3b!k}g
zE_NItb-s$}exImuhPHXltam!#{gCyYZ2CCOJ7m~fgJXq{)jEQGO0Q#NFL5^bMoqOz
z2^7;b8cv_nH9Ck7gVg^3vBJSx>rnKiGzKVRWJF@b@>XJPx-Ob)C3ANc?sI{?m!4JY
zwK}$`>m9-{?`TOLPgYgbRld(n(@vQ~P}--w3p(Ih_WQ3;r2JBDnW2M5Y32=YW01Ui
zNQ$m~D|piCYNO+GBP4%il+_~Cg;V2(j(7n-q=FO4OVbrKS4O|Ce-yfdsA?pS^B$CU
zw%E;;7J)%7t6IZa^RdnsE>Y;657jl+mMtzx8gesYR)Lxhy{G>G26#U%?#+-{Z;y()
z*}1uNdgo17^yf?ItZ;&zqz+qap>@B;N>;JVrKn&7`dYkluSwP?k<6N41^8>O3ZF{o
z8TBC`ZlxSjG+%4G{nXrLH@OXJJEHSc{79#-oU&R`RQV0L%DCyCm8jHQ-A-WmVm{`?
zU3&$J)4El<Zl)uuEp)6P;IB@n*Xk(r-^)W2pY64p+xAw$ha5KcPcB)tOQJn<S*Fn-
zba6(<J);<2PuD$PsA}<=cK}(%fL4812UOKbEkM$$-4V^hZ*Q^>qqGY8*&6zqNf{A7
z=ayuBk(5-}iMW)VCqt@5BV>e46CQa33(y-{?Iw)M_}wNw&MhZDD|e)HFpEzT>H5Cr
z0q%-M3;mS(R+%LPmMv?A^2fIa_e`{BAG6Ig9Yxx`Z>d^s2JA3!y%LvF>Dnq_);ciY
zI5xOW*C5fD$H^|6O-}R3V*_vdFDdFd^a!iSj;45x{{TkowGW$)jq%>imcP~Xpt+PR
zbdLB7B;9vambZM+NgHp6Ta{^}^_NWP^gfLGb0&ST_Ox84>D5&IMXNM=f0LuX>Ap&7
zHTEoR8ZAFqt)7XoF^zE|+lV&^O3t5>vA(r*#F3G1%YUP3Iz)7hiiO^+mctK!x~J<3
zE~lfRl1O@fqDa8Ok3ZQY`BsOIdoT>HrqQH(BA9L+?__3&u2XddbEvB|lT9!dV18Kd
zi}qf1uIjZFdXc8Bp_ZON?C*@UuS5Jbo2MxwYjp}}i~j(sL7&}D7}MJxQ*qKAuXLqt
zGs$@q1D3ur91r}eF{!^vccmuwIA9Viy`E~Wo~WZEPOEGW0}XS51$h@+PT$Y$oKwue
zaOM?9E-r<xNP|zN)%D#)vKU-o2K$^W3iRDNg1b$jVKle);lN=~bXQTwr%|#Y8y^rD
zYlYXR^!HbE?x6sKP+*9WYqyWtI-k(IDD#a_>Qw>TU~#wo%P&1GZEZ*8rG@Nq;E=tC
zUZT;%9X6k-!tin!>=ox){Y&X2bk2rQ0mH*^qb$3oJYWMCP8vve)Hpbd+=S{1eIHPN
z<!fXV(*y00cM7Vjs$W#!MUEs7BP!cLqL)%=-pEDxFBwY(IS)4#MWo#yT}Mh~((38z
zo6Uo^xP?I0O;2CGwUR?Cf3KCai=g_NN?qE1q}_*xHTerCt?2sBog?DbDoldJ4dW^6
zB!7|?@yTnlIbx4j9*5?`Nj3nL8@~@69@*rsEEl*h7YJ<!K-4N~TKZ-=(S!Qj3fjrj
zy11bswX(%=kaE-es`H9lMEJYWUnZz@O*7D*NM~ysX5?jLXfzFfs;gf$EX{@@>=E1O
ztNNFwb?CJd>ee=R9Dhu1$onr${4~*ZYC0h-F}#}#FsQW|JM5*jtD(Io(AxHicS%y&
z<91xvv0du4dRL-<ISg^S+yx(0YWnRR#PqYVw!r|9u=N_W_4}DSj`v={Dt789ZkE^v
zt)=wi>&g7Fc5wL4LbRlWY4q(rgr1Q;**4?_LrTf0^)|>EAahPGFt?PwS*Es^)2@lJ
z%myyp6?|=_Oq`Xy6cXy%h<%wTd{@JUFt0RyHk(ueX{uz7VZ(#gKd80J0a9nAV?ie6
zt>FEXx+b|Kt=~%5wD__yp7yL)8%LqkX^o1QvT20O1G&ocj<2NA+r0qEKsLXvs+J?;
zb;37O)OE?CEsX7VYcD+3sI__P59S)@3+31U0EML2q-d!xW{0J<+Px}Gx^AO1jPBjW
z#cniitE<+kn?WcnaW>rJg@fsSk(#N6^z{vC9FFB*Qfd0ek6OYbVR$&df1;Hn?UhaO
z(d|7s(FR?WGRpAdk#mB!F=#qrh&G~*35$EVqU+82Q}HfH*xf%-rji-jEZ=V`>rm=#
zLH2xK!@n2qyOu~Lu8v0>l6wXGN9gXDtD=0=%oLSu7X`lG?z|newOXZP=w;PvBV<Qt
z-s0xq*?KqP7OAXOQSOQDVYk1*ST2>T6CcaU0C{=1cLe=c23f*V{Z6<>X@0_0ejC?%
zW}-TV)kABN$9sp$20oQ#FcNNTjrrt#miCICy^lL3bTIh8D?Qb)NM#bmR3W$OxxrH9
zCD}!dF`7jG0O*br!uz+lQtJI(Pc&nA+b1~T2h(#$B%5Y?Ww+cde0o<;YfKc?a5guz
zVeyMP>!Ledk$Qa?iWz6uC-m7;B5z{hb))I3uA=Fw{U=iiX`FEOo3Q@?;c0q*rS#~W
z=1B+}Pw?dfHu+NPnsbGrd)y-*rOY@#RVR{Ac2nb0S|Qbc615s&*s1BIW386o3pvy}
zms9G@Wkirl%6H`L$+EVn)9Rl@=CRSwVU5Dh2yGuwtkSl}BxY#Aw%2w~$xNDyiI=FO
ziZ+*2H2Jy1g3If3ncOMcDSTwud@p3`FZAtGOCqYBmn}BfZ042XH4r#!62VP(vNz**
zBqnyW1xB;*<3rKkHT4J!rzhH9`d05*(e#=sb39TqH(KF?^p%LvYTpbZIbuH-2+cwr
zO1QPKI5s}T?zjqaU)f0Oq+RG$T2!CItD=reoEEp-)Ly648ZM;6B^2%7Y=&XMX0(kj
zQK6~bQ@O4@I18|?7<i@IB(b_FNd0k~6uhHhrj?c24^LE4SGnR%%m&{6R?V)brlKYG
zE>v@C5qe(t2RMH<>_W?R2U9(y!yB)KXyj2;iOMcc*zU2^UMDZ7e$qIyE2Z5{s?v&y
zSlB0M+HID*?65WZo2HWFl6$X3=&A~O>IkQXM^i`#?tY4LsV8GWwDd<?q(fCJgfOx<
zgKgHZDz1K$rIJzkh6ld*EelVoY7eBS^y*=0jkxt=;HaS2s6_3&VdMIW=Z0PJM@+F&
z<ik2^q~p`ugB*=;%U;w!RY4UDW?EQ;61TB!!qd}M(Mw6|vUY+$mBo4ATx+}GmN5SS
zX*aPvE{S7Qa;%Lo?JHT)_1{j5R-|NgZNp}3KqYTzdU}#=JVe;rcMAtuc&|a#($;l7
zD0J;*&I#b33+fJ^ppBFbdq=o8_gwigs?liWXN7fa6@4qHv5$^H6VJ4`UB6<99ZN}3
zOvxmcSmt2%y^gU9)cUSXE%ee;YEd!lBlNsozx*#FgQX~>uY8O$2uq1;JO#1iQ_^F+
zm9|vt9e=1)xzuwwRYWigo0X8%x{GV==osDDmF+R~W|I0~TMTytF1A*BzoWW-t5Rhx
zTlTc`w13L7@zfnzH=5O>%IPaBs%o1i!Ug{TU97IEs~%&#?X$qJaPGb1rT+j8bZTmL
zh@)iCk;}csT52DMS_H6|olhHD;p2sO<B<9Hv*wK=f?Y~sBf;BzTe9Ei{W~-1+Q&@i
z#yGzrX|+$oVWN{$rOWC?dzi_(7K>1cuQd1cp4=9cQjB!at+{T(D6|=w8%%Q?adndG
zY3m>lh~1AIcq?N4OY-COl6(b>>+0jEQn{s;kPmCxo=PofRONd-%2TXW)SpcHPHspY
z)NdN2U1^&jchi(lPMuA)ZZojDJ;Yp$h3RySf=xNGRnm!A;fXf;oA+GzUW=rjk07gx
zwn3IWj&K*C{u=1=)KN6aeW#xwt6I$>o;!LwWNWy^kL-x)s;Z45a>hmsMb~s>TlQ0%
z<iAp|ii@^-2Tw$F<}w#mzCGA)sg|F*)<au083wJ55ufI7b?4Rk)hv|F0{dJt#|{&z
zH42F7wn0@h;^Z~%y_Y+Kt1RZaFFNk7rlO7S(W)COh|Etv;d$Ph)EcIo=S5KG!r{wZ
z!B#r1u{=_3abetYS}cR9Y!#4hmc;oytKhZSEV3(g?R)cJ?;w?m)+(b1d}ha$cdTjP
z%0zC(`0~3>>FO%T%R`Bj^2eX>tt6h<Ba&Sa^v6_GIw4If%a}0Ro)yfJO;u39VRX^|
z05y&56x}D&dTl*WrLBxGlkIuq=(ZZ4ND2lrr%#j8aLaRcy+%^5jTm2L$4zLI)jDHE
zF&4$zsr9~<rG~WL2DRq|0m>Uo>Vu|KnCqDOd71po{VrDj0Q!oHR4w%0441fd*EF&@
zGVzK=YOkUwq^M-mHQ|FLt>rUX>9);FyG(tY#@gU#?zOS&5U?04Td;P0xeAY6t)`}p
z^HEgoaUF{7jyB__b5AN#==1$PwrvYnA<pz?XF0)MpQZJ7jjK?It4m_2+xo|I^1Qkq
z%Idm<*<C3Qam0u{Yo;}gDaN9jVN*`;(&ilg$)h(P)rqF<7d>x0Fx5HG%-I>(g@&lq
z3#Pk!9#w<sbqcC-_j~s8-r+M$(^~lmm824<#x_@*XwmfjZBr=&Cx}fO`Pwgqw9z^e
z9cOJoh3p45SzeuK(rcldo$;~2xrc%m(?5q5ojt8lGF>`Ygti;vHUuA{RF#94x-gng
zMa!fH>|k_!*oA)$b9C?l0>j~YUZ<wU`hVfIyMSJ2uSo<|#-3(?NwEYjT)5hid~!_^
z*Hu&M^u|5SX>i4sHQHTXl~`X#R9yZ`9l=*$>Ba{dx*4}SlNl-+&Y+@^f|pRH^d$nq
zUgPe9N+VRI(O+Ax%Gz+snpec)Fi7^Fx}bAss}nhmYwwcN-{_94*WeNwDyGFz0sSxG
z12^TMk&{tX4X*xO*V>vhNDdONj26A7YJZ)3qKw6!0*V;54@=XX?gxQx>(;2|rPLtw
zs$l*#y|Mv<tMz>evDx00$0rM_HCj2E-pm(G(@#xQ=T8f2sjqi1jE|MIZ6=*l18ONG
z4rmyS!`#xSH5ng8CE;NNASBnzTIYaao3UuYLnb-N1`>=}r8=C@P3Z}2NAjNk07Yp}
zuTa#+>RFoCzlSl)%4gPPl2<;V-s8dWRfdg2sMo_KL;=!m&gPpG{yr%|gEmOX7M)Q;
zMMqLAsAhaJ7iKZS=%;OD0`WDjwn*-&E1O)`0aDiz-zsW4w!<CAwb#nCac^fn&=##V
zMwvL8o<oCj+pA3%t8~3pf||LWl;az~!lu{eZBTLU;n`PcI()6EY?4!u+y1aSB*~61
zW5Xjg+J>48qDWdxNx==lP`^T{4l*&NvW$Rxh3H)iTR_$_lT&B#P8lt*eyh;WMd*5j
zLP~iV?ih1iqZvo5FRQkXpY(lI)K$%8T{{i1=AH=u0EOu~Ji11wNL{8>2;{b6amZ73
zXW^L<ywiKnAcf}jI(DI<R2I3iK_gAU<Mvre^<zmxv}yXDj=nft(;LV<IB-@UQ;w>c
zpv?@8A0c09oo%a8KW%GGT_dpOIk_JpZFKsr4_ctPYbAxk&SQn1#AR)4MI@QzR27u%
ze)<0ZNy6H6)}y9sOgcuS^6Gg9@aG)Hd>@5d*8LeBI5iqvqF4#JVCAZxr>R{>?%Z78
z@U#+ZW^Z~V>mHHn4xO&t*!@}wGYwp3?IY*GLD1FL!sdzIT6o;OGo|{TN(y&UYA`cV
z(%vm3QVW)kArq){W|gl}KT+vP*;5^^`ciE69|;~>^g70y*^#A<^>H*z-gt1xL_?u9
z#?Az{;Z@UWGH5ljQO^vfHoM&nt+Si-y3^^pr5$X3wIrDC)5uYtXJt6iuKYjgJu+st
zN_d*tT7B0Uy4&hshFT`K2HJ>S1op(yVBKMQW2tHM>V~#vmS^>Xy^}!KX=`X3G*dD`
zZ`9Mr)pcUZnmKYsrhNI=KZTn2PBKXz-}MR+`e%v0=8yY=q3HUr^vby8iNsmiEjC|L
zR_ipuu8u;&(kypm72{useK(`aQzd?u1vNpti&%Z6{SsxC?GKCS)@k~*dW8=Ct$8i6
zK7Omu`rkvRnX*h_^+CCFdxcZey+Jht_DTzEY)BaUtsQ==1zSCOSsUtF?qT4rc{8du
zk2R<1nmd|`XOhQr5j-c)qn5XPSpf0eBK1o8LS=j}FjNC~#(Sy?uBVcef?U^mx-rWz
z%M@zM7#dnOR7MMbtGGkzH2B>K1b9MH>(Ock;D(dRHSYztX<e{wqlRfFRfD^n5z3G`
z!`kD5Ep)T7yRbX{pq*03vYn;O_WuA^gwkM&y%0}G3pcmiJ_?Df+Hc4mib!ii99rjN
zvYJ;h-rzmnQBKf}QymQPn{ENF?5AV4IF?z2jQ;>hRnoTnf)8Y|$m?y8n-1w*Y@(GN
zSqse9xwkf4&Ey@fvXr##xN#vuOPcHXO5$!r+I3s0XCh{ap+BjmTi0~XldIDHYe}7u
zRCBPq+T;HK1!rcwt;yQt%37JJrUi~IcXAF2NkR7!l-Eoes*a|Lq15$onB;Gf&(Sc(
zK)C(FxU8;qTw${S;5?2#g;u$vHn>cip=#J8<7@c<IY9V!yCE3%fyl8;aNOJS6GlSG
zP&t5LgJbkc){Z1?t=&IyVX+uJ*GZB73TqaH^c!omfPNG&j2t*vsiKo+2?}Cb;bI5D
zL5zy$!))5&LnJrI$SC)31dhrl05ULEOw<4)ARVI~7joSG=$ROAxCGk*FJx-LVC^M_
z;N!wqygXj%(#N=A4nY_~f|(S~4R^HI{3VK^*5<`I;2+dKWWxt`UdwSclRBZ!Z@AqF
zE3VU<sWuSo{^}_sBRnPJvH7;BD@xQ|PbSBlD{1yj1hF1+Ld@;&-5I7<IynSyb@IA#
zWUVuvarRjTo!lFu-B3gZH)jeXwa?tsa8xxoA#{2pRt*=ntO3EwpHpFP#lmYF{8qcc
zN9%Cf20Ui%L(pGk6lCtOA9Q>|&9`M<z(j-Uk736>lA(?V-DS@5nmI^qm6?ef#|k;I
zl{6#xWTw1a+Q>h%5yJ6?oT<GV<)~*gwZg-?I)YDdX;?M%L>gOrshJRvT-jJYnmHME
ziywp>(Y_<MfR%-8hDZZN!hy}P;T7rtENoN-z`TMiJfUU=t0AzG26;(IHu$nKrJg<P
z+CmkPm~cWVnT5phzRGui;0OSO4mW~0?v03o&T@(a8wm|1t{77opNBUp0@Hi&q>e{4
zSf&9ZeaCE^sRTO>$Jsg!vfnl*f~IhEEh0mX$I4d525e>WBOs;PFLU&=btFElUZYC6
z(P<4-%#84POOk3aZH6&&U@=HG?S4K}$=Y+r_FCz>JUm^EA>Kl&)Vg}EfET%i@%I+G
z^JC@WlcdhCic8U7O38usY2+;<!B&i@E{fGGEg#iv6-sxt#Kcek07^efs(YRpAQ%3V
z-CesfRiL=NvR<BFrg9PDckQ&TXn+3zoC62y6rbrd_0fY1g*@Q);HLggrkMJ3+>h!b
z1#)EjM@~KHiZLeeUIR_>V}tZs{S~a(FF&Z#GaHslXeDEA!;c+`>T2U21Kh_BE>z<r
zRmGlw{W_jTnP|vs$1Uy@GRol76zw+{1g!N2y6A}YWZ2=uflSppni9tc%EICN!5Jjb
zsWid*jk{Xsex~^ym!4`>dnzr+R@$#qw7Jb|zi#U#s8u$3%&is&vPeO$ipolhR@VRn
znJH-sIW-4JcVhnl9o0lLl57AY!aj;7%5#8w_*Y7Zx;V&O{p<ueOY2TD#*^fuBBGW%
zUu)ah&Hn(EYfGnzn_vLAz5J$4dllN~%)X*fNN^!TG_L05YO1u4Nach66>R!fsN!Q6
zcl4%IE0g*tnCD0^<M5I3$zm;(Y?^!8`?T#NvYIH%u_J6keG`<MDkEdV>`7Ko#Nb1L
zH}Z}Aqg>F}G-HCNfuMUOwYxbwiV{;{I(<Zqwr+f*pEH~TfEOLXLb8y?1IAl!TBe6#
z89RPk{{SdG0Xr@9y1n)V+<$drBs9~q(y%wfhAgu#ipK1Jrzau9gY`z~nzNyk^7ZZ7
zdpogHWs*|tDyD#jmdHere=LpX?y0Azo|Z!4a^B7hMNtIBqN0iWffu)8t0t^*e%HcS
z;fFMY>VIH(K8R_jWWX{|1O9uZmXbhsN1q;7NdT3b;b<e{l`Ru$nBf=(R`@3&7|9c!
zIUp$>K`oh<K5djM<tzlT*Kcukp{%BgR$5rBK*0kcQCDf@mv98I<8VgBpi`&@@Kg`0
zhC^$O$&=|d5-`aT+ybVlrm2bE=8!?<3sx4L8d^<8N?;iv^&&mIEe4%iO)Mp^w6MRH
zySLF`^y=cr2<jS0ILKOEIv5R|6q_&GvRsf|q2W4o%>>$8n-QN)kV_T4(VkkXr-pYn
z?7K+tt#r-MI65gUjEnND_R-c0;u*&v@K-N7WzmL?vT8?`yluJR!`kIzOHf=x>7BIy
z05ncN;aS(xQ@PHHvJv$G1nnX?+8qRi@ty~ErnJpWw4&4*BR0P-9E)TjtL1^ib3;eS
z3Ij<|6E~KbS_kTA$U{48-Ewxg`8ZlVf%I^e=EZ=E@&Y!M(6EO{%oSNC=$*N@Y3<<~
zMPCEQrBxVj{no;-tr2Ltf|7!u04&!Y#9>)dXw=Rd1BJX5LiimR^(kHIGn)hc5mXxc
zSUoC$;#=HuKC3Lgn2#5<Thw&qFNm<TJ%^T+hw3hzl8QqmJ4lT1JTE|?*6Cybdd(xv
z)r5_qt%$YdrvCu3M$+6w{kms|wns+)08QY7!ZHfUA#g2n*>x95(#l-=XSI*)79z5i
zZ9ZcaK(M|Kl~pv&OwrJ46!onPmduy2Mv!*eUvqmnENgFl%shBjT5hoTkE2pIGqLWP
zz-R*;%z<{NnD^Pk1olzWPZQc4*KTR~;T5ylxw#%e;S&M}xt9*}o1$XdBR!`701KW2
zhw%aWfs{L%=*{DI&JwWu3Uh1+g%i6F0ZxXab2ht?!LnoDXJ-fer5t-4ZR|H54=KjP
z?q{{u@R<u4H~!|wb}5sIA$6r`w`UF$3+{s%#fZw|7`4VeiWsFWZR{N1BeIpR+|cOX
zp6gkd*GAG!><VV%8?5kt3Z1STI|uxwd|Q}y<aY&QQOrBV`5lN$a@&V{f*qmp8?fWT
zdn9YHL1|b~&Wir#WOz!+JYw9Y``Ue{gx3)FUi)4CRxm+-w~l)#OWw@Je#LWMN43KW
zH=VrXd04`_c1mnOW4^qhs$px7Yo|$PgJ%Qc!-O%F%_JO;7U6I7F$3b-?WF$cgL5uH
zzrj+=F7EdV66|LoVMHzu&j-Tb50s6uHo+g^DGqPBxlN!C4$n6EPIGqx91p{SWNu;Y
zW8F@}VeLQstYA_LGyT-DJ+CE>{^|Ayk@W>KMvL48T^feeQyXq=kl?+J_Ya~euQwv(
zr@A)CFl^<Sk|Ty@mfF_{nCf2}L5!C-`cEphq8G;P%{DhnPf>DxLAAqzfGW!mTArb{
zKf@=Rs_M!q8Fxpu%ssml`9;R&pSbLnDa%crXEA1zGLwl>G+>fi(hq{G>KU}#YSK>1
zd4VjjclcG+5Ju~Zaoi+uD;cI&(z(Oh?m0wB8)auX?0cx%8p(FN{R%0OZX22nl$xTE
zph(#8c8{_to0vx7W924VeeJmHKt#sdjsu!`2>LY(6XTGEN&xz)DyYLn;ePLgJk(CM
z_^wCvsG_QpBeC}f!Q>#npp1~Yr0yJYnnNV^w2P|-dQ}mZV{q(+mY5H7aq<?lErYeM
zjli6>62ix{-yw8T7Pn-qCB9Nk6G7a=&k0#XaEP?sgpu75O<g<=_PXQ2L&o#^Nl!2d
zI~(>Z8J3Y(GNAte62;xebhQ-BmAJM1s+UCeXCU?|zn+?%){tGd!3%Nv2SF7SvPKQY
z;7}6NgZgk)y)ATeGz){}HnKRJ-Oa<1ww}$|pLu%?iQz>q$KQ3XjHm;Bj($+?f%)2R
z^iSBy0g-29DPw+kxbnI2k%9>!G!3`6-EPBQLA3i%d;B6D4Zt8O=$u1=7giMYBLU+H
zUV%fJ-p&BwB$R=}a|yqMK-&C+aGEb2$hikLMKK!sDyD0iNO=39$iW<|=dwAOXN#3z
zS3>3zS&*NwbXT<4;Hg_FCeAqeDBQ<2#BEM%PXu$_W~?h{d!u8;+EXngeo96X(|nXf
zPYyd@V6s$cXlzoOi-j`)cs^H4PBz`D7MC#cP<sJ6iKDWNGQ{>%Lh$jEl#(=;gKLDh
zux*_i8e5cx2LZTUO9Ml&;*D%zHp3{{sIO$QG2VPBiQmo&o=8}D3J1noY%U5mD^xMj
z<I0a`!k8N_yFZ~0#!ia;M_s9yyVjNOzZq35sgcgO7(PN!$O+tCdnPh7EVhIbo&vIp
zT@h`t$X^UhCDg)KJ2xkUG;m8(DfD1A`NfvUrTPl5R1KPEnBwHTouCDzsAoa+l`(6g
zZl_t?6M#_X80*=TB_h9|x?@eOjo<15oyEMiTAxgRZc*B<ou*S(iaIFZr3aHtT=MU^
zP-z<Gt*yvLmD8|A9}RP3vHjMEOQ6)@tM#=RBaTadwjFm5-Dz@cXtf2|K8-=A(^H7s
z84fuwlz>##GilVG*xxIq@&P~HLsSc;+au#7@CgL}0A(v;^jW#|%xFK-Y*uZGlI*Lh
zWcq}GlFvMGf7tVKKIrOQGen|@IkCO(8Q$lTf6AITo46m!JpD)^7Y!Z8_K_dJ09h(&
z2foO~EY-0IqNwzuZbz$s@R=)G#%+Dve6@!tqS+!o=^XL(QyR)9!bLzQAJ))6y4--1
zDruo(2|lBm50hop)s#?Exsg-WR84Gccenc>b!|qDQ143duyS1dEH6}bR+&u;sp+PC
zwIo;;y1*rS9T!^8p-(`^RB95voy1<IO7q=kscSV^j9Ps;hAZ0Ss)@x-e7>Zwk=u`R
zg>j~7VXXkP{{YIQA@)jBy&!!rO>>{VR>vdGNhbDMS~_}27!1q={0yULY4oTmw$#O0
zEA4?001vIy(M?ZJ?v5z|<)PNNRe#WnY@1EfWvpm?P|9NF<n3?nR*$CY`a@55rKxCN
zpQ#=yt}pTe%t<b(t38lDzE;FdivhDo?60V_8f`s{5$ZJWaXIwbarL@bslLaT9+7LR
zR#H~XKOsp?qd|NB01go6AGuILr<cC;o~2uf{a&9dN1<pMVPKlGQl`d3TyjzMn*N`q
z!efimV+ZpF@~;d_*(qf7ifV3{)vDv$Q7NX3@(A}U${DHpT90S?gwol(O5tzpu^mPD
zpvV~LX_)sri<6JpWoVn!JzrC~^)f{Rj&H@5lE+#!Wj4#sx%@(kT9*-09NxnCy2nG-
z+QaHM($qMz_>2K#_Flo$KZpGnMNZSHX|d`P9$z8dpP~<{`WL6!dYvChf(v98vu%_b
zjCwA)KF>QJ`iog`s;+4?!<fT}y1mdJp;Sm|YIHdo8;3eahY#)*dts}it7{)sAz(O-
zhYNY4bUvM~Qi`o(sU*{*x9DR%*7~JNH={~&sxci*&Wfa{0+yn-2MiWM00nnRQs{O1
z%sVHoh7fLDBrb6M*P-eCC(_zAVVgwLM!4qx0Pj>v0l(48U4N^crP4pwr>E1v9@eqV
zcl;)Fm57_VJu{{u(&_Z**+-~BD7PixAMUGq)2k_TDr4wL1yxhUql!0z;(p8JPO0mi
zXHwK(6(vljBI{leY<-rGq2rE<pYyXZ^)-(dX>ldM{3vmhowCuSYI>JT*LsboQ0jeo
znq?*TM@ti~@451^a_SV?EUt@8udA7txA7l?_FEZr9Zy|js<m3tNdU-exwqYA^=&_<
zDO_QJlGV&GUg<rzPw_PVkX}f&U6HZXTEu>%XQyD`wa+2TWzp@2MvbyOwa+~Jmwp=b
z9CgH1)>T147wTgli;t?=Yx*Bg(@{wnk`pUO>uC-Psbk=*<a1JVRP`5GX|JF$y}t0?
z0`m#0<kf1-5p9Wt;G2vqZ4OEw{X#{1;+7^n?Y013!%WRKw@wbBo{)gtv_{h8iVA<T
zWAfnX7)=XZrs=&S(v`7PJ8uWwb&=Mq_5P=-aMLvDgnffavft|(_L-x~MMPARh8%}P
z+pLdKelF9&Xf(Y(DBgdd0G09f%#1X;KUCA|EsC~|cv|OvvDtdRPyQC^`u>u~J6O~s
zsJ2VlX5Z+t+9Nfdv7NF#{)>6L-)k>NrmT~uG}gscsS+41efUK})tj2IR(>B()3lC_
zmGpZ+{ddXxESt32kM%Ph6!BF}f7A`X%70V!>=j$1ibEmbJC#YJYL#tss$qhrMi1v?
zWRKkiN>(#`qehadioTXI{X)KINZ>aM3DvrV1KxdUXO+VrtR(ABqtvQS(L9BthPYU)
zwGNe4Un!`obIUogO*wMtoFiSHtN2aRJuTEUZhd6m#Rv57u>oG{JsAd{TmJw-t<4M<
zz`pA*I@7g!4I(DRM?zzqe>`N1t7-`P$6I%;Pfa6OPwJG|70TX8Ju63KV+hA=-+oI(
zG`7`sdfJ-|fhN#@W#`>xQPWY(AkiphmU3(Zq$d9WWn0x0okd1AR#!m_`vB|Rcj4xP
zUpAmB3nh|$*KCeyuq!A^TI>B8&M@fF^d^m|Sh~MYl99Z&{nw(>&dNxG1lPA~-APH)
zT}59=W2@B}O3PzxYtQ=EMbtDpl3mm>NY9X3S5GAs(alay(>8S#bfx9a^oj4f$V!c7
zjuw8ntUCk3^Jr=)<Zt~}p(BrS%l`nv7N&*@i8s+|ayb70OZ%bnGjP_=L7S=RS(eMY
z<CR6!I`*Mk1EZm$s5cyjn=3Ab(|T3Z>~5tr)b(STKU05YuC1h{qo*=y`re&1WBEzg
ze`2WNYTGBtBf#l;e_7NuFzrSeso^fUb-OQI=}w5~I(XSB)@G)w1DQZ@C+M>}?^DY9
zw^GtmiK+pyG30+_?Kh_NEkVDU)ZAfd$PG3>bYmM-k(~FlPt~0b)0J@AO3F&OhyMVY
zmtp&bi*A$A+7#igYaZSJcn-JRBXylWOrn6Z)sja6o4t9)u?#g8&5jzU#xKL2aHS|X
zy%dboTRl>PtMr{JFHVAX#}PN$I92sp{U)PRzDkz7lW-ixoze70{#~YG9y<}jv6hx5
zFvsaO!-rcb8eYeYpQF%vW2n72eJNZY8%8X6`Yg}lM^i&QkyFx2`DF0!$Lg}xf~Jxk
z@XkwoH1LS%-4?4?)Z0@abdA1l5^<cJUWzG3D_xeoGt!!#tXVZ&{)}ff7%N?<==yGr
zKzGbtBSsy2l2(S3N7O0lS{t@Df&G>@uVAN&E%g=UuWokk<u*wutqTabJ7m9y+8Z@}
zQc3FK-3c~mlek`msA(E5mk{*ebZ)mBt{0Sar{YBwG=Gt7Z*$p=&28?c)O!8zoY)r*
z&3+Wzn_3Ev?VD=-QSsA|*nOM_1)8PQx{8Xi)%tFc`MPud<(s%4sO48u^;Jz%NHnb>
z!z04h^o4etNZ(!3$peYGX?7DvqqzaQ=@HU?B+@~RLqlvQxdOz0;Zk)M;%pPteqT$|
zpDz3Y?AagI{Y%l4i5pQ(>dXC18M^cBH(Ah)cy&EJgALl^E&HZ~)ZJc%lC9CD(<ybz
z>Va2Pu)zLda5e!Mt8})9RDEeQ$eS<qH2(m?)b#%VSLlzSYiemBk-%E)AQT5s^)F8v
zX&oF+jrKOPmtV(?D@QLmH?sk(bk2~*-Z+~ZhkNo>Jsll+subFJX5wrzt9plCs;txv
zH8Cy@HVfB32f8Mi&_}51bI9o&E?ayB&o+v|Hg`kGUDNU3Qlg#2XL!g`^?%~kTL<K5
zAe+YL0vZ;}thEgjMx!icTQ1Rod#@7KbsC*-Qa_W9KLD2D$`SH;J_k&^br|w4#*;<V
z4Q+0vJA}^3e=Yw2;U3?^y)t-%#cY9|V>ehj_iDOZn#tKUI6pqq^jDoD)HM-Qwl~b@
zFr0#TU9g@vsyQba#od8*k4j6W#9v2SDgK?gzu98w^nF8AtPsgsVRh^bmmsgA1q3>c
zJ7$Mum&vywOG(poFFWOlj3YPNE}7w1bOo2u=9)H+G@3t8Re{p9j7r0gs;bqcWK)my
zy4i*K+%0c~?Dcwe1TpM($r<5hHMulOSY7K=z~<Yy%AAt)GG-@08oR3FnxW<K1DhL#
z=`}ix6xtzih8mN%F}t$!7wgn8>INzo7=w-l@qePO>V0yd(LIiLJP=aGTu}6z6}s&k
z_30lSEG=nuoW~3;R2qvQ+a)Y}0T~y#A4TN)RRvvbUix=6=XP6slD3gYUr9_oN_vI{
zj_f3U>U`2;Q<6PPr+Tr_Q<oXC21V9mt2%|c{;3@+NqcwXm6y|7U8+c8q+^S~$s7b+
zIv%-CR%HB)j}1SqycE-uYLTNF+3fuxEe@5Xw9Oj}Lw@Ti*Zplp9Nvr$^xJ!5g&vQk
zYISs5W~h{0TVd?0^)7^gjC8t$Qay(y!z-Rx=PurgMp28=U7*Vjr(D@%f30ki7q@hN
zt)tS?wkb<vkP8suYp*Nl*t%+xsMAw8!yr7K3ccz*Mv1|cvIg^J%G@BA9U+>&&CgcX
z(aT8VPQfE>*aKzbm2{N#y194_jm<rUf%>gZn_VR>IsC(e*>7pSRtxbDSafrWnin!R
zj!R9yb!Cl3^0FT#{;e0<lj$ibe~#8Uz*sLk*Xx~8Q?-ziz<gn7x?4@J*PPjE9_b=I
z+rV0>`dPG*hQ0wHBNqy-H?bqF819|Zw91-aTB4c4KsmPx#npOE53&{l?gfRGhLRTP
zk-G7-(&pX5#dUtCr;7Hv7{GImd=j&pN|5PWEwvgQex^3QmYIzX7hygA>MakZ>Z^mP
z^|<7xslT<u{{XzL-{GfI>9XlfqOTFS2HB<Dg<02~K}V&yhe|esc-_ehj(O?P)f_5I
zMq5zRD|&Kp41w+CvNylM2t8A%O-(U^p{{el!+^0LbYnV=n$<a`sgbuorN{d!=`@$H
zJK7}{xO+;yS|Hsp9V@6cDoMj1BWoZB0$<eMp<8Hr&W=hgo}g^aZW{C7;IBMzhw~;Y
zfcw}kexEC9*dzq7o<X=mspvO-qT62TYO1zABGb*iqY9&^*;yS=uQfc4W$qnoh3&ls
z(^_7qrbZu46P(uA;`d$Doj(SU*E*gM#*gJA1tWxF>}5A4N1N64M6^))MlHmQTQ^wx
z=juA$X4zi$MtIGvy&{IMN0z+Bsp+v6lVJ9XS!iVG4HCYe^EypTLH5jU!oDvZNpiAT
zbGYd9?E|Jw1R?Kv$i2bk7W&`x`MpM6;in;5YWjYmr9|eJ?P$fh3kP33g0wmEk#n1s
zX|6h=Fm1a>r|Cb4x;v>`1$1U22R7kW^$%TXk~lIM%h}kpEVQ~MMyW{GwwaQ$*p@z2
z4*WjUHV4IW<Jhh_#Y?t!M<ZT?=jwWi+#3OPugbR2>f2FJ*VIq6_ubuPS)^)|K-1Jw
zy{;TM_xq_RJ!mHMCI!2X>OGS|Mh`+xa-NyE)-?7CXHQE~BR0K*t_sF<#*ih~U-^kz
z?a$}BvZ|o0Z8<R3m&Qg~3eUZj5LE|yg^vdY_9~K+vT11a9;4Hlr_vdj8y^@R;cTq#
zldVL_H!?FcE*TfgRlbc`QK`{7hf|mkTV}h3L8$cQPK!IIf=}U-e}a-xZ()X+b6wPI
zr>Apaots=NTH%nYsCw?2nx(Y*j3Rg(ZMnH~K2}d(t}ba|4G;1VJtMMBK(<JoE__`}
zhqBU<>{a@1hp%a$nbWI%83^_~e}Wbfof)iZGD=@F7+UfHJU9;FYV^%MkU}J<mCPrW
z17vK}TFnR*G#jcS<<UR&4>t0-oaY<kvYb<^Fxp2(RmZEc9Yj3Gd^v;suS_}&w3Ka@
znnAUL`BsCcO)jyd?unj^_Oq|e)*JB$S(~SCO!-{tB>gRE!nZc!tqPP=(NR^Xn!3l+
zxtlhfuD^1M(=<3=FfDl8c<{0C>Qxn0ezeBzJ~>)#KTvcG5;X1{@~w^uAtyWbU21x4
zv~d?m?{9!`u^QA+RZEZKN5j~8A4Q<l`lwGz=wz|DwU1;!M$bo8>P1rsaB(^AiwdI0
zrMfdp6l|^2B=w63abv$zO7(3IsbGqbP|q)+D_e&zH9CE6msZ-H7Ny|3u;cEIBCc7*
zMPy!`MY87pmwl8}XFiPFW7%=kdYvYsWP#GQXZao0W{RGsieOCShZ}~Idnt7pDJj93
z&GhE(K*N+8cC({JJ?ds~2N}-Nj8liBH-5tF^-93v!XD9V7WY*yq}67SRKxEC@=ikB
z(8Z?Jv9A2YQbyr+I21Kw;nV6iIEJ^7;lWmmOi5Zmx^BI$=+t2QoWe3WvW8y1t&zkB
z*~6BSiq!SpJk!|hy{x>qRMaV?)?Vjbkepq=<rgU_Qs|md<FtAtopC3mMB9P*Hwz<O
zt3g?*naRVvV5Y~Wz0}{Cqm)#~$rrk+)FNnMm(%o|-wE6wutrgR8fV2+>N8PIIGQod
z&$xY*G&0fD656|yehwCQOX?=a8H7p=xfjYCRjv||EH413xcUa!rPXO@U}2h^F{8!R
z&q(VXGpQD7(^U!@%UaSKvFGE$@~XP6PG)UuiEogfqiGcqN+oj%H@(V)oxL)uC%jdD
z9#zznEfqv>zCZ<3RrKdlX_6Mz=<ch8e=|q8DxRIywaqFv8f{Ktv=3w5dweaPh4`hb
zOCzaj=;Ek!V>aZ48S-6}gQF>^P-=5hmr_v5=L49W+c{Nf)f%>)Q0CU@)i6QFxuk%-
zo`<O@btd}1keV3>HVQiZZ$iX+j4lU_<~2W_^vZlz?vEkrN*Sf6ZEOuLY00t^NPN>U
zMjBmwTex1YDCx=Kb7-Y$Yq@V_=iN&TT0L;8q%AO$kUJkK<0iTUlwV+#T{BT5y;hfe
zAf2U8PU3dCj~&9=bpHTQ(#sQfxsMjeB^O^lnOf4=z>VGtcPAyHOHA{M@AVH){pS}C
zx|)ZswLLbR(rOGd!)pLfA4OrWhQWQuZ-N$G)wFUu(y3@Uw(D?&WqJ!mi(_`TUFyR3
zY<CU5LMpSRHF`1mnkk;r+~BGDemJS6WVFr&ysgzfw@oY_jNk`twbx`Jjjf}ea+-FJ
zE`F_9wA1Pic#*x&1xF<%T|@$^if>vm`r`*J`y%@B)Xts89k{;=kECGK9aZ_dY23)#
z>k)oZWP-=g(375+T_C1;EptS24ne}OZ2E&~ODU#ojN~+&tBq4Yr`4bm(-y&2c|D0$
z`ZkTI(P|<Z=v>B*9msdcDi;}+<0$q4rM{xBqtlX<K`=RY8<m}2kR2Z54W%8%7WNG)
zjr76KV7M4?89`S`6*EYaYpuZnGlqbqdF4b>!aX~iA1JL7qgm1<WqkvtiOe?=u%3QW
zb!~JHX)SOT@T+=Dt0tnUF~4lEoH>rjAtWHBsShdFNcDXq@qegbje@(<sU6L%;)&Jz
z(@xf7^{T0#9H3%G43DbHRnTa<y*K9c=eC+t`lH>CvZAk})wH&H(Z}o44qV)jr<VhZ
z)3Nd9i|tXbi(hk^eF~k{;ZbY-NcY|vov&{fwpK~{j@b;6mo>+bO0KMuO1FkSS2q3p
zE$~IHg=cY<qUs4H)T(_5WdXg5j|lo&3c5GANY`Hc-wKyN63|pNwGA(A?j!+vJuBgw
zht$J}7s_RhF;v3y%3CY+9a^hQs1N;dU);xk!re!&={lVm{wo8({RHGJW|L8)*VQ_f
zy`r9A>oug|!|JQLtEMXGo@#Wb85nX}5BN#NJthy@?V;UMS4#TU!xNa|><e<Tx~7*@
z#~BMtm~(-`FQ?;UbrUUQPIIrD^3uH`iW*vqab~tgTZ=BpMoKGZEZli?c}AI_zffb#
zOG~54jPggq^e&Kw3OZoOeXbv=hmch_QN-OYzB;`%;y1C^7VNHc{Z~lWAq{C1I<p&$
z*|L<&D}&gt5}FL^Dor|S32Gz_WUOgFRpc6!*OA4Z(R>ByI@~&qYYjA{vEz_CtZuKM
zRz~cx!{r(N+Y&#nnO&vI$?BTSdY7;Vg0}ixGgD5;>#2-k!rNRh;qbAv+Ec$&V2RnE
z{{RBsXkASd)UDI{frB2_Pi{V|lQsG}u_g3sVy4qyL>mLy6YZ8=XDao*d#2`d=;wFk
zxeReOA4M#hduZzfu~d4@c-+?qT!4qyjP-QhjE8#%9#B}ht7CkeSZ0s-*;pQ7tfP`f
zj2AHO{>t$6R)y6x?quPY;?5QzuOMca+Dh+Uo?#Tg+ylY*A#XZ)ng+8QSu|15YG7oH
zGE%p~m#}iZq(4*A>ES+rXp$59PjHIT^kzkA;32l=-PCn3Y8rdo*3%i92L#^Z;b)`j
zY2c`PTG<){z07d2YNT6QVo5I1udLG>BTJ#3(a3+4oE3@HqmqK5{_TeT=JqP}{X<Pv
z1<bo#2W3@R9F_8kf830I>025$z^N-InT52?yZ->B_g6h7KBcB=(N$9kA()?dZNPWe
z%B`oM^(sV^<i{gUEVq3w;OW^0rA`{-`egE!QjCzwE<Kxxw2cp~^u~==jf|@U6S1H?
zFE;9*!%bhOC3R+;=g$Wr>=(z#Ucsa3zL0C6b;ppkH0=_z)077SEN-~deKL+ze6^-l
z%~<zRRz<Q#{{S#nT2`m7=@q*uD;)sl#QR>ogRVaebnR8Ht<#_R3h|b`qU?Xc3&*u4
zR%mtSPU>wv^ym2}0PJ_jDzRD(r?hFS`kzv%(usUUm0(!5_;<?lx~`(vO;e+&l!(c(
zZ-ua;o(C`%O4^9rFy`css;<|msOEw8Xl%TUDn+SwCezVR6-be!hl1nDB~<E~gw)~E
zMJt#`U~p3>d!dklf)5I^qOP6wCOO^hJ+GCibWzXsD(X6-qDr4mrp|5cyz&q=o~)HX
zO5z&qhjt_35v%Bbn7s6k-roNJ{Gl}2rK2K~P^C2#*W&hbeuYs*B2G=3?v~LaoBgRl
zaUZ7Y?tMP0k-3byqZU<KO*3LGs?w^xSV+Fx`<Q$cv8L7|nvg?V0VHuC8T+iVND_jt
z?9Mffk=vsqaOJA|r<qNtJ=Eo`FSVTu&QH-)S3~GXW`yC{A4D0I{;MX5<&w88b9n_c
z-zA`9Tta%oq^6`}s`TLZuzt8)J;UkcXY}Vi&DiH3{{To@-wV>Zd#dSc*xf%}4P@91
zscr+m`jrP&=<cJg^`L7dhD?Vux}F@ei{l~k;!<3q%=>|0v$7K$JAsc1d+uQbW5MJo
zA7J9!SdRWzS<3VzQaQNB-wD?a7XdYqxVprC%6dv!<dik7xF;nFFwaenZycfLhhVuE
zZ<S|PM=Tj5+x<vaHP+nAUxGUn5ttDH;B7o8qy@M)Mad5)F|_vy14ND5>jH;Cuos()
zb8hMvw6`rK9QYi^5O50VXrya547Bi2v>mdz+2c4qQv+=4UkII+!4^@ugSY<xD1eQv
z1GUG(k*)R%IFOOHCfpv&w>hq{_Mhxlqgcn6H|Uss#3|&+<32p0+y(fu$rx>mNwNDT
z?FPl5gWM@veZKL7+$NCb`<erS-581N&A_+99nAM|tQuJ$@Zs4HGc0Xl5ljpb(T6s}
z1u>wo+xscahwA$j*ECxEqeeosM=0XOK`eGY;e{=T7YFuSF5zR!6lTDrjB*g}jI{0;
zM@Tl3Ey`eLjuz<8VLDXjaBGdiJ5i5m4hHQirHpeOxu(a$ux&t*pgeZ6zC50p8AhF<
ztgx}NGOnqz(=~?J2vEa+kMf78xER8#dKcLPg`~!F$}NK993a{+$~pmX0Pd9pVHPO}
z$JI?M2+g=q9)1xpRX8Fg87Fckm7~!;kkVgyTFfxy-8w6^!^&9O+=U@vIl2uDm~Ax0
zw$0S@Y?Zx%vaZMgV+uyf;foX~-H^>5*Wa=lt8if~<SQ`WRkk9?T9|}Uz0NoRE6{AK
zW~#=(M9d-FTm-+Krk*efvz2W_gz>ya-*wdVH0^AD@$N~=gGGcb4{gT?_#(T0EP|$U
zV*>ml+gcdowYLQ_nYf(R7aMm8?}6Je7eTstH?Ugj-kVIQscyy=wckC`OFSdn3dG+<
zO(-pWh_+R$Dc@4&z|U|zqv*O~zE=S*#*ZOt^d6dJ8*jYG<K5ha#pQlW7C3&c*=$}k
zoBg^esdNe3EOEuO#O#y*01J1bboCoHzBu+tY>~lDq@`p|7dZ;^Pmni(h4UUq<#T4!
zXQd1fhe1@@d!iofgzEh<lErp_;6_D}QOmuy2IImeou{`8ju~ZRxT-v}sdOrKInuNE
zPUnS@naqkp*PA#VL0<K$X;jtlxvz|FBG<C<&b#RCOH7^hlr4Qk11@KFuXDrl+x=wD
zdBgew)Ac#wa1uD}z6#P)YOJ0B*T~r#M+cC+)-6+LEPDvH2t0zG%E!Im!I<0Qki98v
z5lJI;S5hNsXdc7b>pQ8{usOlJ_60{u>YaePPgHg&O-Op=f(S^VvW`xHW!0u@_C42c
z_d?W4Bn8F9gYua*Jgm!`>NCjXA*5@WnDRU;Mkti0^hY#h#O)*@{VAi65D7&>OPmM=
zT<Odc5XZ%9_p)lC8?urnGE-+CN<rVTM^U;+pJFd=;cMdQ23AG8Xad}YG#xSd8#Tes
zZ=VTgIGQQhS*JP9U@^VBydDa(g040lvc_R}^TJx4FVP#>>_1EtB}kFc`g048$HI=E
zMU#HZDQmxnZK3Q`T9no$(7$QD?R=qSj;@*8pq0``-KUU(nysbQorhsRsl0_qMUs;o
zb!goEl>*XsaYxZjM^NC|eWdW<ggrhg;}S&UBM7)H<SD6odZH{H#fSF^n@iZL-=fvj
z7LM>gc;^ULMBw5G$Byb+dQD1%8#U6$-^wbQrjnt>lJ1URKbb1YBs0erfoW<TO#6em
zo!U`OFid?|ho*cCq?(pF2-;c+?hX`C(#-_i5PrB-<!GE$IwcMu?ROqjv(mlM4Zukm
z;CMtv*2vASZJpd6>5{TYeb62TSX6mzza16y+KpzFEwcD8$9AjQdhI_}U~GlEj|TQ|
zK@&||6^lb8;DV{DwAm@;GQ#&p?$+TlkYi}mnhB|%WQIcc@5(ACGGI4`$0uXhtjz|!
zS480*TO8(byes-jx?0G@vAk!vI9bN_hEh+kgE=SCsb&uk0S8@2J6r105cYg<i;|+E
z2HEh5;T^mtN2^o24fY-^f8{J^Bu-F8JPu)#2Vo~8vOYaFj=8%f03RSBwP5$3Rk60-
zTf%0QTnob=?J1glnkiXZuXLRBW7mnMSg&wfk^+xLuxW+j$F<h-o~rR$;Nss^QLAaN
z$_&s3#UbPl3K7cInWu*O0c4dFrvy4N$UKE-Nm)x+&8~54$8c;yq=voF$Y88x#q1s2
zBC2Vrq=-)w$RjO#3Nnh3INWqyNai_$IiwD6XYxW3##(2GMJpWJ^Vq6=^EBDgkUa7a
z)jA2^8M99B`yIjhC0N=W&qk7uP=-%yz-znM;X6>#psrz-oVBuZjujm{;gS28Hov<M
zD#AIQ#_nU!(PxdVpeYpfRP{8Z$0#mfI2XU{h20y87teyUl{3Xw-LiXLI48QLtEHAF
zURGV7%I4%IguO6HS3*(M)YE^p?`L)s{t**Z(^WF>jK?VW{>Tu?8}4JV%3H@V+VB|r
z;HtRUB=%1WqHF!6G3Sxkt7>YQV`uQ@Hty1Y!q3SQ;x?I=Vg6>H`AZE<)S0oG0p8ha
zoS<1VR?3;>ZMT^l<GLEEfwe>U;611MhC%|9QHX&gPq)Zd^csydP!Y`CkN&axO6S~N
zlxaSU#--Agl<}IqHQu~Dx-dn;qI(-4EqhBIFhLwIPh~Xp&h=@f8*j(*kgK(=B8OD>
znA=HMcyn;apOw=L_u0=pUeSi5sh*McY24fSS}ikCY^@KC+g>?uVyQI^KC4fd#Zwsv
zvFv_|2wr1&b8uDD`XNuFaT}RCF43|5+u1=Q94~L$%BxMSbIU<+xZtZ+)V4us2y6V3
zk01~d=9^hOS^S$P$*>zZ7L$;Cs7SV3dn`9&9$yQ_F4Sc$TMKr$2ek6nc2I}hS;Ggq
zW9f)@sK+KZ`wTRp?JuNwzjhQY+{f60$BxIkmYz)J?RZko{{UG302BjnvR`IHAf1mp
zA7;D9Vx?@(isHnCERi{_!*{pB=%jFN*L#Q0At{RwQaN}wQOOwxAG#E<UhFp=!kQ_|
zeXchj-7uq=^BJ?UJQX3@?6>w!E^WMn-s(Hr*8T3VTO9F!{3y3wr?~#<?w0lkHtw41
z5piIC763G@H{9NSsxQ>*I}ZACr#3&N5Pnn=^KuA1mJ1`2G1z1%9bjzhgYb!Df!LD&
z094r+(gpbJQA_}jJ2G)~ByJ8DX-H#pPmqzVaLY}KWCltACnIT2XmoiwZ<PUYJo2Su
z@sWesXQL9_KZ~v{u(<aNB#zF*eZL)(+6XrO*FeNOH#^#GWP$E!%WZDzXU5lO^pw+J
z+ewd<F2h3Z5_?}_Jor${N&vfT=J{OaIj3_CljD%K+qw8ez}sCLtS}E^pXmpSi+u__
z2&5J*8O~HrfzACEa|iAgOb#FtKwItt#YX78KuPwy;Bu`)Smyh<`Y5HRAlwXj2&O4X
zH5mtv>UuU?laQ=i9r0`ZQ)HwPWuDXEEhzFsMs6&D@v=u7;ol)d_yY-ZO^EIiyh{s+
zm5y_J9}A<Au3;PQxtv^1n8`?iwJ(ZL*MbjY*rHy_ddB|%6@Wh6j!@EDBLzm+ZT&8>
z@K9rMOl?gh)a1E@kUNgbCe^rmW*<iYj*6rcwn2XvQPfk#ApRK$Sgs(FzZ;t1M})CU
zy5sz)pGzwrc*=Zuw)X8m92DJwS|?!L$QR)`u6%Ae+}{ZrF55RgeiJ0U?f(D?N3el2
zUw|w-gpx+r4%YC3_q5xA@TY9J8?EqB=+|KKLg-vw3AeyW9czoW$Si!R-s=uShm<Vs
zjrX~+@{NkC(ImTGJgB#pJli0sF8H0buDJ4^UPu_v`B-&i+nFaI6&tC?E&Y@yb8bN)
zO$|W3oQgG(>@7ASJ*@=TqPDh7<31B4hi-WZs7^y7E{uZIL{qllJD-&lU=wdCW`V;k
zz7Syc7DIOKY5vM1A->*14YNKmXJIwcl0oLlHiGGg8fe^Zc_|%2(lKN3nGHZT&&83A
zlHfQ5+=8P;Wb|%mKHH&vG78bfByJmCEPu+1rh&3H@qzY6(VHol_cfplj_Ix;=&32+
z3HJg*iO_;EkA%oZ3U1u~%4j9N3hzvST1Ryg+FSZ?R*<YVGC{&FDJ*iTspYX5N5=M?
zsl5#r8SO2_lrpsE35DbwB@ex>f*#N`g5L@sQQ!TQVCX}|zz67{{IAFNR80v(dUvI0
z>-M^`vN~u<zUM#w7VbSe@cX6dn^O9?^(v4q))R4mqVBEfzL6E;lckMp?QiRu(%pmL
zAff3xMo1s|Ici)p?tT9NuvBVK-ifCb=!$Jesyf1P2AN9wO)wjKY`_QIYI=X9Ixk9l
zU#QX5YE|9+QXI?v>2&DehA_rcx-a`p>=88-b&fmWbT4m)w2OV#Nk>u89NX`r$57cD
znA#|5H0Xbou{OrvRZ*!^dan{Xc`9Az!AADZUFppfL*$Le?R1}$k-V|w9xehF?#)Vx
zX=8LPEro%E_uX>2@0$B0bWd^M<k>okIikO(PWyi~!XwZ#9sdB85t01dlr0*C+bdxK
z%@4OFttuI%r?Xn;2#?C2*J}xE^1dd4&e8(Q>pGMsso~BKfxpZ#{nEEx1tP~&)~PAT
ziZ`}LALwx*W%UlHp`|W$OBzkA8qlcvgQ}@%8s=$~;K+ZROMmRL5VKI!=6v-f`8)>Q
zG+@{zIt=O#qttad9|b!^FmN`u#>%djPadFgcrU;60#&sg8=EM+Lmo=F0NOw$zoVy;
zN8OBTZSi$z#UfIZeSy%?N*Xu1KcVGZ(n9D+Abrtvw6L|M^#!Dk2*Q!EOFOo*NEsJm
z22s0UNP)&_Bo1|$!fkt$LnvX9z{gN$C$I#6bzugc=$h9$V&Ug)kyP!G(g>q_Nj<>f
z1~MRt(9s5m(-ye+eeSMlDYa_Kd(vnT77_mRt}VCDQp;JQ^!zQTs&sW#miD#&;t#-8
z<Em=4DVr{(IEs_`Y3^FmJQb5tbcW+f*e!iAqj_$ju0tH$h@fw%N5ZG4pp#kD#VabS
zg9*0zqb+LLPeG$~9XXFr{EnAU(RR8v66bwMD;aHPPSm8Jbz@rg6KBaSgNK})CTXtO
zK2d!mX{3G^#~XcCYMM1nhar;g4*viuJ!Y4vv=~bTH6NfjbVnb$#ng30Z7jZ=vqdo-
zgYFi0syd>ot-D(+k@;g}HvN#5Ng6GtY{s>yNl@75t@MdJH2(m~-BML_*ZLEVsZ(C*
zc7CYpEpzl<Ezq<xYZ8ynY6g-o{{T4Qdj-2RJq@AN#Zh0cR%(&7g7_NC3;jY_Vv>!a
z)=0Ooo{`Z10QDZLE3}W#wl+A1z0zO%5VRWRpVVDC$3DDM$pdl=<qdiJd0O2A@gG2{
z)7eAPx-^Uyw(!8)e#+65@y<UpTORox+Fy0QbTLA6-BJYS71`kWr(9|eagR>Zr}Zyj
z=10%nV)}xQt@Ua5&!yJ5J0k7Hm(sfBUX@D=oh#|$0DJ}JdW7{|L0;-^o2HU?{{UE$
zz$!dZzqSbE*U^#uJL&43DzwY1)5#Y8!MR?HYP3B%^&@<b90v<K?6X>*NcFav8LHGO
zso38Rs5c7V@XJtwgHhkAG77*=z257662(4MVQ=-(kn0|@tF3#WW2BB7;ilr~9+af~
z<y&W+&Hx*)XzR^8ruBH6JvCh=Iop`t-M0PLnbfkEPL;wM+INw_Y2|17vnrC&=+s?F
zrfHf<6_Uj0+S>*^k#*x=h@XhESJ%EBDZY&`HXkYtcB@d<WHj+H<-9q~ZY;UKhg+%H
zQzcxo0xnw{Zb#W0a_q`A(Ldp|8t%JR*y3UIORo71t^L=l^%jj)MWl$SYiTH_+hFNm
zZ@t%>X<DG^Xp9g+F&6${SgEz%r`2_deIq>XjQ;>5$#s^LV%CL=X_^`ifz*0~S8Xi%
z!zPwP`l5Zp^er>+7eb+6mr$vyeAfM2mMiemzFiu!I;S|Dzq<53wESAp;nTLmEmP|4
zVHc;#`l`XgG3#QrCoPoSO`|iU=$$5=sW)Q=8t^W>t6JCU^$E)#Bjj;57CfN3zh3H|
zp_%fEDz;PR!(p|PIwC3JsS;IFypVY<y}qhW-r65aqi^_Yq6(cwwHm&eJd}fvZV6tq
zscM>bokjUw9wP%tu?}Jzpfzers!>k)AceqKHQ2h+)lz9N#OW%%83F7Z3cvWUlD5fw
z&MuMVHTpiEJddiL10=4=CjkwoXj(3-C*=gy6xA2OV7pbnSXD_Wbv}irR7eg9X8~vQ
zrgbifRNA_#W=$F70ky$HDpAx*<8qVP>b*JmVWsJmBD$hjBzr}}-JkNQI^(P2(di#g
zNceX&SQd*c*1!0XEHs9mR!;@SLxEmZtk-H9-BZmqC0wm>z1YK*#;2BYrKEKw2&;Qx
z^)gA+I;ZAqYb-;txZ!%&;m22vF|q0LJ{cInU}Ui$xn4ul-7T$De->Du3rF%i5K1a|
z>LZoZa5eHuF@@5<RY-%mJ7=~2B7P>C3Li?E2z^Hk2D;!cB|2|f^^{Morlpdi0_$!B
z8-12`Y7I_lty*M_qXTu;<D$Bq+6AfFXKViemPiTb<Z!ej7Vcn^b^3+=AL;ddAyF&!
zx@hH%<7=AsUc<$Te^hGSD=m4Jl7Q2fey>m36q^30)qO%eDq45cHQ&tmz(2WElJs9x
znEh#?fcGtP?BKIj%@)uEy1S_=MD(T7Fk}Lbqp7LtnVC%B%4QQ{>sd{u^z}qf46mbw
z!@2c1{gsV=pAL-}sH2^h{*ZTVPYj7Yi#T4<tk61ZN6_ham&W-y+z7f4Uf1cNW1|zW
zwW8Q78&=Mu)agXDt=}Icw2(mg3ni;iYpo-B1QTy-^ZP5yH_;Ua%Z+1EZDgg4aeL2U
z-FHLuqcx3froNJ42!46Guh8__Ab6S5A5*^N=$$WLIGKT@N4J99Wpk{LpGBM!k7uTT
z>296U^p=R?vs&I9-~6v9{6MISPMxw+HKbqk+UrTyeQ~R4x<jIMd{eNu^h&^2g6dsC
zTd8UebdorNac;?S&y=Ye5v8-#w1#Oq%@~x!`AVDQU)ogjbtQLA{{RXqCQQMGxxf4`
zKhvkwUkgB)%?E>QttOWGs40uz6Q*#_)o9Sta!9nQ>prK{S+%s%Q?<hcn=GEUOFc#9
zudg@chd#jz)E!l;86N}?n0}(gVk_!(8p#QoSqVOFgHdltWjUqUuhX?1GexKsR8lqa
zw2QUbT1t+uqUs7!9Y%)MN-)`@ZH?9!qp09zY;#w}*`o*C$8cAnYZZMvO-k7`$bAV<
z>TT}O5#XxZ5lN?1L8eIPTe-4W4$l@)>)OGRAjsde+Sojx;r{?tuXX5Ql4kcIrprOo
z`fUY>*0hOQ^N&%u{>db@Y<TVH&rx*dv8z#f^sfXT<##1m(*7CsH1r>trGhs|1<Yag
zcm5XclCpw=3u&)u3>Fvd@Ipp)tx$1-Dt)iw@$jUwZjvkU>g0J8^g87YOW>Wd(@eu+
z*McmEsixJY#MKV^g1wTVznzKGYUQ#z*J!qXbxlj6#a~`wjlaPMK2`6eL9N;6nk^ut
zm`yp{LBopN(*7c9I%PNI;A13htSxoB(|-;$qX2kwaz9Ir)U4=TG6y(*S|@~Oflsi<
zD~Csp*6JFsP}PUj64=~tw(Hct3!&4r@f#{3jrQkox~1xkJ4(@HGPW~MoZEtm=^+lI
zBP5P}v7SoUBNXZ=*(D~EZ1s+;&^mWs(Kkm)3*>8V01L^d=z3AR(`2v^actRoT^%>&
z;oluVBHzmF6;G^J2$<&YX#W6}*sw>oLFRQv8I^V2Jn+|5JJJ{q2KEa{rD}8Q4QPVC
zH#n>pSL#fdx-x#MpQoxSsayG)CzlqRmIGp^lGD=;I(?(r#RWre`KLACBbAoxDD;L?
zIkj;YH1Ou06&+9F4N;-=T-g}rjtg$Q_o+Izs<gS1IFWQEHCh6TyCBqPY2B(1^y$ol
zcLeagBc(qMq3SAlWUsCehUCY7e(N9jYo|9*mHxdsdt^9q#h0Tqr}ZdiXrir|k&7L@
z*A9Op9w^&r>ctl=8d_e4>0X*^Dm@tY59bFfMWpK;A2Afu2Df%D=G-5u$+ttMo&fDi
zwr%6Hq$*gn%5f2fiOiDU%ufr>kDnZ}sI#y9ek$2<ujv{!1!&ZC_#t$C%tpuVi=@`H
zw?NiN(8mG#2(rb`Nm~@Yl=45&zw#U@r*%CgIg(l0K;V;*yJIOevNNMYsP$f%O8u_%
zqdk=sf8u_ZOvl4KLD#_BkXM{_R;i~|)NN~|5)K^G&(%;3Ih8MC<$mnk5rP$>q}ODh
z6G2<9I;U5Xrk<7YMKi7r+gV4fRBJQ2n;pHN+$)VfnXyp*p(zc<<yTQrsYvI+Nla!w
z7}9Knl-EdTxO-!D4ydV%Ocd@ej#jqB9_tMqT~4W3O+@b7d^Y^8Ji1M6j@hbGR6^Hd
zbDBsC)Vf3P+oiRA1~^2`ZAGylHg(e}dt}@`k3Q**Zfyq6WUgaz!CLB%#R_?8gjEr>
z#^0;D8(sW3mV&&}Nb^xn4Y!VLfSd5%29YdMxU<8RVBDUCl1s2nW2!YBN)r_gFd@Rg
z-DO$R`lV%Ot5>-BXCJcky$?f&PHmps+l66XViA%<MZ5)niaoMlBj~}&qfbLhC5ouG
zi(J@*&;30%qQYzIohcaub;7aNbt+*QiuWa0{v33@POUkR%Or6Fa0$bQ{4Q*fig!if
zDLn#c6ci65O0C-4AK|=UtEqZNP-ISZ6=vpkY4Eh&Ptue$w4ST>vC%f+!;x<55kc26
z3ExG%-@`jZm*qiaxlvz^m6W=Mn(aQgKTxJ~n}2a`57k~$>2$88ZAB$pBx8mf+$&kC
zsr4FrRBfnZhHuD2GJ=YorS!78Kl@5~Tj&v`*l$ktEV>NMWAHz+(sdtPQdjAYW181E
zw~!Z+bq1j5svIO?a|z<yBRYFZtgC31%#-r+evs}|=NCiAi)A%#w9%;+fI!?$jtace
zx{J}UYaM>Yx4~9=mqR=9;(1sk9F4eeMD)I!q{KuuY!S#0>UVW~4^?DyLf=F+m3pSB
z0S$AEZWbiBD-o{r?xI@xVRK}2a#?#i-wWAlq|@jib+$Qxa?-Hc#dejdR+?ckfyeZ`
z6?~FQv0(y}@Yh$Xp{e}5rQx@;qI&gLY7F!}NTawTEZdcZpy=9%)HbD+LRQ=LH05tJ
zd4`=ESzi-ojDJ6Hxf=G0rn+SoqpVZ0g_UqQjVA_1{{Vy*o26;pNh_j)wXr?Fzu9TJ
zgIwt;=%lBsF*-L4wbr`wDL*eythw3+OwNk;WzCCzFWoF%y$s`C&90^ReXi;4cjYw)
zJ+9!M>kq8y8qF;GYr$~8>kC>skEk0)BAw*2->96S=)}6UV_7w8c9(vaxfPR>p<XtX
zunh{AQDa)r()h^1zY62gmRMg)UiX$ehXeXos&ubO$N2!)>;cWjFn)_C_=TpsLy7M6
z{ipP}j4Dg?5*s{&s<eOfdD~SS%$_oC8cs-CufxguJ6DD$PfhtM=70;@+X7dYbylWj
zkcl6-g>(3QR}hu1eYO*vWPOy=bTdh_+x1;9PGvu<0E|A^dw-czQ)`W*aHXnl_HnfH
z_9{50EDeq@YAIwHa5*1jHm#%>m}jB}c3S16<*I5fPRqF@fOQRZ`gL=vw6{5g<b%Oj
z{;r;<t7~JKt`W@JUA&|9Ce+MKY>#V>J;|CpFVkw+{Z5holg=b(E%{dAM0wjM>HdeU
zsD{%$&3(O(0UA0lU5&4RmKP7x+UwGKW=;N#u}vJ*<XAbKzM)z5GaMn3cw2DB+!U`Q
zqqa0-89GPL^?g06#aig6pqLT-!MADqqV)YHzK&?*Y*NQ#kXG7WuY61ms)eu4+kl%t
zR_L-r>CX(CkARQJ+PVXRi=z8Md{WZ0a2v<&pR8(BRM0t+2JQpDWrM2f2`QdmK?J3T
z%FgQ=wxL+#BiR1{z7=CRR*1?9!g`}zbdo)|*gr`NH>N=@t6T$~=0*+32b5l)Oe?Dg
z=D`d&wUyL5Y0{<=v~P!-_X&AZ*mye8q0{MVXsE*)=LqfXAn>VmZllx<LDM6f*4=;)
zD$cW9YjoobZflxHBa}BnQE9b0i{DglE&YV1jx{L(&8UXyT|HG(OdVajBNpxTOx1c)
zH$`W*!+_wu9w_6Zr7m%9&=w=CwV)XI*a&GIlg%jTSlcmXinmCq*-KR87xQg6QdhEh
zVf7Djm0L}#yYml>9l)Lnu=T2@X^oIQ?LG$yV<z+-E3+4?(=g6m8;c|yma9zy2h_#{
zgt&}x%9edHp_Ois#9Y@NJS`r9qnV@M2rPIxYFX)7OlsW^q|=~aXmH#A0BKq+K9-s$
z2Qi_;z7&6!ii`gM%Cn3TI4W^W*(uBErx3c|V!7ic_H;@qXct;7nYN@ClndcfQOT$Z
zpHlvfLrsAl{;8FEjZU9kx%-<SJdO&}X_}6atV4Ni4O>S(Rd*yyNtzCu>WX(#ww}3y
zma)7@-_rGGscQ7@i_@MDSh#Y*dn_a0>Jt~B(gCn_vbCCCm|~}6pmC5}+z%>W4eV!@
zv}QGkWR1q6hDS%-H_FddRM*wKM>X65%Sg)f%GwHf81GTL9pPqm9Xr#Lb6dE19H)Y(
zu_pN<PM^|rePW%kNKTzu!(<<&#Z&cWldtG9nCe<)i}@#v;DmE$hBIkK+i*f5`t0Tb
zNaqRQb{Zte3$eIMv~yJB(TAG0dZ_&=q;tCqo)vr=M6%379AECpC%3}cY8^J`$|Z9Q
zZIdl69@2$wk6A|hfLuOGgxn%u9A_<zr_<{+`cW)0IqV#ZaEGeb8X8+8wmE2Ms*WS7
z7H^w>l}pt<C0AHYMHp<+J0oG?50!n7EL2d=_g9ib?%ybl7HRa!J%a2fAn;T=B@ED3
zeoCl5o#ffBaK+WFeH~R3j8!z&Jcl%0t{y_I!b+J18AoWimt2M#F+Df3UhFHhp0I54
zh%1^cdyfkvQ4^(Q+D+9}TV!Ch%U(EK{{RGH?HwN^n%V4C8q*<x(!%FCovg9FL#|ZL
z9QfMeE!kCcw!17KLr}vs4mNX7KV`Y2(dcHU{N*gId{5<$?0h3B@zJ9c`aFwRnzm>R
zrYD9f%_1td)U>b=4o8B$rk|#%XRY^!`Yz;K3eQmdH=>H2m2?HsxOM{VKln+_RfmJK
z5!26XPh;HT9zRofUW-HdYKkvXl#=^oU!SO1&3C5FG);TKYk<367H*qU)gi0&DBc@T
z4Vv57JSoYyrc%A4`&`nfq^Z3`KbLXN;60?QzOAOZ7VeMS-o+KGSL!v**(`)g)9#Me
zv0X(aYpLA~k$RwiDIVoaP?ZYj4}FmIm0+i;5mx^I7MSu6Bj~*lP(>{tuct}6GA>%Y
z$&j<w-?_|i?0E}CqH6Q$<7;1VM;xm)s$#}U?E!TI3o05-+UA?{kW|#2U0+K}`FA<9
zGS(Zp3Lc@Fr&Ex+2!X%!g-XpLz0L%(-yT;w$LXCC$eOfX^wZ_8)m<$?xO=WM!u1Lr
zHG-D$5(mQb9VVK3LL_8PW5*!yR<lg%zstet&f?b&%ce6?RE`Njw`?O@=@D4xOC0ZO
z{B|oc{+KLrjm6BJrtKjA0EKU>b&lBg#d17_ny%|<9`=_;96`b2%5#;C4pC*KRhpG8
zLnEtysMg>(^0idcQED`sCJo=^X7rktbqyQZSR$(1?P=lPMN?LFT`Hqwkjox!0T}-P
z<u)AO^<m3~{{UoK>zaHpJlFt6K?^Ia%NyD0%HMYz!9?o1^wUHb<74N#qJ2GfqT<%E
z%{{I#RVT%*lZPeIq3OL+N^P+|Pf|Vw&t;|5CxFozVsmarLi4J9KU1TW2|-}&<#Fmi
z(%UWXWFXa2G~({cU2dvLY71HVuY^X0Sv;;0J;kqY2e>Kq8YNA9ZkCv3g6J(KDz;X(
zo}_GZPqdsZI55GadlyUUp1e`h*Wu#=PR{zPjYp+)%KC;+I~dtJO5Wq=%JW)1S=2x>
zZ*XswaR*tSN77`MXKS2=&p6F=bVgA%^*sZo)kI@!7}xfDFo31$$7xSA^S5+;o)spa
z*A-M1jW2j~4(v+5pQ~Ziss8|iNgdCErE>N?N6<E-qqdm-W*ZO%&AX~<O=eHcg65DT
zb_Z~V)cT^LCprK_o8<7S=(R{H=Je_<5xymF{H*cIu&KwR=)c3=R*zDoU~GU&2f3wg
zMJq_$Fjvi;C#}?JI+P5Qg3Ex(8gOsI`U9r*=&Pw%*$5I5=anb=_9T&F@EA78aI<}9
zr|H_Rn=KV|5zQNi>3IJD3sEy$AUnmv%Jo}c90l=R*6cY6Wjg2)TRaC=={-lL^%qs>
z(zw%J<`QpUqnA{rtcZt?N}}0gxGKx8x{h%x>1AY*zqFhK@K>AamCkv&w&tJI72x@+
zD3x|Qsfnk1-X0t;i*{IDN~!WoXMzpzLN8a=By@ytE>J;JPgLEq4*Ymliu)2$zJt1V
zRF(-tWO;LLw5|Mwe52Nf(<I@*VP(J4UIS!}*By$o((4^W{{Tv=J;0$o^k^@$NZk&2
z9r>L)Lgx<6?yM;F2?+G+q79M1s9MDZrfL&YA5xZ3SmBlxaWwS0q#(?}1xOf?qx`Az
z*2;WeObVuW-I&SPdlV6K152^>3Rz+?os$4hka<Bq3%G_7Tijh*5wcT!McDR_Qr85l
zT3XqEFX)$-#z*Kmx6xI$V-eWwwLFaaksdrMG@h9SCYjRge8hf&d#GH?J7dq?5a%*R
zg6jugkfD{Ncfb55S_9b79MkYPM^RUrci)!x9uV+`y@90Ms3s1D*EcQmZV-Dldo?gk
zPgu`mgW5(~Rd%C6NfUsEYZq|S*;UiX<~!Aa`%im!Qp#O1-bpfeNYh0XG)~xIb9PA3
z9y_6`>5MJhEJ5Ie-^@9V+UDF3+$S=yxr7Gp9tsyA{-t!Tac)lFJ0zp8d>4uB^&;-m
z$oeT|V_xF+0@LHd9Mf<3ca@xMUP)|qTOoTrYIj_BZ*YPnJo`w$bV-1=?IPW;<qP?D
zMIn9ne5QnG5|Vuldr3$REbu<4kihocro?g+BxS)=NKVEW$QUKV{3bd(w<GSQjjoJ>
zJ<af^kTkb@EL+_MnTpcKGun7vYaC$`_6M|(e#lo{n07+O81ZAfgXJ;qBv}6dWiW6f
zX|_`&gj((WmNv);ZR}fOn&`_ge@Wn}cG~^?f}I`gKp?mJO4e!xdrM9Q!AMB@6kgC8
zOGU?ao<f3H!FAfQW@u-!QD@+e3WT(^;`s1<r;tG5as4(afkzgDk;qI0HQ7t<zsGMW
z*l@_o2+T5_;mz9P^eQT-t=kF~?q|4gjAQ*~*mL8`ta5r}+)D7$PaV;eu4_oYWYHa;
zYcBNM9f4(Auu}|?vAA3j_dv?f*O7GTnImJm4YIr&J1914Mb4f#MqA-QQy$q46ZE;+
zdmDu{e2{MzkX>s4KHq1;VR05|Mbojbgpx-Ij(}q~w}p&H1-E1pjugew+ya4gjEZKr
zf>oV0Ol@tifHH%SQ3P!bH+C)9s(z)cWQ`ESZ~aMi9ZK^^)*B1hDv4O)OUd1J8P3Wm
zk;Ki1AG#r~C%+xk0DR?0!UCO*&`Tt>hanLIJwh$Q8lE!ufHD>4od6qBWXZ)0qhZ=b
zIKtKGw9fX}XW>?9u(TH3531H_QN|h$;8%&|XKe1p62nSufD$(2%DQYp?Yw6yx-in;
zZY&Wr&wOtL72{2|_H-R1NPV2r50qsKi*RhGX^v)l+h=)Q99tccaG@v}22-?x9>Oo-
zA5SnQ*V^PQGXSw^L~Uuquzan;gJpzn2kL~?SUn?t<0%8n8)ANj=t}C6=*wJj<u@jQ
zN0ojcbncx{=hag}*eVAlg2CTafTf{(WU>7~*?O;6G3{&K&vQ>J&Lx<#sE{#yh3)t`
z=P1);=M=gw^g2h91GDv8Ixe21s)%omyN~x-O&Xv$fN}o-D`lou7@98i(LAz?5vxXL
zsQO*>CDTC7?Eaf9HA5qPLz}e5;Bwn9Zl10Q<1LW1-?3OeuhXbp9W+gAUNdpZzC7va
zh|x)-QPDgBD;m;!tt|$hNZS^Mkg>FrU7K8U*sHBCP?i@B?j^m7T%3T7oe^{Z2IamL
zoF*w_A;4Vn6&|0eQhIx8O@ZKp!ji91iU`Bl`?Q=m70#Pl9;`a1juGu6+IuS9Q$?qe
zl)eYq<F}M2`m5)4tV2(GqJyL@1U!&)%BoWAdTAJKK)RN9MNrp7Z_kxgS7#DgwZh!3
z-l<7XSPLp+yL|TxJts@b*?meXhe;7U9)61OkvT<`x+bqSoiI4re7Cantpcx1)oFyW
zxH0z2Z^Fla=_%)7a64V#ge!C{S4OFAL~fC+87^)>`h;at_GINBN2x_gNKLNWpFPl;
zpG(nKGkaPYAQ*FbRWucKQc?*d7dFG2kW(AfQqxFSOMwT1rkhNqCI>!=TR|nHVSInr
zY<<$PlE%+-Jw|sO$I)o?uBV`^c&4q}1KozX-=*JFZlR+I8NL>`YqBhGQ@Jv7gjtVl
zP|xiI{RzlKMIWRGr~}#$J^tv5%_;G^;k#ZucSF=NZ$oegaOET4L*s5elSxmfY68{}
z&A@Q(gs9T%X~x%sEPb(?Dmkm41pBOTb7iB^I)W*f*3>+?oL`dEckE~V6k3E1i`wRH
zVI9J)Zl6%u4NjFaqm*RF{I2^iNuDYyrnSMX8@P3@3XV>mjqEa0fFIx|jOa#Vbj^N7
z5l^Va=*htZdr#1#YN+6?Z>vt>zsN?{(Nj1YT}q#6;7PSnRq2|JkpBS8Y4VzyZg$@w
zd@8A?0j{o}PX;=u$za9pa8PpU6mC1CBpcybQ|eT@gnpGs+Ws!#!Us~&96^?q&5@@z
z3aY)4lwW8!OV-3>Hgk4%aO8be+*J*go1l1mUH1zKOzCMREUAdPFQ!7!P`S3>OE0wY
z0_U6(=&m`*_7kZ=42I&{xhy~MP_dH66A>*u7L;jxQ@7Kryl?FAaEB~(4k5$TVd23D
zOVOsif-<ArLvVYrqMF#|XxQ@8-Zy{2PHYfOme`TUl*uCv7ICrcRlDeo{fPQm3$hD{
z;Dch3lhi_O>NwlT{{SiQ%_L2>WN7koh%JhCg5kFP$0@G66a5hS{=0)Df297->{G>U
zO*@QIZFVvb4p01pfCb^Q#CUM*x@rgPyAP=!Yw{LuEGv-sUliBa#<ZSVhN`A>K_R3B
z$3-M=4rw^>j;5_{&*KbvK_<F2uVr;LT$KL+!+Qj=92U729~<M}Oab#5<yf;wqST`Q
z0HvrARsR4h9r|DNDu!5U=xUu5(LIl8?kt*6v;~rf%cluRo{hpef0{nUbu~>zKk(iR
za(4%Ur4=oGkLh^+X5#+<RVkJUz=pMr1GC3v7mm9uvL;<<b+S2@WcG0VQM-j|`6GA3
zkMg^^#_X1kK=|G2L^2!>Lb#yS87p>70aJLFXk{|TP@*+-u4Es@7R*mR;qnT@R?@x~
zxDZ8;2LvsfY6ZZEn|*juRzV$eNT^}n2ewhq-Dpk0npoo`VcRR?b-}S#`hKMoz>cHZ
zPxD<zsOj=kOSVufcz0r}=cg?kVRfk~9Fl`wn#jGe*gJe@?`0d>=3KPhr}tUyKT(#H
z?Qt%T!n~!bhGv5svVWH8k&!HKxyLqBMI&!vkE)IElHJYc!h{pt5n_rMHRL#ga8#gz
z&=1)K9DpBjxbxW*(oeaE?3IeiM&a@jJ|@2-2eG=3*RZ#KEW2^Ab4eq*20}Qwk2eX&
zWQ@45aPE=s#fVUc3zK_zOb=s?*mKHK^MVb&2vNFMH2bsim5yWZ953}s8aTL@T;VXz
z-aDm!;0?kWL7TWAsZ=v$#%ti5c}Pvi^?ae+NCx>HQv=+?e#f#DDEUDn34!j7);S5=
zuaSGEI`<dl6A}kBi?rMxLSw<c=9~N`WD#sRD08pw86DO}Vzt1HuCQEg21XYW96S--
zHM^UK3@ic6dEJ9!;G!as;0&RSoyTP)WD{rK>aarE_PAL7-P4@WYzu?gK;{u=4i9jZ
zvbls`Aa_{9p3mtx@!>-+f)PSSNtYXVBmPrnj0+rC_*gaz9GgHEHbloGfW@3Yx)xZh
zOPTitBvNL^;@yyF)*O8~2lTtjM!oSHSQep~Al+{2Ry^%HvI^F2DU%k(FS)k|xJ|W<
zh_DHuF~;pb@IvOek88!n`3R;j8YVEuBXN*bbyksZWTzpn@T^+g0~@}`n4Z&z1-k{b
zWNMi#K#3W&j_RIjhlwq7W$2Yu(ag_tLxQ2ybQs<Xp*AD6l00at%Kely^&Y3R^XB<d
znO?_RmiAE3K{YglIi|{J0C2HCVxuf=6;n)_DYx)*@~3m5nU;~EuJRC4QoLR9k_sF1
zGDPc3+qzwcOg+%a3$DYtrAWs$<Zk_4)HKy&7CV8#1rj0>4bfnZLN|Sfh{>VF+Hip-
z>~)C1Mo8z!gLMn7APooI;TsX665-g|>Ivc}EGOutdpzAn;`W;miZWpA4rx1w+@x!W
zb~1_}JSbkk4}?cu2;vC7eu=i-@T6(R*JLFTo<|FGDEfE0KKB6<>DuO-gfA_z!gB@B
zDZ3T1#!EYcZy^;8KqAK0Ooj%yTO_FFfzXq+E2hEL$>)iZ3$+0Fp2u;EsbZ-uHaJtZ
zXy1Z^v@&)H6}MXG$eu^EaHEnCa>9|Vc(PyYYY6oL&CULbT6&i>*qed!gnJw_ketHd
zf}Si_Wv~#=(|$-mRa3Q&+};#MXT|{p*>~pmVHCC_(HR4S%7RGlF_5Q|Il76iEjdKq
zf!`4Z-N8?cxu(R~NNn$QlU;*r;b5X>NpWIt;VtqkhiD^%pOo<-2E?ReAc*HI=OgN*
z_1o})d%?I-`k(fpRywoSDRiAe7y4C`Q?aA4cm5TTtEZu0iM3EUr;<4e4ML8hiK0m<
z_ch*R$x!;cV-9YZT2J$nb=LNA4K=XIROZDg0E|0fApMi%mT(JL@ZdWTNA_J$6Wa4A
z0`BFcSxWd^9lh}re-Be*FR(HyWs}=r?!v_%4IHtsOElwmji(5j7^Rl`SjfQdBdkAl
z4SjtK4z*0>t{A&A7HnnMWi@Qgh{XvFHpv3y{^`|I>U1<;nEwDxtpUQ~P%P528kVI;
zETB@=Ij#O@Jngc~bthLtr@;75rBPP$J-cchX8n*<*28qmey{49%4&ByX$wzwJHPI{
zw_EC+M^ZkE8pcJ~M}!r1ZGNvgbh1q=PaEBIRV6fWv8C~V<nhM6i0AYTNkb#t*EqXz
z;|oH{4Mv_OnMCZ5wXt-x^pMB{iyjE#&i?>~VGJ)K<*$Bma;wr3t({91L118y2g?Qj
z0CZ!0I2n1d=D}5Jx`5N#3nQ44Gqu@G>AJmBRH_lhNfRl__eoGU5I(6k#!*GYT84`x
zzMOSc22Kbp0DpCHr#2u&@yQ*VkRH7Ur?p?hKAzJUHH|Ay)GJ!tm?+DfPsu8mtF?}X
z>N+=#9)bE*Nc{oP5DEVP^j74TLE_n#)iuiLrwsJz3~fKk!an?>C^hXCj*d^x%^;H2
z4UCReMRiO%eKDro*UI5;G4(=GR#55CxzCOYx!!QuBe+4cK{h$Yma47wzJ$&M`%9g;
zsb(~_5(y`iwZn$Hf%`2-L-cP@brXLzR~$NKoOApLtXvVjTcUIpfdP%t$x~7X>obtz
zeu|DR3uN@<%$$v6l)jxcL)#%14r@>RDf(}tX({T4r>xfgZTGl}L3aJsk55aY)j~_?
z#SCrYN6m6VvpVNTQM8E+)vj*^rwVRTucC@EJF2xEAn5Oc4wKUh_Sv#UP4527&9si0
zpH{4VvS`xA!t8rXK>gO%tMM+9Dv?W}=u%HH!$b4_5Y_d4Yp6zQ^%}@@YF<lQhgleM
z>=WXZHdpFeY??#@6H3_o01f{D!mW;iI>{Q@%UIisl83J9ts71b1Ju;#AN!IMYyB2e
zQR_<Txrk(KiJS(pqXALPvS}mSwEnT_{*2Qa$~`(cB?I+u2Iu8tdb9DHThz<qr1a^-
zje}zsHePJXZBJ4m?1H9U-Wt6p@Y|+_ol_lVv!s?n1@}}lx>@9vY-nPSMs9|isXB&F
z%vZjtv6G$m7aw)J()Eour*!7QMkjS(9I#(1>!~`D4PL4(A5Uy7fLK0Ow+$ZzBcr0z
zG-^i81Z{h*a`T_=h9}N9(D@*s>$A@_>3Ywo!SxK0Q@bF{Y%TOcQE4@l5!zi!2Fw2d
zVOoBv>PVj-qYaCni#6C&bPk32`oULP?Tx*`a0bcJjp&<gEtx8obwyN0Ha)cw_AhuJ
z<z#hzD_@RcW`y(09vnZi_wKm=07=qm!{e-`em_Rb61={@SkR=DxQN){$!M}!Rnel|
zSU*Kl*Dx?u$5z6BnWotKFH?hCk4)1&Dssm-kLLkkX*!Y_DcMN_TPsHn&C&GLv$^eS
zBWZtq*&ni1p`34Jk*%)PYP~1Z!!dEdb3wAdhodyO=uK9sro|W{`{TPv{grh*jG=^8
zP3Xq!T<pTi^{-x6)WZ5YYKKP`4k6rx{E`AqkaazNjX_f+6cRiTY!2(HeIg+~pxUaM
zjm4(z+_6>7Z1o$3UEJfGtwx<p*l8H?R$S|Tl9n3Tr0++gGpgN717UqFJw#0wwX9Z0
zTi5BOuW#hE#=|4dTE|==eH~TM85^cm$sNC2B5@Y_srpKduhrR8PzyFX<8yobs!Jy>
z#ZYnR+jMV2^-j9j>lsN=Pfl~e_XX(m`UueJ!z$^F&H~4ID%+v|01)8QDA`Ww82H*O
zOKtuTpNPMTdR<L7<!RxLN{8S#XSkoTS!Ik?m}3byvW{8pI1%iLr2deo`nO+?NiBP$
zjoXcbfw(_nlcsuStF<b@tW=1jroF^B&69esrnFshv60qluB51kI|l`F%aps()d;Ak
zTMX%KXGZD>n@_B0w30>*!;1yKW$9WzmC}xZte~Z*jN02;FuVg+nukDhW2MxaAZfL)
zYooNjyN-x8-k~nH>S?-oI$G#St?#qa`uj_#rH$KLwS;mF*OA3jrci1xG65@tyPgU^
zs6P?^05wGRIl=cIb>rt$s;JhVJ)UFVadw*_8|9-)xa|5Trr%Gj2EMikBZ}DE&~6r@
znv<pJ<qo6#xS6)z-GgZ#Mc{C2)qj?3aX7_c%U!~K6?UK{6310Bc**y2i*xA;qK~2V
z2{gaUi6Qi3AZKfKtTw;ZT74Ugb4}`j*c^p`)b-77N^PP?Hy&_RUr$mULci42;WDrs
zv9IMUG31=8!sQsNF13!n)7nf_u{qBF0J#UI>eTg;32FzYo7&i2)=_li6wPe~3&gGE
zuHb#u4HWRcA!eAnc?!=L4|XTX&-yl+hf=m0e@dC*n6M#ZEA>~pLS}JsCiewf(De01
zbbEzdPKf5f<x^@MCtmGC^7M~;gOBu+x9*dbv6OU8r)rPfBOB~|j!|>#H8gHA)3wfU
z&K8fRIzL&Vq}^Gk3dlJ(W%j0Pnq?%BUK8lNc5vY^wP&357O$x5Z)|0cZgMk}XHDpy
zgT%APyqwtfSCB<ZOS|(0kAGr$2<;F$qO5J&SPl=BH!F0CC{nf;rfD0cY>Z$L_Z}79
zL{QViW=O{4xw1Li8Bgrm#|#@`WcrSwrU$ooy8I@Ll2jzN%(qs)H`cU=f_HKXpHKXc
zq71RZ=btL3kEb<_ZmH5z#7GYPCDtWe>7R#PTT!V-$n^P|&_&De(m&;EVW3L6;D$g2
zJY}TY3s2LXGe=(lo>;Ea%T5pOy*%^=n0jn}c8VD4V`$~J&Ah6<mZOcZNl55`a3oo$
zuuJl%q5dsdKS{?)qO<bw$9Ow2*|*(4sj48EgqAklv5<nO)2gAGNvYX0nBH5;&+66n
za>!w82|OLxAu5|;t~)C$G>1N?*9GB(^3#M~pGiqcd84S1zS(QLD-M~bsgiKYpyox`
z99?=8G&&R-dG(`>*v>gs_^)?DJf4p(msWLDrjig`?ku$Z3qvmV2$>^f2Q7G6?xPe9
z)ZFbpF#*5oVjaCpt?0AID{CPw0~pErrN<Q)Z)THiQaz3;avS_<Jr@rpXZo958dE=u
zFnf3o2bG(n>Md)j-RQPx;F-e?XysyhvqabEbyoiXt5lg;zW)Gad2-`vXq0N{n@X;m
z)q2UX%*h=UGmq-E*1x6y01GN~YEvY7fg;y9{{V$2;m=m-lo~@~l4yf~17nI4tN#EL
zspw3Mf#Th^mCF2x<LIiy<=LL=*mbQAK~V)*bU@qK?mnSsbk_9;QoOc0wv5>JD<#yu
zUtg~3&NTBlMo+w73t!PXi)bMdmu+`-Oj&0x%{*{Q%^e@%T(4)TsLE%)NWRh%)O7V0
zj5ft$2LOwZj*F_b4M_f8j5*|ByNfGrD?qEPc#^%uj`&TV%EyIm?2I8PK94@A(G7f`
z^z@boy^-2?;k^vM#jl7u+2YI9WTew{$~PET$2<(1FE{Ewu`$Uk6i#U^zWeaJe3|@=
z?y>0|aD*bRMU5pMjiNL*Fvi(gj-k_xMXj(l<*UUtU3#jrted>IvqDM=jcQ3nqIiUy
z+m*2XDYwfbwmb4-w6tz|roGj3whBs(u5rn~0ToT6)ams90G*1uR{$<uxn!&KeOc7v
zt~uKzXOY8#wxHMQhLr6;(=TvgZMj`v;;b=s9gFihw5$uMdW%$(Y!vk)X9c$92Teh&
zR>mJwB$7sWXzZ`Q4|FKCH`G3?0Z<+7W3X1%mD+xg=TgfXOMuPry0GJ@Cn7m=e$^Ar
zDyb=HX&fh~vA2trouH_V_3n*~aE{|>E6}>eze{_+>4RMJ+zf@7i%_P9&Zwhopd0#)
z79l)$Et$!<=>@peK?vIup3{$_^zXvRbp5fl>|k*Nb^EV0hpDOF-GTzr2eh~#D>}}q
zjr-}rf$j1zRg}0pL|l0z=}w{3GzyAGZH5-U*(=HVm($VO^Gz<+4mP^hSeE`L)Xz#A
zESc|>L)1M_Eo>V^ra*Wrn>4w)NVX`r`!yP8Sn49J%+w}y&=Y1p_bvOabUNJ})T3ov
z9@EIUxL!M;`jcIS#20pO!ZuwZsgrIFdqM8fsfqAZEdKy@Z|il+T4H~U(mY*Zy05E&
zacpkSYZY;&eje0oT3nSZo#oB#yCketS4m4vuQrl-9qJcY2P)1@6N*eTrc9cpP?n|V
zo(lKwgw=HYGK4`ZeLD;|@UV0rhxPg`G&Qrv9?Ju{g5WI~l8MwCo>~AIy5pOURY{kM
zaNPj@Ep;4~<+^PI;hw3na5%TsXS!4H_6VLTsvc+Gmt3m7cUIG5uPoX&Uy<1zr}eay
zj1V>Z;vc2gTMRxm_8G~@)>d@&6(nKpo73^`KsQjKrVeE8jl_R2S^aORe>X}<kdGqx
zSUpEmnbH#+i%L(HffcQq{;#jnXB*;@(he-Ne}^4IJ1EDm9CODQ_OjVtCp&8^CE>?B
zuS5Jhsgi<5esQEX=eo{HwlYrik6V{mZlg~mw9q~`w12YZ*x%t-()8@QynelF3_zR)
z;Dx5prP6gecE0V6?HBQNX&rSP%n=6NxXOGyFJ{Thv(I{$p=w*FxzrV}xNqru@P3QS
z=ya)_T<B_d7q!+R>)QIMx}?pK)Y5+l3`R1%)w@Mon^X)F1Iv?2Nk|Dd65mU0UY|-m
zIo%lp7dJraeL+0?>6}Dz4s3r?i&52^8$B>?K<CQHNZP$aQ~v;^w(*-2&%$=nM5^A+
z&q#E2CsIo1RmdZdWCD3w=k!Gekr@q*p5EkkSl*Y^Ur!MA9_S}$@{wfjt^7gMMJS}-
zmf$-1vgV#zRYz7lY3&DVbvkVuj9ZxF#>W+itgVh3-&zL-kZuPSRI<-ss!h0Vad!mv
zT8^LT3Yylm)nD)3a>pE#<k@#6Tv6*khChf@uG5=KTK3orXO^b^AnR26j1HxaqA3{h
zU=C7r&*7GpT|~yqx;X&<0C9%JPpN(yN2Z<eOY0HF=UsJ4x7p64O!2?{B}F8!l2PhB
z{{a0zWffM9QK0Rr3}fN{0JAn*o}{96EKe~36-0mCW@6Ny*xvfPO3vU61xVD9Iew*v
zfvvJ=N93w5(}Eq#O0<()nuKhYH#nY1UT`W!HmYZ$XYiiyb4EY1+7=T)+K3z^HoK#D
zZ=z3)#pq=;`wxYUtc&wRG!k+xVvnY*rW7WQrWU!qi-!q1VyjNpLul&i8B0(Ff$o03
zRi#(q?z2}YbsbY52^eq}x@A4k96gzymDFL;`la!TkjSJUG+)|RuukY}H2uW2q3y93
z!Cp(RejnFROM0^QI^Nf}Em22V)S5jYrJe7nrT$lPTlZ7Q-BKSMcVS&u(7J<U6}n@Y
zJt&iOjK8=G<vOpR-6bP63Kn~|g6Q4F)crTqx{PlzJQu|5Soiv^{+p}D`gXO^hPA_s
zaH)zC<Gl--NlQnUX|(Wrqo|3kdwB#YD%qtp?0i5Tcvsy)6%#8RGzGai7v*ERnrP#Q
z$ra1n%SRzmO|3F~6WSz>iiT-#P8xIBTUY50Zkx5l7Lc+!9;pitt!FYoc(w}Hj-#hE
z-^8`H<P^@Ng;y3}tLfPc&R}(qg>BLLT=f%r&2xh<z~xoz?0t5iXP^c~6OFvDV*EMK
znf{XuPiD%EpprtLCY7PmQkKf1Y7IDoN4UlZepD42T`7w420gAF^0j?sK>BKXF`kr`
z!@$Dw`mI8Gd7j5hz1PVH3xatvPE?uS3~-9Fm#Mm97Ek$_M~JL%ZUI`}fP3FWBdB8?
z820V}U+$}DW&G@-I<h@CVH*81qeyY7)81bR$#25x!m}v-ocW$6%gtt+M5c^O>=IuM
zJ=3&C(p5w1MH^sv{$A@5)H<i;Vrv@{oO}NO+Eo2BS5aUlmB+?bpE-XcMa6Vzx}FwK
z3$ASO{nme{sv)a$^xDUmPU|(-M{3o8y^K4J`71lG5l+!i##zHR2w<1Q_N@mrd96Ah
z)_N^Yni}~X`G_6*WNvJP=$g7gs0iv>Hl7{f2|=${>P<8+mCg>sTI_<NW}jO@UHoVq
z%bSdHx~0Xf9FbCtwtH#NsH!L%Fmqa5F4-D?%8G+ik4c@B^<}^Iyc`g+`Ug-;1s~<z
zFdz$UD>Kzv#Qy-CvmXBdOy_AgvG`o+wDeumj?Y)sD(LG&pBtD7;>BZiD!Cw;(GpzH
zY!*U`TdNyez1Q-zH1&|w!UTfPx9ak*+96DeSSPD#aRIHjoRv&pE}K5r2R=LI{HwQ0
zV9xswC|b&z8rWRX{`ZwPcSTZ5X0xPvii%oc46PGE-HzqIMK-ZnrvQH|D_;@dUoBp9
zNl#G}`<h)595`@M^>kmEXQ*T>n%S|zS>lsHj%dfQit5oU#x}4Mdjb`{fkCXY(?vGc
zpX50UBSgt4st2!oe3j|FCtpt_E!!YC<GRts6{!OzXD{LfTS*;cCOt-z-TiGD2zaBl
z8>wWI^9*42m;Rs@{z^kv5AY$};;L$Tc4s)d(R5Ezag<-`G$;0XeyIfy@eEE8R5O-;
zQpD=@d#=}Djx4=XuR2Ovx=&sZY3m{$*EC_n!tq^RI=Xt7L01`UgZrz+@&u(_8qScC
zp1u}EW*M8<jJa)Lh4jr1r8^z`(75yTUS-m7e-<;4;CTljdQ1YPkAT-V){FTkXX<a&
zLp*GJGNVt@aLGHwg|}%r2eRIck<o1f+5*mWy(DkgV}2cz;H?I^59Ku1NgIjAM|BQV
zT_j?9r&MJu!Y8qhjpo}(?7X+CnNBOeF-vB&`+yyawCak=ne{ii&udt0*1H#3n(5?`
z+azIW>`Lo`w1`c#%S}I2gHSDwxCT`)S(A_E_;R?0SH1T1OB~J|JFK>yMCQsQIrv)o
z32hL)g@v!(UmSS7baPGf?5^rD4D{wl$LZAp?Rz+P)G7{^mTJ9Cw6nU+2E_PUE~SnW
zPGxMZ4kPreeurGjT~)GQJF=Qjc4~Bc&rfu`5>vKF%Vce{@UCh)UXhWP7O?lY3p>$W
zK-V>fmQQ`G=*i`6q;-8=8|9{m`hZ--dyj=2l-7#lwDx253L042SXeMTEC*F-t@RB|
zPXiXRwdzfBvD$;_;f7e|VX<R{h*8sNHTs6vR5*sek_H0i#|iVb(Rt1)Ei*NwMD_<q
zD?LULV{|UNqB1rbs#lADLF6s;oi$ZK7?vwc&l`C{RcNfL_d*^&sfBt?!nS$oNxMZ4
zL+Z40IkXdxN}zs&#^vg?j-{#7#TK~;mK%Q#YkQgDd97DQi5u$Ckquii0pZ^t33Tme
zSEg{&^#(}N%x#nYJgy9olpVzF#U&+DG@9>0QiloYWo(hjmc70I0Qp&&=_S%<44x;x
z5OU#?7N<|v<AR#as0E<^0JcvbWZKI3D&lj9VZJOtPM<jJR`|UT&_h92N;f%@FpPN$
zlUkvIiNy06{>kvuNliJdq<xwWWB&l*A6q;+wK<Kk+FNmDu_(PKv1cdUXra?}i1hbu
zdk3cM2|In!bvk4ku{9BZPav?Y)}=#Tr_T80h`ty904=btdRDcxkccCFfjGY*T{m>e
zzAah|qR^_}7-d5m=*}Ad03TJE>OCrbKB>(C%^kcsdZv$A8=1CX-*=u0gQzJq`l?68
zIS*%S`<wJto1{)E-5yIoe=<xmNE>e@YWj2d4s|rf%y_e0svn|99--++DJ&-KlnWJq
zNkud;Y>~Uj;lV;*Wnrx{KB3X1iZ@6>0@n*GLoem#{w20<u{^DR`siz2r`N`1hTB0r
zwNf)iEU0$ECV|G{#b?DU4L8xI(jpZU?Aa*Ua7EAfUbE1Zu+|3A%PEd#TFxEUi%`*4
zY4J$-cRm7du=3xcK8IeHPnnZCN43p9*SC@NQj~GzjRvwUpGy9EY9<J3ow=XOC;n9z
zQ0j5P5qq2nwZT{|FY!K(wv<s;%+^W;n)h)30Q@Y6TXmnK6X~gB^+SQh{{Tw!UO6dI
z)e81i{w(X%^^$sHXnRe`3&?d%RoC`A9u(T<qcu#<FL7}yq)<s$8=V`6s54@DUHEbF
zTP2o%Lt!7BI5u(Yt*CUT?grUaI$RUSQ)0r`j>})9)(kRHZ<{O1;<QE$N$j!F>EvvC
z9u0!CevuViVUjV;cV~{tlvS|O$$9p^B026Brh=-5ct@l`zi#V?B&40AyBdvAlsbJy
z1mZawZTzRRliKIDP)-Q!wGy?HHPJbuM)n7h^i}orAhE6<*Ix(9Rg&Jv<4Z+g4w1g%
zN$d$wPrjJ$elOq3DUnRcaxT%`6IV>in07lN%ei%<icZ}!nbnl?jgKG{!8nB3rw9#8
zPJ1Wzk}ttfGAe;~OUU6i#cC;+Pnt5#@nrXE75a-qi(huz$_=cVGB8?G<Pp@gHg;@y
z;ox$XR%JwzY63DG)5?}TQIa;#IX-);$#nXNoyO)K2nuLuoIox`MZJR2VH3c1_}$Mf
zMYOh7Ze`l<9m1>>lR|yBMM7Nb9v%~V5$mDy1A99s%1C7No(ul~PxU1-wb+xNDY9E{
zo1;JveLH20O2RIDcR@H7JdOzEB{fu(zSmvwyOH5bR9P#1RugY12UIc6W9|!VP|`*k
zNe1a$=YE%V?wDlkay+bnFt*tkBPqq9!*Ch59#Y?M9mkZ*mK$<Aqh=G@MZ9tpdtDhN
zryatULdUdU2eCuSWQ=>o!R`|nZ0rTQ*@t%saQl)T+aL0ZfX4G;;0jsbY3H9QOa<wO
z8;@zX1tWJg#1N)1%EOVkb}NmZGsykcW<*i|cmx##uYYjJ?h!5|9k2Toj|31ef0Pn1
zId#8LBn}8oct5GRQo1thx;uQ2DW#jQU_-lvOblJ0@{z%=;Y#L$axCDZEg;-r-}g*n
zFb_PZSYGzJTbB|$t_@hkfO~E-lmb1>{>m|S<S7I0E|r*;DFd1}ex)!BaJVQJi~E|8
zNcQ(dNv?yYS~-k#J4y;lW<A!yO%*OJ&B}<*;Ol}_7E99+z?qbfX!czPSx-15-sKp|
z(gmIW0O3mNpx}3mSsrLwXsT^Y?T>B9O3KMbE`C={?s+XdsGKj_#Uq%?Cq8$+e^TcO
z#;QQV)|+3H&9)^q%oeyv<Tnx$NhbM9*&NaEl!VjT*Fm#WCM|2m;8MdFd#r~Jw{;|P
zZFR>f8y$aTy(>gyVOmp40l4g_Y3hd#<rvw(7rN%in<*7WvWB6KXX>%=jBc)AAF9B1
zSV^@PFj<6y@R-e6()(sTxeJ;2y!Og0wWHBs>T?!-LR<A$8fR8gO7Pia4ZjZY^<FnE
zQ^CZ9gYt%S)3#9frYt`RALHWC%QHvPl=ZAFX$}M&wZPmITvgWoVP)Z69o5y86Ec>u
z-nA(_9^Xaj^tFwe5j+px!~2Eg`5q*&y`2%7lF_!Ju49N70HYmIabmGF)tgRAyrixV
zj0YXU-1uCNLv&fqRvU*KgauVifg#rjO+sy>a5o-RJk{lf!PxMo;@cT)8(gT|T-LiC
z$Cc;$oFLSh8G;T%*lN%9n&(99_X`oK%OhkXAog<g{0%Z$mV+p&LqOW%*AJCvPpr(t
z>BtB@vx2h`nH&MO*LFTpBC5>{m~p{gyTqm02+gBGHmOkTvBZ7VMx|X<Aah*n-^oC>
zcZZVMF4A~TmEqX{+(0A0E=?S2A(OB;9$H9o$yYi>TNvQUM&=b(Ard@a8RcDR`aqSS
zHP?65Y0!xl6*R4yE%cI^8Qqu2LeNW5Ln$KiN8OIffBHtDOE0NT=h%NLzSE<ot%NdI
z_D#XZDlV%<QX!@^@~}@#EPt9a*&R<K5400+1wm1v$iiO<b1lJdbSRFhH-8nbus^6Q
zwoyybX!wE8Ay>^kO$9?{rn7)P;Cw3@H<y9CpCLtGLm~boO$PnEqL3MBr0Z05p3)f`
z$2ab-1QE>`7$A&%uQi%IlakM4o5)1RuT@gTvvbL4y{@yx^bTKUo~ulfif2he;MO?Z
z(75|u{{VyqR+&qxHyfa+X!kMPgYo54JF6s;JDt)uxEzHWb+^>*dm8L;;mG(!LSW>Y
zC!a)`2YPi8m&g5KS?C&$v7w!;ajl^KXkYr8KkX_CT~2vy*APc=?p6H^Y??m~wbpH*
zI`&z`S*Gf={<S2&;riot9MkkcPeuqWEh797t15KYMOG?d-3$K!sfPtw(N@kQ+dFQ1
zpDQI`dg#k*nlGy7du&hh1(T?vtkbHl((4m&M+?;IHp~fYZagXtW|r`mZLs<xq~aY&
zhoyCQMQEkl?&YriF8=_+*2H9erl5Bpsy7^ur<LciK-V}17Pb9>@AO(d8ls{S8eHOA
z*zyuf`X7#sY;)1-4E(mGN*d#h*6yjbu9~f&W2e*aQ&0Uok@iQ$J7-`rM|ThA3g1kw
znk#H}=8jrYsS8wi?zN_VW#&lYbQ6yUztL7uYW2Eo-i=cT4d-ydUgNFk)Ec{eSePm5
zyp9Q2jblK3Z!p(W0DqO>Toq_#5}GO@mrd284jWr32qULWMLVBQ=PkYn@)A~by;Ki%
zMws()lO6f`CeUiqHbX~W8=B#RyjX<k#$67d*<nujs$(pbyIwhJZ=m?S(7$|V`AOkR
zBO2|p*th|Q4nmfKk~w7F*)4wkzUp#RHE0ev;*sDv{+q9YrmKML+V6LQ5tZ6ebFUMA
zwm2z}!!#_~=DE!rwDO)3eu&B_r6tjV0VTc)baS@&HY2fCwKTCv&FvWdh*gu&xH|i>
z*sG}~Nv4TKWbL=0;2qo^=*k^l7e8d}bQ5qK4hpC&Eg_Oze@lXq#1;lrGkbeHC2&EE
zi}_m-A?#~GIooe*zMc?s(l$-T0Cx<!GlCFt)Kt?p(a0r;i&*jz4XpKA()N&B!`gDv
zl_?>#$YOt?C5_wh;a<{eRP_-ypHhq0i?oCFv;P1px=pg#l`H|)_RKr|LJnADfyZgw
zISQ&|<pf@8eKyBJYc$y#JU(07>a&wV=p@-Q4ZI_0bt=k9H_}Y#-@}{P-&AO>rqnMT
za~T|`hcs9vbJ!FaRRhdS1X=O+1x#RTo9a_IwoY~*_)*u<OGzm$H(~GCq^6WOZMZ)N
z{t~tA6i@6rhP99W1faz)0Fi`AbzEm;*tzz+WE2b9CKs@A9mgRNOH(`z^xV-bN0vK}
zw}mEJBG!*qFHUCe2N_jDf>?&w-Reevl=fGxk_j5%z+T=<59)9JQ|XO7CidSM?`{)D
zR3xKjPOh2EH`+!1GKY#sLh$C27XGS+maZGcwb;eESuI;gnwi^}3z~c?!zJmFc<Z8C
z4Ncbp=N?tF8YX9{5xMRbIj(eX<Lp(H4Q!B*=-z%>szkZi;79{K+E)j;yb=$O3QB6a
zde#QX?34PEz9QFJM%}%f5nDk=2M2+?XUGXRx-0JBoD|!b-De+Z?w8ayAXwkEuXHE^
zi5l@^hjtx`Y^}!Abr~1^KeCo7F}6nE=fcAfIM`a`{Zm1`_TZu(!E<A{C?svXtY%3a
zL1Eh_LXqt*X7-Tb;2>Xt?iUJJWh~1M6ADO2w*ub^7e>+zvG9sJWE-1<;HaL_yCXe{
z!%#2;b}9DWEPr)47_)#-y@k91^jK0CZeg>%&AM<cAdq)7{^`wg9CkSEC(m`xiOso<
z3ozVTz^NJofVfeI*`t0Bl_iH`luX7tJ39XW-8c(#pOq_IICt*4R(np~=Z`BGYaI51
z8^?tEhYS!t6g!AE<KZUYNb)&ZpdrTK-MBr%mMQJ}vGLhN96z5Y$W9@pwl=X^!pUA*
z{sGD!W)j?=+mwJkg9h#H6SoI9<RT8p2H-(9AaGRdb%nvj@}e!tzCKqso!8I80YMCK
zakx85CNsAWZ`^Q!x4QT2h=ObeySh=6u(rdH=*_#@>A<+yI9R5_;M|Yd5JO~b?UZhT
z#A9T0K3m;(=DRquWRbbIJgA!D+=Is`*sTwm2<L5_z-~EJHTo$4z82h%3g$O8z#Iac
zTwC--I~7{!%f@7d-jvKEJ;IUHQBE)IAgk%&f^c^R-rdj=(Ygb8!Q0_VaQZ78pJfF4
zRJ8Bk9mw#V9EE@fToA9~k(MlxwjIibvVtj?Ul|uuluJf!6^)ck?XsKvs45_QXW9vA
z@VcT2A$6>zf^x>#`@%|SrKSqzIl}({WedS*u@_b(wbv{l9|&1vxw~zD3DYFiG8hXB
zt;N)m!`vUTjjR_o!S1=zzB6NT5uo4E8HvL@kCf>0epIZHl5i}Z=tZv6m6@)_`fYF|
zjHulkn0>cS-dlFs>Cww^o>AXo_BtsGO~DA*q-@}}KriK1J(hOn;Y&?053|2@w9QmW
zSwUc4)mrf+X2$C3If3p7DIHA|{{W)iP7>ePc$JXUI1J~`RNlA*c}}R)+`+g6DT&Po
zxki_0!STx32N_cB7SAfO2km};WnkGsz)IB{m!V5rYa0@To+}bsr*rO9PIqE(o-7Px
zZX)eDPc6Pc1tDf`kP_Q-Z=xVuILBm;W)JsLHNf8H#dD9GrPyc`lH3&65qptup;JiP
z+~eqmEg;<+HI8lh92B?z0Pe|+b-q--p#GFYw0jd`l1oiJL36%T%&B<x$4u!+;MkNk
zV3F(&ia<@cD9sL=TX-ynH#w*JTB*gz=epY=H8%eM^61|ej>xuEK<Iyh))U#!aLO*D
zL#w8V)p~@Dhz{mJPwcX~rlY30#8TBr`33Lo7Fnc%o%9!7tcp0^!tmmI46L<ove;WB
z^Unzc;62$NK&ZN}s~!oafWXHAZT8B-*3{KkzSFs`2l<eSY!5}pQ*}73o6vxVx5ykS
zYI-)$E#+}H_~B1OrqedgY=pbPYPF?>yTzmpBY;h=s*+j}$+3`8Ll^)|U2X>3SgVaM
zMyjfFUmRua>}~)Fu+l!FMmk&Li+B2~>UR1tfat&t7qD>zqT2#R&r5Ve^$8rwYTFaX
z8(Hdp_9)F~pmjQOV`i&L=8nekpY9fJZll#AYa66fO&i*AA#Wdbe?!%Jy>%a@tJO;s
zp}(!LHO)U>;c;cjojZ!ObwU{Zvp*(@O+!{0S+=G?c@6|3%}?dOhR9>|t=XUet6f=Y
z$sJJe{NmgYskIuZs;Wgb9AngbtN>jwww05WCti!{jbBcsE;2LMcZSKeWVMc}suczL
zWKq)m{-Uko{5aO?*d>=yq=$F%$W7JnPyQRlMDNYl!A+<L@>t1vvZ71uR_SQT^v=Jj
z>J_b~t*)hrNNgvTFhhR0TF?D6N2ThpY8tM+r&m*x`e~he_u**k^)8wkLzvwTjM#1T
z#W3CbfV}z(SJk>5H>Rg$&8}l5r}yCnZeOUYt)9ULSJY~Bt<w5?d~g67WOFP68UFx=
zdUagC>N?h_`k8sQ?X4eWjiR4j>Do_FXw@+R$zyH;%JmObbtbbTsp%)Jc;Lpy+w8h7
zD{rzDE|*83^)#I$)Aa9whLTrW#hbSk=Z@8AbqUQq6$>H`KdGeK`>dO^t$M0*9jDc9
z2i>?EuUY&X>Afa7N!O`eBaQ$LBHv`HKO-5w3d$DhT31a|nPO;laqqW+h0*kmqwC7=
zR;s2*X)j{y*jwRxH{!=g^tCl8t)ii5w{64{vAsFg15b&xR1}1_jg84aMYN?-*_PGB
zn^^od(6mq-Yo(e?bGTV&YC0mOvZOyxW8TtubT=Qm*GwxlN~oV#L03y0gc9i(LrD9p
z&ZO4aqUi0T)9Bvv;cfA|1L~(YTSX$h6#6|Lr=!re392HbAb&Ff2t9JTNue>jQ8EMl
zEH?hhdTor<D+JoKuk^vWX?H6{s&%hQXjH};XhYu7fFlSjdbZ5+Zjv!NWn(n=7dA$?
z9!0EA?x5HD(oqAVY{jj&0HC_BuidT6DQRd~XBz+*H-BZb{4@L<X1rn4wf_LjQ`2F_
z8`!(+@P#GsLA%+5==~q4db?BuO{R2>2Ifa#0KJ)=FIk~!%#OEGik?8;3s$RDpQrjW
zP86CIG*K3dUe>qYy7At)>e`yg+$ELa-Zx!yODv@L<NpBkq;aq1A`M?fext2687loq
zo^tjQw>>fVIn$AbYBdtiQ*61f0?P-|T9JlNRprtic)HW;--wl3cAi^I*`vq*0Gl>d
zjHLzE%;On78;Z)#iP7NnDX7@lT0c*uFudQaI>wf1eH}WPh2xKCUUOg6n%=*t7RNK1
zTyEzPW$J&0x@Lu^?VqSL<5@ei{_p%J$BpIwPKBODkNB%HuxR~Fth02D^jPlU{gZ2d
z5A_C8yZEv1BlQ!7@AW-t(KIwpY<(>wqicP{G+ZwQ{6_1D>a`c07uBbN_6&C+URdE3
zqAMhsjc-Wm6myqO$ld||S75ELMd<o`)lB^3{T8z$xF`Pr3p1wc(+OK7w|j>m{H+d`
zszDZ_+KKepWv3(D82f#}3Juqx;+sB;qt|+Nr>6e^(@ZXcX2u%Xq5zBAmE_u%nV{+Q
zwG--^q?0-BBw4_Jgf)L$=<rZF8W^QvEwJ8fytk+|dF!fPV`R>A&OM}sE0dOsf7Y3%
z)^(jFwMHE_N}CgH!#~*{(a=Q>tqoO8Y(zQs4x1Z(pzyQZ3+m}Jipr62P4X_Ry2`$N
zbg)ABqGL_TV*^P>P-qd7dS}u4WYV2EmNC8}EZ0PC96YL>d+^6X>SAid^|V!PAMQf$
z@(S>Z4z1U;JuFkvR~GFS&TaHZ^v~jlUrSKRR_d$~UoSBNS`^eKpG8(krB-S+{{a60
zS1opZ(opO1R=2Zd8(a`N7vOfKLnZaO3u9@u*!zXQq}QwJDcJcn=_({6J3YBUYn2sF
zh|5u_O33Y#>sed&Tcky}v5|CtNNDkUqK0<?lHqgrRGRHaPE*EP4xLOfY&0r&YLrt~
z3SB+Md7NxqU3KZ58TfalSJH}|Rr{Xtdklf`WZd~7c%;t=tJHLut4NZPHb&#iO{}e{
zYP70qf6VTU?Y0HivGqUU&q`B9;Wn2|GYCH7HkIJLd(wJ!6<e92>Mx2X6L=(j!1^9k
zRz#&memho*y=Pq-o}wvq#<)Gk!p8{4(`wpl0jj5xB1g6P0m@Iq?GA>Ps7+kwU557!
zy7oD`kEbKjgf;Ynp{*DaMs541bK)#xeV!`>dXBMB+DO~FM;i^x&@^xV09VeXuBU9S
z*J<hZi-ES`bXtc^PpGne4uV=)+UvQ$%6^MORoDGXM;mFVC}xtv+fFa{RaqkAvTqyZ
z`jKfrg*`>lvKpGXDYYnjxu(Q@iYlvFr=)O_j*bYb2P`Jx-}pdOb=O)~4@ycIB8kGz
zYl<66(rYU!OtVJUZguQMh+Mg4ZldVv!x#SmWNmc6#L32-`0I3N@Y{QPFEHwQs{MCU
zl4>eBc003UwZ5xk)Os~dH9T_DMB~NVWECxSewxkh)8B4fNKcJw<k%+Cf2uL`-4!OH
z&}*A5JG<SuD@{q$Iwp-oB#x=U?H=vvHU7Pr(3V2RnY%M?LcwaYb)KzDB}{ZPzMN&m
z3;><-uhj~v{{SXz+a{T)lN=SzhCz=_&izTRr_pGEI*l-$rx$75Li24NimkK$W<uvU
zUvpiHEiRE&9X6=hUmGNZ{-(bzDHL4gRy(N1&9_WVp+N6al7_F*2I1wmR@$H9T`rvw
zj)s<3%HA60@}kpqzL|nCBvevBZSM4)kFAzlton~m)X1cvgw#v?uQBX%Ps#4BKMf_R
z9P7&dgDXD}^{sx5;OWnVvm03JkUZH9pz2kW(T52C05J=kOST(5r~It7HBV6JH7t_1
zN`IpN0R6_BwZU0xTD3G$erBD8ta!gREGw1b;OdT*kxg0X+I+8UVx}sB3CWC~@~Jgl
z)w+-~QaHNy+}8H{EUZ0WS6xl{Z_9$~ZDg#$KUFq_dYTIM$pveNaL0>-@TmmXaTavd
zrfjCBbv!L6b8al#g&a`&k(lZxcyEAmqSbneyizrlv~e;~`k%=9stVn9KSbI~JGGO>
zd+47E3Dsz{=mXv=0X`gk!D6-AD5^ufDyIY6c2o5V_e%2SKKJA**(zUbT>S#n%$n%G
z=^FDu=6m+Y(}Q)Z>i(&v)$|ihs#6ElF~7p8jM>2aj^TOkl|3CqMj4}?8NtM?1cUVm
zN~Y@4Z;A?8=5GLol|`9Fab%^9-Jm!s-%&f`6K%1uAlVP8GFCTfd42qwt3H|NE}+!)
z0d^WzIP&G}dJo`RWR5DDx|wB=Sdi=m%`CX$tfW-Eo+Hy*ZB&x~0Mk-QGmdQ5uT1G~
zjMeL<WR)y^JYUjASG07`L+RRU7|{zF=Hmfa^)*~NMFX7J2F8v+US40w-~RyPM^eXn
zGg@YcL8H*`Eo)rSd-+*jq5MOJf}qpD;x?Ndzw)8gI+9IK)r#+9Y(q%6ULn?X)ik=S
zji?7F+V3jZ{3VgBlXfhp$MvJu>wggF=A(1vad5UnPD=8<Z(NsE)Qf1M{JbRCk=<su
z)>eY(qm+@@1!1LA*23W76M_E#ySnt@6pmJ`^^Sm{(%VSa)x^ixbKEOUds@-7!M2=6
zN$|X?EpJk%lh9>6jJ_>nWMgz)UsP|dB6E%K0_^#<Nf21yv(-9ZMR!xv`p`>v9Qs$b
z74;WG(&_actboTT=IhP6Gg;QUW}%*~Jcc%$+V=}-t$rakvX1of2h4G_k8mkvl{K_7
zgs(;Jr$?p59_DR^W{=j)73MnaRc&UtDgOXADl_eKaPOiITCD2&<NP`~L~k|^v9e~D
zrs_IvLn^DcHfHAMh0Sg5v{tLL*7{ea2BoG3YBZ5q!`kva%gwsCLaNd_u<7EKLj#Yp
z?e>xNTh5jILxi=oJECnvMT1`JU+$pS`nA=SjfYaEa4mJ(OL6unDwNRtr5LqFVci~T
zAQCyYxW$JEJx`;5>2^-wKp48-yQnnw(}u$4-rrS@>Q16_q;yOnt~`9MjFO64Ar&Ld
ztNJ<e)_z_I*vC5!7r{OeI!8m)GI38+FQX{qarTvSNl5)eQE#s22DtLo=oOth`E+34
zTh(J*?2!JZ{ntB$+O%Cbtw_!2+EXduZ6#eGC8o`g4poz=gmIA85Zl-bT~g?}%#;&9
zPp+8DvEJ7ltBP*7qokS8R8hWIuVE`2dwo|lvSo|Xv!Oy0L7HW5qo$42P|8n$Fjhyc
zqSv*JVk-K59!OsuzfW>It<5J^Xn=<}-KQeQg`v^9r>AFiqml;`$a96q?t}6hRM9_<
zF?N|<)16VO%cC}vP^A7VW7-KEn|BKhS)p|vqfs=mZGo~lkj&Y80I1OCm^3;Tz1&*D
z>TOnm{{WG_Fc`=qkh!t`vTYP?HAl*wW7GXZq}73`Q@ydg`(<ugP?}{t+uG6{u#u3x
zgQ@i`eU6%rr%#TmpR<l{_CWNnPD58`{#DJnxn;OshABCEB{-<=%-i~ESs)TYF_tF}
z{_caN>609{lmVU!^m^R`RMME~DO>75<CfbkNkYnLwo}y8x+;O)!wyl&%}R>HhZ|)k
zi_?_RJ&rN8%|8kKLk6Ej(sqE+kVhe3>a<OzqIFFK;1-L%Cma6D&Gmg*`m3Er<F)w)
z$0$b^{zjHn{{T~2p>+&983CE33^cT>Sv4ueTUy6S8~OKeLi1feMyrL*^v#+xyUO&g
zpVc(_?K&zAR5i5_jjW%8_gx%S5?rjk{{UQ;8e5VJfXQBM*7}I6k<%T!yV+^#>ga?L
zL+ZBT<8}F7SJe8Pan(L8-lKeil34jJ%0^U6qJC#o)Z?U&bAy~3Pc~kmrG6eyrxw-4
zE2;?>IN^EUKu060nLQ)@H@V&Wh3*Haou+8!H#2j~Y;C|lRZcFtBHUB657z98j)*^F
zW0+)uKTufx8%mF;YRjXTNak|S3BQP4Qrfv>ibrpG`Qc^yGEHV3UMJ~pczfIhyE!az
zdPezZ_T2-cspz9?r;J$t05^rMr-BM7!$#RyMjR7*dr0bvng%|mnU^gatW>Y*-Fg{G
z3=D|!(k>R344%<N<U#umr|KtCxv?+?Uk$%?o9k}5tEFjU8uydIZv*O#sMBVqeX1JZ
z50Q_uqUw5b+8HElexL*N+T@||TDAw7C!&&t)w<y|6$f?uG@>f>7}&<Wu>eo%9hO%^
z*DAESvn4!sV0XGVExcV(N2=3?Z1m-|oGiL9#wk$@vXgdYE3}$0?Zv^52Z73kwN9df
z(T(l3tX2J9fhAO)q!YM<zz7=dmamGO${gd2f)h!kByIFzYw9HY=$Vr`CvLbc#h0)C
z7<JE3>D26|dz)EGe^7VoA4TOc&^@}7%|v%-I1ALj5A^6Fdmc{KxbxU3IL2(eT%xS>
z%FT7Ug&}KT^?gB@+|`cNbn1fFIncO9bGMc0dOn*@_!{6D$0NFfs3{|gnfrz<%BT3r
zt%>u$M~u@{(?O_yTt#O&*0CHFX{y$mctafV8Mm~8vz=P#X?0@a;L=VHg<Gv^kvmRv
zD?ydJeU1jiCB8qa8u>dL`S~mLaZBrxT5{mE1E++{5)xc(%JQz1>L_Bbb7pA6y{_+N
z=_jixzthj8@w|=-TUD?-y#Q)@W}i(dFCsU23YMZsV3*Wmy-2~x>`)y+UsG2pkV)-T
zl-1JFlF~g!ID3P;sd61-XQ^nqB@UqjD)hGqYJX7!f>!51tDc2{nwe`RX!gCl73P13
z+JL8XW{Kaxc>>3=TmGXG9W(Qg{{RpM+^}=@OF1&og0e26>l!)g9ZyzUcHy_+tfg*|
zNnF!eLI&q#w)j{*TUVb})Wi*l#p%BS)+=MvjMVAr!7;mKuk}J0n*EJDkEB-AQdQE<
z4DIxV{im@-$JB14jKxp`*hQ6{W~EIeZ>Ow?wXVg;!t-vVtNfi~p=-Coe@Rza5_E`4
z7OXd@Yv9~!DI7D}>OP*;rI@?ZzV@7h-7ie^^Yy^<6tT3A<#FUGTcpjRY5}swLob(E
zJe8p$>FBsMZJD9Z_PBBgNm|I~q#?u>k&vxq()~Jk>i}&;FBh|XAS$SLH`k^PbUeAI
z1*?*B^mgM{wr1d_j8q2E#b<+tj&Jb252xv?8>gT3T2S@@aOXGN(6jneDFtIU5gEQ7
zy;DJ}rgbQayJ=|_-n3?)VVrAd#cFzXpHWU<P6He=9l=@3Dj&>Nmew_v2F;LW{{T?6
zy?pu#N4N5GHNo!MKt5J~PotJcvUZ)!JdxR64Ktorhw2(UF-Mj(4$f~1oq@5`2-_$v
z_$ysoNPi&a5>3U3Sl8+Af~Lac1K*Wi43{*+WTU8&;o!PfcKB8LogrW|MeKO}K=)U=
zMyVY$j1z$Da(gP?sI8~;-Ik986`dJf*;7TUPS~v0hqN0Ic?oNELAP{dv*A){lex77
zkPL5qg0<DOX{4nURM#QHj|lvgs{+M)E9$kU%0wpaas4DMFGN!6hN+YKj%!ECsOfzR
z_@1=P-6!;|zMWLcUvA$_w~$ma=B*<5@Lt)z(KTtQ9>FWHJA$@!`u>?w5Nx(C@)wKL
z^*swBa|^C`uts#|vAZ#oVZc4YI5IXaTwG1ZRaR0tk}@(L+i~G|7hlsddbg0><8~Z*
z3)kx9g03exJ7k^LpY=^O9HLL+hP;1tXEdeIu!E|z6{6D34C84fzuYfI&_6d(PIk1&
z#$nz<^T?`2Jx~HbT;2#<ZjkDFW=iHiXnEug>TTO7lS-L=q;((qOy-_&Sli(ESKs=+
z3Z^-dO4DJC@}blyw4Gl_lAvu8TanGzlWKZZT{TPJPWPJ}3-G0r2eikAZ$<A^>Wr?`
z3=EB-p#GpTgr7#LF$rA|k}i1RL8sJH%>iX>MU?{q{{Z<~UY>l>x6_f^>CcjvAL{6|
zwyuoy5HNt)o(+!$Nmkm3BeP?0$0NemR&@O}a57QthHhJ9Ym^-|EmbrB04u4}5I7F(
zepgp1C8L=}E$s6xUV4`}w3lbHrgc1#&Fa0b0Qn2p^<JCPYH7>Z=C(jEe5~|(D_u9E
zQy;+jPYEa4Ii|WQx;s;-qOYf@jmK*o2_FmS?v3g?Jwlm=H?%z9=PSdjI$`wD3Fuww
zi~E=cLYq!@qol~m;*fw1%SUv%BlI>m_IsyOX?hl;0hQ6jD**P$22a6RN_uxuxY?Iz
z{Y@)3Nz^93aQLcR5A#Oiv=LVcp)pAA)(5&wb8XWM()3!xsL?f+J6zL;F!od$%c)G>
ztu>l&n-xo~vTA9Z=15%LPF8lOTrm>a9&o7O*)=3-s_U5C?hSD7bTv(77NZD;p{;w{
z!@rn)3e8o$)wJHNB*30PzbGv#u(oebW;u@sAo3KFy(U_#bZKGIsRPV}xQ@p8OIt)3
z&*1arNi3J9W7~t|D4^6Ox2E9I2a%N=j!-R*DrI9NsHLCyfVrgPc3OH0dU<I?@Q~SU
zk>yZo6_*4(fPJimq|_=PaC|N=XK{WIgss?Tjnx|GQL?1}03I-02XLx2JuZS7a9YQC
z1BG*?*9yuoT5lj39o25JK{Z22Xmz{!3e8KjMORF1G|!Gd%E*6L>3HE9G|HD#dfN-*
z@~9|dtD~4QXF5nvpXFM8FIO}>A(i4t95H^&bC<RbG4zVFK*u~r@LCDOydtBHY9Z*(
z0bw|Du-0N^^v|lLaM~Mk)tHN3U}2@Lxs2hj?$Vhliuj4D(!o<W8vu7_4(iWE(mkNx
zX&(zaCZ=esgCw-DxZFH=TP+h)q@Ez?q-hr7`B2FzEi(Axy$6V+jv~n#2hEl{s_3H)
zl1RfqBe7Td?xh@Xy6zl#UT?1Jh0c2!DaXo`Exi|MC2XatsTAegjqSiwY4bL<t}hww
zb(z%aoh*kX8PnDAwc;ncY3+5?p-RqIJ%ws|K@T!9x4K;ir{<jRYsetvE0HedXDvtQ
zj%;-T#@8II<v`+@Sy!UHjrE%ecHT(jfAFKzA*Yy@yaG6~^eBxnhkUjU1D`7)uEk6F
z*Hlme6od6M`Car+47a9ESkl@9sncbN+kteH{zolVnjVW)EQ8RTh9A=5+v<kWwOh*I
z;lTH{_*VLUqA4mHH8X=xc9D<SP08Idu~w}bjW4Gw;io^EyZg26Ls!vMG#Kh*!2K^D
z^0oad)tYsEFr%nzVV2*Z_xTFPQyOrA#m)|49HpEh)uH1#CV6pSisDg$-E-p?1-1=6
z`xP%x0w#H;aC;9H?1rV0<}lH1*5L53iRgw{y9TVHWbL>YBeJi2aR&NxGXnv`kgR1g
z#&2gdrf!N>o3w85tz>=duaX9|5JO(x#CSt`QMBzW4rhd1o7(SZ=<rgu7Rb%aKTwu~
zK<$amU@SYM@OvU)jsgL|J`*Esksl!b$t7VHdjM^@3s7vgrG}bAwcrPLx^AJQ$0U2H
zaPg9=*;%w%_xglP8k~%10?%jcQdGMcQCloUr_+^%uIyALj%aWhvbL|Qj-{4-V4lQw
zRg8IKjq*NIro?(9W4jUdDN7v_ZyCE!AwE_%L3SHE{H8-D+qJ_fm<WmF@;j!Tw%pHf
z@T8TW%-kO89vyqw{C7aYHKygvHyy%xvzu(&&xD)oct21QkA29s``KV2f;$TwgWWgW
z)|-Il@ox#@?RGfs6!C04_gd)$uY3W(n9aMVFv!-8;JLlklc>$E!}dw}XE+gMH<pU5
zO@K0H3|`?nT3fVDAGxQSc2ZPOJM}bil$74Q4!cf&r?E_?n3BfR1d*WNjDLk5-qt?~
z!gyOSE@k6*<%hq~2yVhdn}tC^+Sjqy+ESLA?_mew84w-4%_<qGv%VJ__$dNJV{HEb
zqyX{AQHm#*WDum~#1XaOPRh3n2l6qw2Wz0J_Cxs_19tnnp=PCfPT`fHfU;JHW9pkx
z3mcJ@AC;%FiyCOmKI4)0U9;PE<SSa3BbCQs4R?eK;d2~7HY(~?Nva11#UTLpQn{e=
zHk&BOEk6msCA(hV34{#xDa0OHn|qrfKul}ccKK0)TY-_>6iZ0poG7MlPTUk54H1^K
z<%d2Bjl$#S%1e;%1Swh@FMAa>%0*Z!oI|r~Bx{MlQ%e(p_XP_bu<aoIQr)4diCYtS
zJg$5|jCNcdaFv9#*rj%D0?Qw8qBjWX0|@q<_(Dj~U29mUh>S?(wiL!!me>?F(j8}D
z`BF5wxaDS$V&9{Tjt4hNV%#^j-$f_2-13kIvD^?)v8ZEM;pIJ};XIwg+z4`&t?$a4
zV<bl$WE;2Yw>=ZCIwB!^?bw6CSs0_m@0B|m<~%$bICxyyVzMe_VXdCP^2s3+Mf!XB
z3#seh2@VGfAJY2x+vra0@s)E`I2SB%J}g&@m&b8*&bZ3aqZ+JpMq9W7c?yqHoHj=m
zpOs5BX$KCmL00Myb8>PLM+38RNIm+1xdi?0f~<-<p=V&89I8!Uy3WB)6%JtB*Im8B
z@4<<|+9f$&m_u0lVd+Q<nZR-yx|&BYIy1ehXseqeOAdYyWho{$Z;0K!+Pzq}+0M#_
zI!K8YKSYkIYmJ5o<Rj&4CUw{VJ=ZryZAlJkEq$;;drZx=2~AMo2?ucglCE@ZYB=5-
zE!uqD300&?3q8QK<AOV?*F|R$AT4;{`9e@q7n4V<boQqOL&S5Ixu=KsS_!m@SsEsc
zi}r8}#OO6Dx)-<8yM_2#%@3+-!^1?Sj{gAjZx}0@SY;QY(VBWa5}Fdh>Bx5k=TbuK
zJ+}V<lnn)VsDM4du%Fp2O>DHlJ>z_SM`X8JV{yKYsnS@|WP#Qr`A-Eloc{nL+3xNw
zf}m!#6qeZV_MS!Z5zUe*V{6!VG>^DRJ6#PI_E+jU2(Mw102?Ud<z#E<CW2!fOhv9A
z3(%vL@mR2zx5(rtSHVfB!LoLM`+HtFLOGvI&OXl=ucWA_sr<|a-OGCrr_*aAnnCEf
ztdQZ%BL!`BUY~nfTJSjbybKVq8qSX;HCvw2V|z`(7zK6X%B7}8ajm0aM8PvdzeD?l
zXG>W6M}YHo_E;SsU#Vn*Du-OR8;DyP4PK6-4U+&J{!-+NvXGj3HWXEGOu_EBBOszp
zG)6M`&D-_JSjcKb5?&JG&jj#@I=xLe^<muR4q7s&88qk)7twE36WaakBxkaQrmmJ~
zj5RH@k9FF9y+^1)mo_;^Bg(1Q%N){Lc<u^j1>V7`DC33XfYQ=%;JPa3(~#Hum^eMc
zt)kUsf#s4BEN28bUg26tQ>RMH#M_Hygyek^vZ>K+NvJkfwC(_LxPQn+n#rl0AGo-A
zYR|SNuzK{fSa%9|wFb0pbH~nZrzDtCMw*XXbk4CE^VuK%qYUgYRWJ~ExLAX!z{hTm
z{{SIM-F1%}T+DXLUMw7JywoY5O#c8@litCR<Sg#2G`&&&o}j}|QT($sTHjPlHQ6F|
z0ee2YA{!+ps=|FXZ|)Z3E3v6A%*ka=kuRq!y?SH%WF8fr1fif!PD7jBsg;y7!s8fe
zd}sdvZP^LBZkqN<x)(k%{Rbg*#%-#Qtt4q^eJYrVry~CV%*5%b-D?rY?iC>w5I=h_
z9HY44t9?6Hr>bbDtF$xQ1e`fdryZj>{Q}KM$vLoa#loo6sp=`nCi^ehURKf6f@P+E
zs?c)V<pCvL_}v_g_$^svVEF8zmGRr&!MD0=LmQTz@t#2{YS>x^_-^KRY2{Wut`~hf
z$nw%~x?z&Y&lr2?++#CQo$Va6xKL46Gu9Ex(!;^HP}0>;41vsbk8$N$RYOUvL)sdF
zkXwb-QIgTk%29hQp`>fr3rH<JyDpbc^oI8PoBci&29>DR=#@eZMTEpngZTw+DCMTF
zgh@<8v6ikm-Z!%GYD-39Xc-~Ew{TE$z(cm2kCmpbqGLgG8)MuBT4Ih{vBZKqrRF+7
zFp8Hm(Z2S7N$2dkO(t7<kl*O0lAfX`-LBlh-uVju07a^XXu~Q)eL;ZX{{Sedwb7d1
z%&+}KPadmW95H`{OjRY=cR%HADzwO|BDjsN7Uz|j)U;`0e(0KZj~$R%6MG7a1R<~Y
zSceYnIUhvUPWat&L%ciB!3qN<MJ$$;gn`4Y{!y{XLsrwcnC1SV!B2l;d(i4y_eCYx
z;TybmSCCHyYc@Q!kGFmb&c2snv+~}>5la-2koZV=8QOA{{{TaG*f&z>Ww(}++qo?4
zR$-4j%MIG$$naO7u*X)z8=e^P{H``CgImyUOn@8qdqS)-S7fIPdMYXBbYwdGcUN>8
zlVxY8Bd^;lHe;F@eJL7GhbbP{vpENluir#oyEV;pZx+EHRUDDJI}viysI>h|wZWAK
zz8tP;>M#f)%y*Q+i@mNQ{Eq$?7Y3U=Tz^nYG(i6V5;30&COdV<2f;#&JYM0z+yt#~
zd9}Dq+U6f_4}-#Mg~>ml_*#Qw-y1<75ptk(PRVW$`ANKkVo6emZWbt-#zf*U>w={9
z0mFsB?wUo#&RTpVvw*naC`mDEjHWoaXOOrwyDfEyTnP@^@nijpz-WcRkHyG8;Vf@-
ze$(!6WU{jE#lm4W$7H~wVi@M{W<rg@&C6|X35*V5yA6lJorDpAV{R5O#ymTN{{ZNe
z_P)b8_$o5cTzLn|R>*jg$K_*DGuR{;Lp(XI+HY??)RJy)Mn}T!+p>5=XcRK#qupXJ
zf}GcZ^z4!GxLM6N@)Tjbf%`4kLYuYX?8nEH;|MOz!;sYX7;V8Ei=vr0AP0`zqRcW#
z$Z^NnLPd@Rz6vmwkTY<j^xEKB?)(*v(E!2lp3*pSYnoU~PDhl%kJ3q4)D*`$FhMtO
z)e#K9{*!fFBqQ2;^K{@(AlV8vvf;A_422ZTX*-xuQB*isJF+3Q0oD%v(5elJ4UfC*
zQ-qEK+;;?z4J{~A=P=;s!pWJS-%YL?qjml+qV)>~*S6tD6qm?#o#9H^8vC*0>C+Xh
z5X}s7w7N65;RNqi3yhI;WkgSH-p2w5f`xrUP983Ph&ZNYCV}Lricnb~0HEim4EMzA
z-9EA%#J)S_0P3g2{f^;Hz^avvkb#hPxi%V`$QvlJ@)IfulIGzEcLUAGg*3NJKiP2h
zFtc#JP_i@|gOH$(cLtjhehPahzA^VrR0|sD$adx%6*DRx&;*=$P|6L%nsMPdlC}QX
z1+0aR6C>F6_R4}b=LhVforRVxKl~^osC!M_eo<HGTP#KixHeHp+i;x>!Q&~?w(YuC
zps50S&SSB~_(xII<bN%YGO+PubrWvGbjxTaj854bw3~tu^FR(Q_f?S0@Nc^c#tNp9
zXIR_HTBCAI5^8b{`1_=fdkx7pRv*J~#fTw7_^dE-;TyhzR6^(6+z+aPS2$l7Qn(A-
zg&dq@VJ|@=6#!UprevVlU+RUCgLTsxF2?|PM!=}DYi@1<vPW3oDUeDCwfRz!i-a#@
zQ3Jtf=L#2_<CQz{dmQ}`vft=RC{{JrzbQSxDmS>c`0dI~=lTckogkj(X&p{n+NL_4
z<Gb2Ih5b(5J~u?_w>PjY{{WOet*KR1Mp+$PPq?$aLw9|a7pUjbbiwbenreriaKHgp
zw{~+U=(^UmSs!`o-v0p0yjVInWA41~sI~aau7Zu&;^5@1u9?zsbv~TaN7O~&i@F}|
z`(0)=o`jb`tPQIUFq8iAY6@|jxV9fwW$7s0QvU!}d3N0Ja<8bg*vSREapdy1ohMDu
z4b#BXT-Q~O?r~@-y4IP~50#IkVc2=}UvvG_e34S(1s2t_G$`E^U^KPY;56RIxG3T<
zfPEG?a$anuo|=x4#L+r;x44y};Qf@^eITgXXC}vs4ikx{b7|V<G({r|hc;GpbVS4*
zGuT_<!5>GWNh2F1b49d&DRqfX)#x=iDM$SSggxEBvd$q*bU?#T1~*5ulGYo4m7eOJ
zproTF8aKJGb^{;oB>WJJhKic4u5DFk<>PN9tR(*G+wkwFdKKM6>(y58k~4O`q1eCC
zEw5uG?8xXnGu9nL6Xl`PgvQsl?WW&!UrluOqowNw+O<2Porm2Ujzan_zo@!9L!fi1
zwJLdP18mmC%J9usQLC@&IkhR?);2@!1dbHc)SF16kJ+q@(a8?!;(fpR&K7^IH8^PW
zqfJLr=1nDoP5%J0>djcgr@hqg-rzr!Un|dQ>9u`Qyj4{>q7eIlO^HgCzQUa@k5T+P
z>8h$~23Kmef>yX(0{jKElT^}SrgKegH@B9x!r^$Pqb{RCri)7;hznRrar-JQ4wqcl
ztG_Qo;}+wWy8tfe$<O$ll7g#~H~#>L{bNl}NakskFLaI;ATKr1^{VQ3$yZTPG;VRb
zLoJWpdgo1k5>e9z*Xz2os;1<zj{pFL>iD`dOlzY2oGw0Za<jtMY|3$Jk>~nmy!}&9
z51ML;+zpFd+Yj6=Y_;N+7QQn0-EPjvSjOslB{gfk3RvS~xN}@VSNcQrO7}FHx|h27
zZtN*1##$>}k#nb0Y8_7D9-*jK3NPku?{#NeN7MZrVXV@0=;o@3?hcUTtBNgBgH6-6
zQ$3plZF>u^EbEPQ)#?uPYbCih8wM5SCC5Y}ou1Urr=P3zXvErdaoM?J9biw@dDmC;
z=T$bL&ZN^lDr;c+q2J*}(0ymAX*zMFo{hC^cj$0sh(A71n$D-J>MoV+sGgCoIAaL_
zt~CX2(bT5YbWv3eYMvt*4r9g%4h1u%zYqF{tSiiMI#z=0%3F31x-N^SH96)L6%`Ul
z+up@`?@8*Ku8X1ww0$ysHpRiW2jx50O2uu3bZ_A&Omr+Q)HQdquCNP-NCk(`CiQ>f
zO%*IorqlMZg8`uOvl{(wx2?+W^=kQPzwInGx7A~{dJQ6)M$Jzo^UNJ%bA$F=vxM@$
z+0yzc7Z@vB3$3r}9;}?jr_nv^zFbZf?@s;~#u_U1soMEQOip#J_D|`qtU6^76!ejt
za9L$b)Lmn%YEn7Wntev$&!kBUw+=XBRTOjN$tk|gez{wq^z8wT3K%1JZy*a5gk@(@
zbya8N^vZU~!hBhvDoOOduGX9DzKT~s4t>`keK}jMjn<peI&=M24^Z=Bi;{bhlv?N#
zvqX=kDa4w-!y|@l(UP*dzOzAC2&Hr2cVHYq{>j}-scYSHugJ|hnpw+5gBhKz@>0_N
z6m<ne51dy)6rfy3AUQq~M-=AyC83<-9@#-PeS2`q$%p>{<hlgIB~+sY&nG2V)b!_2
zP*(~)LXRZbuV=Zg`>j_?bbhN*S@~$9h*a9*IUX9~J{H>SJ?s;vx=y~U(|@MenoeIK
z!3#mC=}yuoik_lacFDt<ZY}=+3tLOm6<T#J-D%Zu+*{fR4f<JB>OD24nSFTmN{OSr
z_DnPTteTUcQ;ylG=-m^eE8uK(^bCBbnONJcS?S)0q8nKq&9L7{61?Y3)f=ToA);t5
z><X4mcU7o<>02=)Blva!bf}PaY4trHLy)<&+EJOlHrOAs^8WzDT_kDD{KXE7R|842
zw)=oq`lngyFar=|j3fD+EoGjQRO$_Ws6yK3dUwe@1st4GDGp7H=?;U{`kINgvC%qc
z-Pw~3<LtGX2jPadMKjqJmr&B|ZgWM{x?~l4H7j2oOPeSc-xG^(`y$)deOXT%ggTU^
zqxA1Pzsiq1Qqyee;WVuzS!ln9+M_iu`sp1>ehC%{{{V=ehk6V;GwLe3jq%LZk_3|b
zO7niF{735=sY@iUkb&8l3nmV$)D=MMT7^sCzj+F+#;Pcd$x7JXnAB-#^>WHuX=VY~
zk))rx`a|%`T%@Uqt<)+_JgpdO!2x-1Pean(JriF5Y_i*n0#=?LqKdYV`g9CqM;ojh
zKV>(MU5(ED8h^#Ut)qP}`gJ6q#eM{UUc<;<2Vc@%M^j$fie{Zbj(1`~UgOghUxu24
zPx`)~D76-H$)xs^@T+>W@k69Kc4ts&(KfPihDl5Tx7|mCAn&$OIW=7(ucW^Yq^YNc
z?5D1yt!TU1zU@Cky$Xw?>Zz$iDrIbuk!LnW0#}{rpNO4BtCpWY(y*UoyR7Ri7QfVe
zNkL4>^-7ta2HTerYmcvVWjz`(w?)j_29r(hj+PzG?9i#Yqh9IiDs6><vo{+Ev#y5F
zy5FWMoD1t;45zfC1pQGRd8Fz3=7wtMn?+joi~AjCgYbN=cXE3=BgQ=$v#iNkraq#I
zt~Sika}0-Rx4|llqxGJktLi`cYKO8ge~8Dn;bq^a>T<ld)-g4wgUZ=-CsgTrEo3lj
zEdnrXWCK5S(6PcVqn=Zok7J5b`WF6atu7-X*i{<c6=tPM=;?L_+Sl-}VbydUMwyaQ
zR5C#J-KD3pr`8<kT3<;m@yibisxoU!MD8i=?D4&CL9WsDwp7=Kx-HiZ86S1%QT3LU
zNz=r~O%#J~ztgqH*;I7|HPv8>&CUn8;DzP=Tc=A&x%3jfpVZKBf^v$Ww41Ohj<7Oy
z4OF5wep*=#qj17Hkjtq{YABxj<Ta-OW%RC+)U{d5!(X@c5<4$J=&1)xms8fTNuEa_
zEyk6Dm4FEAqM!2b62$SyD_PT2amMz~C>xI(hbi;wG@8t<c!&>3`v~Xmv|5YkDRf~{
zTN}e!c^Z2kg<NudlF0>NU0Eem`XrIVPrf@^!Ff#twIaRL^1}Br_AGF*3tL&%5XB6J
zj;CN~;l}EZKz6s(db4Jugb>$d<+v#(?dWJKRBh<`PD)BhwFsjQ4guD;A9dB*?JX@i
z4Yu|Sfy+wWXgWr;bk@>OVH4YDHN*Taq5Le-<CxV{`-wL#c2_Tv<zvRS%VNaa=<!Wc
zSl2p^Q%R-KOEiGnc)+*HH>dvq40^(8H)=C_3^}m(S$z+uXk9-*2c;Vt_VHn5X!_X9
zKAdc59k9Gv{$eS$6R~*h_IS+~;X^|KsFCIVT<Zd@=zkA%xGm~2h2yt3Tlr^;b%{bu
z)=F$2ZwrSf<a0~@#bb&q(VmM!(y4z<Bw@pwG%FfSDhIal(KHV>R<yK1&%5qNkgS^F
zNZT+1JXv%90F{yZGm7+9Y1A>&&e=T(z#c-@L0Z!g0A}1O6H+97@%B?xRI-kk%_FQW
zg`wo++PwkeOq*TQ<J0M#D~N6`yoas2r&XwmNhl<aq6X$hyEY21@q_UNu}38g5(6W}
zfCYJ0o7B~GkxL8QUmT;|a=mW@#FkIp^iL*8<NbY`o{+88HQMLIBaTXT8yB^<E%;h3
zW230$k9|ZfJ?`~`{5aQ{qiPSCvRWxk$nduPRn-$$v5lf(lo9-^+vCAhQOC=iwop%`
zY4oxdQ^&dEfCdnzmQT+%Dd@~?aRYU~<x8eTs?A>6Ofp14;lq`>bsbGj6I$3B*MXc|
zeU%{@EweS~lSk>zI%+l<V2#4u*;vV?!9y8+F=zv_$yI9lzK-z(ux(+(N#LQ*tF3C1
zh$-6WoO_<jr=F^bRd!oyy5650Z;q-s*(I>+V6QCdEop;L-$w((gRoc*SEfPG6*Z^U
zsxmrZk{!WTRGlNIQ%Kn+iH~y)i*1mV#lFUiu8Iza>-I%N%4+&B=3CreI7Ic2QE8Q0
zRH7CzTzg35FG8x(dTOId4XCAvJ8m2RUJccnG!g61qtj~-r1SbuVxZR-#WDNc7|Erm
zsMNrvke8QWgTnOApVReiQi?h{s^`Zm1{)|J*s6}0>8EL0n<lAfmAA<uYW4j>3MzI<
zMDXXh*aOQ-XBArPRNd^JqK+ymZ$e<!J&n0{pOu2v^*E=L#S;vUX|Q-+g`w$HI{Xd%
z<fiZPQ5F3cL!*n-FgcFl$)kc&{iG|)6{KT2ebr_Lyg)^=4`p#TR8&V1rnwI|<r6-m
zNumK54U!Tuo2(~N>-2Kh328tVIUSW8R8^)gJ9{*`cTLpS>J6`x8NIHz)H+_93jwNv
zCgV5@57K>2s54I{Di_TY23!XSO;@a{<_{i|nlEpVjHeaS5h*vbRn>hxpv_GA=-kL3
zYu%U&$!qj^q?!AtJ3+*e9EEQMKTzut%<3w=#iMtm<B~oQoi|CSH&uvg0!GAS+bFg`
zQIuQV6@#y1XsI=rsmG_NRXL5od3hmfdUvS0!i}Dv<{wuOz+;Wi*sEPzqiU#HDx-Uw
zPayV4IB@w(q0>#KxrU-3A~_Ek0dq?Z`Y#zpt+41dZA(&s!CypSd%sMfycAbY%U`6|
zfn3JB7i*ithm~<psnGsj&S-JBWth};*k!N$oiiT$oL{mr$2h;#XOa#(H`U!mq*hV-
zb8UiaV4e!gOBd$@fM|WMXSHWFT4^SXhk_kzgeOk*9JF<2j-l;oy_<7_s~j)6l6hBA
z4b@vwO$*xV?eCT6Ra$hkx{K;!aC=F<ISbJ`lU0njY>|dJ!;!&QI@#R%lF0AwDY!?Z
z4o&u1QR^&<CdT%)*XI17_1#J~v_6tio=D^&ok1bAjU~<pEF&md+BN~}F}6LyM~@Xu
zDt19oHAhA2!uLz+a?pT&fvS6IDrsILC-rz+E{lZ8TNor?x7B+7lLZZ36X~lUV_wnv
zNWuCh#}v?$lf9lj(w>zNW6l6tD&0<^wj&KI<2$iu94fxEql-?}9NJjOh@J;zE|YIn
zk0$NE-5B;HmW;N!($&<ugXF5d=R0v1xce=qKu1RfOfvw`V>})~S31n!>Kc2X3}l-}
zwcXlP7L}yV$B9nh>saR3O(?Yg08m<epH1{fQfY3YYfS78Xtjw~m73KC(rm)MXA)0C
z2r$m(5zbJ5`oCC;Q44CFBT2SKLSA!PVOZe$J;$mw-8IlXn^}?Fc_&iqQn98u8uHf@
zwA+;GI*Of6AYboydv;b7v>uDEJa=z`rsm}7j-aBg9(yBeJx^Km#0MOkSy<^&!s&NJ
z?UHv3)M)hmCa#6-E)94b5tZhBRZPt*Q!b16ZW#oBFjsi$HkgYh>6*POP-QDGBZli`
zr;oBGqp0AWhBst+@Uawn!z-XIwWVsX)1Vb3I3IU#xt+etMvJNro~G0)jZ1HL@(&2j
zYfh`tBaV25qiD-`1S@`)k{VsH%y#&?XIxiC>KDN?zl7`ucu6$ktrmmi>5+7oU9qlf
zeQX1k6T;eRJyAtprn_+i+s)U__1Zmtn?L8MCH&PihxvJL!Bat7s?@~j86&{pw)qO{
zD^c0aJZVahFXEQ8*|jptcY9jyZnN#wDr%?<Wu?G3lAWpO^=_(j>P7R9lua}Y*dq-M
zc*2X8ibgKz%hOWK+JfROm7%4iuJ+x|EH+KlDW`<`zn62E(~{7&Jt3$;BR?-y0CZ)x
z4z@xunrfMzHkc%F65B{DEo`dx!|OTJ?PlY9U2R=K1iqwfec12NP!Q<#+I4GQ+GiVN
zIl~SKBG${vI!LtqJ=5f(-%nQ)i(i%!xAS_ML~*)Cx_DkL=JT~s=(>e7<K0q3QnXm#
zvamX&Gml8i>NThT0J|x-$%3c?qeRm64M+V#o))pr=N1cN)3h)ea~#cS1G>t^By!IE
zmyMhO!nvfXbvytxoum6ICg@LPC*maqED%Wc008W~T3wZOl0tK1Yaa{KzY_I^I*HBP
zZoGp{o>uCnZKcd7CfHKOo0}~*xSo~LT5Qy?wrJ$^&4B~TyVSi+LYL8&kJXf7>bpj(
zY_u^tH&_b-FT%a0l7C&Vfr0D>#l>}BEga1#mD&iJn|w|OV8M;w@T0A%XnWZdTR*6H
zR~qN>X`fL8eL98<mfMx)_1fh_+(-_NrLM}8#+d6P0L?%$zpF1BK@`n1dW1x9;0{~z
ztn@QmN*zxnL#C%c?Y`W6Dm^Z)Jw`BL{{W`1AFdaEiHDKkqv~p^DOv?3JcoWB#}Cp{
zrCy4vYitLqbegBgCXMeV_agTS!=vlOf53U$BSu)`%CXbuo}vbcfZPUJRMP15)kD^W
zq8XczL9(wOp&E^CmNm6h(+iEUkT@$Jsa3qXK*n6O@)6Z^wJm9mcNcaJ2yT`!GgEyH
zV7s6C9DAmDsS;RQW^$+V4|tkDN%#ngYGYds<Y(B0yVtsDl!2AdW+VF8proaum)%cb
zPwE~Pf?0Yr)5Kz7&_Qu@HW|wbw5F~6lme1=?qj$%{VKy+rW9w?X}R(iYO1-iG0b*<
z$WJ^Lsfi5yS*_6Er7mocyL)^23T<YG^NiUGcAhr@%JYg{Zlg)mSyN3RC8sSsI4?)j
zdX9@#q7%U8#WP2~KH#oTg~n;Vj-Q!HXrX^e%*K~UNx$hgP5jIBq9b|Q=Hly17PC%i
zcFOG8dH(=f*T*ZI*qjZ&NnKJ(v_>zx4Ai=|M@%DZn@<?U(6sNDQ+t^u#^cJ%QPH}-
zMwdR$1$swH(J~+-sBgO1a#aftDl)paO4ib|^Dq}ZfZT*NH6)cVnP8B?Q5nuTUb9&f
zAf>(tw+FiOy>rx#uh*b}?!UQ>9H`AoFGoxur5h&Fb?VAM+Ipv(9B#e}wy3LQ;B0$b
z=XVHgDmqO?o2IAO{v6UW6!lsw=%w{3noNAzJY?REcNDfAQKr*Y)9;K3=V<x@sUfMU
zqN)+tfqa9)J{?F#?Xxtrj2zh|O(W`$uMOm3;ox8QOT}{7%2K08rD}{ZG@sNKk{wcl
zu9!inv|ssN2MYtIFvab4!5xZP%D1q%9^5XK#T>0R%WkHOMBpiAYnV<P(z9|&t3@*}
zAF9jY-NF)mY0*t=5)JHotKOZ}DeEpTat>SJLT`)FXm7CnHoVix9Ix&(@RwVthGzP(
zv|8TamY~tRmbt-~?tx`10e7bI>y8OXpENX;6s)3sMOUp!C#L4RARMjEh{<JRTQi$`
zey-tp?Q9iPHRgJ9Mshr@$4cr9pHBS4?$@^t3n+n6Yf+?CIyobj#JGE2I4jFK!%wQA
zsCy=9+k7uqi>v5kX@XC1{*tKrsrr7cr${Y}U9Pr5s+^x_91=XIN1nQtru5Eqj6Amd
zEu{-#)EdW46JwZgd#p&3N;<+Dk9C?t^iGkVP1Ye4(^?vvTH_Z!S2kF?v!@J_RLcrT
z2#K+qI1GJJRMc?qv)S$Q;W~XHu7upYy@Q8@4P|+z8;iZ8lBHQFdxe&Dx*QcT-X`7T
ze(MdcX_|(YQVU{xTiWY?)0NQ68)b^5NY@@OkgWAs;MAfp$q4l}@<vm^rP?&DuFp8>
z?M=*?rQXK^GQAs1siM^441U<=BEj8?^DTczsnV*$-~PdMn(pJ^qi8i3!}=awi~x96
zjMPqNjkmK;uTcJ7?rCkE{ffkDnuDpIw)bxzMWK^keM~-uZQLzpymHlt)&}~Aw{dU>
zoAMFiZ$k2}%bh=2osDw?-00of{3hzuaaK3f{U@8My&>_$@YzM$d#wb{g^<{d(UHn6
zaUMUpLlM~1Pd%Im1q@}Wp_olgE0_Vn3A((#i6l5VosV@&?R2v2k+%cS1q<ca^~0l5
z>Z<)om^U`L0c7?1I=JO=EH}E)bmvghK315v$16rbI4fcKN*!(zY}QWPxE|@F7{wEm
z<tBK)<)$wFD@Z+x8m5|P?C=O4LiKT=K{WExJTwt|Ds59kl7j7;E5vv<;X0ICqEdvG
z*-_K7I!GH0Np{CzKfzYikX2AsA6oK4e@n+?KAjwNZriuif#)qfzE+cAr=}A}{{U4+
z>=Jor)kh>6c8cSYYMA!ES?P#luVI3+deqf4vc5TEdvk(9)@gFniO6fL9l$3ATvgD~
z*U}j3Vrj-420}$O5|168VWmwk=ESY{UywVmLDIBH^}0`2PkW)OX!kM7EhD3%iceY@
z1ITx|w(PwdK+)l3Y?3C3=4j+5oR?@wCv?n3A5GU6i0T8`BMu10Ro!6J8AbV7w;yeT
zyse>`fQaiNvxg4@g*^21lhTlOxE=^mmPFB28fS)T5?5*E+uHX>f7Naj6gt+|fbox&
zvg?{jX(MxCV3rpj84Cp35hL!=$>YMVB&LPQk;UxPL0wHyz;_ICn>;X^%M*qBwP#_b
zk{L@$cHbkiG&*~N!frbb=(uE$ObU4A+ALWdPXyo)I88K!8?yrW3c5*V1jqpda;K!M
zmGN$A1dc)~Sr8mx8Y%43>w-Il9Q0x1bZ`2%xKRFZkPVK1vWj}A#sk44<RYgpXxt-2
zGg3Gna-)hLPab<IUtZY&I0wJV8P!?1AS2C-!4rB;85s+OC#x0MZ6}W^HdbxU3TUe#
z<h0m~qOvf2X^Plh4%Y(5k18qSdrh9p9>gOBb0==cG;i$X!gjs3a2WH--za_}ziZ2U
z`B9de+Q|17wA&U@J<N6pvTu<K@jk)!lH0c@!iCLnaV){^3M`g`e&f357C2`Iv0Iuq
z#KFMd%Sd;Gpj)0odz>0<>wFc?b4b1}7UqHRv^qKDg~81C3-GMz>S^i#y_)XfQ<;D_
z!h&g9PUbsnl%*9S*yiKerXnj?f%QPvLf1OYBK@qYA=O;ZYx8dEaj3Dv{gk-4vfSe&
zImPWIl7aAhq2-Tt>~{|dvsK3+4JQ8pJ`(|RKTFkPIw3gThS|~Ozf?pr2`ujY(-|Qr
zx5_|Sa(F5JM9KVPYblJ5yH3+@2yaE%W6hoA7%DdVUB#0nk~eYBmA*jyVC@pZeWcsM
zo7Iucv368`s2t=bK1T9A!~7&}{SKo;CMNeL&L7O9Gj0}l?w%)$hkJrk98VWzmQtfQ
zr?L_QvC56{TOeE`V5cr3$mlfRP~P8A5%~q+iUQGacq%Cyp9N`av?J&lAs*q`X6jn_
zURfhZAooof*sduN0$Ou~_w9JNAQc1U7wnsJ$l*U?wnsVI?1dX%>+S_iT-S}SA9W0o
zxx5>XD9{rRrJgyzhbXhV6&+nYooid=2*;3aMgCQUPW9p2%Yu}b7igqqYM2{au;it2
zYlXNeB?XQl!ySreBQ^)IOqGiCA&Jd5y~mKGEn}Os;mLwWM~+8?pv5O1*K?JcW{q?=
zZNUy*vuL*?{3UQKHh%}YW2CkQQ0zSp^o_0!!hArJXAAgIvCcWgmk9tiI7`KiXeq2?
zfNYl|$mAw$lAYH+=AP@KlmZ(k*r~(D+Z?o|X`^;NEwVH@gkQpb@-XhmCy^7kMr;&<
zp|2UX?<pKCbs&Q0F~Q9zaL6j&gIXpb4Cg(a;Zgd6)+I*!9EB{Hl$A00mz7ngaUu8l
zP{muh)_X_QRTnt3X>n6Qj(he=3<(G1E=(<vn}7}oXSPVeIV>r(wGu)_jlwX^9HSNv
zJ&Lqok*oyT``T<%&1=}*udv4{^1vN|?KVMAPcB+T+u2nlB!cMbm?RfH*26-Y2Z6o0
zBMZ-IW0jJ7fh@n=Ek2D<VGZun{g9fjg--O%jFilgwsS#m(N<S<>{SddjNaL|aICb-
zwmvXJgNKg_z`7y}nBWg}B{qiQdEIuGEitz10h^Gl^cuPvg4$Zhgf$<^{{ZDG_fn($
z`5=v_&6O2iieV+Pw4C8lWWK=h?AB6AEjbX&cSdm16}25StruwZpms|RRzs(2s;M5@
zdZwC+VZlGCp>4GKsA2)}NIf%=l^Lk9{{U!|T}9Kcg|4pA-flh4iunsYr}aFP@)~-8
zV|eEM*7H)UWX=wNZFuI`y2o`UnGJi4>}w*NaxGxxI{O(-`wyVkOXRy<YySW(@KwxJ
z@yyN4b({uUb>{K4@Vje)_V)0NgHn4AB(sMO9FMA;u_w`GEgNc$V8<V)BX>05g-2c~
zE1Kp$!KaUe6SWB?0J__UaI31Mozh*TwcPzvLL69<YJqF|eoA>ABU)brznpRqPKL69
z!PhcEcs>=>I-Pwe_eZ)v+$$OhDQg;E5NIy_aXT$?>T+~NC1o6Xgxf(G9#iAh%x}xf
zeBAP_X3*QU^3n^AT^Z%SMPK;_xLCv<2R9iCUhH*a-7PI+chkMm&)&wssf6|Ji)4-5
zZOHDXpwI)rnh&WL{VPeQ>AuFcM%>$!u4r_d?8LzT0ONXcw`0k`JQZTfcwRtt<9}-{
zR-w~WwXMT8N!Wm><)p0AUFhminW;hc%m=xj{352GMxsh6{UiKLf;m0Vnyo&;z5*@D
z3g()h_zjvF8&OXF91Z^fbTvkv`2j6A2etBz4NS;MUclnVIJL>}Rg&vD*hgwzG-M_D
zYrm*}%BcSUPM#@T!0<@IYF>o4UBOVsfJ65LRCT_Q^&<AW`xQwI9IO`vgWk&5O{NaB
zWp3v8O8)?{lWiJJFIIx62&col6`-f2XlCu8j?N1$Nu&lJQj~`db|3g!jTXGb!3)`T
z@Ie_1CXqIq8B<B>+?IlT*-`3RP<`wT$8pG8A4#Y9up5u*@PgE%j#!PokNEO~bi)?W
zjEhjJpp#^;acIL_f8`rBZ6#|4_BJ_fhqs3+%KEl8tkTwvt~hIm!9dm0O9|Z(E{x{L
zaO7I(BD6Xu`>*g?qNb&er`*Tc{{S2xstuKr#NC%JY3y@l9CfA{gX0B<!QiSwEfSoO
zV>J*K1X;tnYbnOyT;kUb;S~;}1!Fck%#-CktaBW9w{vgGeaC2(CM>Z&dS6aviDUX9
z=r?Jy38<xTZSGi6&6TVH(Z1uj{{YH@uthsB8-pL?%AE2!X^$LfY`><}sjFfhrJE(P
z0t-`wHuA<r`M6Y6&f5L5UA_u1K4y%*?J8X{)JWY}?^A4-2g;fmo46Lb-$cpa5{q0L
zp*<O4f3)r%5x=8X*`(7onwmKQckv?rm8NAy9-~erfQaS(mv>%r+L>ZE*}0v;<Rd7x
zMzq<N`W{w$H8S^7jsq!*c*9@Ch_%%PR+BBvv_+&0mKALVr43N@Ywq~S_R0LrD4619
zJA<Q>)QIr*ri{4hh~j2xr*smC>TVi&VHh7mj0}8E6Vgm1i=U^#SDJ>OO;HD_W*h$i
zFz&Mzw9`?)d@p{_kN)zW)PT8mixDj~QM2Rp<p-POeF`8{%}&j)9=ullLy`4a$H^q1
z7PvLzw*dbD;TJ)w7|4oyvBMcb#i8v<7ZK4=RvpbDjwsX9P*ua}O5MH)LDI6GW4XIx
ze`3?^D)NT1rju{xFDyUSIcj+2qBF;47pQt-yG$;Xv6)~Q+y+4TRa8}Pi0#Q97rDVD
zC4Da~m5vrG8P&ZF6r1Yw_Xyv~9g66VOCaM$Zi=osS_7T5_)<?5-MP5=3W4pYq^L1U
z(#JILkEYZfHn97Lg+wb3ihp*=hB&$+N>W+sM(<I+JA@>z62=_d{3cUXPfGpFaV+i=
z0Flf$_Yb;e($j9;td9?-t!Z;lr7!j<S(xa^W5(a`P%<M9+I%Gv2Y0dm04c5l*ve^W
zBY-{-?8C_f<J#`ZP0f2lWEmgL-9hghw73rIgS_N_ghJUnm_f~)6CWPXUNV+BF=JxV
zq$GZ({>uP>co<Fu52#KoYr%D_?)gk`Ao*A|MAu}EA>(Q6LW%KgBpidmUF~)5a(M8R
zZ*R1Vj_U%*h2wY){gj|F=bfj)OmkW|_YW7y`YyP&$G8mqg^W7xVZR}9Yb5Z~@VGc1
zkh|JN@IF$TV;t85XK*+nAtv@bDX(F*z!Bv#NWmMJap5t)*pbLuag{3{`}jkP3>*E^
z_!n+$v4R{h2=Cbr_JhD5ME1x*9Ilqm7aXi$a}0+zQJ0n-r<G?*BW<<TCf(Om(lS>2
zMf@#Eg4hFO5AH*k2^`mZii)C=SWj|1ro%18pU0GHjbW^-u(3<Kcsp_|gmVLh+Cp2o
zg6+k*D;S)(u%|YlUna<NIC%G9+Sg2w;`jTY&@b#bR1k1*l14``y?`pck~m}a1w2xc
zMUB3zbP=*b<{S1y)Y6GTAP?DEM&R*hSf<GkAEw-PTEVntr=xpL1-u~Sjm$pl*!Nn)
z8()V5{{VyyRUOGT1tgJZyC}q07ir3Cm`UQrANg0t>$SG{PHZiCw+FgZjNKK@4`~6|
zPA#);6^rN{w%{S33!)hWg}8^6f&zFZ{z6|(ju-$G=^1w$3lxoOt__ORZ(~{=8Txro
zZ0_%prfF-(xC^1?h_HeV5dN8{A%}VG<u&j(X(PIUk1aO2M8`W_gUZPPg0}2&u}>Mu
z!B3Hwxlx9?{1m`r<C)CO`{f%AOI`qX2vEz6i=;6SZr&2Mf|x}1B)O#q`5f0-*!WXI
zOHGREh{J~KT?+dRgP(aeLsT{3@qmbqCo#gt!4N}U4ad=E`j`R<%T1BdP8{3a1yM{v
z+&{98Cpm{JIH$BSm!?{iyOhVr@S%=hJbbA{mucZDW^3q%Nc@lNnX~@Tr*nm^*+=(x
z?x?m6k!w9f=E!2Dd*qkR(9|6-u5}PKO)Yrjwa&3X={kI-Q8V)4oBXXcHovJ;$LK<0
zX&BrapX{vEqQ73wbk*#prqZhP+M^pKnx0l1mb-<ei&@qxD2+7L^%W8EX%66kBCcr+
zj+A<j<dl6gO*B?>gPebv8c%Pqd)Gr~=q(_0kz5?)3nPsMRYb-;Iv2RKWHenJ6tfC#
zvQUeWiEqN2O_q8+@=#S4R5*K&WuNpiRs~H#QrW~c1hzmj9x|>eDcu+>U@mvYR)eCt
zGg#KDzd0nq;n{gSFKp=knbI`Kh3Fubp}(o_ZPk=(`3U6|(cx5jS5QvSX*8O-N0!D_
zcUL>Epwk~4bc)j*js1j>K8xvIrs^FpN2PPBClE9Y27mCpuUP9{F1nU_iFFAZ7$h~$
zHYHCcRTZRY#XYm;tuD5zuC7XIpIwd)v)XRgeZuse1E(4^$JR$%O$lhfr!XL&xLC(k
zM?X;1)HC>wbIqM=k}kJeHi@k3L5*mZ3T$1)wp4^$RtGLEnR-D6r>l`usWOrVJKW+A
zyXda;odx>lwfRj5#ON45i8IZbev4xtPUzITC?Te0WoPv}HvN^=4^G3QFjUOb6o)ou
zEQ7`Uo8_}VUC>ig5GiV1Pd6s*20z_rHU6GuE88u8tm!S<CRuCxi(99piO&^5r1IV0
z<S!}euBl{>aT5cZSQMO6Hz_jyDYQB|ntHlTQhiQHj%g|($L^%+9;BzKosxcDJv0H9
zvO5#^SWb_ZQq;PJCs9+$BLTat%Z2Mz{S~NnC!_huY3bu_u0hH%$0#(z`o7Groj*`(
z&onwsOPLwNr8psMG{3^0mx`QKbuO(@Sx|D}zQBEz?wipu>9nDdYEaYIWV4lw{6vPQ
zOoP;es6A3Y_TB}`IWlBQq8xF@dkfa|?ts#x^yu`cCwF5Yxj^ZiD^;u?S5494qoz6B
z;k4V~V{})~Eo&<4T-W+%aBl25Z)?94Cyz}ORP^kQ!r8J+aA|UzvGU|!#t5&~x^ja`
zKlPHnSqCi!!BNRqM-#}U)8S|z%;wyx-BYNlH3`Y6c_f~}Yx)mChg7rYcqabeaIyO*
zNy*nlWl>gAvbwHj?T#WxZL!!Zj+)SQEnchBeRNa}8Q&;5TmJya)M(LchK3hLIR&D{
zQtG<SlPnKtiS)98VgUqQ89^?M9E=OA`fit}sbZ{yshLqIAUZhQ2yy=aAy&JsrlzM9
z^b)<Yk?tpjMNvheYIS>Rt0mLqx&HvEW!w+J3JIwwG>U^1TAe<o2*cXje*XX}X|#uR
zEwGB7tkj5ebqU)o&A<)1&FXr^MRbL*Lg3(kP-au#M?F<pm5|6;f7Au`{nnMW)RdG>
z6I8-yZw253`>DK5%an>naY~REOT;0j^{cAO$NvDEF1PHg+1D<i-42(hu;SNnz5f7Z
zPqJNdwm4}v0ORgEg{|Fv0r+jvy(deh$Ljhnsx9|9#1nPfjof~b$&#<^`MXi8>kUS|
z)fDvAkq4XYh!%o_uBPf2krjTOQwv@Cp5_}bs(QCe)AZ{)I*NGWBL%j?^3J;JUY?<(
zbu>k@R)Jt*eZ#)0a!^AlKSoERsww(pin@BOvyq*r+<q0dwfKbRNa~2BKbdg0Fh6Bq
z)7>qo^=rjlQI4JhZZ?ZL%WtRj4vC|*OFRN+jPG&WsG~Nv=wH(8#p#;nqgoARY)*U6
z07rzB6`f@#P{UtArUu6oy`o+STj}*JCr@U^G8VLU!l2c9>Y5N?q>I#dZH-IDE3uTN
z=^AZst2&EN(>)5EKAM@~wl{U`u#)N(5>4qn>@Eh!X}YG>_3ozCZxt;Az;_*r?w08t
zc6zf>sz~}~oZM&oDC#|Es^t4UH=<&rz@4#3_x5)yZ&jnm4Iz@z#~rVR<Schf)O5Cp
z&AOFjPm#Z>?iatnIaj)`;x|Rlr@D!??`yW%qS;)zeCb~tW5dV2$npOG#M$6xuNx^U
z*-+;?&TCD``ma^!DqRR@aa2`PL+Wh>*KLjLy#6|FnmV+#?51^Ot~<Am-|&}R>e^~(
z9TQ=im;q~o5B3SxM$)xxFB)AlS=Bnui9+Z4F^dk@UT3UzwJ4}8f*8;Jq+Me*oocI5
zsC;zOx<P;D!781)Uaz~>G?Nj2Ldq^%V7lzn>blS7rE8r|#)JIL7DUok(ulwh7Pkts
zK+`AGh^Lk**!$$${uiZa9T%cQMhulKmQpO}p3SaBH5IV9xjh*c8abE@cM|*+6;7+E
zP_V}Y&Tu%|2P@F@f5LjrR;PBKTN5F^TH|K`y%rz9-6oSq^<}D%)$G3ayN{xJ)tSA~
z^Cpwiy7yC8pH4S6J>K^;T!Hjk>aW95plM>dnnqVSt=%h2Z7A|U@AO6fS6JzetZV5b
zyl}hqGX=u^*Q4vyx{p@qEuT-OiO(Y>dtSr;04W{UL!}hY8jbam(7E&#O^z}>!QB4<
z@UA*fsQQOeV{|&bwN&Hu%J%Lp9uLBXZkDgp>fbd*OQUc;@JA~{&|O2*`XzMK_2M?Z
zPtx++3;j`8<69BU-i+^4X}WHmSjIW5r*wdyZX17qtBrKj(d?t2a6IjHKV^B<Owsz6
zUwauiWKrdgz6tnMmAx@FGX%P1Zm70g8gfvpV>UxaUs~a|qL4`se{Ida%1N}nI(mre
z>7jXHIctvPq|$XgHja&+y*ugWZXDgd>#MB?N~hE-KR-t#OcEc`({J1$l%*v>PBDpj
z&@?nOv_ayW$M6O2v=x*ZeDS(SXY`&ku$(HvInx_wZ6IM$^(R%)K}KHJwWo&;>#@ls
za@D;Romr{2iL%qVz}y=j3&*;HR+>p4vhN`O04TlD-A%8*Qm-tg+(9<I?zBBA(^Jm_
zCNwUR`MC?4QjhYHWql-4^k%O5YI5dH=se`L?ZHvj!&R>8mt=xAms-P%uR@3L>ZZ1E
z=^<n>oR+n#Wz(Gpq-kysZ97=+=G~jFT)&aQ4Ov)t*(K=nofoHdT4sPCCEiB`8$UpG
z2C;agtuV&_0MynDuV{{nk|;LD%YncMNoppE{+`{f?BGA;c>Yi4YfwjKKLY;%lRV!@
z{1Vb4h#Io_U2K;-{uaZhI$n#Xz-1s0Xy97KTrk#$hXP*IZ7boF+4p1ng1qT@dGjl_
zU*g9PM37YwJ?tSirl>i)cYTxQm5_o9K^|3IT|_PfwX2IRX>{JglI;k_LA-~$#PGUb
zQa2Aw+;~BHKC|%R0r0JK+IPUvBye+kUyy>t+fG4pu87@E+NifUS;2KYdmpg05&hMZ
z+``Y{w?6}vBR4Wl(zLXEr<N*u6+7%UnbET?_MYkr>A`RTmrBQnI_w_RGog-V-rHO}
zr<OO;2A0aFHSoO4Yc%Cibq=?77yu>C$HF(OHKu9Q62|)jW#SZ{h%Ap^mMZoW4(m0=
zc78X-j$FIx37Sq2zh&)bMrpdt&Zw9<(vx=&3a+d0wu(|?^{0Wy^qXL<zJt{LKTumF
zQnjS=2@3M7UD3ZR<GMFAcE1bj;~2szBg<}5c6jYy;f-#X(<C*Xqd>jE<zMtBpHt{c
zT^{2Ju_KT|AFaB|k{F*AB$o%}0nj!2gq5PUCpnEhyEzV4%~jE}lUt4>u+wgHd)Zp(
z`u!}fx9RdYRNA|JX$^0tBYnNiXys(}omLo0d{>S@Gxb?atGYFxiWQJgrX7wOhFkD~
z{4drSwT!9_bJ}p{a=g=6>i5<&^3n&FH@&$Cu9VcQ9iL9;x++fXi8_+e^tEqL(6Wbi
z;klq>FE;9Kv846fVUV^#n}V`6I<;G=oY5(BN6pusYg5cC-qJ`U+;}KFj!ZlhQRq6?
zUR9b&BaU|7-MLvFp02B{)I{<<*WG*fMD({u)@zW8gFeXbpCNkRO8yd1#Yo8wL#2O^
z`vs#F?TaSfkwa5d>8P6#Hy~laWPMgzp|uUJ0#`V+8-jRVw^`AU>1{H_Dc(D|_x-}m
z>M&_C%4y_~Hm$kz+hQH}LA4jLlx+{`-FVSJ8L`qj-^vw#T6LXU>12i@wlXZ{ykvb9
zwuMav8=EuQ8E+__uBPd&OHXs9YZ)+aEmnE-N8;Jxb$YdRP}tv5%|Fe}k$peY^%YeO
z^%`E+oP)?(zLL;jt<)ydVGID0<~hd;QAtAm16OS>rAiplV#x+t@1aY|!^VwoMd*-e
zdQ&5N0By2tvOkDS(b-kLo;EUYZ@72*g|n*Gp&Dsx9@`O&@UegTSnAbpsi>H^IR2B^
zDa|>$OlZ<p$+}vjN7pGF+G&|dslY$my|?^@MXPGlH&WYFz{w*vb=zWoR;isGrPDAu
zfsoAJBnHJ{diAYr;j>ildojEmkdj$kT1}LWH6>`(X`hJ@Gf$IA)Z_Iji1v}lK0=F1
z>Y6&UBp3m|rLO*9vATYX{;N+P`h225c@8-W>JEj}gTZS{55WHb3W?hjilS+CM?qBS
zVts}G06|d4SxWk*RzmHP?z@^+gHPyMhmdD3bB{kN=AWQMZU#t3-p9gqE+RPC4OLuv
zo|s^O2FwT1V2u>@8phdTaP-f+8D5L3boE}E!8JYhw>S$qsOvPr!dV&{Q5p9>)<1N9
zep1<%8eNup-%Y;1r_E-V{{UOjW#1Xgg}g61rDLQwEjz*eiu5S@jxh^npqJB<-^5_y
z%OljXz}nNOQM52WGO&5>Q%bJT618E_I-a7KHO<>FAE{T(qZ*Lo49&lXA>h>MrH^}g
z`0Svn)GFf^XeGUz6x(B}qTi)qZ8c`sg2|e44gp@PO(h<qLK?y&or44%uPW*HL#)Qe
zHdnHuGw!&_TM90g)}@KAqpEX@zeB~qKLr@%OGcC%*+bV+&lPlYNA4{)aqNDo+JmRt
zsc8(Yh9Jqd-OXnOS;Nq}-9&(D&3@bS82<pu(bDv-c8Lc1S3XGXa0$3Y#r7(ax@^g4
znmyum+IL>WDfL)mp{Kot$HJPkUmA9%TT@2pUgPdJ_LWQ4I_)gf<?u)j;lN!nlw3$k
zElAAk8mk`1hC3tYga=Pe6YImC1A)d+Cr_@`Wj~f}u6!wB(rc(s@fzm1XLXdNG?>wY
zX17!`XtB3app*uK$Ax>*--x<CrtwLvQi^$a5&`W$KMT(5b%{L#Nm33)fjkvYp}ezL
zYb0m=JDu;hkA)nNQ+B&62{>t=L{-vJZ54D=wan$Eq*$sAa+gHbWCpq>`i&MKKFBwL
zNu{=3GE(SV+w9%K^KPuyrV}}l$?v_5mRRQnO@>p1x<{w!y$7Jj{8~0l_B$kcm$JO0
z>6$7c9~@7&kXO$-XHjbOl7G_b6%iicuQvUb=chXNS*9&zZByrk$CJoOK2$z7x;<X2
zNRC)c)OCA^AE1sGpY??LfQ9tZA85cOF0HBRFzwVd>gTjclEIN=ESkkutpSRw(UHTw
ztW;Fol^3oiU#7Jx?JrpoR6LqVFmJ-uRp_<Nu6CtI7q3kJ0B|hLm2?oryumaVZSdpS
zZS)vwsI=|+blcl(u;dj-2G{B*Du1vA7K+-)8!MqX9_F|z{a>O*dynKB`FUD6>{b0I
zT4^+obv~yX;BYx<9DNp+mI!rvR@Z3tB53)$doF0UofdS}o>|jW0)tR?pR3+EI056@
z<)YNOUV)VEsibIV@3%Hu-Fv2KHJvz$f?}*__Q*K}W4|x2=#>njtEg<W&cj|tK80y1
zcA2AASag*IJ3wpN2`8T`U0<feXuvy6U|^eEEPJV|=xSM27~KnoK<tUtb@z%-PB(5m
z2BW`YJ+gzSbbx1-)Xy&4`hX}c9w#-e7j?XokdNuPrhca@Yk`cvAULV|w@;peoa$Oz
zOO5@^<R6sJLbq;$+9hj4`5nqytw6&ExY%3wSp7e#YGpo=WQ=|P07JM|dWYtuqunqL
zX&Bl#TJ2L8i?b!x6%yB0Y+*Z3ASrYm9yuw4T-$gyQ&Ca+^*-=zer&anQ^7|??Xg`r
zqN0v$vTd25AEwXg7i}jaJgqlQ>UNUB_b0Jf?x1Vxs<yG^t{<o2YWf>Vlk%;7bX!Tl
ze{=GkN7%BLrd(<j)Z1j-Kyeuh4Xe_{G{2aNJ~Bw<Yx=8AlA4&z8@@J-+rrD~_4M!!
zr24SA-1i?<J5AFHO)Ev0PHB|2@sC;NH{00Zjip^hNmWTwDeG9-7;wpage?K4hza3%
z0E>XG*{Z_&Z$?J7!{?BP1X)e6Ip|$Z@hcqLbA$~>vlJx9v^C?um1QM$A&t>KL7oNp
zSk9u710$_*ZVEDVQDahD4%Icw!I#{u!}UpjJsj+5A&$M<$W--n)X4JKfq%la>5V>L
zP)$)MwZ|+|omH_TY0>QcFR0S>Cr>&k-VCf|i%%=fwbxhl{<84c-eZvV7qYq2w7ShA
zq*v*)xrB1j`dk*AMIO5gY9)oOscpA3_fx~l60}=1qbSon%C}jlsHZ-pE)DZ+EbFN1
zYNu<XeVXHIh3;?Z%1NNvEjwBW$hH+#S4q&u9q3pe=^d9`@;^ruAs=U!9+`8d4s?#O
z9FHnlG^)Kc`jPG+b8hQPse`1>TPEi;91=gu9i2l>Q4`^GK(vbkZt3vNWK}N3$rlH%
zjEz>SBOSK>;o9gi>Q_w7%yD2j##O`mR<~KKbhMyHY}>n)=9SYrg(Gh~B!=SlNs*|H
zjX7)<hed3xZ1lDk!n<se(!>j+bF4FqkeAUkZS^5LUERHkf{R{_nu+|wY!9@zwUoX`
z*>x23SWrn<t4wKsLrDEjT8#^)$h>mXHQD`pQ5r2CpI7PDLIYSu$!{%Qg`*m1VQXKt
z!rYGO+|-q!9jzE?`bIj7{{RV*No+U^U1T-rYP6{xO;X*>;e>Wx%dNf_Kwk^PZP|Ix
zRSIoFmCT*wJ-j$_3WJ?J4wb4f)H-<7x5>)}E<C3QtF%WK$9KYiQ+pL*(r;xX($h;~
z*Bm)q>yU`F`6Vsg5ghhiE-FgV1l(msZ7o#>u|!#R!#hW`lCm8^Q#~ZcIY$Q$9nji@
zQ&LuX)bhMA^3ZrvRF>CMhe%7D25zCswpm56R>uyf{49w`!37gZr&sCIGmt^SZ*=WG
z2;h5MM;sBzS{7Ed(T2Xq<s`CD@yGTuou0YfIKS0f!$us<%pCJ&LswfAX6%p;gd2L0
z!!3jF@pUDYtrU3E_FHQqo|eZn1N})lVyHki$l>mHKL`qH(W+LkOaN)cg4j}YoF)M@
z9_Eq7_*TVown}O-(Vyyicnn6eoa~XgAa_-?I*aC|Ae-XO3ty>p$E`|O44aQ&cvPdK
zD(MHR$y``_E{tu*vz~P>jJ<sn8;pg`7tYkmSR5YNX=N>uxod$(YkE~xI3?FD^Wg!e
z?}k9fWNu8{W-8?ljrT}(tY>bUt+X-suzBIZU2FObb#$(&(?cXBxAe#J4~6IYo{TDK
z1kt!T;9nh-T{YGkmVr2=uH7v#HV!8(P;qc~6QNB_RFDldbec}I_OM9<gT2we3)D1@
zprop!X?WW$u<r;;s$QS#3UMp;Hlz$l+&NRt)0&o*8^lgCuzr_(ByKZyimQsIFIQAP
zqU||6-?0k`6>PLM*S+Jv={=UI!mh3{y@Yl+;Z)ajrCXk7zo^e4bSOmSbCs6Vm2_H+
zV#GD%TK@p~L+Tn!Z@7bg#X+U%Qba6n9HZ4MD`?1T$#VylSV}!IQn_>uJVuyta)PSW
z<b{Sm<>Nh(&{Vp<Cmo>MkQ1piYI>P1P!88%*l>)a8EDazqGPoR_sadYBp(W@qMAt<
zZNXb!rRiDp{{Z8_M6eTfxCL3IQ?hrM<r`go3g+X*=;&EFEtyu+RnoXfOMwRkX*B+z
z)Env9<%PZct9q>(M#ceXbZ3QES*4g;xuXkOkhIe`9X(oW<ZSZ0_`rhim3^q1ddgQr
zGg=PZ73R7<T}1=f`x4vp;b`U61w>*-Zr$JIOXH?=#&))5^$_}6;|}5)3b)Z~q=BW6
z0nxt>Z(^%8CP`B{aA~<w(7H$*8z?1&+l+;HTU$A@C3cINs%AqwCyD3KcQ*c2eWuo!
z;}Fd7_8SJgcv<4@toFFMhme^`R%z#Je^dnIcv8!X_KM@l>6*~`oilAj65QV5r-Bxz
zK<avGig6)uj#mD*94vh`ODh}sR^9C&ZFhxNs#8=@J9|rkZd&3004XDl(DIV(^&L-J
zr<#=6?YhS^s4M8JTw{}b1ms_Zmu{g`P%h`V4&#N-no4u(WzFssWr9m(p_UC%wAHmS
zSwJ4#k}?9#!x&_l76*j7UZn%bEO4>@QjVUORKn>g-reBksj)sRT(Gn-(?=skh}=*T
zv-0wg>jZOmHK01<=G-Xe9;1E2=gRaGw0Z6{$Z%s0Xt^KUD1A7?_pog}z)z-zV^Qh1
zBeqdhl&^`+E@5Fx=`oeil#HgHJ3Xa_->d%sDJnGP?6J#F^LSCj;hP+y*)y3I%odQf
zS(TJEdS{|}$6|$bCH>9htIC6L=HBga;PzGJuZWQBglHfKPnO%5O}mBPl$7MO{>sUc
zH~`^;-4hgylMlzjR+rJ6WfQddg`XKDc?rRjaQlaO@~@3QqzsUqz>DojL=yrF06oF%
zmXLWrvWT)_$TuC57~LQs8#}_Ynhl&A+xH3wF|YV=?h&NT$)cUknU5@ZBf&`dWfl$=
z9&E1|#!U&1b^`9sL%xq;EyIUoI7G^FD&6Y6mu^pm3+0e|UJFQ8h7U~LxUzeqhIS3$
z2O-8NWhpX^)3`fp+iUPrNFTH~WO-In(T~vJ2=a%DBNU`Lq_HxJeG2B$TPs|9Wimfd
z06;eIuHQ_@jm&TEp)}#Aa35ckc%XA-V3ET%xbCH7q<{i4T4p>K#@zR6htXlnTVvcM
za6$Q58)gl4h&fJthZee(u!1jar?xg9W1D53IEUq6W^xUl(r?0Sj&+G{LMm7TFhMQs
zn%3<C!|s_u3-UGwT;kNjyn-4}DDuXWa4h7$n{(~TG?BS7uVaYXK_6u3qNs*TJ9gg1
z9OeRU1+1SOz<&+m{{UVJNmtR6VOnX3vd=qwSzA-R(EG6F`B}%iW4)HQgiSV}V-|V#
z_XS0v)Qw21jzP4L*LXeE9=l0PQr8n^zu^H@RM!pAOV1<1tgWt{t=i+fb|DTAv<B>|
zt%SunWz!h)){NXHNh_t0x!k2_B#bVISdNK}o&gJ*2u*89$Wm^<WkGC>@ihB|*F^U~
z{lg(h0Qx47I7-k~f+R82MVva=C<g~d{jV1aTRo24-aIGD88ZQIAtg}F@<UxsE1>ll
z3)$R`LKwxkhXRbHnrc(+vzz?Qz6vq)^!2g&)MsR)^)UBEuq0PT;^z8q&A3p_5o4|n
z5ienD?B?xw>{HlTBR0Ok`BQq?MZEwQ?H3=ibXz6COsI{~$!80<vx1K0sn*bq?t>(R
z*bYaP1D`ZT*Sl9oR(N*`Qds7B2tTG8AvFg7096^3gK_&Vk%Io-6c4x`2+|4)6O&_n
zspF{ZLIMYeVBr+VcQ=cKB?Q8lL7O)nl(9^C{>UdW(G2CjRE!(hxrYA$M5+k|NVtk%
z;cKS8SH^cY_f@dWTI(C!c}2wLNZ=fojSpc^SGeK%`ztDU$1n|eyGZ3%MM^Jl+qe9q
zsp+2+gV}d5^YE5bGTC5s_}IW&K^{VgLiipmJ)M$z(?CPn?qTJq${Ay+Acqf@l$#A8
zszYJDjv%8Ms1SBYNH(x2DwcX}-48v&36(6B#j;!;{z67j-Dy=+@<tl_18h3!bqGW7
z;kliP#>FJfZ}250zAmlwty*T06+>>`5T;~V!AldKHk%F!R*a*4D{|84&vDrX(HooU
zK>HsG$4u0NoGI#T2LSd-ErysJq3m|%xR#y@9<G~v3)zyd>h$)IWT$Ys$!+jeB$AlR
znm>mle^VT^WFt=WQAtK6n*$@1HExvG0_brdTG|?D>YwT`S;)G*2umLJ03176J(;>Z
z&Kij*>U}Df5Z?C-Pe(@#@U~WuRwrX{<SDfcJ{d0!YeQT=On@e7G?f~3`>Du$XO<ou
zvtVtp)f!Kv325~pKilf5>hw9{ajBp$@>oCNZlHWKv>02mKt1t0{{XzHA#4tD*fz=C
zr~VT2Xen8V(yQK1%An@FU^?0RtIBvGp3fFz{Eq6zyGp03JA`0Kf7A#0K{k$hNj*6j
z?U%v24oQ?qk_cT*F6Irc{>5ME(nB}_;jzejb}G6!i{lQtBHZ{&*xc6K-oWxZDY)ol
zUTtJ<+aXd&+9}~NPR7W>JF3&ZT4A-`qk9p^S?yM~uTOb4bEEU&BwJ2~X*3&K)3q9O
z&aLU`L5$`~SN?~6JQT`Gx>~muIx|a9+&(Ar55kW~>LIzM&*!&fexS-7QG!An9K(qk
zGyAJL7T6x49@v~YX$vP=M<JBSAGlwE*=ap#sc#iSM6vd8P!G#F`=jrY5mMqBO%&8k
z1-m3*$A0SjO`#5GYk(y1LV}_gOG~30N+Uv^R?Zkr+Da~5fmE!yq|&C0hcto$H~l+#
z5;X02?my*Q>7k|}xM3P$VQ%I-X|mrP5_9F*pJ9@l^^LzHgtIydxQPUA_(s;mNG))|
zS<31e;gHKtU18ekCl^{8F1suBohllZmQ=;Oe=El!W#n~6kvM{K>1he}xb|CW8u(>C
zjZLGFV>}eyLrbTtVPlxbH1<=5SwYh%_Kba16m>C)sa<k&WCWBBlorUs(zFfIq|)Xk
zjwT{_J&~`aj-nwfWNrhp?2OaeB`DdBWfZVH2L}=4c3KTF?%EkNf$TU1N=!_Dr89P)
zo(e1dErf|+aTm$(gs1ie1d5$kORRy$qKVt%KdGI<0kfBjA7q0B6|RZ0MPT4a9n#il
z^xA`cNW&tU*mnS_b6qj&jMJj1mYlvZ>NI~XvJmZ>QxR)U(mzlt!StGrnK$XcIRk>6
z_C;1pgG6$V)$*E?=qcA_Y&CCVtmhje<D5tX+wE}v=z6LLIk#oO9|%~B>ECHMJRZq7
z1+vkz#Ua}znJ1DtOqv*-Yk<i+9>q6ga<kst{{Sga{$xNsIhuC%C2l6M(mHB$?#;XR
zMAK@IV{s<Y-@!vRvO8>;Zi}%Tg&fpiv)7`LuW9Z70N)Ccr>0I{(R-)rdyRnwr;*tm
zBvDkyxrA~0Nm!U<k_p42KAZco+$(6SpCdK`St#HtOBHlYWZes>Q^v=gmk$M1)e|H^
zj&9d>DCsImcG}3?TsU)7-;@<_pH9vxcOJ*JB9@m>tf7-@?&$B>;chyARs6&QWA~0r
z9m>VkLnS+lWN9q}HyH?xDUvnKnu+#zf{dV=v?`YAo}EC}7y7hM^rYp{o(eu%*SaFv
z8@1#4NabSm?N&h0+Lji)aNw>Ps>d@#RaQNlAmk~jGzmeJJzEtuKzoZeNH{j`vE({8
zmbhRqK-MYasHSsXH?;njwP3YcO1cTX#K{pja9ud3WM>^{mKol_3tVm7gkW%z#1IdW
z-Bdw1Kcv~-5iFF43*h)xB&e_k*5#+lHX5Dd(wuH@7d?=4vNA^5+>hN7%6Ar$({b1o
zY{*Gt+wP3ry_6(^FW<tPTzfzujzJ5H8vA0!Y72Ho*N@WRmGt)>q%OyCbjLBxCgR~M
z3z+@PIYb0x7Gwend~e)*9|(~6sxbD3KhI?hv21Y!Sz{brLRKF30Y(k5mo3T2T8(0s
z0&df^_(;hJHh3g=Dd63r*$J{-HqRGoP}aqB1M?ZW7ESTLb&bb$J8s`|39@;Sj`qE|
zOb7iCM<ZX!v%IHo+H6Iy!bu{wMUz9nk<G$W6N9+pl-z@X_DlzFk`u%4`mj8vGdQ#!
zLTChJAKgDT&+d?bN6N<ZD=ba;DM{xbBo-h6gpN74fAX=t3w+}ROASG2=KlZ+1ABNO
zM)#JRzQB11EdaCzIY9?$!Vao|moAOgDj4Q1;`z<|qGPGJH|EK#4Kldzf<o5<Gvz!T
z%r-d*XMXZ-2f~Sj0pJyov^GX~Ha-etcedc;;G!CLTfdZ&$GBp|juQnCk=%aCyY1)7
zk)*VcMZoTn&1;9ZzjUKr5<yY{8?%&KWDagEWme`nyeT1hVFKth8!W)N`AAuli>P9p
z9)D7uhWYc|V06fz6I?$?P|HZ%Ii|<q9gAlLMDpSKaz0Y=`W;Kt0**-{HjrJYg9KG=
zJ1unAIgdHxjD-%_B0J)7BfwgPbOl{N_?>?!HsIKg-Cspi$wtXQ-NC{hs*R5qj==u_
zWEfP6pwL_h?2+v~#qON;J~xo-ruv<%k(5tbB77j_yr|sUTz5o^9D`)w!2aEqLC_GC
zvfH>sLnKlF0RhS?n2ct`Tp`0;*IXQ<Le-W<n{o})<FO!E1M-EZskMXfJgLi?<93^b
zANFLnOz45mKFPZXJ4i_!gdE<=Ocz`nrCpRt#Pk|Q0)j}32}ic$l*fjf<11_qG=Q68
zEa0N3rfbKw6C`_h{>lx`X}1e>3ILKh7;(Z_<*~D`{{WR>=7+b+2BICVbA``^lT0GK
zn_}u8Q~u(RJn(Lp{{YcXKt+u`3!e__0>x)Rr8b(M^Fv_WjQ3GeNwy-#lefTE+D@R#
zdPh?}7;0d6!(|z7(R4P>Rj0CsIGZfwM%?#SETxViy{`3-^pK)4wig#iy4T>Tqn)md
z<ZrdWST{u5noc+UAHXR6CW@m_t7H_Ek9>rSmUvavJ0_fZuN%0v*0)Elew0kKak@#5
z0fAQ%-$rTGp0Crt>RKk56hepI8<6J<DvqN3Rf|X81#D5$N(b`tvO(Q@)B?t()KMM@
z<Schvei_xp1MBrIc1a{6<=p=Ol({7c>9AviZ0@i8PNLL{<Asl&M<3Sn$IvW`be^f!
z18W&gGicmyFURbN=w64WtF09$R*%$$;E3d5v#hsWd96u8Dd=K>u-&%y8#TZr)Oy(0
zdPQeS=+No%#Wc)p)i%U-#n!i|Dti7sFd8j3o*GvRU8DnLoanmI{;3s3LoQnD?Qy#H
zr)#<;T?-<6<!%P{Yy@32q$*U;0)wcv9-nijtBQ71Jmk5zztF1PfAJezs;6=M!-G#@
zeaqanO+Tcjf$uJn`*K?50zdd!EqcGBqtK^qJro8|(gx_-K|fTkX-8pEP3Zadvs2Y|
zN%l9_l(^tnuSxti{2Z><{XIikmC@6aaUXN_R)2?GQA*l*DC#s?H?gkv$Rqa!ys!LI
z&@??e(%R?91{w!-(T;J7x+jyB(luH~PHDY8rwV#1T6Qs_+lT>B>m5O+X|lM<Qun*F
z7&k8}*1r^W&3>TAPFqb&e>ov*dUsyYC!k}0G$E`5B-z(1UpH(<xRsqr)*9`8_;ei>
zvSL4&##RPR6R7oFLw3B%iZD&~yb*u8^_@enbiFyv673Z%<gtZ>kCl+>Zn&oF4MHtD
z^KsF}EO$uj6ZcCv!E9(wO;RSH(YiZLqHL8D%Pfr^=%hB!#gnD0=^Ot5(m_tkavsb7
z0F+!kKmMmgC@E<ss&%&d;DQIru%P@IqK9opx2^gt?$(|@sTA8?l=#eCwKT7*EvJf^
z?CcvA(b_Cp<aG_GqSI<@4gUa!!WzA6r#dgEwBj42R!~+r^4A+VT~=zp=n+0Tm|}&k
z7!GJi@+fVUSd^6>Td(S!K|K%-{KQXav5bpf?!4Bum9td2&w@d7?j`=<wqJ-ncMW}8
zprMVPp*AIk!}e9WeIA!4o@#Yw)IIJvbZ_JAv@*P#T>~Z<;?nHT&e|v#*0Q2mp8i->
z?@!CpI#m<uwP+mq#zS51Y5OAIqx9G19ajxhut)|3rr`b7Css5Qz07>OtWIx*MI{mq
zHciysb?Zv_^jb#ILBP$*&uG*dpHXT}f*)3S9CMXrp!Bplj-nd+pF$Im^N_Z5%%$jk
zP8ym@h$ndcKsw-rB`;$}H_@r+pTZuXZ8K&SQ9$0{3ze&H;r6QtA)4gOleRDwmqY$C
zXtL9_wXKD&IJ2>2Pg(vdbnQGv)Z#Y2-^%cAxbpc9Jr{;6(?^m1A@q+~(+56XR$97o
z$PXhQMd!5i`duWVNuqz|8hzI{y4m%A;#R4vm&K>j&i0-h)|HRbX|);5ve(4uu5W1t
z!faE?C2~{=#w(+9)16HeH06*~dLTCqcLfEn^_^qGqh(nGf)*yJjBAIc@YfS;D@nRP
zUS^vfs^+#@XJp%!{Z~uM-mHqlOwn{^i&@mw9;Hm;ICo~}C3|O1^nXfev`sD$87-4>
zd#|7LuB>*A2c*)_M>a<f#L4A|vDD%I91cQ9l7B<SG4^|9bXpxVo+PV<@s2P7YR79D
zln#5N(juOv-}VcS-Fe=dTVJfzw96ye2J7VZUYVflT6UQeV%Z+>J8|_($CvVSRy4Mc
zFY4VtT&^xP8f2_tKdHjRDf%lzgg13lgWS%~<!*ZOtf=Imd@(o|5n*9q7m<x(NNTsT
zR{~AB<p|VY>S@Ke+dU$wt(X`o;%heGmf>CW&X1zSPwMJX38g%joBqqssWob-V{J@Z
zp3~mf7gsc$MI^NQWQ=jkQz<`0+-(<qV+Tw&oVuS&hBuBJ(UpP~&@yjJbE9W$-pa#R
zt^CYl&$17ux>~2HwQ)-e%xo4feXoxQT${EU)duw5pI@nKOr@hPa~yx&2Mu1;LDKZP
z4wx#nNuMQ!-6Mtel|N1NeIG{XW@sXGjt#rRvQN=@?^gA#MRiov?0eZx+qAX!1pFkY
zCrEqZt(*Rx>WUL1<83=VHvXC6efNCX57*scUk04$>FcHRoq`Ln2mCJ)sMjc|+V9KN
zO-DC|oH+?cs10r9vr8nz8y6R3EU~o3=9)LORgzbRx>}O<1AAWfTb_*SkMw80neho>
zlv>@#(Pug<rXZ-&HikI33xYW%U^@D*QPOK=qk?BRvDgm7f~>TKgSKve68fTn^U5M?
z+(`W|7A-#u%&DRO08*@Dr=*e4lkRkRAymUrsp?K^>LzrAadCg{v|28gs>c5SQIi%E
zotDW#U$Dum(XyfGoh_8jk}9ptBZrZH{t&v&Z5E8e)>X|LfW?i%f+knFp}UJ;YY+!0
zx*Zydt|wFLR5DNMewm^-bbn+yQL6hfb^5J-x2Q3(xIMtwI5xuHC2smNO4exD=}f0-
z8E8M<X!>vP`kj=aw1Aek^u6N5g}BjrUDVcevfkZ^!r45GI917kLUVMH=2i51%}lO}
z38gm{2b(IoPr|)#RH@ymS2#rDa@G!4y^0Db4a96N9|}g)GW$eAKcew`pUT_+0F3U#
z;?mjYJu~=4rD)Q!aL`^dOa0ed_%!MYSc6$i(Qkxsl$KcJChZQ**OQyc$&qcHQO6kc
zh?pB|HJ}fo5~iQsxGOd~Hj5hs*|t5l+kchE#@A&zQ!A-h;B&$!(}}}tfcQ%u*1Oy-
zZdA37g^+rJ-(;#au(?|Yju9BMKm)P{wnns{QI;cu6AeW~lWYLYKr_FA`2PS2HdPtJ
zYMZ&8oD(dKtpUcnDe7w^bo&FHZv__0SIQdkU=@XZ6)B8J0NfBU)_zgqH#E2&EtMAs
z%HG3vv{~u&vBb=P4|Lk+21pD%9zvFl?x<$q!ry|MBO2K*@o-feeG{$OH4O2vUBm2|
zT;|kBBaB!T8K)*tU~nMv4`pEu2Fpkav$-k;ld-yW3t)?Mg6LgJU54?x))-b#n33s$
z&t*-o#P(6iBRK;AtrbRFdpuk5zgwNOuJpkY3|MCC#G5s3P%iwN-hAy_pT!QKb9HeH
ztvf@F+DfF;`jVDA80oGC2tC)*{xcGWEB4MmE=|ji(FT=8sYu^a2;UpOq}?4nde9pS
zo&oNRr|Pj8-yJC1=E}w$ef8`n8gV17`aoWnCfUrRMnnA*QI?<?!<-4Y9#-?EwQ4;w
zkJ6c;rGnYz5u!&^sRpuWOe_wy_T{R}slN{@XVV34p7QCVZQR#jy{O7M6+MB=)l`z)
zwe};om5b`Cm@A~-((IgArc?C$>!18LIyW~C2eQ-YJrx{L2Td`M9FpU~NU^rG#&fMQ
zi=rZi8rB^~iSknuXE?`wt8>&{FQ-EYuhXm}c)1q936#=Dq7ugeD*)o)t8F){wAmtk
zIfS|=eyGbqQk-O%@RUq-E}2&yP>a!f;*eqBTqjp_j3m3(Bs=+EZVK1w_0&*QlS4C|
z1C7K_8E41Q6V#LbZi>{fY?O;}hb!a8oNaa{OszWfX1W_%gQe@gD_qt~O7GO)`3qgC
zYSU6T{X;<1H_}Kq7|Fihh2~Rq&Z|{3#LaUgKcMzfXb@^TCZYKqOLG|G`knepS>lq~
z4mqajnkufO)pcnkrxIF2$-R)eUXuEHp!&F6$pPFXJQX~YRL!a~M)1~~5a4(!_K#D5
z!})5++W5y0x~yWWWajDUD6)!pJw`tBG<}vYUX8A(cce>SdpLF~?_8~;qJ`2^%nJ|B
zLd46fHlnWZ$P0nV@|DvxTdOwO1q~phWRbYVR^0CxB~|r*Ub;GGX;pNwRIp%3PFj40
z(&}xCOD<)bAZ?vx<@&txR#%%H*K%o9QWo2G%~Vyog;gV81cmJGF0ZtXwVHwv4NPQ~
zi(c74bVUrZLFh0RKGy(@6?svlvRD3FQKZ>(cDxL%p}xb(*F`?L)pgZ3G?MRQh5+O&
zopznBYPXZpxF;m9RMR>;Oax6z;lKHsPxo3{T`Gncz%6JtwSd7{V2#@g%IcBi--pzC
zpHEh`)e)H^ko}jx^#1@*Xz!$8ovmpfs1d@$YOjirow2pi-;7|Y3e8%au(_l)!?o6u
z`W7zxJ>8DdXJD3&c-`K><S3`ArDwKBHKcj&zG0iJYjn!?no5_ot~mwR3h?#SeRU}Y
zP0|6|kfkSHiYT7lsOma!fz6Pxi!TcNP5hL4o2I0Fo<+!L!m-fmYjq}*RZ#DNbh_?~
z1hDTfYiuu)vWxA8y(7(-`j*+j?vJ?epq9F^<;`)pI4JFMdRj8(7w$d+XGzr1R?J|X
zws|&dld0IQ6egP!gFyq6m9o=gps9<~n{09h;`}*Abb(I$ID1?!(iPU1(+--Q&zhQM
z;`c2@N!F2^RqUlS(`gmWnT;$Qiw;8CbU#`$ioP=}hijZSG29hj3H+w&ElMFIEpM{?
ztj@CfXlDj7c!|Zi3VeBf$bL#ct3I>S^<6HzPh~?K!Yz9e6;`ROP`(LbjDcZdyo>Pu
zx;m{qM@Lm5a~tl7&d=EqsMb%p!SWb@{Z}@+=uNb9(kTA`6AL7T!N+yU*!K4NuQQ|d
zDrWR1c5iR0(sf?1Pe(bL3BNSM`q)kW%NlihZ}kCD14|iy(|$e_-nuE;J>#ajN+)QM
zPfpM!Xd8!>Thzvu7##$#k5RbXLhr-ww}er$GbjWO3Bgqzd#zGx5=$gcY;t(=xpGai
zxZ_3_T#_Lxnp)Qn@SxHgO4_*ndBkld+pMZ)mP-9nIyl}M`5m+u91p7A(sX521sI%3
z9c7#RNbUX=<7zf6s!oD+TKDO+kBN^1dp(j2w1wt1wAGar4|^hefjqBZ>8eU;q4Z{n
zk8fz?9DOdeadiHhJOSUAg^mNjPO|e`V!Tw(0ix2}BMy=~A1I*{spJ60WN-A0mFT@o
zK|@3y=*xT%yxO~06k3dRFpylwgJ%nZr}L?3XNAXUn~s(-*Xiac2s1^*PUM9spmepx
z)b0GVjQw%EV3mE+RXsn|nsaJt+ZLaxFn*>RT>k*!8K}6^N+Q%_V1EL3_fTt#v#Jv0
zshOIJcamJ;wo%CQ^hW7gjMP7*62r(v*i7QfGExP@nt2Mcv94?OwYCQa{grWL**uu^
zQFVkL>sqWr29dqib-4@LzY4TEojR5uLNgmSi;l%%dOnhjYHW35K^F$=-}Dnr6(a<D
zcJ09nr}b*iM%~aJv!%r(ezPpeEyBQcBu@-<HBdFto=umhY84O$l3oqhp7pgsY%hEu
zI01Fbk}2%AIklq;MbwU@noT}<_pqBr<DH>LGbt)Jxt`aPaBi_$_N3R=zIGQz=9>_S
z)Adm3gvG#-o>0e$U9z*wdPaed0$)#1Xl~EZCv_?6R>v3RBLb%9X!%)PXInLKgSx~8
zK}lUBE7>DtAl+7Yljxer&s@_q8aZNY{+l<Pliuj)bl*&oX1Tl&LeFU(M8OM8hi!&W
zl`UUX)0YQBHU}ykQe~8zLAr*G0eO}d20Oi$SEzqAM&_2dx;xl~ematxNI^C}Y_mO2
zskP7-1`@|A?kdqYP5#84KS<ijrp!Pj9D=<Xk?_S#8D@`#<UKj9x{{z0E=O+mTNt%>
zY7yQG-1Z!*M=hdK#akuo4Pnh_qojALBm@!Jt2d@})RSI#o?9XR0CF?ITMZ{cbcfZE
zg~i!7$qM{w@l!NE^pU|sg>8%SYLVxU(kh^i%(w%$gaoxUG>_RPZfptewcSOm#S@D_
z0D+&C=UVoz*@*?&?30$qjG8atX{c`JxW?izgqusPtE+7}XD9V}37sLSeq@?WM*9Hv
zNI45*r@T{2&|KM=@6#a4M>>&o-C0*h(#(Z`7T@fSW|YX9Z(;RX=*>IneM^ggvRbuc
zsw#aL$!I3m9g=2y(6F)>^(8)<MI7-uNX`St@+*BWQekkZrv#4n@#RNN(xvq6sB=A5
zxMy}$&``R7S*-RR$i+CVhE*<&44T~~MJW!H2iq$ZuWNsnoS3H%w;4cnSdxeus(Ap7
z->6@OnxulFx^3-ok*@y8$CTKODE3<F8kD-LUg={2z*_d@1*B=v)l>lB8bRbM$_);2
z9iBa><0?9;fAs2r=&T&ND}u2TP0^|8xM5?P6WAk>xMYA~%V7wj^b2Yj*2+f*hXsz%
zt6-jldv>^T)5!WK*4Dho>AB}4+E*;{TBcest)jQB>8YUq0IH^QK@Q6<v9iSmruz?L
z$6ywdRf2lBjB*lgEF3viRQe@MQi3iVIB;7IDRFx==999|p|xrBeMPi&g~plq4?KMe
z+I0nGeuWU!=s~HWIg&n0K0@=UBB+GB^8lZ!^bUd4;MR1xw7Fg!_BO??<!W&n;=yUU
zwjE*{(@Gi-AmYd^W}a3!%G;3O4VG7_w2F-fTzhERSsUGZb_++-`h>GUDeIkf57Pet
z2^?GKWYl{pHcK4dt3ejzA}aOM{+}frr`qA%qqVAMGGZbk$0Na5zN3hi7w#d$uqvt(
zOF}%5y^O7>gr9rbtBq_8mt!OizkbTHnwqAva=`N7tY*<CftQts&B#Sze!%jtL~qsI
z4BniK8Q|Fx+PNwXqjBBX1eDrrb+MS=`iBR)4V2XsQyC%L3lHf%)fO0&d7B?Fsr3tA
zxE~04=%jzWrq1kE&q$w5*695jfFrDE!+^EZYBZ?ZBcrz0fsYPU{{S6UiG0k<=rdJO
zR08pFe>Yym(c1Jrn**K*wn1K7QqRjcwc~}<x{;?hWQ2VRP7XZ>nwMw1RO)mtln?+=
zPpQ+3hOvhDBe7mTN!2Bi22B3|X~1_jRuF5_nLYmiqqCHpr)4<Cv}<+O(M-eqA!2wq
zvc=ZYK@~`mzoecPj-IZYR)f>t8B*RnIaX9qNi5!+ptJ*(Xklyi5zTZ(1ydto0Pbkz
zP<1=$WVsEwwrm!F(=wIh08TsiR9d?mDJ={G?1o828WC&*r)sB-%{22CIlNhV4u{o_
zdp{|u4U!B8c5?E&&8E}`ScYE&EkzYoHl+&$qzCqJ?zv?fc8-`zl}O!8`gTq#pkqjI
z_m0jV`9xlsv3_om&3q330CF+NSxRb|X`(PV?~LOr3EMR>GSbu$xMif^{42sULQTP%
zN|(?`!z52{$nF+Xs9hAXI@Tm`LeExeH8EAVwZseLUkYkkqg2-d?{|+YNxLH$E6~jl
z7S<n4+?=&*A~F8}xgDDJk8@U3(mFSppmy0ClHV%Amr`W7kZh1(rTHJC%Nq7-scIV~
zIc$)J#_TzS^YmFwQ%<Kfh14xEo_4#CuJlUi>H&$~*EI{Q(9gfti;<hEsW;g^F<lW*
zhx&Ub=H1Zq!5qd$3tV<8NOcw%%u^PL2X$RlQs2yeu6v<8N$w_wUraMh)7dnIfHvch
z?&`)(HL$kqZHIB;S82u4o3X{RH!VI@^)*YUjK@26$Oq~i6)qBe6>~_ZeG42zh`-7z
zZ4xQq4~zioXXQj>mOVwVK0qRIvAUa875aOGkTl5%$?s)cb8*y(WQw0gcD0gIII+Wo
z6jcoqSlG1k7Kc!LT7*8J0kT^lEcBG6vRn%lX;B#8vqz%THl6XlG7AZ{zoluaKQCVZ
zZr1Pq#bPv&_Bz9l3htg)M1O`zB|-0_qQ1js(`o%8!UJA7J{4VMDW|unEDs(Eb#+9~
zcJ?@lS~xw_5>?h!Qy65XHu)JJL>pmBfu96ZN*zo5Ie(eGo%BZ2RaDZvdaQFxM?I7}
zWDbYi;7PxJ%U0N<uA^&Q)|Y|Jxl)oyv|FK+GR0RG*_zgpE{Ct8bYQuL?d^m$L{iZ^
zZHuGr@T7-Omt}>EPaCqWj{O|@60j%xPHxu&`>Sd?*s3A?t#7zm!Tu0aHaXZ%0q}z^
zbY~zcN<5H}n~Mn5^!HIadmXwnmXM;Sd!NOwe`NFO&jB&WUf%JObg@UUf*MDVLKfn-
zH7Pv_Ei0VDK_B=+xsC&4!65gy3c=)t?`_;W+mN~Mjz;eo@)E3<re}?%Xr`TpCyN_`
zQ$PAg)L(^VEDbqji%v-Lgls;UB$HxO@<66KnrRw6ggAEy+Aqt^C;dR$c)x`Na5&lV
zw{ShelBx;giL*JDZT|pJ9DP*V`WZo|Y$~@;4UCo@!;n=g;%RvV?0DnlA4{o84Wpki
zo(h9gbv&1Rb_AQ@NlIzcFTyPYLf!IgZMP5Zrj{qL+3m1EM^R~kX(7!#`C3Y9ifuvx
z9GhD$t@TDzk~Co!P`)1a!VY#8-q{M)zKWufLuYP`sC@>=z~&M1(y0ezrTXcWV88UW
z*<42KIA^*s@H4Tw@VTPR4Vk9hoC2y;N$d_bx+BN6E7}OSM7gDdBYO`DH$!i9d1+Vx
zmfCl;q;pv#OTn=UV#jjPW85C-dwa<jYra+m4FI%@kEl}yMJqY`_)TkpJ6;k<$1%ao
z{{Zl#K=v`f#_vu3=AH_P@s_&Ycqowe$O}#ng$Jl(f2QGa{tyWRgMqQng&XB`ZnK6F
zp4Z^mwD?iU5I)yfwFYEF*D_&nY*aF}+pI;u!j5QVrgy0kyL>0XR@sKfu%Th5G0t#l
zW4^@)F_$6S_C8gajjm}I2jvc1XBN0&1x9I=o|Lz{N%<E_-%+RCaut)|*g*pAOfj|m
z3p@O$&@G@dM;yN9*{|@JAlhv4o1&fUcGnIPl1pq&)><{+V7`DO7WyU_#z43|!Yj>+
zM*!os+@>%$rc(&9u~WDfoaA;s5|GypMb<G3SS`(piOnF~VM^wf+$Qeq?5qkJEbc{*
z`BK5TuiYEAI4IrmmCPhM<B{1-q2kHvWptnyv|M)xDKE$<@%%>ITX%#lOEbBcJ=&+s
z?4ynC0~t3rWAYHs8*gK9r8aS~!A)}r=PA&=kl1cH<vQ*H*GTxt&Qqc|vxUd_Mf3qT
z6Os~;92BL47U6Jc?uCp3=9W6)SZTEa;iRGEZWIkAj<_}<H)35HsGyE!<O6VnpG}gT
z{-hVTj>;`2yoYTj-wQ=gEON84_)~U^MJXbl0R=<0J&kO`&vaCJXmPw}YrHAzwAM)7
z?Dn{15#<X_Su7F=s{zIvDE|PI8~O`~Z7UrMwn_lc*sH2`0Kn!R-NG6PscIS`s{y-*
zwd02=n@uengQI`1PJVI}B+5r&Eo2h{EEy;Co(iw6qLw#$wEqCZc*?ep2<4B|j?TAl
z39-qw`z3AIaq<#a{A{JB)g*Jh8nLnC`MVTrpk+YahCj213Dx>!Z##kC8Q|N5jHIZJ
zoV9?-ACbsZO)_mbvN~yB1ny^pk=U&T5vHw<?Do8J7Dv>mhC(N4Exm)RtSAje=E(!C
zZ{{EJm7%#BX8N$o)^5S#<ybfmPduO9S5iIIQ3lV4qFXcIc#5QMi?hJ}KUFy);^=f*
z#M*4X#4eHx<akBYPe-e<uZByL`dmL#PlBVU(*FQ64(P1#axL9a4KBKZv)81N&2vr5
z4+rXzMK@?;OQbe>DcahMf^hM{TF7J$gdRfAXnK<>;n`CdWB7AV{3~`b(EFjgnf*7&
zMceFOVrm+6HSrSBXIjfQB^^$gAr>!)oVUl(YT}RqzC0f7IJ%Cd(Nwg8+dKM7Sm-Rz
zFh?b&ibH=r!fkBiI5?X~JN7DSx>rLXk}I_T0F)%pZ1Ipl5)MI3&BU8Z*JJg>RUX$I
z2OjH8T^z9nxCbzWf^{p27iqBIqp7PZX=4q!bbc?w4H+5<<Mc1-o3s2V88HsAI6vJ1
z2DKZ%SG*h({{WP;)I)8|aIx$P6dz@+B!U?UiN?<TO*|>;scEYtA?+C%1!rGYc5aE~
z&F1&WL{aMliB0}OR;<l51*r7nY20Ltmqc@Z?LjbAP`eLwkssVG9F_Z_FOAK39JL7@
zMHNlNZUOz+@Az3Z2)39jW_;0!A(I{3$S5k7%GYmY*x~%Wio6t1mU^^<YsVwXV2P5Q
zlDA}ox0JU<lCUi`@Kt{fQe%C%D4LBbwuz#)mhX&Y?a3efB%4MPw7M4-$lff9(RC`V
zHR1}u=_0+2`zkGym522I08zss6!VbDM*#5Us->PO*=GAm?6Lhp(zJTjDX!6{Y;_jC
z)|?an00m`qzN6MOI?<==5J~B@*hqP5tY4y1OSF20bKMZLnoE56RJC&!o$(OhIZlIH
zhNhjR(uo-1hk}5vib71VJKB646qB0hF^{sdRhE*i-q#3bAKazWsw$#p+lfH^(6x}Y
z#?NR6`hpe;nu<3QnPW=h%@n>R<waX0ZKMDn2MVr9%rftR;8^~ZJXKV+(b?D|w{U{1
zVW%V?dwUR;5pgqUvU6#*C@w%`qrw)Jrd={&4M0Ab;^N_E>UDW&rVe3sugFK!>#ePe
zWYLELJF8O>Y}r%G9F6s&w6XG8e1u2k86!PvC*1!4GYRgp6pxykK`b&Iha`Acl$A2b
z&sv^Q9K*Qa{X&GJvWuz=n1}xW4ruZ@4hp)rO^L+1A8GCIj*nS_rNWa@V1lEDxNz^G
zOEC~W(l{3OavMgfDU4FKBH0>A961Uir>K+Bk<E%j#l{@8H;Mda=t{jZI-q?!HRB*2
z>ABZtQB0(D9MrBXE#A)r@$_9JEs$B(dkF8yRuRuVE$OQmT*1SL%YN!<V~z3ej>h~E
z{{ShJglp`}&!#=3x)*Pc`a#G`Pe)S#FM;HF7v)?!CvWv4_DDGgf{~L4zhl5-`{M;V
zkQ$<?(K4j%+3CzXc~jER%^jO7cQdgZwG~&VNaN~6LGSJ5MNM5<M(wlz01=nL?iJ%V
zS|cd0Vb0UNSVyP><LvI?SIZ4vnLn#eOXKb@*<Wdu@lHr<n;VV@ISx`+QwKEcjDy{u
z_*qWfF)5Jg^J$vALMek;As^jP>-r6TmociLE-~LDu~R;Q-l3kA+e=UB?iKcnt~^Ki
zO7@4ai+j7Q(}veWUG`>lZFV}J;MBCW;{+Z;zm66@FzB7Q6$ems%>`&RT5N(TIodzr
zR%umLdTgQ!tPVGJDl<v$B_i2y%9qnTvvJ$qr3YUuQ?<g@Cy;n5!f7e1BD07Owg^=&
zh0Ung;tNj%B#fByNT9FM%zLJQmkZpqoP;er&j)0Hk@VqgDs<`NfXv9t+1|>!DhMl2
z@T|#)BgtJ*&0ola!^?3i1K%IMH}TzAY1*#W221Tedld~{oi#JaEFkwiiV8@#lF}?y
z<0SecC^(xIM;%)O+HP&1Aq`niBwXP3a8w#~eMK9`xR!;eqSYy@8W}Fo<L82%Kd~sT
zFS!kt*5ctt_C1c=2R;>@Z3%7N7D4Q*#^~?|x5B`&j3MJZ-<2ql%^sYME{u+Qg$vpU
z+{=e2M=8F?ji=49R-mEfjVA)(F@tHdvefX>+_auJU3TrsvK<DjZ>Hw^m`#(LBVEo9
zbg_^LJ(HZk_U-^J*a+l|x7^YH0EE`KJKFJJI8#NqVDZ?d%@*s}aEXQ($ON?AsxM4C
z-Q7<Up2K2pJgHpPKJI9<km$f=w!Ttrxb~X_Q{uTDih=AcCf$)R%(U{Ka7D-5CbWk-
z*aYIq++X2lYZDjAU2uO@hl07r{eok#JFH>uyLrg+neBHO2_uuYBe*GE1-CO6?64UN
zn&w=z;We+Z?xhaSaGYUenf)i|vAgVx2K|#<(m}O>uw3ZNNdypAG?x5<ggOp}G&zSq
z<x3ll{sLQHkdQMsX-!~gS23;^2PH!GIfm*{d)VArIGd12zig%j41}@f*3J8+lAIej
zVD?V*K_%?vJ~tBIehOO$U}cYCxgW7aK`9mn*7~WO&_@8M{Qw<%g@TwvWVpT44ap%h
zVQ9v4oTmqZa!4oyYuZbFsv=7bvxPaf-at`2_9O1H2*<IL3!iI;bUVz@b8^)?n`;r-
zBOQD^8y_onU{^XhuycM?64MJ^yp(+OVa?wWvG9c(+V6eAL7*o<E@RkoFuAf86OI+D
zJtzBKGvzXB0tMM(E|RFKl3>gXnV=Gdsin4B3L(sNZua1=6B6Pcg}Vt_T1T{tE^FMv
zEKku`O337Aw%0((6Pv(UI|X|Pj!@y1D_yi)al!-=2aF^#5H0eB1v1%_0^1TUmG1Cz
zszm!m?xu>S!z7d*hOol?57|QY2MdFgf<`}tryoVTF##on0x+2~gYW_+(e7!sY=d}k
zb&yEUWHQCLV+orNf{kNu`hxF7dH(3~F>J_UBYU0;Z<5z=ttjDxW!m6Hv6QuPQ&@Ub
zjEBv;lmzlPyZ)Vzd&do6xm`(F&3hKAS3ZAEFbF2Vc~icLv9t%g8J%lK+!bj-)5dKX
z)p9yU)F06p=IPomLTa@W9Y(TQV3C<^^Mp9gO3>FBe<MrK`VNVwv9&tneypy|ye;Y0
z`Z9(V8d`R=_W%Xr9YkvB>I)>)rE{B&q~TLVQ>x7%YaU!a4bg+2{g@=;_K#=kZ^V5r
znllEC8J?-b*v9j9;~jCS_2#88cBiM-Q_#5F?QQ@o);cdq(BRV})U|k`+y&huxgUPY
z!>ILsoz-ZX-6pk;+CzOZHwSzzB@gx_X49m2riH3Or2xjx_kuIHSgVZ#K$EDoLtj;0
zYF4`2T<f`O_1y<TqSHlQqfHA~@o*X3pn67yvNiIu86u|{VLieS{h#VPN-?%x>Rl_Q
zvrc2Q`F#h*+&p6c0Qp{htX5YYMYPoVq^@zn+U{0|@dv7)({%63#V{|muy|e}TddT}
zse1I!b6<Oh1C;H0CmAz*bsDM~v%gZQZ1&4b&5EbgCX%V|XsB`CZa~IR-7}<C>($<+
zWkZGScNMIu(t3ZV*}3|=Dx^HOZb3@YkMd!?=o3I?RW&E@rHVXrCN32wzYR3iKBY#c
zWN|rTGnCC=T%(?F#?_WaO^9QAC7`0x<ExHpdY9D1?EA;*DY+^K7Hv8cLDPK^Ray&T
zXt)QDx}oZ6DC&BIQt1#!PH$$pq=A1Y!kb&yTqxN^L`~g*2b7uyiCAUzUri&Wc0+(A
zBza0!SM^b#KBCjLsApv!zfop^b~q48A5~MQQRp%1HZ65YzDv*PS3OzNJ#Af3+J`{t
zAZ8ox&69M_lCPwRv&%g-&+222K~J^WI*<KL)|anGq3Ij+=N5}`e1%g@sOy^bQ|hOl
zqIg<z0rr4}(Yku8^HIKVUr0~!8V_%U=v2?p^qOx^OpDSaUClXZDItcoRp!z~6grJ9
zD?zAxq5x&UkV3+Bw@~YP#NU^rsI01|2Ww8^Kt2}RS=Hdw1eC&t883^FsXBfp=(@kF
z9W&a;8|`Pg31L@kX!#9kc2o4<;m1<d%F4-{0CkAJA$l&6_-(0>-&(NSy_<!i(z^Fd
z0kIas!Z~Z3w5#^@WeeiCcc*cK*;Ps@QOzeOwr2HCgrIhbB_%;Iy4aF4kXMLmT@_WQ
zYYvK*XX*^S_O+*QA4TjvZPrxGrh6f&5<G)o-fpp-5v6Oowzzd+RQe#(cDT3od@1s6
z=%Q5}mHKvt)HMwh`gWduM+<so)*)$hU&BtR(}((&r=-!;Gm{LbaUpE_PFji`ef3(P
zg1R09qV~Cjce1(b?x=R9rkY(mOA!Lb=E<8$bOqfWTdZ_#7O7I%sAyx;Z~EHD;{O0e
zXQXs5OlkE00GQOPqn*tc_q!k6X1b47*EGns!B8C2#ravCK9^F}DqB5VuX78oV<gzE
z4Z1UJdpCVSt!Q+xnqHivWV3O)Hrx-oqoV0vsMkoEqPOz!yOy=K!rkdL{W(pfHYQQT
z*_zvJI4x8fhg8;6x=88b4UhRtzu|QJQIC5g&B<#(I^Rh2=8L15C#!g^Xt>Vp#UIc=
zh?*T9m~{O@BOqw7X%}mP@@}@*tLy5BmZk1Dw%h*zWnuVv(@vhMD(dp~#xg<V1<#Ty
zf6;7B$NN1Rx1#iZs@2)3X!IYJrg^-9*aY9Qz105z40K9pV{>5qte^~oc0C`b>N-ZB
zLO&@xM#1iF^L0Vg{c9nI)29-;*W?mD$}ZPOY+#<u&bJLdkoVHkytVnikFvy6YE_0;
zZJtfv1s|>IHTBOgFi7WiDvFTHHE4mrMJeD(i~R~{r|gDKKlL?TE7JPkQ@X*<WMh{*
z{ua;w0NBM1EjX&I)T9!$Zrb83Rj1+JxlN|%ew|f2>E?)AeXa@ev;A?^)!L;z)YSDX
z_M0{L+FYjcZ;V#Lp{`BnlTX#US4Vs3V=a;Gzo`So!;isC8bn&WPp;96shO8LC-6QM
zM@V#yMDH4m64O@~W=PAu{{Y=zY86pwyQ!VJhG&axegR13PLtTt#@_uD8eW-GsA`|-
z;jP_&c6eUX_<Pgzx(qCPV<G4D6P?G(%yjOJO+i8aqrN(q$OD}uX7*P4cTz;cT`Zez
z!(D|~P1zigrK8uH=xS(7o?3B$SI<9<?9;tMV==`zakH6={Z-FY{w763O!(rQ18fj`
zuMF4qtwX7GG9!6?-N`sjDROlZP)%)?{WsFpI>|DLLyL1_Fjm{6dVfV`vkfI=Po=7M
zHn@9UehL$z9^E#XqHH(}f~~r*sHh>OY{P42Y23$HV1-8=S_+owp3$e!QRx(|+CU&-
zc<<xJktVlW1y-3r_SOTn?qINZRa8HU^_B3llrXwx4YzI0)}u<P>WyYLhSEn9UBr?C
zPwb+pJDV?m_@m1-O&3?8W5r|_Y3?~`TMmq;tko(#8R=y$ZUeyo0F~-mCq_PZ33WGz
zzqu{2D_f`NT6F*hD22y$$Dhu{7f~J<CjS7Dk)!C1@U_jB&9+%={_6Wg>8ct()Brv3
zv<`MQiw~lPR)$%`h304T=aWlEPCp(o>~l;IFg7MMSuyWyha`j@U0f|TCdflw8-JO3
zxiWi`I^hqbTS*fGHwg*&D!!sq6TPGn@`iSz4mTj`>f5{8Z{O&-rQ}5vj32VmmG@_l
zDT27}u|Gvo3+A2P#*y|`)D&-JobW$oqmFa^o{^;}ts%{=CEG~1)f+)pV!4vfY3!Q%
zSl;61jQ6^()I*_ZAdm-OsFKIDN&ean)T=3^1Va6?cq=U~uPLiE)h;b*!(0%R^{kEM
zz~mqV?x~fejo^{lPAN)Xu+2EfM&ChX(aIeCuZh`fo11-A&Zjgx3qSy@{*gyf3t25R
zrI^S$1zObaoq))|9y^Ze^%$)Y+j}aX9FKdhPSkFX1R_?68rKH*Au>`}MaC4=Mlm+#
zo=#T7jVE?ePxYe1SC%>`n>9RQLEVa)eL<BhE)kZVz>6zgMkhV3EH?;fw9Vq~0{zu8
z%a>%~1cN$m2Gqb_e^BLF)PWc*I3ZT)5zR+Y>>#xER+XpJZs!c7n~b29>{@C?c!zwg
zdrt=_4zLV%nJxXU48aQKhte-G+yb*dh?PH;qH%Hd+XZC@N`nV-+46T+==D0cR!t1f
zb=Xc?74DJvcL0U2mQAu-p2zIBx@;P3m6B=@?J^(MTvb<B^&JH)4`n;-{tb`mUt{Cq
zP{k9>&zF?l84W{8i%+TiqxR(36}9Ltl`y%p#@6KSzbneduQsQwuopS)Yq>qwvvh{6
z?K+k}TQ&*ZMOd49HS<x>Q`4G;v5k?V-rHcTA5`_UbTPV;DXwqqYfgTOxA6<Cs$-du
z&^@j)n-DuD{u}hvI*z8@OHtb_j&<xt0-RIJF6k6+g8t0@g{O6HrKrnUO{TgyWOdqK
zi>)-&eN9KS)zVrq&!%|`=nW!^N~EJ`w08r-&h>VqMH^iVQ81Ta0xr5-Ar+z#oTT=6
zuTjMe+F-4vl!+KD<~Zd1EGC_+pY?`D#<`a^BybA#TKzgIs+k0^S+C@@aH*;~QkFMv
zX%`0s1hI?uJe+Su=98tw_+hKD5}cAw3em+R3<K2I>v9$bgQ%aRJZZB;W{8_L-NLqQ
zM70buL>>Xi9o6F{80d_XY}~QbPK*%NxE?%(o9oDE-=;ry(%>%FcMCNyQB=}YeprpA
z++A7HXcKi!EP?fs#Ua1|;TM@oAXwa4=CnOYG*!leNjF4In|{k&_$%k4-9*Ps)0+aa
zT~+vTt!Q=6s4jG@-GgrHNBD8BYIL=1p{=Bl#&BFkthprqj)fb0Gn%yywr=-C{g3|N
zRcFvWB{rj|7^>uTJcM0?&(V7uqM)pJhN2ka+%n=YR(DXRc8#hqwmZ}A{v3@tY5J&g
zccR=P(VFVclGgND85F?JPbLJ79DP-N2Tes!8>E&YxQpDcTdV3A>U74kuWW=i+n1d6
zX0uNeE@eD{&$X<qn@fF?dwLzydesFR->20*jFK~Wr2hbduYdJ+kyja_s4Q#S-*5OU
z$#nfTdhJM5-PUo>h3HyWPBo|3^xL$H5OPrXoSoQXlC;ncv((>}d;b6{A!%*$I3ZL)
z*0u9TcQ}u_FRAoucFZGWxhDg%ZkM7_O9j0<J-?}|N?aDelAEMfR&^C*_uleae0NmU
zwRKX0=!1bPLsh56NmLpD*iJ&$=~^z0H8gTQHj`_VIr8X#kB?`VL(|%>p-=gUp!ERG
zIai%KK@}lnHJ5Au0I2@}h3xtTHkC~n5i%w>i!3kVKAt45AL+5T)qXv`e5R6ZXn4f~
zPf-@0-OMc*z7}I&)~mGu=D=>z{Gh9iFGAGX12ux@MsOYBMXhKq(_AWIb>Z`5B${8b
zE8dyr8jEUXpKHMmzHYU>8KG=*CwooKMli0lZk?y<8vg)AuJoU4hg*`i+DA>)Xi=DI
z?<`%393`D7jSb78+8&VVvf1X$ah?~c=~8LaP%*FA(8k%vy7M@77EsDZs2LG<ZmW8q
zspf)F9-k{i94_l*CB>Umjhh>jvqkuUL#NJ7MHGi?4ctHQuo}HBEYx1KE^D0M)Gz(h
ztE=lI(<P~fcS{i;!~>Qem4=H`s(zsOV|nz$zq05}HKGkP=+kuVbhML)Q_A>Xy4MA0
zwdd7WQx95l=aI`!3d&MO=Sg=91KnBC>XOs7^wL84T0cp*30q^u8QpVCnkXc5Z;-PT
z8gu4ziv!)a4geLru7<w4C%wB%f24A){{Rj38Y)?zrq@xjGW>d^Wlxbu9hkj3mZqJ7
z@IKb<b=sfjCvU3q;NgO|olT+BX*!D~ie@@Fjl%)w=!KG!9i`5QIupx5$oedoEsW`C
z^On)d$yrmAbCcnH8Tem9+TN3a{;--*%K~`^!CoV)2<fT|VfRMwD?|8G)z#W2q9Z<`
zr!K&@0(aJlU+uF~)X-`=Zm$0T%)-cq>w?}8I*(A#6m5m_Iy>-utG~p4pk}M5I%wku
z7vm%7v)_m2hPtoN)ngLGa4vZHT=7=voeoN@pw%R)t&Pndp*F(Gf2KSANsg?BN5max
zHp}Sh&W(bVjeIR+l;mBn1CNDGS<=+f65`hG@nrl|dPJo@NQb4m8%&o+ZBC5v(_ri#
z=xt^><KIbGPpZNE-NHLeeOFJD`FX7mc<!h=m#AA;SQ{jJo_Iaf<C0wIj*_hvRCTST
zsU|CprrhwYb!wVwiZ(g|1f<>Swi*)m7qzwzMpJ2mGI!ix%CEzFK>6#k3R=mjHoI$_
zM+;$~b)9L0()UJxq@VDp>F9?0J-2USQSYRIjSjeNyQ)LSYuPF0i}YwB>N%VX-ytKt
z%C4{KDCKd9t`<BjhQFw?k|(wqE_;F9VWR38Td3_XBwrs1TpD4F(?$1IX`l5ksRRbR
z-v@<D3_=!`mtDW%Tvu0`+A9-tYkgIH4KObbep(Je?x>PNJ77?;lGGRpwfIukX%kbH
zy{tb6%F@&5kV-vDU~kCs6}X{uX+1iSFff)-eWp?qRZPKta!BCYn~qS>zG)sk&KEt@
zy4!y#R_*@)?cHB#lns`OBP3^I{{TaRTl+Hox-^|1p*C7(K2LFY?yWVhkpdzFc58-k
zu73}k52DH`+|c%ZljUl)V;`bodu?ILS@obRv*()KFzH%|WY=_M)&|)NVbWq2N+pN_
z*I?mA*Re!P!+^NRa?9vi*`lA*FZT9Q#V0TJT2EEz_x&nLPs)e1v^v=fJJp($P%-;l
zEIH3B8$P>R6(O1fc5S{2!F2~$)m3g`dymyw&B%wxM7>|FIrBejvwT?z)7o=u$E_o`
zIGhDjrqWHURM<)ZJd(W^rMgb4iH)2{Tn9M97NUnq%S62^q(&=U9PuA-=_^aBX*1GO
z8r?C4@(jrb^$#HhSy<Qr4QY;6@_egpBV3MpK<7%<$}nzz5K&n=D4e3UQ&MX(PXmlC
zH)!`pc?b$h)*6Qg`&@ew!hcm#{{R%~dTZLrK)j4;uyP-#Yc$Pd+3#!>tizgnm6kem
z#g|r%k56?N(;ey5yVR#VT%tO!SJSI0OXw$H4sGlY3X@aNjZG7q89S|lyxUZVQ_|{8
zayCFes>aAp4d~F4>~6iN)&6(Ubj9(z1T7y%%3uvUZr<X{4r(1!QZCZxcf#28txR!~
z49?j5V(PdmIuk0Cwt7V!Tmn0dpjl-);M1B{OB8@Q#NeQHTG=7}FCo7RKUFN1PTJ=i
zAC-C2L>1X%(OTU_Z042BcJ>=J{hSuAx{{`%0kPzH9u+S`z{)Cym&Dwj;d*oEY3eA%
z^yQ(!zTmmvj~1;ROEX=be#vU62yEwjKdERa>*(iz2W`E%K<ffAJEM?s%FWh4(3F~I
z9lr?Ula7U)dF-|7SH{3>K?moBilXW{v^{z%+Ia{Kb)E<F1YW68JxoQec?Yps%6%Gr
zLs9&>lVjcbZ^0<EDztq8)D*OxS<?|})MPqeOgQaXEi>8#a)2ysZl(Mop1(qw`bMS+
zrjYGv<RW_i08OjW^+!((Mbxw8ICd&=sLF?F$|I`%CsUEQTyRzospM;1Z;r^?+WPq8
zE^IP5TR7~pTJET7VJ&y-3hky#i$vNH4b`GBi?Qa;1F>Gc7K0w6K;6ycV%?XI{u#kF
zM!FtJcFtSyzLn{kHkx(~zS1~Jk<uO!ws=mpLs6jW_K~O4z8%<w4OEd&{6Nq{yf0b&
zLD6XH_cnH2o=0N5wrw!!)e<xk__MV3vWzmXWhaihAkrwJYyC*<9(YA+a#V%~ZZ~gq
z9VYvhf^H4Mnq5P4KP@;OrR)jrsq!*>5FJmiRTk$$_dCl%s-w}SuCEY>xs4{o_+F{_
zeHA;|=+x~t;FY1&dQzCq>dH94aW^&`q4V!!d`2#h@b)1_*R{q>X6iY*eblhJ2S<4R
zM+?!kX$>oVIfe!e(0xx|rnVwjM(^;s^X1i{@#CjV^DR1^wAzQKRV(8M{keFt?26Vk
zda7xd%BF6SquV2YoGPBF)R^$-fbW8t(zSz8Cr#CfF_HW!4<M^y&gC78mkNxuX!QAD
z)nf;Jq~_P|s<o%Z8=VP^wpQ@&#a2~8U82|eWH>P8uN)LbT}x}&-Qbsz$nuL^p2du~
znd!u`&FRbM7*C!V=^h_Xayhb>P!5fpT(wQ2*F`+7idP1k`%AyV+!8?LVf{T{C3N14
z>?J?Sd#jB~mZ#7yjf5Ly6bp36RBBO}2c<C2w}&m&4J)LkZ{|+v0K<q`&828OceBc?
zpprLQXwA<C%1SCnN<)}7Z9Mr~eRhJLXKg!L;m69L{JfO!EN8i=$7LwwQYf+3(aw#I
zhXT(7p5<2QhMa2*6%76xy{-f+h#uN{ruyI*{GQ<l)O1XcwxWgLo<RzgTR`PnEh;o)
zO*pBdaeM^aTb8T0HMMjGH(93HK2~$2b-AK&rK@en1Qh*aQJRLh>;%B<g0i2cE045i
zHJVvrtSqyvP6`?tS3W?;J8(RFE9&h=mZ}izw7mC2Xw7Hl$FAMGie-|WF?e4@+Eg>s
zOgA*Sr?@KmHnq_^X~-XSX-lHPQ2=yuf)#$NLnQ<EGUhSKRZcf(R;AM^bts!GWE1Y~
zoTK_jSBbKJr)vKAorXwzeN}x(Gq{lJ4<SoWOHWYEud^j+_Ma%a_9C=g^(Ku4JKH@4
zoX2O|!pl^(n}{vi>*Z;5+V9DqMsQrfECaHr`iMaKzh0aW&k8c6T@X>eAtpO32RM3r
z+hcCZze$aiFD;F>a2Zz+Q+gx`TXuIUO;ahVD(WiYk-J>t*A58eBQ)Jw0Ko*z7aTbz
zv!XPx)Kh_D;b)l?jFR3CT6qZSdiDhPyYy=2iLxJ7oRT|_D7`kX(P6uT9zSBTqfn`%
zgzR&#Y<#9gRZ&-I8++f}!N^jSWQy`nqgPp8+NM~t&TnKO!wrZnCj=;?Yo%*gTrX@m
ze}cJ?%NxsF2>$>IxLF*iN4d>*4U@OFP;X%1KXk4E-rnIxV%p*l4jhHlL;4#8u7*J9
z&PQc)Pc&5#-1}r4k1B=tiQeOm#Z6CA7(j8s;lV7UVNQ!0f#})5fAWFUX(uoW>MOc4
z`q(=o!_2G<Bv|)GX|c&oCPwI=`k8O;xu+gGFA3h6m2{Iv(K8%gKbfbpk+KQEb547O
zu+%gdCI)(YFr1NYR&!O*<fOdx&v9?_3viwjQ$kMQ$Y^Rz4;x7yT2;(7(8${ywZ_G#
zy39GH)-N_Ex;mbo@cN8-xa0(0FJW1I78;g@T~2CfPWauE895(Co_sQg5IgeHu4uJd
zx<~qChemMVQ4>QATwbeOE_;vgQ$<%|N=9+CV%wQ_TabB1Q&XF7h1PiGrApY#CUYNP
zL9!+mu)F#kJEoGfD$pLKSuuvv0!S8B^pzs^I0v{qe5>llM^N39G%`zDcV{g0+I-PU
z?V|SKN-^WmWZNv;3uG5@Ztl(<)H8xTjur|!8Jyo^!ZbCmZgQ(ardBzwZUMq;AGO47
z+kV9nEM=w6VYnQF*)le^R-OFzDUunx=!)R{{HUjavR>FeRI)<&P49!<AvQ!%Cq`O!
z$=iaJuGrw$<*1n(xun|Qe`Gs=Hfy-@v5uAq{{Y-+xIMyxc3<_6p;8_2<O1fD_PMeR
zz<Ya-3jrVlb{<Io0F>sv#1Qdw{!tP#*J!Z^;XwA5X4h}`2vNVWTIQD7*0*FV)UDmV
zFhN8X5Z%L%gyuJU32DgwRJ1ps4U%oU1<!D}NY~wxjjtF)mXLQ0JI9ogvMJkQLtoy=
zN+C|jStq9NP2%A!@U`CN9Qg`2HPPL&*xU5Eb4h0g;PMedvNr%pYsOS05N&i>+W!D)
z9QRPZCp6gS<uYJsAMTR<oIdI97QqRnsDxyVHa58ljpEj^QZd_2igV*@@-X53)-eOg
zBi)ab!rj<7ca<p}h)i=$`B=mbYnW_#<tTP<kV2Z_*l^F3j*7<MEMzP$AE;obPiMEo
zf{o3yG5aQoE-da>Jmc)FBo9$e>)Z>U@}gsh4n{U+G}+??MNtssWeB?Lc8FXBv5-_@
znZlH@+iVXCJcn^$m_|z*fBW*Icp%^@Vk43hoZIAZu+^Y5eh5sFfb)CyD#9&<fac@6
zK0PV5EWBiW5xOG#Gr^8)hr+hgD;*n}*AwtjZPF)%+41gYkfNVXd}n-O;BqXqq`i$6
z*3o}OP}y6O4b)nNGh|^PVN%h~=$-~fathH?NG6Ywl{Tr_(-+93ib-hCrbn#-<%hS?
zTxr$bn?~1{MD9nAs%1?8c3Kp1Q9diVtasajgsGu+nSV%RWv79_x4U~3bLrbz5t^KA
zc>Qso_*6Q4@=~}tfVrQ{!WM^3sg7UbQyZV=VdX)_x+<iarUDF+9i(T$;S)<x_)h2<
zxxdWCWm6qJbayP-Cy=UShH5wNEhVGBg_gl5>6YS)OxB_<g3(StQ%JI@6tig4*v3mQ
zV}8imDwySwt|x4O;qAr#s>-DPZX(G5bBFi(Ep?+tBs6S}rXNzA`-VtXF)@=f(vhGz
zV#m79Q_D7=Qe6nR2Q9W%o`SN2Q-nA@u~ZJn7b#j9=rc#B^dGV}dwa0<`YT$kHI;F0
zi~{fOso|<S{W)7=-W;tcYrQ#xT<{N`#cns*xfInDvQxaaXw8QX0?NlqE@O9z3)nw!
zt?F4%TEfeQN=7f;XDUTrl~cMllFQ^JZLJKyV)m`kPY5ubuM0I<sXCrw%9go=96WYb
zl=TqTFi8u8CH}=M+Iwo*>CW8$09Cj{u-$eKMX1M72=zd4;5ob%6<s7Ud*ZnIc2Pe_
zmranmGG7z9Z)Igc6fb4tdB1j^P-&nkq*TRrA5HEK`LdkTGFI4(6zxu&GEY^5jzyDb
zs-rdq*zlIx9jn?at8|l2?_N9D@&c`>WRYeNOM8xNwe=5Vv40HQj>@_8tuEakwcpsM
zQ?Xa}W`xr=&H&i*6W;r<mX&Wc0C6NUW4s>!07MkjR=Ebn7Sq_sqn56&mP@tAZ~0Mw
zsS^JHQ!&5cTF(G@Epu|JD=9rPO_5Y9O&0VT)Q=!;CEiut9buKANHRDp1x`$IS*N<w
z=~ZFP4K}@$=O1WjNY+!z_Ov~(2k(_Ul@!%Y**iA7`n#;_rh5hBIPj&8p_O9A+a&|d
zkV=P=OtHOInIM{mV&AU^>ZPlypz1196>Lq4se>0B{R*c1<xDOx$lp<;`A<J&ALk&F
z?q>6DZHF~duV|BW_A**JtuBAyI`JG4d=-DBPWdDDIE(TMqn5INNRr_^UPmM9qtmr-
z%TIe_!bwH2>7!3m2z}hvi}wT|qoiZxEoGYF{HMCNpsu8@g6#cckfWZI$o<wWBZ3s7
z+B14G`qq^8JJqHxib3I4I<~SHiz;Fd?QpkDEN}4Ynn*YfC=E+Uv`&025=YIug=Ign
z9B-ooQ3Gn*b_abdx`$4wh=**me5<LV^kpt>n{F}wQ`u4+c92@($RqqNl_b`QRHDdX
ze6X_4CBSlxrK{ROjzZE@LI*s0jW_sFRZ}~5=2@;t(z5DYk#yk=d<BkZC%^vy3I<D4
zMhp`@^T0U2>tO!?l~)Zz;<vc9!}dqAv6T%1LN|`~OYzVY$v-^!qcTL{EF-^kMK-Cp
z2e92mr#gViumK#WkWL(<)O7DkLp>ncd$X}h;ICsTmhY^BvLMQU1G^PlEOODxT^YP?
zK2U6wJ)2z8$wwfgDScNk?IuQdXK<5)iwkL^pH$ZXK(X?nd!e4~lED7}QiD-wg}~ov
z?0YJyeP*5P_YV10QPCFYxMS)mUI6#Ud^~nUNhA}q_^bet`iBaJn!ZK@xbAOopCx-p
zCM!3~Nkv2rg?dhgOU6Bf_A1_sQG8K>F!dNXJ=(L>)o<U1<GW9FZB6LZv)JvVe=l^;
z`!r&`7Q5-{N38^)Kgd7j0XSo%ER}_i?0Xb6`dvhFdem~3zmnVF{gjNBNi7uYA>Y{j
z5sTMi$}I}oxnTCS=Nx54S2HVFX<7sA$O$Ha(VL5r+u=bdZqH+^?+3rp9x1R{3{94q
z+?~7(t14+CkQT^$V5&(acsL|m%6t`rcGot}_(>=+qdn}@QEGC~*^(0^KRy)Inq?-S
zKRc#M*s3`#9n}>zY(~wH9j6y4#<ogQDk$VGXC=N8a;-7kccQ|Mp^yInq}1RIe*xZA
zcDtbf9W6h(r;96?DyelEawY+?j9$r*OD!b6gvWeGhgoFWcMztfsTg?}=-gQ|O}Gk3
z;w&OSZr;}HwVLjc4OCvVBjj7M#?0C1=P}89e`30E<m8A?7agMSPt>N22<AKE?0bZ4
ztcInV;FY_)DhOT+cLRlCr8*fU^vi=u<Fcxi5pkjAg@<c_Bg#iI&AqM>Qo|%?_=j^p
zsUd{1o8utkAv$S@^bH%fn>XA%cu%ulJ-PCb#vSiq+Ixh+?T)#@@`;eUT+@vFC$-0x
zocJn08!Ijx&`)m4H#0eD4jsb5WURD}#vR+`IfbO{b8JxT#ewIsQaS$HKkPutQ+7UR
zPd$_lyK|d_LmpZzPVwa{;{<L7<KZ!^fwBT~f|2`OgZrc{&8(5&^L#81L^870BR&&7
zS1^GfxbhUv;>6)K?7ut|8Ii;SZqhB}CJ$}eMbkiZZuaH9!ji$@SfFR37c;wg?3&PW
z3VVZ^axOlpT3X|4f{S1fUe-DJPj5E~&2BNm?S}Vn+#+L*i)`U_#tVR2K?y(y93Ki+
zf<6{C1ME1sKMRXV7qT=)*ED3@sLO4DKXsPO&?eh+p9w>6#zL9Vf^a!ZEOSXCgg~f9
zHp3ru_eLH#&y;`*<wyy(3KkL|*E1b}x^N(m1xbQU#jcZJ83=>f8OJG)j1mf+%?=!3
zq2IZVxj4E3BR-=A&mJzDC7#dKj_8)Xu5Y{Oqn0j9PCP6g!2{mHFO@5OH{cr-j~KIt
zLSthg*KaFm44*6l_qF**SlK`()=dww+Vr5DmXu6L+GY`JDFkkgz+8^%Fz_r1L^4tO
zTruS<M!&K-DPyT;w`g}|QC&qOMEh~(%KeRLH*2hxeX=uTtORy8NuiaknG?P-i`&9o
zz>KS!ngCoJ%OGkgtkOelLd^`MnN=-;unITl7B)|*X<;PZ)<XKEy2T1(Q0Ib0+i#+4
zUTilG6oTFPP1-IvSjcp5cHoJQeC=?#?1vz50^^gMSuKaM&N4O(kCnnO;%-14m3t(6
z4h_O43Y(A*C_VHQq4Gnwi&-;lo&qR5I9syqjPw1Fvo-WtQ3*AAwo_6y+ljHq3)1>O
zrQy<@>c4EVID3o7A4P`H<z|smBx4u=;P+anda=)t0$KrG>bgf9n>X-KQpFjSjg6${
z_*p)r>MDvt<{29BFg7A+DzzPK2sHK+xPGI;WW6(|X>+<>rk#?LlO54>j8?>qT#q%@
z<Ez%BE`o|lWj)v~R2qJR)U<Iu&eG~5xb7@Z%JqF0SJGKlS*Njrot%3Bw?Ih0Mby1h
zQ>|-JHYygrHiL;R*+IEWQHf-fduNJj6n#fEJE7fD%5(go#^17+M15w97HB1Twh3*m
z^1VFttz@u|&s1lhZNa*NT?z_l%N+O0KkjmRby7j)6zv%LNUH1R6`It~WDUz0U4iyp
z)g5z9rct_&NhQU?*8_xKQB4zIbS|-H^sEIdA%k0NwDAXka@Pxklw$QrNBcXGSp6%h
zHTtGb>Pm+}E5BWd0ef%Zzu;bnQ9#+X#y&}0FS(8&wOe$Rd~T<Krj8m`8v@n~1NL5}
zrB^{6IA{$Gwg^n8ttvF4VrqW{`dO65Iyvj<Wdjdvm%r36H|qZY!J0T(HA&T~+FA+S
zE<*RcS6il_gv~soi~w@H!>X!vzOUayME26tzZ>4ua*@h&brO+^O6Ae>{U1*0udjVP
z^-<Z6+q@eOs`R}B@b^omF&gJOO+H5d0KHErJA4v3T5gy88q=wFH&d9@x!Jw#m3gW3
z=7pi@@ARc~3<KQV_#su}lvna1vc<YFk@O!$>H3G}Ki1}R8gAXr1zJ{hPfuyB^yp_5
z4rsGLZ!66@!&lPat9%eh=eFk7a;NEG4Mw0}JW@#+{Wf)oQ{^fPihY}1bFAy9W9&UB
zPhhJ$WwPoTn5(Ff-kVPcf}^UXZ1M)Ol31I&l5Pso=(JEmBZf(szy<GoBaPG8CmLU=
zs->==rlmVWTnO-nY*h8G{utN~WF38Who(h&<czos?RP6Ds{SQW(KXTOu(ijrJg%Ne
z5v%Cg>RKH>olI(>{#?0)jy@JAsd}0iBWvk{F5Vn4Ry$YgjeAvjZ?5Jv<7-Y8Wj33r
z>JGfldt>CAD9dG1YqL>9Sy$AWoG~}`INNoythIVAV@R%T59S|dw(ZUndN1;NHA5tk
z<9kjsb*k&injKPx9Y&qaY|+>of0ZdDJX>s`>D?|#tJx-^OWF;<^1UL8vYr<*2uq`H
z79$JF-CsRCO{tB}EGPAHjfbfumLYd;c^1N5jkDBc)pV*x7RmfKALa#Qx`V1Afv*v{
zuLt?B!pnwh8mo5F(@i0E1%<#;v+%F0tD4u>%lT+skZp1k)TPj_quG_}E~oV#=7LSm
zGLO)8xeXX|*!az`;xM&T-+|DZKC4-K%T4{A)xBPUN2BRZ)9ND=KtK0dEZ~w~q8chQ
zdu9%!TrY^SqicZuF9yVY)m2uds_LimnrstP6M$ONh3fq;(R~wJPG@yXXOX_=G`}P4
zwAwzQq3IQ0l&6Z6MlcCzZPr<1)z}t4XPf>Pei+reP;Gv_2!7*m*9(uj^^T;`^vZn|
z(b7}4G8#pi0R5A7-m=j2=7Rc&ng0N59sd9eC#`-V=<`xJ)U)q!<&G9rc@vEwB<{>q
zbaiuA${BFhyCaJ&)drsgT`=Q2BbkH~as}Fd%Ja(Ztfi={52ikw-N^>Y&+2O0I(IkM
zafU&km9fn(!I3x7)0taUVG%6diw;xWM-@xj`RT)4({`I>WvhCcVCynQk>H{<THSk6
zsAP2DY;gc%C^yTaC0jN+jdT>cJDW`H?zYm<Zs1lmw3>@y{LJ(-h}>}EFjuSepW)qD
ztB$8rERa2**d9Ks(k1E2KlJlV+GyW)+iQi;UOj%pOUX@fK47D%o|(p4YKdT(xw~9J
zTMYt|r>?4?rPb=}=(5=heZ+XW((9cOpwm_vq>1d>e@pv)5W04wrs?%!pG%9>ka4!d
zDpJOiy4cXj+NiVI`ZuI{drQ&drkLEdwk7YlS%1V04^4^WQpU$b;fFV}!Rx<>8nqi6
z6x1`pC-S-9rNIYH*E*h~2#M6C<lq+NX5{@0lZ!JwOQF%jU+SBX*I!{b2jN~(^ouo!
z;HuDcnW<)f`;9IBAK0s|nCaa^Ro7yy)F}%fX}_la>)rIYsVHffB89Cs$O8!_ni%8z
zF`OkQq<r&N(Y;p`f+y30{>J2gbWIoGj;E;>{{X7J!K0QmTl=q}Dr#e%!d3zY0EJmw
zP$C}DVeq&z{z)ZKI&t{7*^B94!)+f&V_h5(wcYV@R^o;VdNyr|jcB)oEj@DxAe1eA
zd1xW0vhy<eZe6pgI1(-;t7}GGbqlo?jBg7x>eA+Woo}0<YBf062rtO;xH5SW`#KgA
zRX(KFw)a)_8q+{Gcp+qKHI})g2{>8ZLt1kkV&%^BzL99)HyVzw6oA?P0Nqu)QZ6<Q
zB=!p}N%`vON29p3^KiDkHPg=oNj2Tx<p_BBb3dTYP{ef@s-3_P;1%sYp2*rCGlNx&
z*+WMK+*;BH2g;{p^%a$4X#N;Bvh?wInDFiGoO8=5^l0>GBmGTiw_{{wQ$QBAkhJx2
zQNy+0uH1M*Ro2ZYE*NS|nRz-UpwT?Ff)<gxg+r@q%^}Tk7EsmHlH%7pD=n?fF>{!~
z_gr(y=;($!1J(5a$;jLd&BD?2JvXl3S>pY`Sxp~Hn!dPtppXs)m#cKm11RBZ9MCQk
zW5(OI434ymN((iCrM9vrU<+>055icz5O&`^k_H{eI4h~a5lpSCdt_m0XZAwrw6ZpP
zhZ5WOR@G43mfR;(zyo&+SuId+K`=x>AeA#3=HLsc8#@Wu<8HxNQ?~J7<PY6WP_bLC
z!31vKxLhVpQue=VhB!q!R@{Svs~-E#TJPN$#y*X*X#g$U!?nXVSuVe-ZBCZ>Wwz^D
z=Yq9$18gn>n=c~#P1W5SW`VA=z&84-LN3xn#V*WMFGh7WQ|Fq3t`ki2a?s<r1zo9r
z8EchoedZ<Y7tO$4mH1oLRBqD=WX-44U>0;w;z9oag>BRyh#DmHaxm1zNjrbti1H7|
zmG%&7FiD;(w<dh;r|8n?)$gaNY4uuiP8Hp5yDK3PHsJBX&-I^D$*lDr>N~NFcF_I{
zhsyLWhv`@~jXjlhhjV+h9NjH*>}L4A82uYdpIFrz=RVK9+kOi5UYXNsY1kMZBa{L3
zD#5)ur_sU)Ya-e`q;iICp(Is1Sba^I+!ZP-LN?yRwF=F8frj9{mca#7Qdc`ts|C;6
zK(nK9$Uh5DHn&Y#rM@?owc)oQuPm>ufBLJLN*!W<SCut7nC>?p?DZ2v2&4p&aycsv
z)p~;{oMLIQ@}-MX)(tPEE^&t}e^KfB&1}W<xxzdCpt~n4=^V-}c4+inE|R*LwGzlA
zbF*MLR`buNY1IDLUc(~m&mpVTbXsQ$SvO+YJSrNAHOkkSB&jEN>H~`|X-T~njCE$C
zs&#5g>8~3Ps?+T)8T+jlLiHrH<~VHTJby79s_(-68V}C4YStIDWP{ylI@d_1qH`*!
zni>hew0BaI;n_(3#-4d*)Fu+hH#5ERi)NEX=(kST+D8V<J=1!_U8e>}9NAhkamoi=
z>X$&rG`NdoWl>EfMBH0;S@j#?hM2(D-ruGE7oOJjhNSs_(dt+wj2~@<&+eksy3Mt5
zJ}ZF!Hy&=Ov?rN0n5t#|BSXPIDPt8WY-Z^f8jXE$q}dCc*0@;t3aOeQsAs7!s9f*o
zz5?BK%rr02j;BZl=C|I_*<<>1s$yeI64=CXk;2&&qVzU7CaIcEmVzo~wwh)%;|^Ey
z)wZ1NYwvIF7HdzUs;IAw&^6_fo3-xYZ|M3tlCiSOcgRLX@SmMV*p3^dd8b#;xC)pJ
z#qZAxF+;D^y0c?RxxvczeN*uIDvxQ2%xUZmmJeV2J(EG7^D%qiamhI?QTd~E%B)Y(
z6eaQy>w1oNKMK&%%S}z|K~Uh*GarPSGwA7>*A}(r);Cs015oh#dloywqKd5o*_;0W
zS*fRxz~{-d@_Z>Y%~gi2f@hZya8D~;NzyE-ZRTM2cv+6J>G7kHJZB9&ctW@_t;td~
zm73<89+|n@WguC3=DV%Us29_~36HhZG*bTnsceW!S_!dRJtw58T@W$6ms<DinZuuK
zkMTxlqNJ$Ps{`c(cLjP?M^nX9LL!rCAXt;hRC=zT1w9*^v^GY!mFHFZq_Edp)FRlo
z-E(Bd+oaBnc~V;}waV(cy+PFNVdvUF#g!JR6?GBbT<15qTAebk2}Du=3FO>l6(>|a
zj!G|3ZQsBFTMh`uH|$Kg<tJW>UYz{RcIRoXA<k~uV|NZ6?hu-nPtT&)ih~(wes=N^
z-7x1;Rklc7uy(g~tJk#{Yjooruo*}e1*0IYh+<7y&hkEr-55hPJ7uSHH-YYH3rnL@
zP{=O!#vb8f9o>1v4b-S-H3BCH$1PUWy7;>!Xg6uUJSaCztar0tS)fNvFR4!9XXG~6
zS?zM3Hq;RKgijnEF0Qohq@}HkY|;TB7|NyVJw~2bM(1snqXkY;OK7^AmYGoYx_32<
zk<OMZv957B_)eC&&xOPNx!H#_tn50RlU6V{cJ`ayt4*lTNvKB3>PXM7(eAhN4+S1h
zBJkwQ?R#H5jK$g=?p}$~nqHTvY4N>`V<!VY_bPo4OOCOZmOZW}*%ne)vVNbRbuoKd
zdH6;-($KQ;+vvaQ9WAiZJjO1<J<R1|X{sHkRu4?=vA8QoL$6Iy3%x-1lG|~0lGa^$
zTmv1t_`(iK%@|24XRCDAUrqTB%2kG#%W-kal3iW0jqp4ce{j6RrmG8>DQbn73EJ-M
zR&^CZl7Hd2+#J~8qMxB$J(@0{)SVMtADfGVZdab_6|Xg|fARx$ss8|0qpFM2pZaV*
z6(wagHAH)(ups{HB^R@88hswNDPU#X0RsoZGN)02!()gK9oL-AsXmq$#>Z`QMhd8h
zsArS)6LHQ{<D2#gMINN>RECyr2f+v$?Qd)(Io-UhMIN%}$>~V)-P~PEsl%u?X2&c~
zYh=q^*o8+u6HvAT)H=i6A==_e?x?AsBdR@D1C^qmrzWZl5w*qO-29_xv@qK+um_IE
zu~Bnfl;cAvB|d{(4aKZggc5+^o>ZqzYhxBRlzygp`AvcV*Vr7R%}E(W#q6`v^(krU
z0A>dnR(htY>0rIb9IWinRKp*r80Rn^K;Z#4sr)xF!N(TkD=h`2%5JHx67P=pK3Avy
z7HQLJ8az~$4K8D>SbT-$vT5(El!gpDIbP%VIa>`S927MSv1S_LrzxT1kJx2*O6uBt
zzP$sU;=y|qLuxfD%5Aj`+bc%Wy)F8UAdlQxa67DbP}ETRu9i6)8;>9)<UbS2`o4m+
zPF*8|;5^&1z|~N`8lB9$m<~ep{;JpXs!&@jfx*Dy>kn0^>C?vl07vS}@}{LvMHCel
z+67BZ38tCXV}-J_-BHuj?37hR{n3}@qq+&YoRG?P`$uFwM!f$3U7^k;zsxyIoRhG%
z9yHBAPEb(OJ(YB98-=$udPb9~z#_P5F_G_OmyKz<qrW)WX}2^J?j4t;X_R#{M90G|
zp^>1MH?i=UDNAgN;<QiJ5y3S#txVHrewTL(2kKT+OK|cQ?7{g~x(b3^!}?r%EZ0y7
zA-Mz)s|fI7IohBIwW^ZuO~%KJ_fWS@_3Ir|O#c8%pywPE4aAQ!Huy%-Rc&x}{muDR
zQcp||l^Xtv>VpiQ>AJPUue3SGg`w&iDoWV4y{ve(+Tb}}ajiuCLX1^G8Eo<AaOTMU
zBdF>m(_2k2B1Q`WQqD9aSp{y2%{IBUkwhep{{X~b@ULt1NHu*um2?hlbF>2+o8RD}
zw7piIr*u<TJmJkh<sC@FL>?)mE{VqbLBi#mY1z{To{X&|b(PhVX|*l%s$)A&?<yIn
z>a^<P1xqs1f(8oEI)<XRQuUbqvyL1&`>j1CG*#5b4N^7<*?|85Dv{3pp=F9IqPIec
zl2Wj?!Tw4vw^gpwPp2i=2*C#h8AYZ?xV8uFb1`GVMCufASJD~^z#8y9kMNz#U#k@=
z?8rM(b!AyHkWU93gjHsq!xyg++}m7_3pJ=w)aja&>7;SHPqF?&vWr<TFu^~u+ju>~
zINE44v{6@1-&NhLP>!w<NXc65vM}AH0n~NC&i?>U7d@4AH9b{SMp1In%5<A1+3nwl
zde)iLkQ#caTODj-_Pw`!h3QmLQR^CG^or8cD}UR0?!Hyhg+(1qbrh01Ihb#8h3Z{9
z*A4U|bx|?ZMsK)qR5HQ(DG7Quv2^5A(#c0t7$6%1WnHa)7-^ccZhR~e%WhkXtyZ6|
zQS}~;9-&S_k)qEX(2vxey@HxurKivKT+b|`%c!P|A5L@?MuA@GULA0Gw=33qURcdI
z5?PM|*7BvMtcJdXM>`tXEuWQJTNtE`@<!sS^0ozyARfPCprewaG3rO1zzeT6&}5|4
z-#iZ^ZSDc=w$*y@5jnGv<~Ufi=IhFOx+m#ci|e$PxJ4_s77pJ<I5o(5#kgp*)u|ap
zIc<Rhg0q#vIX$+yR`Tm7QqoD1HwjwaZIw}>SJKC-xAU;?h~dMyT@Z^>uSYbc`j$N}
zUr|L+(DHpT$HMe@I<hDzuIUA>dxeSCv|~*ZE2y3(q>~_z<@hR-)+6|CKGT8`$%A?X
zGTJ>aO4q6NX{Bpq7ww)^e^Tkqnm0L)KVq`9S~YDwIIg36k9#!bX!Lzl%NM0s2#|Ar
z>zYyHBc>AMjHOnSacLMy@>4131TGHQ#z9-UmQqLwYeB-J)Ff;`v(v%&N9L^x@wQJ*
zQA=Au>MHOHY(RH#vK4TCPP$0qCP;zyxOhpc)XvE_Mh@SFK8;dmEhG!~1zQwbc9|Kp
zl`tBXncPO(8-D9Isleze2c}C+?k(ARC2o`*6Q-vJ$Q~9}sv-HH*}xgWE2-<U313FH
zq3S<11X0!7)MgncaJMiL+(~PX*oA=U=CUBu6Rtb0WRkt~d)n{PIUSVRu8S@9RCTG1
zhkG1HiyK*GsP!owGh&eU!B-ljt*djG{{VWW6jql6wZP#dVy?p}G^o6-qit;!nr!{Q
zy3Wy6O{LX}YOJ#M1grWw&q2PNhQtrqQS~@8kl->iaotv<Bu3<(`YjnH6-3T3v9ZcB
z8|54fRS}q~7!C22i=dWLS~48o3crfBPfu*j_uApZx?VaO%6_2H=A(J2rw%c97vUAt
zH4Kr$8n*6?@atuT89iLJFc_QzPhy4A0ET_9WsTIPwX%^-vu!~IMGN=D{{T`VE(pjd
zit5^VSWLDDxOa3F6<}m-4E-O?ACIEEf{#wrsP?!5;ya^_Mo|VwD7~1f>Ubk~o{DiK
zWc%a3TBCuxrUATjbvIDxH5xrwtALloeAw~zPoR7i7LqZu`r1FpLCMATG*>-@YEOjG
z0N@Ob;lQlTO;7Q5WP-0X3TKbf>&AE?QB*`JW)J5)6kAOhMa6~auMt*<xE8hD?ZVc9
z>qb2`2a?_gbxEgwTCNt_%{Jr0DUwa6J-ZxCSN)V^pJ=M99LlNbpCm>HIfL~x!l=|F
zq>^DQ9@E@-T3TBATH1n3+RBfg=L)A=(SwVsDB5>_G-H$$(0(u>6+4@<X!e7al*(#x
zOINxpX8G(wi%zQzy)|PGrVXxnYAUGyP&ASs6Y|FcdnT0rg^U_y#RU{qaXLudwqcVR
zif6hO`f~$td-g!-)#6OV`%KOUa)^C&I;)HmxWzL@97Yt>nq?&v*1_sK5Poo*9KpCG
z6co}}x+3fCHoue<vPjq9n|3Rwn;_v5`Rs;9;mxrb2o|<DrF$GnY2d2oRLIa=39#jH
zu56av;eP0Rl1BK^XvyCLiwl8a{U^e^(e*G0j&ca#Kf=eFtG8iw$7L9<^oRk(i}^xQ
z<ftneN3GD-KtPS<qT>YcRc@;wh359!d-f{_9<L~eYh)x3o)I*?K>C6CI*Yvj04eTQ
zKN&^ZDB~8mu)R(yTNz+@7Cz<_1tn31{>NRnP*zjTA>PN35>e4QQMNbP;}%z0b+Hx-
zEu89lrWXeWxC@m8a|Qyy`(L+Wt91yfs0cE#!KZ_6Py(^rxgj#0^eck)Ubc3J+4=B)
z@`;L8JGfcbRPGjWu^bf0>f~nxn<LGO!5W9m-M*Zj<{#W4-y`ETE)H+<li3ABRLRE2
zdtcZd=)mEYk#KN9REx55R4=00$Fu<D8+}Mg4hG|t;0#U<X(hgVCr;xpy5n`SM{uYu
zjFr3p0E)|JkfZd&hW2x8k19wB4smF=mZvvseeC;%j6rd2uWk?aLrB{a212ovM)v0(
z3a*mzNn$SE>jTjnL229*-vcFSe0=u`SHLz2p*xs)@)S(m$8HM*7_rRxZ*?1?HV=pN
zk&)pYeZ-JB<wWKHcSrYa(ub~rTOL2C6~(Q+kJzGpJ?DIW*A7CCMw5aqWD&asEetjz
z1xDal@LR$q;E!vw;Ha!X+H#8m8s>?z2G@`7g^`)!)<rqDIJhH($vwcH;R-c^Jh{Vb
ztU*!wC6_EanSMKjUeMuZD4!Vz+HG&xqGrfkE<fZhVIjL*E)=^Q*IbXNDW$d+?fw=6
zWKu@Q3xqS{EI9;^@QN)U<LpyO-TJ>*`AljBdu^LsBn0u2ry~c)aG2&|<0}M-=I4b2
zw*z~3L>7^oTqY0?!CH()EdJIhaxm+a(ndv!k%r>V7x_xofV9TBps*h3X>EM+5pH2_
zM+kX?Trb^9>75B$0;z4=Vb68cRUxkQroiAI39^zMVwz)YqxxK#Bu-Ac38{`qUJbpc
zAoeOqTMa<7{jX8b&SQ+hP~TDqayz%=DIWlh!STP;iP;Yy@|J?7dpXq3jAUUj1K1*=
zd$1kuZ<NVHTKj>I@RHw5vWjZZ$b(COwVYMO1K$Y*0z#~8O_*JdvxfywO;+e0BB*Ht
z$~S97r4whQR8!6a9tF=Jt4f}qrmKXy0?_MRS!Fc&BYS`j7xEU8lCoG@Ehb0GgrvZ+
zzR{D{G$|?MbAt;W4;JMCr_??vc0UEBZ|iI6>f_m09>-e`SnXbgpPB|Y08a#WRD-oc
zDKyI}XSQg=hbX#dv^!}6#ZqbVNfU!!2nx;3d&T0hC$e6ddbMTkHj@=gw?QLYH;&Fk
zMWeLM?qR2?9l@|Fik7lkbM7)UH<N6&Us81)GuYTG{nz~y4nkR{=rNK(jHi<4)@W<S
zH+fSEcwQ_mar&6!&&W=OsxZ;H!R+keo1z^A6#zM=$FqWmCRN2UuBT6eKjKC)-rb5B
zwJnYN9MUbqxt5z~%e}*&loa$aPQ$ckxc>mcJif<KR7Yw`-emOW0}ns*<RY~F9+Oaz
zQpo=R%2xsWH#GZX`3j0y3=)2_M{Mw?ZCsHwHO}74-M8c)AofpfbS$Eob*LKs4b7+5
zDctIFi0YU<ze1YXn<yJ4yB+#m3c2Y{vZ0<arF9f-sHBi>^(AfX@bCPm^*2FJr$X&l
zrX>9Cn(uR|!>;JZ$B>@WIofe_%BZU)V}w$?;QL&yMR2H#(W_u_{#W<=ti?2<c*`Gq
z3>KbRn>|HM85b^m9i7}HwRAl?G||$;$M0vf__hkUp(053oE44Ix`C{4g0tNT{VyNN
zu31{vd)WQVJQ3k6qR=^8G$xyHv#jR*5S4mdZM?91UOXY_^*f(rm+}#xon*|gAQU-z
zGetc_krHB@?Q+a(RPKrXtvuUZdyL?%4!FSY)-C@4a9G`5D%gXJGKr!+iLnbR9yXCa
zm8(eU%u*5_4o8)J9YY>K4*}fRuP}nPYJEsLpgFC-9mmSo(^UHGYnbtK!5z_-KWHj<
z*>^pAY2?{EcQ*X^O{?_Y!8A?}VeUIB+QMgTq`5v-Ow~0SbcDv@S>30ChZ_yib2CV8
z>u+z7*$Yul*;q?^@`0w;BlS1L>wi>k;aWjcO;k6)@W-B7d#uxlRFfzxX!hiSK71sh
zl2~LLj^>^mKjmrNPRYfH0p1lgZkr@8FN2QkSuiwRQaDK%H@P7TUkl?ttYm@^dTjEH
zHueMb_X^Rqu}IL#tR2PDwBpB4kQ^25oxYTy2|E$NO@F2*4XPfS_-x>I`SP7#qrJcN
zFlD^hf5LSn(aR5^R>DBwo<en9p<mM$dOE6SHdq|p$0PbA`=DIfTImcD56abp`U$nq
z!m_5UsM1ZE!C6A{?}YaG9tyFo(X`&7)BgZ7r^;R%-u9Lg;Q0tPmtbl7C~0b{w5foY
zH~?_)Kg!zZ`m8lEk5R(sy7Ria%|k?+@|wh7nWs2p{lG`*l0;l2qMOu>+1r2cgrn?A
zv(g_FPiA(Ol~+>fXx+Le7f0j50+z0!knWC6?H{R!^#qb?EqFG5dxOeH7G-D$S)P`u
zrOo~n{%wM&<CWXm$yx{p7C8#TQ>PUTE`{yg&Ah5Mx_D*u<^tE{S01!HsiQ>zF|<m@
zhsJsGKB$+zneF#IfZKvqL=JcX%yG8_c~1PKbvTdO@!3&{6-2XsUiNX^)5-1-Q#I7&
zmOFbn1Sfu8Ry>DXID9A`WR1iDe}lnI77UOY%8yeAp2~WCc4}98RabmnpWzENKd20p
z{>cVQReaNWkrvL<*SDXAN{oqHMuM((Oy5#3;xy+Rh150fia_oAZHxZ^<z;EBB&H<A
zCgvaIz7jiAmGkD!B-v?Wq!l*J?32;z5g6X_9JayiRTWh|RU6&Q<NeiZA3NjU1CO_m
z71oEUK2iBv{jvjqNK@lo4f1mIRMfeoda+^Sk>v*R2`_2d?(JHQLr$l4<bc@s9hD^X
z22)}STsUx9B+T@61pcN8A;DYG%GQy02;|@s!Br7cdTtDo;r)uSgkSh|4Hi5VpFvyM
zp{1*HhS%lE^S9l*ZNjOBnn;D%?d|j785K*mZIIk~QE{${r+tJm?2+3qf2hh6QK2B0
zG!i)lJ?&$?&2~owauLwgGyxT0!>}F(57jbl6LB+>L}h7j4;_jOK<L~9nQ`LFQ(L5o
z53Nk?-w01jec_p#UD@5$W06S{aVi-0w~>!N71o<G3kKH$@98I%Q&&wS5^a!Kx5I}8
zHH|U*gZ8_zx|T?ngY;=#Oe7+Da$}HkJf&owuka_kB>Cg_Ra#!5C~%Hz4+QsDPyQrh
zdpES_9EB~QogGB9ZVi+dN7>w<wTdX~BQr%}ZP_0afrzokdw9LGZ<HNVC4g?HlW+aK
zig>-+12WBmYI$ty+rpX5B$u()JmDQQ@YOi6{{X|7au0MY(d@u+y1JhBNx^ywpw>43
z00yjFadNEVF*&>7ecSy!thB7$ecAa>rK_5e_7B|83en$3JeJKH+Z?9%*#7|RR5AvW
zvEVh|<v|sEQ^mLsa2zK#SgIrD{{S7rqIOA$TIjz)xC&_H54d^1g%e&FLmY0?fP8&Y
zy`yg7Z1)MM)=cK^2Wa~y3lasz{3bGD%p8wC6oj?FJNzUKjr|-c86~b;e~_B+cKHED
zUB!{36TFEH+hA>#7&i8}1s?Y_+~j;G?rX+Kzm!8soaTTq1-qt}{{Z+C_gL7QfSY^p
zuque2%iM&FXzzsg5Dra`l-C=Lzp)D#cEDR=GE^^u$8&#VwsSxvlBHyz;nzPYdNCYs
zIk@3Y(O@n?UFoskrPd`NabdH7D_Mtz2NBr$PPMS^JcQ8Zn->1b?Q=*iKeEU=JGKZZ
zr<=H4JOI{%a#Jtvu|)*!w{_E9&eQfzXdny!0AizY&QZH3v^2+Sd?f_`05D1(FJQX%
zy}O{oCm%%J&f?#?kXgpZp6MRJV~nH7%?Q^Kizk+~{j#8IwjXvA<8Us;(R&n*NDFOX
zqAzvqLOXTsbri6%*CUXCz@%;$@#Sz}BG*rQ2;f;aH?xl@QLK&emkV2tQU*Lb0TLPj
zz&S`jBHh-o&@ndWpDE$j9FMwl<Gt~f5sZwRl-3OrHS#jWg%HYyyY--f_gIr<ErGUD
zwPPni1>0N=$L^UkW0ZXNLd@A3+qJ~}pxr!-c5a0>WH!2t8-d+Z)X}-FHp0CXB0=uT
zW7@}H*r2u8%Vh%^=J_gJpyJt9l2Nt5kcE9an0r|XBPIsmMaK!Y#!-)q9#k)Y+T$q)
zOluk}r1Xg63NSX2d-L5+*WaF2c80P_eb>%HCvotgV}h5|`6)H*$danAYPNu65sx6D
z>HS~Kh8dh%PEGC=k5yA?dQEegPb(yZ<c-P>o~_bro%wj8kjQWYa(>IQFWgRF_IoEo
zx?Mk~1KCp6lH2ZYg^%k>xhkhJO{+3X90F8S@Kw{&nr~L7IPLmm7Q&;i(wQ~GT<5s<
zJ=Bv<MG|p{S50b7r>twtt#A&x9#^~cmssd^RB^#n#zgx8y36LD$g-UJZgb;zYoaOj
zeM?K2HYYZvoPbK}jF(J=(vkH3s}_|#GpB;G9lYCkURBn*-317H1nqOX2DxNubsa}t
zVU3P;7`M2G5EetJ^wCRL-TI-MKIWHQX;;{gj`mzqims>Bg(VrwiMy|WwmmoaaUPji
z+PeDa<Sof<u%`Sk(W$8^#bi@P=12w4aILzNRi@BpeMIsKm|e?nkf7YUiGS60%D$uO
zS|850Pt#b>R-W6-QJQyAO;Fa;`o)esJHb`wUg%9=v-nJ;sD2E)LrD6SmDDTQrRvXy
z8n~*Wz1a31-}ze{mGKPSt4FL-X%*EjY_(N%^(`51zmKxeGg6|`;oDZoA=)_vWq50P
zz0Hiq8zt?FJ0W8FpIp@{OTm_M!{x<va^kc>r!VBsY3qN+3LP=8i%;~b9mU((cu!V!
z-l?wEz4A`xM(!9KY_l&F6?6J~iE%yFpQbu)lC(OSx+gNEi^ludAB8DSyBR{XjP(UQ
zRb^N<bICj{{{T$WOG_+bXl;Hri>sXrq#>lHYySW-5OwX6w;emB&{D&`wT*N8I35zI
z#g7=Z*+os$TK=j-Xz8{v{{S<Eki9|Dy7rq)_RQ#{k)s0kE70mc5vX)}6HI+M9Kb^y
z&;ed$)?IeZRmMRr-Pi)BEUh|;(+nxDQZj$~TU*sBpIbA7qid{g>sem(*FiO{FRF?u
z7~x`Xdn39tr+TAUf%DNn(xH(1!94wzwzH-p)AZMG)MkoijE&X>bf(g|oRg;NCSlzr
zq3IC5s!1Vjjl(Vq!1W(ivPy?h=}<A2_Lnz;pVzLfYhM&qZkjvf6O~KT{WUy=wGxun
zexdS`QcYMR8Fb6Ol<ECPR+LLsJN7u<<AAkt^z<~25J{*y#QvMye#*n7UglCbwXJJo
zZH@7TQL5@O%ULA5h3{gg$+E2^i|5g4l=^q4OhGOl<`K9!{T0_jei=VhYjq0fwlen&
z0>aB3(zRil#BxkMNDeG}7439=Ni`;%BByIaKx4|jHlnsiBa_lEG`#~#(&<|2Qq9cg
zgk<&AH7tEJVT>W9*~1PC&#Sdb>R9TyrgK5&#}`<BvHVA`p{4w*C1HDV*#XK~WK0pq
zv(dFpUW-qHS4=}*&Otc~$U4vQ5tTlrB@|)KI2Yw)9j)tKM_sVa>&R^9lD2(4_+uP<
zYU`?+`;FV1l##<MpUX(2nuq%`T{oxo1!VG1AGMC;T!Imrr8Qg;x;nX@*LHa(?Ov#8
zG<_nEb86TlBb(f>DC@memGil<%eY>_!@6l=gnH}|%PDu!NGK$Ho8MC;x8c{l(Qni0
zT+77QI{3H>&!DuY>T_Br+!KGI_4-{WP1CgY`r<adqa=lte$3@(jp!W>sOk^(noB#2
ziz}U1@c#g*T}^1|%*-8{Mc1M~RHUP3=wA^$g3>HPl8dWpE^R1dfXKgeB;t&dXNV4x
zs;8+9s-}Ey2izXF-6kpYZIbL^VB{NNXa4{aI?{TbLD0dq?r#oja<Y0|cCA@4Yo(E&
z1Xv|fl)6LC2_Hl1KZrU<`gBYadQ!6^Xu0|oQ>y+c!37ACno{WpE$+OY3JTdCF3BV(
z`f|0MBlu@quT_84wpwPBjpLA-dALXRbV@iAdP6Gz01!28ZhueGXQuod+^=E$B<Za+
z`f#nQrH)CT?s0HYbl2eSk)}Db$$2Cl-fp+_6ja)D0vK=yV7MRU@nUYab;HAL8E&rW
ziY-y%6HE+zjDC`vq4aK*r&-LWV_j^JIa;cj8V4a(RMy78ec^c?PvzX+w0ao4RFwob
z^7O5=Y-sx^pIS$Ig-ugmx!%%9K+UK)65ZHdPG2_8*x*I<`jc;mA!@Z2n2zUX>ax}P
zn_?cO`vsiVI+`HgWP~3VQCX!oqKgtnx~ExW4<tMvx~tTBm9h=3b(fv$T|n2kfi3Uy
zswUU0<9P?}tg&R8=w}En+39m@?rSVuEPhojez$x3?iK`V?WvT+B_;e=a<6)CN!4{-
zL7S<bDX)@7Rb%-1w`~FE#RaBX)7I42KhvgZb=Iq=Iy$1U?UttQ9th!VdP}2e>0xAs
zCi%!)7^0@7j^F@CU>8;|78v%<Ouk!siJsB=ex8M+Yem9ccU+^=sb9J6Ynm@>;aBy4
zTT$r+&6VwMz~nC?)Fsrq<EaBF%&gOzZz2A#g=IcZj7X@z<s)IG>ovVqsW{Vz3T8Un
zj|b?z8%n19ojy+KNL5`M)A4B(ENpE8&BImvG_yU=aX4Ig=H)6ws!G{cSL+%5*SB>!
zbH6O$-1rK>Q3tf{b&twM(zT|*oN^S_IW2|BGcfHwT89@rn_Uf2r8%+-fp7A)#sD35
za8wmBHb$0_^e8-BsAW1U^c_AZB@z~a^$PxTa0Fxn<x|rc87|j;pDOB>FyJysT~UHc
ziN5UUqLhG1N6@{__B?&cnw}=QAloTofJXZ)*7Q#7Ng!|4MCh#BHwc=7cGw`9GnoC3
z`zGKEV3lkQlskfnr>T-K1@CngV}qZuG4Vb&HNzviNkuM(@36Vt9K!b6{lcw+rN5d2
zOAv5=6s|5J;E{e+HD9Y7#E?PkQlyZ|CC;~91syA-FBby_>*p`TU0O|FsT)P6#_6Xf
z@7s{KpNTr`l-gX7$nw{Qov!k;KmM;Y)Ov+QU2R_1%_Nq)ym(%(<MBr<xi!(x<jvxS
zy_I@rMe38n*AnQRZ{_5D(`tVW=X|C~r<O@SspPMq>IR!eLtE*!%RAIHv_=;=0rg(2
zoh=*@c6|4#blK7>L|TjuYXh#?8JsPjPinB~RKB$o!bmM=GW;JXo~fO+lyXMxk~n^z
z<zwa0C3c<px>+33J<f-O(7ch_44R8H72QQuS38Se{5$b}7f@;rr<_XXmo$un;bh^d
z5izdA2o`fm<u<mp?x)`qu$e}H-Iskqt4Ae!Sp$fUPIJQ7^fe7FRVLZPT_y1EKSkxV
zR8>{;v7>Wte^D4(T6)b(LyQ-0J9{^`%6K&gu_T<<k4@DZLrVenvh5Zt0j~8eJR#K1
zb6ni*cNX|7JJelMQCiQ``}YI7&3;O!RB(Kf7B>DaRVO<pp!z#n*Ndh;iT3?f@8R5a
z8l78PD?f(gdzBp@ML{HOdrPEnJeBCZ9i-FgaEA~YZIw8r_B4}^M(;xD%1Ef1aMyuw
z;e|=m?x%&}m5vQ#JCz=>)y$-(FtOkeEG$+ZQPgJEY38M=adX|4IYTaFy%oidQeoPz
zy{1#gwl|JHP+ongPgkjG1}a%ejpr9tuF|y$wG&JvbJ`zlmFztm(iF|pBYT?PR14hp
zMJrZ4anmq5PeWDKN(D)gp#K0c!qr95GHA^eF+NG7u-*vER=Qf+dMJqYhsHC0Y^XYe
zts-qHY*HJMVgfv=3&hHGgc3_k@lQ03Yw+fWVEvT`NNF)oT41OI5NwlI*Pk$ToI<3b
z>KW;4*()AFX+x8c)S`Q?ixae{*x7&DZHT{RxzakGhH6085$iL*mE$!1X%&8+88w?I
zZzqQ;nRV%@oY`ZLw&#GBO7t{ZyFP%c*J<a4#(6_X7+!DJ9ZwvTGSfA{;Dw6RdYe)a
zG4n?wSa@;ZqcnX!O;(Ocst2}A0&``^uuf0*=)cJo{7lx1Q&~||=$mrV?tBI5{VOC8
z!q}W_M<kwA96d26n@zeB*OQzK*$Gs27BIFLCMS*H8!tjFB}nF!9oskcomoRb(;H+D
z_yu7)*Q#5o(!H$xA0=fg#awgxbBDFg;JdoB(e#sBMI;k6i6tJ?lYe6;^omUer_-1?
z99?>sP4x@{kJI%7U2aPAnr#BNPOOoxZ?nM}M$^*IE!#>R>UV9pOq%pbrrymbQtOU&
z*iGDUE!|MlbbVI21e3=%r#CHW?uM3^P>Q97x+k@l_L43N-*nYTrlxGIC)<!0K5UK@
z(QI(!VS0Z})F`VYq11!pmAGg<(E6h)p{XpK9k<4KUW3$Hr3S4Cn`mWBCfDGfg0Ou_
zsm&vqAEwh|YuhC>GxKx_V6CDVC43AU4bQ@|>3wU`s|~6IG@RTcx+V%OMl(%YP6U>?
zF7NbOny#9rl9a$&*1F!uv<t3|R6~XKN2$rC%RuS(#MYMkmzu)*M|Bfpg~Y`3m1EQz
zO??yJ1Lbp}?PJ2K(DdJUh=c2gU9KmUCwFXk$5e~+($dEF%MDB1!fwlURT}1%uLs(y
z2f3E^$lTm5c#^i4PW0TzwnhwNpM`y(YxKIMJ7_B5WKWD*-c<Ru*<Knvk4m7Hnyk6)
zAmY~x)VeqFrW?9;wa4`|_d)eemrXNdeGH5fFkH9F$Z53|{=9-VJ+edko8?k7QbNi+
zc6x<%G!$+#vcZnX_*j0otuKksVcZ%xOm|k*zMa%_(}LbNUm;Y_J7$oV@oco5BzXQ!
zjU0~|d(hh5Jh2F7jjeDU`>PJ1rJ<Y|W0EG{<Sa{!A&zt|EO6s*Ayr7~%83gEvo+m`
zy^7Mr{R*;KcUlD$hCt@Iz4DxD;i!u6J9B@ySuH|6PB$2(4|98wbXJE$S5E!go?7lc
zR!PUU7yAawQ8OmJ&(tNKP?|V*0&Q+p^*)el=$!umL^b1s<yA>VwZ4>%upUBnD9Pwo
z86;*Z>t8d81d>W8M5S!|{YLC@N788xZl=dErO~+La<_Ed8p#;is7Bk5a7#I;c03`>
z!yPK(#`hi<rt~}6U7|LEwSsM<*ht6<s;^HJ(l#ct=drgc!=>t=pww6$?Q6}3e@Rn$
zRFLZvi?FxpF~K9Ih2WUY?ZHj1q>81YvMVy7pQ*OPmHw*)a+6aC*!JXraO8!Mn8V|3
z?mfXuq~3~twX+*77y6hpQ@FOGFVxUEPz@fYNWV0|ae^(%wbk71GNe}0*gN@v;ExK+
zLDy(&q77>U9!;Fj1yVC{>=J^PK;0usWUBP00nw3S50$0V{{RjtH5f~wjj=rEa2C2<
zIh6FTk{7TEWXQ)MTvPQA`fLJ{y~oie(M#RG1w5vn(KyDP9$~0-q0wtaJx%tX(IxP&
zbcVxD)|-Iw!m;Z;MwWU<ioAyl#^K-PW;#Dof~Bvds%Z`mA&x!P!51k9G}3`_uIqKo
zX%R|5vdC6eYE=&}bn+hK+_d%dQVEUo5$|pgwK`kjh&&5}-FGZ8M+?f|v(I&+$6U<I
zp7%k)O&s*4(7XqZ%HOOZV`6>q;udqI#IC5^_Zv0bc?wg2_~g?IG;+8HmfgG`C~0(g
zu3p9+r1xH*r0JBEb4TcbXAHK;n(ZDsXBdk;u276`Z0eMkN1ABVZiMY{wtKHh=`BO@
zux*eB#(8gWsWl21qPwsy;Z#ehK8{AYk2VL7Dc!D#YDT|b)Y(?qnM&8n$iX&f%Ja!}
z3W~|SH(WOMv0AR1*J#GA1z6f0eX_=Qb5APIuX;KtA$L&d?P;cex>&&dKOqGqH5s9&
zxs=Ut7$Wxywo)Le1;ht;9#zhdTX;k=0&Fm|y+R)SO{IqMgO7!rH)wlYS~dMTT~P=j
zzrt{^b+}M#ns?;Cj?x+&wSR}y)YX~`BP{|({{VFUuj%(Xh2&+nCdaqYQOid%TRf7c
zt<h9^k-YB*7AogX)@xkg$8I<9s46I(1!0W1xNgBKMWcpB<`)5R!dWEMu%^>DeK$X<
z=vy>9UhHnN)Yno*-)z7&*29&5O*(?MnY&8_tmUJ!v(%g=gwslMY!r`;Xno$y?Nw-^
zE^{RSgU$I>6}?>>F6r)V{J^S>c4?{KH9VJdLBrNQx<@=bckVo>@V%7fT0IGx&X=w|
zjW1z;0mrg4R_UnqJv-4PGFFSnDCKy~4HZbL_334E8@lD7uT|*%dS=4PTBnyc`CL@z
z31ixJJY=P&VXJg$>8qVjTFXe%MtDCfNz%G&VUy97myN?0S}vu63f4AK0gz-LAy&aT
zr7dA^-@@s|o0L-}EJ-j9r_h_HgINI{nKvP2<gRC`2=<U{R{K+`ZFK|Tdz-r4EHiYt
z{{S-Uo!Q8`4<fPFKcivzVboITI=G5g7g5xk9}O#C)=|$zIIpF7{Ir=iKc!>(dV#P3
zx-HFj7wo+T3P)6FhLUT#GT-Lxxtx@wSwoLwx<^}*qBcc1I2eCothJiS92y$$W4o;O
zh}d-F`ALm{aSbQ3wylJ?G)L}?_F1av(J1<kf*C1aEK(CCyBsXWis-BBKhvw@wtb|9
zw4RO4I}3?v!X6ziiaO}a$MG*<P>*9bN{*uGs2KOe=*On+6@InQtcpiZPan98j4w;m
zsT(Cb0T-~tl$9}w7-Ds<I4R{f7oj*QBgN>Z)Vg`Dj(808ZWfX^a6VQ`Q<Hs5=713!
zop9d^-gOEJYM9>~%x%ab$GY>H?u&bC-s)%n013wfoxcmK9)5afHcUJ=h(8athX?*r
zQNAOL_F8_V(_xMwJT1erESb}tEBQ^Q)7tCgS!<m@3?dnsxwgVwnADvO42~%C2y11D
z!Y6}cg!!an>>NP_Yx;wvSo&|x(tf6kkUK9v*4t4`;cslLJa#Fi;qj(u`B$Ln^r-40
zC4dwJI#cPU^&@EnauwH3YBcqbZ4TQrKT`^`s%sw+ENBH<2}KZ`n`Ikon%Kq&aK=_w
zsUs2xO%TQVc2+v{?}lq|;(K>OM^8NS02)J&Eh7XaoU}X=ZjR|0CoLqK=D>MZ^J=ou
zNpl;FZo}GAY4mWltn`M$*JZvIoBb}IRHC!&*;?EmE1EeQc8-Sxqq8XYQ_CQ$r#5dc
z1mr7vSakhTn8$X-RNv74$LgsyEjC(5$jHHA;QXpu3YwZqlN{yjH};#Zg_b_ZI5K{r
ze3W%2o~4D7u;7u(4xV>ZG)6_wWM@!ng1(T!T+Pxje+p5^KPs0>sM#O{i-Up|xcW6o
z7Z0Nhls%2P{$b@?Y0yV70@uQho>=6Ecp~5+<g0x=qDW1yauT`yhlRT@B+{ei!3$SF
z!yeKs;lqM$HnL=8oNRmDHcGb2E*+l<8*HZ(wlX@S6Fn(O4;(lors^qZ>OecTp5aAM
z)=I*2bxWx;Y<IoDO0l%;FC<z$5Nq^xRAsdU9m3h*tgUO=OH=C6+(u3I--Sn}%w-!1
zBwou|r|H6`Esn@I1qTN97|9|EYW7Im8(8uR2T-OnJ9K0pzX>{rNv+bHC1XpXIW|J+
zb)nA>xWA7oY7fy)QA6N!soQoxYnrE%TlE?k@&%E#nrG+fjZGi>jTvC>vQ;rSO8DH;
z9^PAQszo-0o2F<WbaG19HcKAF9_sdzs(Z8-pHZUM^1Sa)mUyZx(&7o>dIwI+6<k6$
zklC0rJCr2~+YB<NqPth7sC7h@QN?}Pb4PVUS6M&h%t5Z&59uQ<E7hr~BjN15l~+`B
z%O;ESbW8$JJ<aS^{b<s=(dKk@^7@u>+Tr?2wV|kWRNn9zPzTw_dYvi$ud$mA{mr-d
zQ#yubHL?bqj{U-Tw28GU40K+pEdtLRs0BNk{{T)yhjH~*8c-Dtv2gWTKXo-+1YyG;
zMbQ+FcQ@>+WjHS}KJ9hze5fjP$F<iNR{}Q7-I8FB((d6tjzHNx3Zb|T96TnZEweai
zq;Iv?Hc`t;?bi!cS4|s+<~wscI4bF(AnmXY{{Sdb8re(e5DwBpMpHe~G_}My92ITo
z+14V*!kE#34Xzxw6b^DN^f_Uvj8oPztf&K%#Do6;DfL=EqbIEk><5EueN|-@L}t|0
zM#LXu`+|+1RGyMC9Z}rdSV{du<#A-h;O!lF@~JJBQT|s@r8E`o0mOS;Rzq6QrPHUu
z-xH6u$k$g#BmJ+(BRnOj)m-{#Q_g)x5nykSwmXX#CdyV*7Xa6fx>r!i8^ysQ_$b<1
zh@Q=l7I*nhl6N!O?6q~;Iow}pWE5N5aBShmRh0`1<PlUIuNZ5*p=jiN!36VytlrTq
zTZs22PAm;bY_WQ8EPhXv9KrCraO1c{!B7jm8My39bny+OTo9O27@8#lW*nzU8-cy7
zJJ|^wkEeef@)eV14`6V!nt!qkDFOC3{U^VKJgp3Mp3wGoJ`t0!HqRdBrk1tw`$fn2
zL?Dd4JA>mlVdNq$5&kSeq<3#A(Z(!E8=KsCNMmegb4l8JC1x%(-6u@d+8G>%3ZECj
zKx<tmt7*<JY(`kS7K9{Dk|`T3FLN9X+hb+u9Uazm(}Ab!05RMLxL~Qt$~!}<XPLzl
zp652jk~ffXbrg*z?QpffaJ`?Yx<-Rkq%{;qF!Pp3&O-A|OHHV!s{FNUJvrKaueY_~
zXwQ%(7L5Il($@>!Lo7wNE#tzrtf8|`&PO1iK-+e^?wwN+rhuajH)HNc_+0plNe;;D
zQ4fe8drC$Nu(jMKqihI)#s2A!1-Ll~sbROcCT;%!?5qutHNc&(`xM7Cw-&;dNPy2}
z%)qnnwD(wGIa*upZbyY2jR)K=M|ET(4ry(ye4*utvDU}iy3{YQGBLPiCc+4FdGLsI
zAmyUg?3&h)d?8~HmTm-w*xMke3qf^=u~r5x{@`pvhFER^Jo#BO0~XrA@#QyR2LqKh
zSZv{TsWt}-wFc<G?grh9P*n{#@H;C~(BWf)@~i3^TX5lp8`)^|S3S2jPK}r2l_TS^
z+zu46FgRdkRTGoh52du+qG{STkkf1SPip}dJcOZ!<cturR)C(ywWXM`2_=lVm*p1=
znrz7iJf}T@hmcx$Ax1}38AxQ7nn5II>I%{6a!_j2{+qqBv}7Jf$W;}vHbJ?Vb-40{
z)21}lKH^y6!5x-y<sEh-mkDp9NOby&IX!^6fZ&3x=&B5$G`rjnd?0AGNlQSGf_(W`
z6bz))EwqT{^XKZhq}u*PRAVi~>W4dS*EZMSl|`u7KFuT$c<{Cch2|3!&G!NAa9RCN
zO(si8cAm~nj#05^j#1fG%8391M%;EbR&+B509tN@4RtZ}s#qM)J(mWEBy5n#3lDqo
z^;BVp^lS7wjW(i2(rS&^(}quP)9`*3maF)ED;jDv_lY8SxM|2E$XNPmTK4?+TCR`k
z+RX{VnsDl>0&>HbNAlnNEWfd4pK&SYqt~>SThM%v4!~Z>ohMmzjj-Iuj#^i&!8Vzz
zQ#PuOMoPzyJN*b%mHi>5*SN_PeuVx)62_R3%}mbG$m+^{%p^a^Tw$19t^_}~%051u
zuhS<Ef=rL)aKnPQf;wvWjB`X`s2sHa0K(^#X&o@heHe<WS4jIlGS_`ML(4??*=Mwt
zp4M8*>K8*GY>hi_hj?8kpLp|f4|OGyv{j`0Fq6}<gpqxxu~wZm)!N5R$k9tNo|5^6
z?j#SP?26TNm)XvY@!4dnJxXViLACM<vT8`1Ri=7`wH-Uw5xTB~vrg5m{6-u$L-If6
zR>?$SE~KkqW5CN#2jnk4q><jcXQz<0;M``*Z>8$*tAVg;Y;)Q_Or!O){{V!ti|o;V
zMHaKCR8ly)Chv%wn+_FSF0WTZQ?Om|pXDcyqTfj##%z0=G;SW(jtE%&c7=?a)s40n
z$XYoqabT2hXtj#EIoR3h=Gft!{{YG=4Q20k$s4j!!3PCm<CXC`!}di936F4b`X-DQ
zKyOCQZ9q#2Wk9=6dn~50G|)_66U(AMbY6?AHtm9<&Tkhe%}Rl@L}jNJZ*UcsBu|?&
z6%f<cuonOxI6cCelA5lTJ@F0ka7FNeu4J_Gmonqy!k0tVq=s#hewP~%vQ20<jZU9C
zWry6-;08^yKB#R@iIc`m7IrRMfAET?d{SBf`#=Q0SS;5Zk=UkBFl6D)Zr5Ke7zIt}
zrJjAOQp-(MxwmRaD{5nVTpWI@b*a+PYH<6Q87LpQS!#_f(8yW`AF)(THL`6qTIl-e
zvsqFJAJ#bwLFz{|TjOwZPX%Kjgf+l^pCZcIf+^y5_#JQiPX$I$R#Gx+K{bP9o7wGf
z?mMS4rYeSPkOn{Kqp6Y3Z@rse@xfHJvdbH{HLkcp#CFX+Eqv4?5A|T~%jA6%>V!3n
z^{ESY4B2Gh)tXzfe_`^crPLbPL5@HVk=<txX69VOR#<&Gnn4~>RPCCQZ}kl(Z%$E{
zv-w^=PzJ6Fxc>l({{T*5-?2i+Q7m%a7ZBioP4HGV{Tp^VgQ@6W46!ykn|~4$-{q^%
zHJui}rz;GU&U@)gv0=yl71cbm`mLyobW;OxMi#n?s-Ih>G}Vj@skM#8n<xJODQ(03
z29%6;jnvWXV=H}whRxg`4*vkkys3eeY;3SSyU4h=4*RNZq3Ll+D~lRLXOZDj>5tSj
zX)P0-QAT-)pVR*U(x{@PxRQLAWsadV)Y5I0rZ)qSR6m-Esem|#A1c;L%|BJ8*(O2Z
z*0Y*?6+u^~%||Zy-Mxh1w}d0uZLs*>=#M_p`ztzm8z2s2hVLqhmVM3I?D+{KnreA>
zL=MuOY%J4FR|${Pr~$7WJIV@ALTmy&T>{ySSPhsF^-@JgGzZ$^_J44d<7;SW%j_%C
zaAv{?aQ!a|gH~grn({Q~y}4QlUiihwxxK+nscaPtEs=n<{H2aYp3OK~(UfHk-|9ea
zJF#=9eQ(f9Tssk!dUWFf62$HC{{V1`f}WbGfH~VH?D78qD*pg2Y>&j*p3}_KGY!`b
z?{%c7podV8)}eDmpk2(rDTbOmntI5#zxiF*{H3O(l7dk!KI~*zrIhcZLM=LE@JTFB
zFjU6o5sRKt520*>bAH5dtZAz#wJ5|jvHEob^vISdjXawjmiD&=OPKV^I*M4^iiSGh
z)H^6Z^x7El>P7sn?iQ|UcFN7J0nPHNrqbl6cc~5CA8=7q`wt&z5{6?DAI`(&T0|)x
z>$4vSNT^sEWQF$!^)&WPeI(%TivIvbyLt}Ma}5Mj4a^`r{Ha}~Iq{b5xbD-!rKPQ^
zq>|yn<F}Qd({;G#aBIfL_XRSs8(`5<RMK3+T=@I2oR6YyRXZk+bAfBVISWk~hE|8h
zK_if&o(LsryLP+JWRj1x1k7aQFc_u*%{aM0I+ivPT5i+WpYX4BZ8_~OF@i@WzxY}D
zlK2`;i<{l2ke)KNvr}6*!)y*b6n>kj8b=0B9OnN3S8%IoYS`dIo)3%i5qE3bXE$*2
zIS5V^G-b(CG%b>rqzNE+YmabnRCN^MMr?4{;y%S@OQxlNsZ4h;@&dfl_0~wy6+=fK
z&Dl?jTS2<e6<(ghb1=te_*FHOvqA%!OpWYT<gyy5ZpQ}&M_WevX-%3#9oU={@tvBC
z&<-NRSoiQy^8ns%J{8?n9m}5>KP~Ww6h5;o;7C8XSB&VC;blB>SlzAz=ur^N_DjCx
z6w2K$NS<98Ax)<S%ls*tLx*+HrE1a1D708bQR_1{-QLQ0Uu-no{{T;wRZ|5;6Svs9
zBmBV^O)Dm7F}owR(<T7t2FNk(aO5V$;L%`IY?y<#VQ&skdvFQQ%Xlf8vtQWqT*HDs
zi8nR;9jD5Ky5FdqCAH1L<HA}Ek8v&JTpXqw5K9l)IgTgV;c%HWWscs%geb^HN=1XN
zJcTrG1Y8h?yJZ9)YrLk~NX@UxCSh(ng{|~ZIJzNh?fNccg-p^2$-2fv1B07zaGQ|p
zgtA5a%(y=RBTdM-u~^KKCy+T(?rYm;9H?!Jk2y(f+#x_rkhHbf;W#_V&y^nM3><~T
z-;P2i2ohr{2@bg!LT`2Z+rp4bj^L~}WTC~SEB3v&2R;-oIKB7@Vv^?9vK2rW@ZfHF
zDFgnuL>7q~Y+Vg23teJ3MFFBqn-UIusUv;t4nhdI<MfaDQ?d5|5tGWs2$79&_$Wfx
zHQwG45s}60x!@c5K{^XV86YERwbI;x4aL3`5;oSh7cyeUZFX*$R*9VZ^Vu|jd)nz9
zT7AIc$`?7nfAF;f**&Ze_eucqbqgjU#HpG?fZBl8G=h+@c2XAN<Q%5$wd^pp7=i4#
zQH!<N7exjGdw+D-uoHj*Sl2^X;7y%tD5_~&B!1rui*~2R<7<<ftYW672_iV`h4o(7
zSmMh?BLsrP3;zIw1yukbkO}UFpJC-hH1!u2KSeY4N!VN}_eA*JYjB+u&H}^{{{Smf
z4=W~hIK9BijnQyV3T92l<vc;J7_wG_7FNp@?pxsq@a9}Aso*?;f1(n2H(XdGsvR&7
zQ0?a_J%5tAXp3)asCJ(p*$yZuzUm&AjwxJbsdLTqn}p7cr=imIsA?W<7(cIz6;-V3
z(pAb{$CnrK0>9}!3b$0Iuoh{~;xM}*8Oa>dnn$wLYML&$M#kz4k8>Ml&mIro%JWX6
zucM%?k+8qjXg<>3R*OXGZ^}dsOs*gdf>e6>>8&OQO8DTB_RC%_RNsqF`2}ZHNgiXV
zYf@L%fXLiW79z@ONgm1fRYzlMH1@g^UDn%ETx8R!0|oFv;T_ZZo1VwEvJtzr#nU`(
zBSvf3*VgK-mF=e79l!&Efd2qM*K2CT^)&MBz0JofOQ%*gIol&54tPJLw*_yg-Kc8X
zccmQ<rMO|<6QxSh7EfkJOzH?UiZ)SHvBKCTyoHtgLh1okBci93&xlz47N4lU4z&SL
zDyu6AYtBPC3oX>08CyXBmMNQ21HAGQzgq%J(UZ`_>#BVa;xe`MT{P-8#WYe#@a{=B
zM)Zb{rbkHU$ad5Wu!G9e#iZ&L(Y7`a#t-Ij?3qE$>6ytz7{AMUZvHdc!RG1>OHZn+
zrrkvLPTw8DUX>T&?FB;#)Mk;-@EvO@DEe1P(YMP(B!GZ-G3M<*AyMP4*)@?f2h*Jk
zH1LXw)|g&00xEVjm5rjO1J!BEtgP!gk?xXeT5GxNCu>@JDt!*3Z_YlVv72Pwadit)
zms%~jqfRtW%hNV`n#a5ma7QETvpV*=`g7?+UnbFk@~nD?THQxz-`hD}Z>!E_k=Jd@
zz7sg9bcKwhj?^ortf+IFJDlV4QF;Xd_2ZtTILCfdI(CGDB{0bD_u5v0;qSXyPWHFB
z3@H3=Jt3T&k5%aYq@~le@lQ`PT0=nEdxTAWEImz2HtM&+NIP5?l2TAsx>mX|Gnw0H
zCd+Y8sa0uua|@u90xU^kQpp+iQV~h$!)kh4DJ$I#T!v_x@*GEXyXdVGNS>9)NvUO9
zt#Jf|Z)xzddZld@RY`EWT>P7!>IP|*jSR2TDjfvzn}<g06qMQ-w4RMdxirz4Ddp2<
zpnn%F!TYR^r9$SnaRjvH;cPT7#EST%j+3ZqV$`A-E^~d>`lGc?BSY$nZQV1dHjbc+
znrX3P@UohYo`vAwMiQ1r!%OLsT6qp#SJc|QH6f>tV)*Tc46A;g=?z|&RWy3o1~Pq;
zH!X1g0D`?2PU#H~P9f7%M&?K`O^#8N)O$2>S>Z7CKDgLqf)~8DOb~8_heoZ`Tx6?}
z_vL!8SZNvqwKm13#M)Yy3@|p#f7Kb&T^CzfBw}cXqu*~KG#Zye&O8ikoi$0MbhLWC
zEkH7iy|?540F)GZ?z1!@l+TgPwl=th?ela_pFv1smKMG@WVG<*gzAbdGfa1>O;6~S
z_X|pHE{vhc9(g4PQ0fr5?UCVx`<ruwx<^J-O<NT8f5(RY=J^WM+M|q*k+YVPe|2@!
zXHnG%ii#5A>;l{ir`);|NYm&VR*R=d$I!6C{l4G^5Fdy&@kkp3oaTdv5Nrp^Ca*y1
z%{Vvnt!z;{i5fQs{Z@CV`b(+m9qPwXO;H)hvE(e^*I~5YjMXy@C2@h(CTL%gW0k4t
z-k+tetq*lunmz_q8+3^1+&?no9GA%Cw62z~QHA?7@gv>kz0+f>`vkdqJvJVL=-P5>
z>ZAq7^%u=yf1)c*=^mWcC3pH<G{!jHwerL-W8rztH&69etsd%`j4_ei5>c8YI_E=F
zKDLKY1<oG$q{|=m9#GAZ#x)+rgd29*?YbXAX*zb<TE>(A0B{RQ0HmS;u}0DMUTM+&
zZK`VedunT%$2)NZ#<d4g^`YJg4(<y0Psn-s+}vg8_wZnk6w#xo)Ie|Q7Fn%(R+b^Y
z2i$}De5&fbP1_xJU@T^})Ku+}@w!r6K3A0to<><zQP{D<J({|XqI2W1J6+)n$ttG2
zg}YjNyM^a$>s>0AcYa~*9mB7CDRn=_9UYo;poS;SC>Ch~&0dxd#b(Ivc1nI+A*h~<
zPUr>OHAugP;4I%+>w0FNO8H~0h9|USIrl5Y^?tI|HBj=}_rZP}9u_*U*Pc@9iDi(U
z?{O>K!T4B3e#Z_^K3Ah()E#+KSu>kUA$^Z-7H)lZx@Ycugn1W1(b5-61A7!^r=`9S
zFZ{ybuTvj`hZ_B2am&leKG`J}r#szeS;NY(ijKEYm8_?0u1&55)n13ER8&i7m`gzc
z-wWtJ!+w>fhfHk2!L<iBBZSY!g4$aL`4X-zneW42!#Ry~b#;*!clR%$bS|HxrG=KK
zZr}!NvpqA^P|;PITIz7Z!(#70D^XY0niU%hol_P60Pb~{nU^)no{KB37V~~uk)OnS
zSUfCeUUg2DL8i**RW*b(<Q0YdTl`9-sikXlYMt{FVi}tS;hLK@oo;dJ)K50^h8GnW
zMtNk@(k`JG$CG<3wZ5pT>Md~5&_d}8-C-lLY`y;g@QbF!4vxo8&v3~kWR;Zs68th0
zaWb~HE6*lLBaemdkE4o)lzL47G;pWnP7wVut$mFa<@|tU4Ts%;4+v&fgEqz+pmkcu
zI!j0Hx%(-!iWj-<lFlIVy!5S?YL?3h80QVdocyF<Ho0;tXq?7ua3J<7wxV$vEF7w(
z=vA=8u*Y%AgJ~oZf`Un1C%5#T%D}uapu6`~(nhKyY$4KEkJa5;(^AODt_KKeUw8y$
z4i(HY{{RdJ45dh%n6&P1r*q2bUID`4U@kaN%;9V*sVJ?JNNn;D6mhY#o!!bFX<X-R
zBj{0@b58{#$#S8ZrDSz9X5rx6DPV}n9f0^nR5W^IUnqJh3?zqPEUGVJsWy(1k+HJG
z1(nyTV}sObAowdwt5*RD%JOf-9Y$6?p@$E3w*@C9l1eb`md2lK!u}=H%d1k&3?j~H
zwa0aj{5jS&9Rk1d&5X82`QZGoLZ_g!A3KKN;oW03NZjp6%Ns1_9splU;&}f63@G5w
znPh*`Jv&90Q`ThlrJCSpZTVK3zo8uynON|^8gJ!e`dd}hDO($(fQb8(d!}{c^&L)~
z(!(ikFJLUGk*KOA2stu}IqBim<ZC1{!+W;qjeAwwM<kTlc^0!;vozXns>)yW8hE6g
zj3?9pT(pI+=)HeTtY~AQiLPnd=D1`P(+s>J_D)#2OswdBmX}?R^R9%*TJL;r79-><
zKB?%h^qE^+90YD6@h?NCuBFo8HT3dEHn-dw+z_xoh#!c$J!LGB!*|Z!8`|rhS>?+}
z=!O{a+cljzL8sN|;+i<4XbtAs1!MZVORk1t6a})egn(Q>vhTyKc1h^2_xf^P_C6KX
zxzrRUoy}`OaQ#H~RmqV)$U-eW7z%0_rri{=?3KB-ku<Qu4*(J{MU{57tG=SF7#d5P
z-J>N*Lsci{Vl%|%8-j1aPYGXUoKa}Ws|3wt5(Y8YBHSsebvn&5X2(9_9h~rsk{G?U
zjRCB2$W`54R}8v)Snvaz`d|M51yMz8o13Hsuhm1Sfh(RNb?i?7t#3`~bhBx#JDTZ$
zyI<vbgPbY@Vt=~dD|gV;8rYz0l;d?dCut`?A#zUyrP0$2$up~HBcRkpOMtm`-WHMi
z^fa1inw{X|fRWlIWlM>whTw}8m+DTKtfFh3O)Jb!&cbhGV+lo3r!^;N&vh?S%{@!p
z9b$R0<z=d?<d~mvKMDGU9Ybbxa+@3e>HRwkTVMP}2Ypj0(zYinbWzq!;&zZjxw1E>
zG*9&j3+COl;kN8nmsaVP*2vQdYi4)pw{@fZI?&5&zbR1}VUP7+x(aHvJBG}CR)eVN
zgJo4L%wfwUwg^{UD@10IvCB;Ai<}#9SJ8TYlR-Y1DeGz5EFreY?5Joudr8rCXPR)=
zQ_ODAf0X!2@*t=f@zW2RPB7L*{4ti}Dt#WEl=Q!oV-Kd=+TnTyWYiI}Y_4ldcxukn
z%R*;!paSkWxxrJGOVLQewr1$1tBX*PzL9iC4JWeJX@8V_1{vdECy`{dte_BY$EnSV
z$aS8sbf%h`b8&lG>6S+xk(?Bs!M_mndTH9`z~<SxYlb$JC*kWNtkb_OSX#=MzeE23
zs4D#zTc*_r6`;5i?f|b&=^mQW<n-z(OCJ-mJc5^#lGt??P)(-L)KsyxgvR6TE=#59
zlr&nu<>!s8E;nSh{b6c)*QE_zDKtc~XxeN+w&mw=&#6gD-8!T^$pp3%yY)85kD^4{
zRA*hDkEnF@1L-c<+bzahZWd=!={TT=^K_DtYu+*0UTO7JH1sW~^-Pu?=9CR?tsUJq
z@XL?Wbg|^L#+5ar&fB5NbyMnGHba|mRJyNA!x{A&1CJ`^qgRR2mw?u=9u+RV)U1v+
zvIFjMx6yURDeUEPm5{VULgr0!&79knuF+<0rKh%dWps@_{4X=qjcoC{cD36G_W-8p
z4R)tPs1I|C>0U>u&TaCkj~^L+#OFI&H}zE1?w`}EV|Ke2D<!SdGe^}K!GY%OaQ;%Q
zx`(JJt7$jWOwvfWJ{AjG*QBbY6w<qU+UvI6m1k8%px<Y%XilNk=u0PiJz&fqA$k7*
zRmANJRx%5iiNl92D!)b5D(RtQw1vbBIlaQ&>D?(eQHIT^IKSI=v~X0Mc^2iw&2;0d
zt0wiR!H^%-zl(e=6-5m!ZuKN!jFIkl3rj=OBTi^!EZMYL-wLOyrKF0T(aLQ8Hi6wj
zYAd49lW5Fq+C3cNFUotRkXzaj8Ye?OuWM@ynBl+(K98ym*1&oG7&ZX*UfrY7(|%dC
z7j6JI@`PJ}XHqg+cR*3b*0r?lzj8+?$$AQvp7`mbZ`o`Hu}2rMv;sSjg4K1Hgk-ht
z;~7agxdBFxHtKGcf;frvque|9SqeHhA(X;w1?&OrR^MK(HLr9+VA576sx+$oHU{bu
zlPfRpAJUc>@=N^``5_$_(9q3K7%VL<JdcG()Dgzofaig0SfDhnvSe|#IqYrc!qI89
zG+j+gBWd6=MZs_xX-~nUOCn_@4LA}uSX|dK`Nl%@-k+rW&YC?r+9YV={H%_h)0LF6
zY-=|GkUXtUg{M_Q*E;TF#|`YGKiH%xEfku=nMqLQ%G0}n?Yhd=P}I*-%9z0oamR(Y
z*L4`l^s1@7Ih%{ym03wNMU7x+YesE#TxlrN7I(_gchhurT85O`T8G+33o=h5!Bl#^
zRbGdv`ZYO;!v@$}E}hgVqKj{~;3}@aik7~C?y%kkz(G`5pX|1I-nXb4wm)O?P6uQk
zMbgzbP;{?ztX<h3r|Auy?G3pD`z?-zqWS|YzjK9G9!o@<;#@i=*HW?Dw#^v3U3HY|
zin@xj%6GU1#%}EXrGKirY8baf(~PV>p;BKX+<#Mz@>FV_GKy)dLG(4W^>)+i?%``N
zyRsqLTr~565gUd<3oA85WrPE@<AR9MHRtd2rFP;Cx#4x<q;qB2vXZ`|(Gi`bv{+q9
zNvKC89)!l$B~&`TC&jyhsP!#J(s6SQms*`1&IEsmdUIyHw4{t&g_-F(c_evluugsz
zg<iTQyJR=QkEEiSYWKPmw&1$nRHpBt;*FMxQtdXfBh8A`*H%TTQa(mlN(If9LU|!D
z10mTXJo1Rr>x6MQmjiI3rKVeruqw8hn(+5rgOIa2wI=4BxLRt5g6Bzl4pkPZR?ySw
z$CQn->M=$}qAB304rAQR^Wl4k;kK(LqoF%Zt#FmHN4Go>yke@Q&v6bID(9m$x}7qu
zjB#;<y99qK4O-|#sp#BK(~gRFK*oSBb~@aA6b7}RdQATSYR>~dD}Sfe($>PsTIQFy
zayz5-oe}j^z}vO%7E^5v#aV;ss?kIM7<&zf@)oOG)?t>Fj>DrP+&nC$W}NC;;^u<T
z4pVE}C#GD}YmAR5?UHF(k?N?Uj;Gg(#f0A-leE+Mh(lr*cZJpDK2J@;<G4fV&61A2
zuBX1x>w*6O3F7KI6{Tgqp6y>uoYce~8r<8lR?zjCn&NY52P*qWnwwCh^yFhh+%gEt
z$#r&u$_f7fGaZ|o*bY}OIJR|sZmkZh)G4c3CgL|aWpx-_$qj%Yt7mEd0GXux#VhR~
z{Y>(qr(<hBhUS*Y%vh)7mqPq)l=N}S48iO-Z*aAgPJ}=n2(cLmD5xI;%!WP9Cm|H-
zCd&z$ncw|Px=FPm<Bqn%Td7Hihq;%q&kE9;O*OF+B(WpfEx}YeMLS<nwBK+z3vZx9
z=slwMzn;lyL!qwOgVpHk=&HRp-|K8BVPj!&n4I!gsB6?zm2~fPt!Q{00I*t?n%E}V
z*9S0*{S(5bg_Ch*o`tEv=2^z~#k?)Pov8YhA%uYNJ%_PgWv0@y84H>TW3y}Uw2%oR
zpaeYnXCvWCSX^DAoVl;;Hn&ryhgWE?Zq||RJ_^*+x(O+xeKdjb5q6Mnyq~LPHE>5G
zUHnG-Nb;fRj;5^9Dt|9Ibo6dHY308~MF!Cc+*#|D(H9oT!)Jl+2f7#3q^lve44tJ#
zO{~)D3~S(i4nb7fpprWCEJU^4te4|#JpRqbldXzp2qrco3H6$^Z*|(>EWFC6Sb3ZH
z_>%pX4NhraaO3lo{{Rz`0-qP7(2Yb@t`V1pNIyxxDe*%sG`rl;@J>a!UU2<Jr_>ED
zEj)vDb)fZwW0ACao4_OV$ar!e8;H**B~0}CM!`Kedt<e}G88jgX={kwlR&S9@!UDP
zNVv}`v#E_ilu1U@viBpxKP57M2nM05ROzz<&}D7%-yvhV)+nk#t&N)lv$w+8#Yrt=
zOp-S5w+FhS)^zb8bT1<Zg1sDBRHMY?$&ZV(&e;r(oK#YslQ91O01HJyskUgnIWEbE
zEg>wrL4rp;qSnq;KDHbKW`Jy!hWGN8aB&KneUSA8ZI#40S-|G%!=&rz>Y-+tT3ZzC
zKf#;5{1pr3kEk@)I-P;Kg*d#Bj$S;4n0p<(mIpRQ9(W-5Tv;c2XKp-ptsC0tB%`P;
zdv?5V;lqcN*)`U{16cj9?iNaZtg3Y=qpNG3Bv@m<6<l@Vd5hdmRAU(@XsdB+XQ65u
zoi3vQaB%fnGxD+e#au5wo5#iMrh%7()Q#B+k5hAmj@&-#^2FZA$0TA|K^rO{G0C6l
zauPi-iHMAoVuaB(C&gAEm8H>>&xO6ysi~hBnlaf<QE}Nw$xB58DQY5%9gxNMaR<uP
zRzla^&9}+}P|@2YKbV5S?H=a&N}Qg;=@oRLwGR>4G2C4k$|tf-uEGJkV{RR1w~rwk
zO{+4d5gf;Cjlgp2#gZ>aCRoV?iefve{Z1w|j_wa3A00u%UViE-m|IZO<oI2Q#iNnN
zUd;ZKSsh>_gN5kY9@fSP9haTYK{YKvk)V(Y*!1S0C62^d!;qmSi$y<Xrn*X6nll8!
zrMCNp<(kz2)AfzfW+xn5g{anRWMhr6ZIwhP{O`5i?Dy=VyR!94nX2j8V)Pmv?QsIf
z%7>}CZQ7(pyGspjr3k*x(+~Wv(`h9T3xZp09|>QsJ4u`}pb#(Yke(2l-JrrvDt#F^
zDStA-Q3Pf=n~9+!#jYHy%@#J)O4qQMsw4YdT|PQ3ZO2p7_Qzhv{{S8#fiUtuQB?X&
zGX~Yuw`7*c7_soV<&l<*VqEE;$B#D>G-P>35om}b>vdgAJh4jF%H6IU5#3#lvoJZh
zb-#4VNukV-P-#q+u9^|G$2T0T)86`d1T~PBIR2O0+W!FlSED|e-l=<A?e5<RE3{f&
zMv%iaK(vn;2gq3<J)UVbBjJ&=(*keUD_S<bp@2^foo^hg3T+y%MXU^;{-T(hHRmJ`
z1#I-~77Ds{%M)A0)#ENG<&-U+c|MagZr;#LM~q}4s%UDPXKW-73)UN=wS!~ZaC@en
zo@)*n?I|CTOg{ylQwvL4L20qUX+ze)18&=v_C6P=SM<bXj@ryPX2T(2b?q*zOOyDm
zE~j=ICBLy$hG@@1PaLAG&N}jed_AgKX^3{&h5rELCruk{T^R**E%l?n^S8HkVF{|V
z_~!m24i5)~UtVU86HPeZAM&`P<C0jc(k>Bgjta<&Bm(4O{gOQ`g(CqZvQkTDU(+Wa
z2&PWi0C086Ghfr65p-|;9g5FFC8mDM5<kiuQwx(t(IQCww`;;CmQeVM9(}-aRc$px
zWjXe^BN$pu#vVI)TZxp54L(5}n;-g0z4Y8+4q&*qD?LlHLH_`7{_5XMt&#z-i^h9+
zQ<NWQq-MHgbu8a)*!c)oPc%d^#F5ymI>$o$y@j?v%8t>fsp=R#R<*(1iagp@!NoU7
zq#l&*+U!5FYYX6gox%R<=UdT3Z0dYDzo-7;@~PXrG11gC*kJhyvE@@1c-%(^o#w~b
z?m<nvqIoR@wK=f|0?_eu`c3&xrhlg=rBEz86;Tcj-q9px$GB1uJw3zj6RK&wH~NvA
zf;)FZHN~TYjzYk(vaqt`8?f>4p?Pbt^K;qAt-`_MF`N<HC~BY$Zs`5Yz5a^~TWB3q
zs_4!U`i_zg&2hTW>Kgu+tx^c;;tYTCn`9q1SUB7ZOI?<neG^}J9ea|)!5x(41l^&O
zzRNnNwX(V)CjGoW%7O4hI3dT=lGr`2fpm_zxwzyNJ72k$H^*_=Wfp4#nh9ZXYsP=E
zP;f~D?5vpcw6bDL4-W1S)esil&B*eoBL^(IJ+~vc@S<?HBMMV?yeCL6d|>|oWr5f!
zX#?RQXm&VK{)4sIX-MW4oAT0?u!6bHiNrf0PD3SN;_1#~Uc<e<-ozl>$HxBvX*NXx
ziz7@=xA#nuqD#5EL%b(GP3^P4Q2y#7(hlbKKqyF@SnnTIHqc6i<T!h|NY^>G#oBxJ
zOkvd&#kYK8a}OiJ7!9NroFfFKg7_o2Op$@@^&uA@%-;zvw9Q{cX410)$HEe&mIbc|
z;G#g-;Oig!A|#EoGd8`HrxLJ{ogT>ucL;_@?z>8kt`iict_o@=4j;m#Iujz@g-1%~
zvv3z6aG2<bJS#d^1`r;7r-vdcXxSroMh5G4PS~jw4q+gn_r5c<o3p`J4u}^JT0@2n
z)Dy(V3l@NUq>@Z{Nv2jv@JF<tqJ~xnpW+PL1S20$V`4sqDWz~1BH?7HEw+fLq<jQ!
z8=2u8=g$yrRV20`<RO^}795VnPR2R77tbiXX^G9QjkiekEj@DuJzx!xV#k$#sA*AE
z!d(@f2wqkxoYyv3iEGAg7RROfozMXdUG6csE-b!37s>}#EbZz*+La@y++wSYx)N~W
zI8-&XFQ@)BF)~1TvEh2LpG(y#%yPAk4ht95y+2!|Uao@mG)MIgOH$*??~I3>6IT;6
zNjszdBu?DXlHTE5)6_>iVa#y)AgSqLsv>$*>B<IJd#AdFXk;@}gLC@X+w83&BPLtv
z)%BWezO5AQW%+5~tu~w2vqxc6#{xT!3dGaSBxnQxM=Ev}-`>#RQYll|)5N5#_5BO3
zG@AB^Y9wnMdljIPo{Fu4YG<^c<#Txp=emeMaFP;0zhjWB^j@OXbjJZtP~yS-kH{*V
zIV~LfiS3h9vUV7%8Uu*6`xOV|%mZVr=5{L|q;>2y4QzFh`ci-0!qn;7<sD!RWX&Xw
z3g*d(yfb}?U88!jmqKnx;b6LxL6Q5vhj(`t<$7!rh|R&=->(TZN;qnx4*+g(!SbT6
zEUI>o4jNqWT(CG1*sFaGq3n<{p|-vOAM&*Nu9qunL}o63OTa*#D7~(0OIbTl7sHhl
ztr@CioHV|)7H8?V7gU;!E7;==LoU<$UO5Qe7QRY39ZgWu(mNi?(z*2Y5SKS;zaz@Y
zZpGx$=Ngq1l+Pz^+u6gqseN0cd9k<rEw-r%jf5LM6WHd<AFR+e=16c(ao_5@p^DX`
znt5sLuYRCCTsqGF%KreT`ho0_2arI)2fD%67soLU_PfHDPp$U`5<|NtaG@4UJvUmU
zrqpSjQAkIr{LEO1qI5MR91vB8ld4L>0D1b~ly!V?SGU#LBbME`a)W!>WJ#k}nBxLY
zJA5lz*RrmdIk|gH?mMilGo2AJzs?G?p{aCIShSEr4G$Mcnku5lSe>pM9_WG_RNJ(I
z{{RXah~b&H;P&`Hv6WP^?rY7#!3u13Kj=8=?vU7wr@-2Z833KGbY6TbT@qH;hOzE!
zbpyBcE2mLziP1>Fabs|mhmtDeiW-P_Foy$>s<jGe+i>P%&5>2KH5zk_w7HJ=EGi>g
z4P0AXc0a)!q)n7n?9Er{u{@VD*Hjg>l`xWGCc}`mHS(HgoA9e@CyH-#Iq<0&G)hrL
zZ3R_ikrui#{lC-tzh!@+O3IrF0R$X^g45wXpq3|wNIZ91O(LF_wfjI6^?>KFa%oN=
zj3wE9rBSk0hP>wX4p#?9af}xJq559jAatfaH;ARXTsxJm(<Cw3ugglBY4$U1bX3IQ
zGX(~yz#VHgOLDVX_JsO5_q1L!!EX!DtEnKVis7w2?crCj0UN1mnd-vqXR=-{F3`$q
zU7lYin&*ESox!f)pFdR;PpO9S)H8Dl<FQ(fsn9C4(CY0xnQ6H#8QMNV%*UxkCBxZq
z+yzCn3Q2;`MjlMGjx9Wv71Xl4-Z@+D>}`c%O$eFW;C~&7%C(D3WT$y(YySYTL$1SD
z(N{|eCeMrzuXOr*Fdx>#-~RwBp{Hz82&EbNs|HfK8%r6xPlT>xaZLf%XziJW^zPX&
zj>Tu?rKn`iV}WFi<at}#P}jGBe1zKSdTFEEEMnt_4nj^z_ARxe7f8tmwe2Iw@}a5I
zCu_|`Db4O!f8l6kfswqm!vlhx)-*T{9p!Fq71Ko>JkOFHl`xa!JCLP{s8YBVk5V2p
z$XD;6j&|-M&i<gPbsaJ71h5cCZpAWaO0by41y}|!*1UG^rDOJwN>9<)_*o|kig_&<
zA;9pgsI@5_?5d2k_I0m+svI;cbZV&V2+iBsSjR@!w{u3}+$s$|wXwOPQFb02J1rFh
z&d~VCEj(FjV11BHr3ZVWZr7osr!l+Jk%SZ8%TW<)o17bPnKe5flF(Maqkpp{U!%F;
z$rC~E!lA9Fng?C%Ew=;}=mn05*f(=jHB{8qF}OXAx#cuv>{h<aT?W5B9lcQJG=DH!
zN*!*NwW7`qkoN3VUZtZ)3$Du+p4L@|PaBV>?Y;u4oLUj8HZFWmBpYAlQ)`qFPQqKX
zJJ0@AbXAkYJsHmHewX(N%&nY{P3GsZ>{Qw-6lSaFWrj=S5OMOmPSlJN2&x)Gcv^eK
zQhhlX8vAfhDz8@2Nnw0V+&p+s8Qz$(jXebj87n<%cW1%ip(^2uazk7ps2|JNpmf@b
znmG$v;^uH#dn@x#O{hQ#cF8+CxF|_+3fV&juUn-~81Ul3$SYr>Yg9U%TV1r1hcv9+
zT|44;qo^}`59yR4C7_ax!fHq3$XcTyY~56840C-*4g1@|qSPUpo!27S=Gai^{Y6;>
zjbxW|d@UO)=`~2~;2Qqmp|#jdyC#Zb>A%|V@|CoaG5+S`$W|J*iWt{O#*jN%RL4^#
zGyOT6xts!-KcQN((mF=T5oPzV@o=d%O&WSvndvSEaIPsTHn>R{xILBKJL#(9+Ta0I
zj#j%lr-iM=!cy1AG4yJhV~}F!gh(>ekm2u${n5Qupn}sZ3>$#BAab*`Rnt;Q=+xcp
z7_scSqa@adQ!WeI=7Ph?;Py-s7PtZuM%bojs{zMgnI*s>!<CyEQwby%n+&H${odD)
zq6R4((g8U6MZ)Gv4ULM%7HB`4u{bG#*xK{=L`LVZ?Qptuk+s9y`z#*7oYD>3VwO1^
zFza1N=*(vs38kQ$Szw}gq$A`W)=K8I+0DsNG#hdEQ%7--a+C*fY;2UYJ0p?EN()_r
zELUWG7PBFy*ReK8;b(H4ZP*~DKXAbpw{%l6z%|%Cluu#Zl=kH3f!RtdMTo*C_79PS
zx5ff|k&Kr9$~=Q&v8a0_I0UJ|Yrx!twax9_Nf{#Ctwy^YEL(h@>Kuz;qQkBZFq-xQ
z#tIz(jtAUi=JrHbIClGYLb<MK=j^48_CDeAiMkR-IDDa>Vr+Rwx#8CRkn=>-dj*$a
zXcN?PK)uu0@LOjT$r+#dQQq7q0V{`amNz~-8>r&_R?3~bNWXFAD7H??Lz`!F<v+<5
zLAjPUX~%?&nav*Tgem$B*imsE(%2Jg{S-`*uNFN20EFw~1!@SdV7C@b*|dEWqdkSw
zoZI$T)Iif`C2$ToPS{&=e{|ap1=cYH)Xjfu3o7ZUY;TW+aOZ#c6HIM*;2R>OD=5nx
z(_wV@q<anxm4wvbHsgdLX4hP!*lZ#?hLA7!OEXyEcI63c3?<&?j>=9Wr+Xu)gAO6L
zL3$qrSvF8W7P@b>El~Dnbd5AaFnq7wwBMdq{{TYjXmr?1Aq0IEFG!}Vs+=@5*p=x$
zDbaNDZIY}t$KiJ=asEu@lsOcdzgFw@?Q~jnZ#Uy>Ng-0f(!EnzAgrv4N3`b7C426b
zrRdsY8+aH19u;p}^*)!U(7VtK4g-erQqMX{qJs=xj~LW+`Dqw8Q!#{N2f8n&^fzkI
zPg4Y;vcqlB5&DP1r0Nc!nzpc!yK9e*7pi^`^wF)N{M?cd$B*T8u97mB9#2M^j5-sh
z^xZxf1oJjG7K`n07glq1JuMYE6m9}LTEntGT<CfqR`J(L%i|7MYR-k!sdYa<)_T-$
z$dn9^s@HzRr1le8*3EkyAGPFX-H@;yP1N#DR#{F<SnuTr3)4UJHit({W~iJw*0}}P
zD>+TmS|whs=|@gvgp=>T>G5SNjs2EU)s$T)3C#5e4$c<xgItc9o80g=c0JJbS``M9
zOkC-UhYh;OY7!Y|bZ|BMNyW;xJc+sy<8QNPsC67>G5J}2Qb*|=gW+WQn^)ImW1Ag4
zLjmsQ*=|1zI%*fnDl10s7Yot#?JAmGJjBXY8*tz<x?EBt%AFrJXjBiSnX)=dRL#LZ
z&G4<dmrS05m{mHhl9zJU^3tw)yG)Lrppoo*4cd4BstTI8>T4sKqD|xw*MNUe9oG!`
zDOu467O1ADY}H58EOWPGh3mhC{{V&BEmLBz)b>d3cDs+F##Pr+Q$8v5;~Br|jEfMo
zS|?QNV70Jm^9GLs!CMwqm82}--mLl~PU*gzqNZ$6>6E})-|d9w^#1@(Ozpqv)U9`o
zfq8z9_<>tUz{>VHqxxh+bsyp(eN<A=$!i?68<lmHx7i<!qta{i&YsePpZN-Qk=Ovd
zm+?QVG=mr9s3_xX<l4jweZmW?`lG0|NJA;&amF5SR%@sFYO-pRKBoQiINTel$}^c*
zsKac6mrc^+(qC1o#~-M22*%%{#@1^w$5vvY5;?c9vB?Y5HI9~TQv)ZEhKy|mX7vu4
z)3o_Skl1~Er1%=!VfmF&L#5SGNjNodyFI(zJ5to(sg<<abZ=!-54G*VA5{ai$Lcz}
zA%amGONG|@ho!X5DTVb;4w#SkJCdU;5#`CUvCQJAtm)}`+J&rq&`GGk@%mk#*sH1?
zW=ZReb#lu}&}`^s8EHV$>$;YmJGRcpMH{WP$B?V~$EoORViU=-Ih*{<9I3oYPoblc
zqgP$2X?0V>1L0%K4cQ>%6};(fLMWha%Ua9ly*E*F-5kwp+Q&QFC9qec>6+vbX)-(3
z44N^)Jf@98fj`{zU29Zpp?H)uSYU<Y{dcTD()O^nKyItGp0%r*H^m8iyI@^;?zvZA
zE6b#gR_-^*!r3lQpyP^NmRdKbsaKd8?Yp>M_xNc^L!#5Qu4@i1O7Ty_Z324A-&N1_
zX62y&05aO^H9Cb6*dFNI1%U?&>NAQ|MouzqGuV2wT%?;ya~SrP0hatP1k~lMsn*>F
zm0vpppJ34J1!tyyYg5zbZBC%*Dx3OT=YI{u!3Y`(6Gs`Wbd58y+nfi-g(taw!^Lrp
zBVD0>9@SR4l^UH(<#`$1fVQ-KGoxv-gCuNe9mop{L->~1=#4z&2Q*k73di+d;)QIR
z<Az-D4=buUBNa%88Bep(`roOv-6oOkh3#nr0{LDY)SBM4tUSJs8J`o6>Td{b0$IAB
zsNsuIo#rVYlH-N%+GkB^x>Y-4j-E0${+nL-Nb&Riq(43%syv7A!&cXH3dtj^gMB2%
z?v2MF`2~9=KT~N&gwDwsy`t`6ISPZS=qVWs%xr96i-H33D*3CbwLkRwE#_w(qiXVe
zug2rcK1por!Q{#j+dUtvdb$dlX+P6nzG0ocmyYWi)ohh!N#*ar?6i~VI-LO&^=-|s
zxC?!jf2edBz-!v$XP#}sZy&;r9V8r{Ly=7R&0DO}a(GQTWn;l}8?wUoBbB%5UX^4~
zwxUd%T$cr-s?xOi;Vp&YDJ_Q|J{MD{^hq}^&m4{!qnHT+2kNgVG?{BZOo6TLQ>tNq
z`q8DCzV^DuAKiMVM07+I^v#-C-ro&jvA2~(oR*2UqIt2>pQlv@Is2O7cDmgBB&?32
zbLkcyaJ{l`!>TsU-^^442srm<$bDO+^qL`f-qI~_TvgUKmf1Hbwt4SIPzp+hz1Ghl
z_gnYtwHkdPWHC67L2nACR%!77*14d!jO3xU9b%r2oPqpC+buaNQjKh+WS)REezDZu
zDVR0vBf85~)#@6pXqH(X>z~uO*ei!i`RHG=ncGf5w+S>#Q3J0dMS;G4st*hs<k3jY
zrB-PAS51#obXs_Uf@h9x%Jp86{40u*R#d&aqz3nJ;WO}~MWe5RJx-m0t_N#{vMu3y
zy!B0`X4~0#-cOYUCm5Yr<0J_~9C}nDH?&v|%ClM4<1Q?P+kyQ<!h>DcVU4c4f%=u6
z)2~-MrDHig*P8M<I!8i=t(FDQ$0Re!{?T~4+0#cHEo_lyCkueHx@88&IypgnZa1+X
zq^$)UamNE=Yl#gO7fl6Sb_qM|W~n<2c4!yuvo!;Bxhm?lq{u)&Dz>(UV;`>8lHL<7
zyJN<Zp&>1ey@4u8T<Kyq>=Z1fbD{Sel`T9n#!lgJ*-gz18=^Sy{126FCE7i`&{}*u
zh{i%AQmclFFl0GBkmX`Y?C(|aeyfmDHO2T)>Gg5e8;(0GYFb7#?zqa7<lL&jnn;2g
zGV!?ml(4hYn1g~ci;>KUw**}QS5(vP9EH9`0bQ~6(gu*=eW#UMJlG%}ctv`GW)P}%
zIa^4_IqtWGESXzY*wBv3jb6R+lN-1u#_J`n&>GtYk!{xiq57ArD59)1(o1)fag|L|
z)wJH2*)79xm&Tl<l};$U(&J3MucwYG4@6m}-Mgw?Gp9_|ADNOqd1{fGqbuWu%_nnS
z3BPc?Ge(b1n@x^(7T(q^Jl%c7GC9FXs%MPx)Twl3q0?Z33zh%}Yb>`{YB17MKVfTj
zg|h0(*lA*OgMa{FU3iC8SIMbXIw;B5O|ji@PnJpXJEO)C<VDjRSzgU<N?0R&l+&Mh
z0`^;dGo@)AS^3!Ea~}TybG#HM;U<|yMW{5@M8eWQ4sggT*mcb|o{EvP((Q8`FJQe)
zcw-3KJlvTaq<P;{RKuoe=X*grZDZYd-lIa@V^J=mjg6R})5X`N^~6)^m0y#J=J~il
zX+1K^2exMdBpJ$B?bvp-ioTDal+&0c4u(k0u5eQ|%_6wWJvX`Saj|ghw7TY{O8{%y
z(Aj_?<ah9+(lrmvL+Ucm7Rco*n!OI9(%8<5>36Zg^RPUh<~`N+xuMX-5tnO3gOHEX
zYuyYivn<p6%D1X2Cy|bHZ7;Ybzz*J1&g(#jWem?_A`!jUkGKabBh@Z0iQ8Rvfq+UE
zSk|g3WpgA1Hu$>E)M|A#@))DJCxE7<F`Q#Xj)+XvJ6vsL?Z1cmwJx6%W1DZKZ*czr
zmF8U;qOxcjYQw|8$pv0iX;rSBuu(|xFJf<eD|6yWLy_z=^#++!8<_yRz*w%Ns+LgW
z0}tFQT??jbDCr}7&vTka9c9{sDXE<1%5G0($>e!lbai3DZ1JwCg0$XEfS!JepQh^=
z>d@Me>5^<sxL%vD3VFA(IEBilrRj+3TxN~{*A7LwQN!dp>7u!CMk>=T^y*!b$1R%X
zxB<KW01H_~rorkmb~pIPhXdJVG%YTqQ%crVZZR8(k0Es*SDiYbG3|3pU1tNx`zk20
zIWEsurmdEqA4*n`0JYbh_5PzhAvILhE^Up#y19?4Xe+2m6NkI!7G6o$`tho%d@+(^
z2ExfHwvbe-W`{}Y2lX4{{M62lNbo>54q8g4`V`GLXaeA`E$IrTMmIR^BL!S*y-g%k
z{*Llm1%=maAsFcAmRU$ITIzY}UTr=>!C5U&U43JSmQwT0iBvj`Wkp<t+nvgWmXfM>
z4^4!W+)$0XH5x{v98$7YTW~yiUe(a`b+OShrjlc_L31C4^W8NCZ7p1Gm97jf$?Uze
z@Xu6jJVH50b1i^W<&H09BRM5TtEhU$su%=P!1&%UAK3j?Mz^S#LuMO&LTx3696YU0
zR?^aHlrD8S0G!*wUN@*RYFfv__ZtF6RHcTP%QlZq(|V1qfU*aAp~C=WX7%YSYAOrb
z?@hPkx*MP!6jc&MQ)0<KLy6${T5W!gD5LcN7VtZ(s75G@n{38aHm%Y72{z<;Pu6-j
zP>O;bS(P7{idKT=G=7C~MOOnz^%w`i;a<>dl=O7c#VmfU8-`iq=$1*Xq2na<%nq4W
z=*uY|lJj6l{>hbkRYRpOf+84yP$3bi7-iH=Wh)C~4!}QE=z0;MtkW4G+8i*taNbq3
zpDI}1j~CP_>M36DNyK??Wd@x^C0x7O-QHHm@j8;8kQ#^{1@C(miRo=pR#q0U9faAy
zc=D4h9Bm=7$xE|a)09F&=frl-&(#tBU>B@(4zW*8TMX6>w|>hBr0LD8Yinp^Yib+I
zf2b>2PXY1zQd-Xg8S=RPR+-oFCXLrw>(tDn-AX_<z1NF%4^Vz)sLBpn>p2nC6?ISz
zl1$=1l-~p@3RoFgXYIc4)DewKU~zC%U+C0NsdIHG4%=IB^0%}a{Pc99A{<%aQS^SC
z_~<=00^xjp5!#zYI|wZo9}BuZG-S4M%R7tFN7UV8Q0bi<V`&}uvIc{w>#C{CB$cis
z=PHk?i(kG$hb-oosmV!F9!@Wir9U1q=%h1p?DQ%_RZ~y{-`?P>$u+8IXq`)5!2bYk
zjred`ojX=!(E5->NCPI^D*bw@O3HT@Uw;D1*xX?fQcg_8bqrC>ug?_=iy%2;e0(oJ
z{0P;l^m^%Z-9rqV`w8-}6tq<)yuIykH}BnOMI^EMb40=%*8&_lQf)L=Dc;YdYQHT`
z#?N*Oi;tqIuhglFeMU?gL0C#HcTv=|i0R#bRf5IW?6Z~s0G~5Crlw7o;_H#)wsi8O
zYI?g^qN@TY5G8N(j#feQxs&gXXO{ex6k2?e%w{vW&K!bKwK{n;f$Tgcr4uWVW}m3b
zlGzJM<Xu`mqNVWOSKXt!!?tN-b}x3Etra$)=hFrO?IV=3jfNfUywM9=QV3|V<au6;
zrb8KoNsN!(c?CUmlvQj5TpWeD)4G9zlr*?tdEs<nX)Te@ZdxolqBy+=I9RsX_+CTQ
zlD0WtvGyaf()C|emNoIQ*ge;l>b25URPAetFLIt*Z$ia1j-OF;<@Ce7-IFOQ<cCpb
zs0cUD%GLC*O~*J7eVqGT+$$YhqvD!Y$!&$d-6V3tIvb07MYfwy2D7CyIKPKGa@P+3
z01G=`p=wi3=shymH1`~<j-PEtj$OOl2kBcaGNrnUMD2~cfU(9=`5b@IP6?yQYPw#s
zIh!=F9jrd_<z6>O{FPNTbOicD0^r`u)TgCu=+CRP8(~&yntWy%&4Zd<YaYpdNlEC+
zF-vB1S<;!Q(Hh!#w#def%>$K_bE+XbNH*bmr%giWYo(5Mg5B5$!l~=7or(rYTMIyl
z<-mU`=~30PJhw>m$tq=ZVlXbt_E(e|BwDtW>O$}1uzQ>3XCSC#HR76Q4^71FD^H@<
zjVh(GFpaM5bkM7yWNx%%HC-sdE2ELSTo5$OF-QZBJD)3O*OOCKZK#9>xQy9gpFN*q
zNC-5#7A>>UdOEkzdw0op6Z<by(K?0++9@S)HsQ<X?FUfXc5XH$Y2(x-r3`yyIpEz#
zhZkj>`6GGNk+HHmNC<Ezvc}I*IVFXlkMOjbCZQgoMQ0Y5@IfjmwD04WwU=S|M!t-l
zEt&dAX(xGW+5^vW5?4?)ht!RO<rS*Z3MYvH4Q<f1dczGJqp@>)`9ZxIEs3Y<jirzo
z8)k!(@Q>G8{YOs{Q@_=T-*Ok7>l)FHSApL)@TKW)uBoA`4SC%QjhxfL3!UP&bVn~9
zi~2uSmQn*vh*P>K<d95TvE#TFy0J6CQyg^>*fLCl6thsh@rfCmX2D6Oi^n7+0_mMB
zWuc+3AKeH1cmbX^+2i#z4po7P?X#NPj>IbnDPyaMdxK<eKPe+B?4#PUnwCi9+c;@s
z?~!X|X!PA$7}>UKgV?HC>L*gXxu<YH$`gMtBkA4g{;oySw_@;2(A4TpmA;wBg0q@|
zd~z4N+z+1#{XH|KoYG1Oa5e;ttp#3`$su%a7B=VQJYNlxn@>i2PkdkpH{8Sfg?H=1
z+ET)CY%01vG|<#KK;vszu<%z`Lp09+0H$lcM}+dput8a#>S+TW3tT`BxK;NvO4qai
z?%_?ZvS&-^NYi%rQ|T}@)ZjRK+rd|Y(HyN=xaji?)QyCY$Bg|JiS*HymPp@yuvTlN
zG^(ec%r@j-f!S>5f##es?Kd6O+DRO??DMXwrr7s6g4XV;bS*)?sbt)P-EBIGm8P0Y
zvgY0wo>DXa0LD*^;53i!x%n%kUB$TBt*U{tKqO}3(l2q@XEl0%Rq?g%_6G~OYBX8I
zP;8KHX%@1m>Iz>$?wUKg7k^}~RQ6<z-%J-tK@3q&L1?o`H&^a`Wh*y4?zf)n%eo_6
z{{T;`WD-AgE+c6@m!@iZtQC~ajyJTB-a+MZ<%3SnoO4Z4X{A-gJ)8?g`5!0_r=o7-
zQwhIwWkEq)>Nx`(<n3EtFoC(=*N;4{k0hegMx0|MMQu}^QVUw^IlY#Cz6%F#<rdn&
zYowYt65hcxS*ebuozDfWkappEk;`h?=gSuzBNJ6MMwzL_Uq>O1Xr2fogYZ`3ww{Zq
zsRpN~z{smh0I8>G!~X#83(j@QkQzxh$|s>U*<!5>^-DIp+Tee(hIrbvR|K3{F1eyq
zGF|a7xud^v@Pd<1k%g{jwf+xv>{QLA)qSQWMOIsK-{pVERJw;uf*kTJLH#|#<%VuO
zol?ikqYtIkIx)53!?6W7T5NBOxqx4~(Yr`saSw0t2RP&^y<1N)#d}@8d@jg&Fp{H|
zUNo-E)}F_<ZIVVt{t4i%k55S~AHs1Zr-D^BksBp<p;K@#gW+i?pfI!3m7tq@U2afo
zk`M7E)Tc1SWVMHIsws76)W~CD0Q~n?VmT&_?Uk3h&DQC&QdGKF+urv^ICz>_tnE^q
zGx+VeapWpsZ%{04m31vo=VK8N1j7V*Rn=N$MLU3&H#2ee8zIAC<)Y6{WUsZ(;ljSA
zp+1;)?D$#T4rj+ZVVCw>5CdQiW4mEj(JL!zDcOMb<LHC@zo73@17pcg)GIRJNDd03
zO-!-&Cl^w7#&22<)T#r(E*ZDE1w$74kYPCh13~=0zi#MxszlGYcelEZIcA}&WbqQ_
z+!C@*AyT~_qoFV|ovnBTk&vl6+eUq4WAd!t3CnyW(RJwO0Fnn7SM-(e2X1?Yc)DDR
z*kI}G#Pt4&t7*?`*!O_L?00Z{e1)yitLBcQZA5O3$MpljK31lkl(lr?NH(7%xG5@h
zIH~|G06($$OBAKpT$&}Pqo>qiJT^cs5H1r?RC+Ul2V#4x?GA=W9N6A0;lWn=-jxM?
zAEx%&P%a#!D7ZZqjMMDQ)6Umg{{XtQqm7Rvu~|CD&!tc3RJ85Aw=0b@xBxS7cqqk;
z%Uaq<>{{jr1A?K^<9!VO0Kz23d1*z*P$U*`3GuXC?FyC(4Xu1mr7}g&ap6@rTVp?k
zBY?LE@fdRpP65Ui2d!u-<8!8_ac{~;jYt>7*uPVa!!92MR%+5wS5rEkp{;m#Ag?y2
z>I%{P3WM)y@}F0&)w0BbNAkFT%17eM&=zF$2d`;w(<_`KJE@*an0yZi0M`cx#B<~;
z8MTvD52ZX#H}lz6(>TW=2i($pF5FzIq;pQMMXe+)nhU$XD0;XbO7Bs*YrG>VNNi>8
z7jGnZPkY-V3m!Kx@O&o}si-kj!D%u)_$xoC(E+$N$H5)eif98LcK-nQRb69U9H-iL
zo=1c@??G<N@r!HxIDd3aJez<Ak-<dOM9Brf7xIMk-q(y=A}DkZa~*qFqoSO!ha9op
z{3`l)5_Y>D5wN>qu^XCsYRn0QNW%8+jn^LvT{5~@Ck!q-KD;P)nse$xcf#&RgvkqE
z?r7WK_(8=;btblrgcVJmFxNO|f)IL_<%RdTt&-pW02jigqnb}dwXXLL-c@yE^=^4=
zhT{0SP>v?0qR%RE*=p*2@rj@}2bTCz7l;1<4pE)~QEAmrjAQN;^&2G{*^A_Yx;i=E
zV;NHTtrUjr;5)*aLc#-?Yxh<2Uciin95XmS!3P;kkiNrqxH|W>{{Ui}8=TjY(RQ9%
zmKj8Z2MZMHmPs9+&~0u}p@`iZ9OC$|Zs9bGToMZpKM8ji3yeRw@|^$@wA|nvf!PBC
zIf18b?;E&264=IZ#ko?;AE%yJf3j`8wg&Ayd@O4@qttD~tb2tuH6!I~jAt$69?BSn
z&D!fc91ke^PvRd^HyGw`Z!0qul~6g4v)N;Ru~0k~jxe+*(yaxqZpj<^oBseIRn${D
zDK@#j)5DUd>6(h^;w8JAayd}M?S{uK?iGuoEd4hi_Cvm(1?=bfhlJWO7TbHH7isK=
zmNEK=={)=*+R`lMq<dQIfwcDtOjicA&atrn0F<7Y1de<u=Y)bBz?Ls?vE?y=C644c
zSRd?~)3wAnUA{ak2S;&YEKu@AZ2gkx#4d{);yapqcu|1nShSX@*j&ScMY##j+I`LY
zg_*1y_1^XcOBP1n4~5T+pL2Lz!?b`>NsSOn_?qxq{{YqHR)(10VsNkOBJ~-ObLCRb
z3neU&eF_-lG}eP@q`P*w;T=y<`g}NUjQ-(O(v8?0quL2zy_Fgf1XR8`toFEPzmyD&
zCCA%hl!Dh-9Cl7?$!^!<!W7M94L0_>j^RxmfIDnjdlbndCnVh@S8J`<qS3h%7-P2P
z9G*f_*7xJ*vfvH(F(aLv;H|SUtuBg7ix8)DESPSM!*_6o+*s=#JB0SS$8>JO%m|*I
zs<x5;0K;)3`bk<1BdMLYWUUTq!`S``p=6Aewtuz$e5hxPn}A693Npl`QaK!YEwySI
zXUOX9E!#;qbVIk%KS-^Lt-gfh2aIQssA7_;ockm;@OUXCmBMi|F4y<6Uyao<zC_)Z
zy0)7vcA5|mf(I(PImsEp;DW65-C@pvMJWdTj|B;+!rlI?JUfu4qv@4X(HkeT!TrLK
zz)B0Cusz#!6PjEu)0GT!Ij$^tAoeNapiZ94I0K$7Yq);sm?~z8`=XWcyc_#Ut)-q=
zrV?FV#Ax*qXE;MsY&pCYM>_168|c2!`o5)`VXSZmhP-fot5HkUaIl6=a@FOv5lald
zjO{IW;`}*HNmv@+LVK2Z9EB{NI-b#^k;6>(2kI2_!X}8eSiASKt*(wKo4O(evxS4x
ztL34R^waN++_0<Yb!eW=@VjfjnS`!Kj!=Km(x#=@?NG%q4X8UFFv$X>sjaBfooTPI
z@bSX2nx>wh7QWUz{1rp0Y7s`)(ag~+J09UtCT7#oESkGs33KiWua<bG4)oj$Ph=~o
z!|2^LJDli8>b6ThzY3sH*HTDiieW4+H(l6fk;Rq`kn3?Z<bvCH_&{lqx775c7tS26
zYoL~BL+lTmDyCA@$1`5m?rACJ(^?i0Y3#6`mU?FT(SqiDD_t(7l0+LJxBMftNaQep
z=6aDFIY+7Ju7&>qn4|^FzFIkI;gh{HvN35`Jyb4<=2o5UJgKzzhYx8bzB`2dIlzxj
zQIW_c88)9AUHOVPZE*cfz7q1Hk%<jMWR1b?8-ehQq7l?bYk>akO{1NzE^CIzaOR#7
z6wxuy+})wT;m9|mI8)IZ;dBoYMD4C_MX*BBXqwb@L6FtCt&m_m{{YIVsHT=k%T0sr
ziz;WbX34{uASqVOSEhP3T`W^a+UNEw8`OG3Ze^tfvJ8>sO`~hmQ`(le7e;s|HdYnV
z!&McdkZ-memAYY#^v^i2s&?ZIQ(OQRzlB3sDygRRA|>&=f;cN}tm&e6Ij;eec0Gtt
zXmrs)e=kzjxr4KpPAX*b#jc7y8}pLL*EZq5Md%tXpA_-5RE@6XuN{hpo`RYehs3~H
z{uTb5_5e1te7DMZ!Yo)$P%LTLAD}7f&*}XW4u0sEWi;o~e1Yu#R|236-5GpCdpono
z(E(6P1>*(m?%oJovV&a~Qc^DkcHC~kLsr!vP0o$rkS?>%t2r!rBf;#VeR*##`XpSI
znCl(%Xf%y>BJ)o<Xa@v4hbm67=)o@SS3m$f`=qDrep~+lg-xlk)eaIs;Ms3`-<5CE
zok3SZ_S4pl@m|*`t6PX`RLo>mPHdKQB&Vom2;p1lol73!1xxn09{5_`r0Mz{dLPfx
zklKJRxxN0Y&2?=ara2uHv2A!fswWwW;?~i<ZA?{hfaf*MBiixVM#{Og=|g0G=$*kF
z73Z`yb=q{hB;4j*XsPvx<fru9;OmTsBP?_(o#@#^Q4wgCo%e5cUxZ60Z0z2{xOe{m
z<$1jNjMUFE)5vZ8B%(CVsNVax_;U<7r-vv@3+)Zbdo`MaBn>5|?e5a6=<A29Vw8|O
z9|}rMR+~_c+r2pl^54J0Ni?xD{Xj`~`C30x8tG`brIGQp8<()<6(rEQJb>ZjxKuQv
zs)^fP9QeF*WNzk2(&*09+$Cz5$=_q@=qRg2?i&8ZQq^gaK=Q+4J0B`)!!%&NGH>-l
zjb=vPImO4wPYbOXuS{!yF-}MTxt<X^UawO{D04}BFP4?m)zs1pJ2&8|oktZz3*sXE
z?3<DohtaU3uZpG-EN(U<Ao3N2a^1JR)&hdEZ9ZMH+_L<w6grb%7?LXyY>TP3BekPO
z(#bGzd?=-+1QOm=Z4RXb?hJdjJF&kC#k0AGY_|HQKxHPR9>7DHcKPlVEX@QRgoD{_
zDxr#a^J|rw)wG$Jx=M5QTa9cfqLdQyL+yW}ccx-*8=2e@kb|hGk~s@y4r9l1pAM$X
zM=!P4!R%3QK}eXoH#fl?c?r>K4P%5=4*EQQ${u!!j_A#=^MzAT`5N;agX?vpvD&m<
z*HJ}L{78Tg>{@V8ameW3>9`iScI;5pHPca_YrROjwD$Td86>B!i+d~&_f&t`8fYRa
zu;{%ih?_KL2H;#MpHAvldbGBdoc^YNN`{uf-kZhIENt}e5=3_};J30$u7*G*u}tq#
zgme2T;%nG04T#``OQ~t<e~VB2Igc#tQ(DKw@*dA{?07#!!(9{8Ykr9ID>B|Ld#2aZ
z(@w)JISy;N7vV!yOBGaDxjn%_MNe5q@M3$mcWFbgXjW6r1HXoSo!U`U?U1+@k_uR)
z59iwN3DHzWB(wdcX4oo=N_v9mOjC`**7_<PdqEWd)KZau7FX1)WX&b6Q+f|+veC%m
z$x9lM=PYea1hyf-1In_dt%_l`OEi_LuhOEZVJ?gZ6_(WWc`0Nshup)P4$H0?<1!M&
z*F>(T1a57u<RRS~n0GXrrczWrr)~bAqlu1Db`gHym1Ingo~MS$+oGD`%MLst3~hcd
zkec1`l0&#e0o#W-Dmf!-z0DvHqmE{~;Hd+yZ^FSuK#)jq%9W!y;VXb}NIj?gEFR8q
zx4V?0Lwg*h2H@Q^vzHE1fN&Y-l;V7ZJ4tT_%0@omU0|ekz%F@QE--Ioq=FMpJK-Au
z@CYCBk<0{=Ib6s2H%|??1X}AhWXLU&ES0UmvX$)e6EY3EqhO=G$!~Fl@X+iVT`+>%
ziy_&DxNamI{DPae85m9m-IK+DvL+)0kGflvg(lA6CK2{nBr>#F4E9;sKSX1gNWuD{
z<rX$0y4SD_jDSVYAK5GH1=>zi2ejWQ_XfuK?RA-jWQ6-q2}=QQ7rKo0Hn()<ym>f8
z5$uV~b289urHX6gg*$dQTNgvk4TahkThKxyeZe59nIIrtRR_74@QIFa?051IrV9>p
zL9w;eZvY%5icDmb@(CES)N9x|#x55%#5evE<ZpnZa3ho3g^bXp;mx)$@Q0|2*nEWd
z3+IHw{>LZEC>2Nz`<ieqbjLd4#PExITIT%r!Wu~I(S&I;CqVDGB#)x)&hmeB{iLPX
zK2p(6OWCB*T}cEYLK+>;R*Efoku%u)W3gE3Jw9UgvZRp_Hoirb#a5L^roF7FsXmk2
zxuo(Id~dKNA$6{#)Mow^7a;cvzK^Er^=FB-3ZTf3^*bt)RO%{PM!k>*yJ@gDS?a#A
z)C)@^kbqM~{{Z5RB`>qkH9CHp&}k%$wmIek+0Ip0Np*IqO;-ASIJuBK@D3Ibes@)I
zl*s3QQ%`lU=^-AUXUM>CwduKRR-%<7*K`NePQg=GQs>_`F13*TU)3;a@EGAC&mzOR
z#Y@y0jFGwuNF*1)HbnHUi9LR#*>#6qq}*LbNw;m#(Ta}2wCQzydZXU=#{oIHu(H<)
zwA}|!19JqV9N(2+_>rv8^xZol)0zXG-{tJQV^r!|-9lp5Na3F-E>r$J4brx5wM|}H
z>Zb!KEWR?Ww1}Z}O^~!5zC!c89rXdB`-%GaT53&7M#pB{-E_h{dL=gGk4w_^$f+V5
zeXbmY&2#Y`v~ansaW1!&=JIN_J9f4S3%(k1sm(n`rKoyxHb!nZxFK7esw2Vn!n%*B
z^-XrE!Z7PN;@kxN3#4@#r}~vu1{RZYNwU@G+C@H{P8%d`FCzxZT1_8Ou8s1(v(br$
z+kAwZ^fG8SNzv$xEv23~=5!<$$!wJ-yVZwFrZiMkjC_s2C$gri)+zLcn4)(11_=i1
zDO;$^RZ{6dbIXm*h1BJbkkOk=mR(b+HQhzD)h=vtxz+`O)(h48OQh*2Xqhyn&zl?f
z8{K(^nN|6Bwr4bgGk*&1U&J|S7y*6<8C_W1BOMaS&Qd)>c2h?fX3)Yg9IK?B2qX@B
z*gkF-m%FUBon~*#>CAiF^I#e;by2Cms+&}4tJyU_d%Ee~KrC&u)OGHopo%iXC^8N<
z<zw|-P1P_Nr=_Wi18^lQJ4yPhKf`{Xh4mt?x$LN!xe>qlf<N(3tTey$$uufWG`?vY
zv^288hsaWtl+`ZELmfZp!RT_e`lCfGz})lU57spr?KJK6Dx`c@w>Pr2{5R?OJx^Y;
z!MDAKE7HvePS_fl<CJ&ZlBWz!OKf>$ROs=VN*zvETTvvFIgS@M1O(^Q(n7-xR2%#f
zI9}PRPoXzReLXBp7H_quvhc2<oJXii&>9*~1q_g0g@o+7>3Pedo|Yyt^v^rJH*nvP
z;b}DbDj*ta2y=T}-pdcu?|n3;W($Hcu4S$DBMynqYq)SeRMwd8+BKE#>G~Q1^9wFN
zNdR1|ezR3Bs~cNIrvtRuI5(AZqV)B4t4<`5#myPoR{N#&N;+C?rL1emEj%kEp4%qm
z(TLD=eP)|ZilvYk%Q9>-5kp^qZl~2^+<cLcSD@Ctv{bJRF_w|S@K3}|NPnqFVj;IT
z8&bU7e^eEZp3ALsU7@C9-Aw-gVgAb*UDZ#U*w;Cr91yCh=(QbEP}rE_*B(y`(7I>v
z>MDp@YM2~;QCQse!sW!kI(m&pp^-owUh`lFb+^$!3iTSgc2-rr&56T<$SZ53{vYYu
zU37IUEoo^7D`{1)(ooaMNg-{Edz7=r<D@huo3>!OH=#zKS?W&4?Q5_>$X<b~)l+Ho
zpuV6uHMn*AFDll$`h7D|m9%dXF~cB>tVX@nI=-z^*kqPiV|l@~fWQ1EQ>8*Uw<gV}
zTy>l^Ep;6`fpIvuB}w>2qzSddRXf-uEx6zR01M73w0gRIU;eD`zqya>;I@=Hl|>8V
zeK{?2I3WnhCt;LbQR+QW)9<OBpvE?|9i;awEwAWsyGWWzBXD#hBoEX70KzLy{7RXT
z7&Rm6GT0}ORV80lSL*t?r=W%2ll_txj5(*VPTXar1<4uBCs-1+(lx}Eow!b`r_@P(
znEwEa6|m{vjib|?Ws)%0y~L1@*XE(6q9bcTZ(+)t!$W+V(d9JMk2;sFP|{@ME71CD
zQPtq54X37=jBY(mxU#L%VT!X-WmJ&2V_kAQuSeASlS84=Ejf*(GQu{Dl<|yG+XJ>_
zb!}@^YYW*cw~^djELN+mYEPBEyw7na**FMJqw1NeYGwSfF~hj+ZTJWtp8VFSS^Qu2
z0r#IO5@jP0xuDjb?^p8f5tD}!wHhvk9Iy#0ow>)kI9J+B-&G8Bk;NO_8?~FpKI)UH
z-Kpua8cC_lSHL5JwmItB458@+RaR+~G{y#&mke2<5z)OlH&E9$V+*6D4!IxHf&4${
z>b{|`6*a7LDcV5*{{TAr3qjH8^qM9yk+q-<3ojq?f0J037(JaHKaYE19X+Sh=sIxp
zTeLKOk-<W1Q`PDgG}miS>iR2sE7iTxzm6=d>1ZIQZU7_YeEerQE>b&PMbU_Zrwv=f
zrrhE`sI4ZSr9npkX=u3NSj-t4uG|G(U8~Yl3(X)I@|szcRRWxziC$g$SS&t^nq0=(
z_VA>mtDviavqL)_b7P(q8iTzqO@foi*6d|ZM>aRT+n<JxPnFNB^hq0cG1%I<mGFv9
zujC9WcULgZ8uOA<!z?2kZ(x*VCsbNP7#DE;F6@b5U~QfDRkBvY19r&vwA$^t<wr%W
z(M><5AMYKmrxz@lIK>R=F}7)Fn#K=S;8-k=SXaScR>&i$WK%@zmfs{I`iEBhr38*+
z?B=%Md0ru_YIT$AM^=1~W5yaTy{{j@%{9fUIH#T~_OsrorJ|vs6E;SZw(b|;peO5k
z8fe__RAU)l8&}pk%+nZH_Ou>(Rh4knR)@Xy4{3KG8v>^f!)BD<CrGFHSkgU*Q2bfb
zp{X!WENwiDqcncFpsjleX)w+DCB7Gdw?w;dCEnnB=IcqOzMh{=bu`a&VFTN@mX*-|
z00jvz+FKF%Rnk48tEy<IWGsAx;NJ_*{{Ruc5h)|3k|?C#DIV5>v6Y3@Z4n2|>{uPf
z#44ur_WF-fP0r5_%1mE@sobTbKP@GsXX>go9b&K7czX{$)`v#Y=6geCd+dAoTOB7&
z)5Rl4rpCMu3XSc7p!!c3Id6sTV(~FzNkw#W%PjIcuzDC@O3McvcSS#0ucT>o6TjuR
z!9?jomTCPtTrxOB>smx?gg!DhTaZ=qIM9)8GcDAby=`SXT=@;Hk#$8v$ei&hIc`zf
zrQ&m%;vJq46tLbvdlQtf#U9XQl1)=(+jSRGxst_jI4%DGm19%*gH=sJ=wuF&w)Ttg
zs9i%>UdJ|y6C;=|@C}Fx?u(-%s?g7<;_847*N;95Gkif6$(8yyQ5w3jQ1gIn;oTe6
z-BnK=F3NX+>vB0*3Wrqb71F@q8!T=hj>T2ZXVj{|VIY&A0Zpq#BKW!rlUAs#sxNcN
z&IQ(wr)$k5)^Q=S57?<Rj*N7=XXY9RnYp)>Jtm1Ghw&Og93x4s0^RJ|XqucdQ<hYc
z2cHP4iJB?*M&0f6;Zo9R?uML59d_6QbX69h&-RH9>{wSsWV$6NyR$9T+HD@79N`#c
z#qc|<=Sb-Bvb0Atb9@^wOq)y+UA~^?J2+5{8LS2SLmbhJt;b+&bg|OX(lA2XI@ZFg
zhft`Y)}xAf3mV@3K~QV;FKi+)A!FOzcUAAy==BOH;H!PAnP!Iplk!(SWZ7I&RY$n#
zol8RP7txT1UB1E=8(yho^-XAZxyH(ho;t{A3~qn%8ZO5JhXf3|k%mDu=I;meuRY=U
zCa=-m8Ssvc%@%-N7<0wkb96zcr=ui1?Y}<-KczLpRirm~yN)+_SwF;0Qd&l_(UMyG
z-NTQf^%8^?BhGGfdl@}+(e*qJ)9f9)Y>n*TRj*TYolR8YzA8o*$UW8z9ntkqs@7tt
zmm5v)SH99})D6;DC2%)wlJSdnZgP%~7l%uA4WgEr+k2|5bEcaA0OPTsLg91&0BZD&
zcCSm3(lxUNxMsw!HtJ1V&;|(VcQBkZ_xMqq8hS4bsp*wZ(M2Oz_PD*Ln;a0Gs&u7I
zKy5@Wd!e>FttU$8a_UifzN4JS57XE!wwa>Or^0<pzC2tJ!p%)CK~4?vM~Bns^1(5R
zc!=?Et?6kD4{O@ppmT-jeOXJVJ_96eYg`5I-BReZaMy>mz<URN>QKt&=@gbV1#G|R
zE}hbKN-t8VHSavL{#9>N=#?5AqDmG!^5Ff#w&?!={{R-(`Yv(wi?Q&wT~kKt%`wi3
z+Y3tTSY=j@Rhe?8d2J50IB)x#n{1B?vs{4cGKa*_*IvZgMJO~Ho8fpQ6Z;jd(_2j~
z2m&ieTargAYrU0eC8DoD(BzNVG?@bJBf6Vdo}xQJBZ*+ZB}+c74w@Xvfw(v!XSL3y
zj<AT~h}`!h`>IQQ5lN@AI<vW?T!ZkcW1h8=V|i}tUh3;e(<*9%WO*j%0Id{#I^Chp
zY1(-NBMfr(Gm>RREi)=;KQS3@@IA~`kn6JP@;V?(ZhuYIno2RHmp(TF(kxoB9ZJ}x
zd!>%y_q~vWo;ezDQ-~i^RBBqyG_IzF@<hRRTQ&->rD)w8jhTVOcL$Z|ABXY8&wDnx
zl8Z>fv>KmBQ&VoOqb(uhaf}`lIXSk_sysU?bc&W~(nV0$5Z>d$(d*Ju>KaGqso!ZD
zJ=R$Gswv>BFw}u#f)8Z{MP&MHk7Q3Srjq{N%aV9oI`QUFGn&q^>p0TP;y`iFgl3H=
zr7K?<yGY1Y57R$8T=&97iN6TyYHHdt8@12uEI-P8c=)Ph@=u$zdJj%&{{WJxU~~Tf
zhUajvdW+MZoYcnPadHC0X!=b>L_zboi}oDdZ8VBzvX{`15<6eI>5rKRM~h@1jX6F@
z^FF4csHt<Lq>aQL%7T-oYo~tsNdWc>*yhsOByowHlZ7=djSw5j1IV)B%jY)g2<yY)
zMJth%=-o8XyfQ{^VHR*c7J|R0so5iHDVjDvmX6B7l+ea-J<05q!KJzS70C1Co{o=-
z5qdKkw@*{GzPt^y`?XXySX%EwOEtr>3t?XsM2vHxBsgZ?RQ)TV>Agt|jg_J*#^U^C
zR}`nzg~`Qj8EPqGgWSiA41g?!u73HqMnP-29tzg${S8$@$L({$9C%)Ts0rw5NO^Ny
z)4@*}w#iHECP$cusTl-!7g4iQcK-lOFp%zi1dvSxqt%Vz#_T<x&{3LH6w_3GUG`}|
zq25uK_B0-?0%^3=^6Cy`&a++md@GpgBc}cf$MA{v9}3<*0+x6SE$K)<OMvc)qoR(Y
z5lK+j8CWg<0Ll{D&@SH0obkNXx7EWN!A+`_?O_qSj|)p((-ly>9nO4D#ktypsp*;N
zE?i5;V`WInmc($jdET<xncP~&mlNezQfXB%)Ws~#HU{J`N&f&rCEMIBoG0pfR?2Yu
z3tGhqW%?W9vAr=oY>BUHfZN#_u4|O<qj`nluWktWSrIgpvOH6p{2?Zermu5|aB=6t
z<ai|~XlS(^GfC6B%vJEq1xqg@Z?yRe_fDvqjIv5`{5NtuEFVunQ%PPY8Ex$5_*>{?
zVPjs*u=2W8bO!5Yht@Tb1{s4%7_tGf%cfVfmzOs7k-kEwtd>SK&t!$5ew!g_dX62&
z8sWjV^pKN;!z!Fj^?gMzqa8&vn|BMJg`es@Y7g|O<CaFBZLQ^Gb&Y0f2|Zdj`qa<J
zZSQ4@)_Q_^qUL*r%I@XOXykF?$SdlbB}w$X*~PmniV0?xj0s#_Yyz{IEOQM-vidH3
zMEixVy+S<+l2OG`M{>eF!1+qw9>!7Sv}NiX`RTnkUmPs^=$|Xx8ge@?OP571gf)?n
z?$}k|`f<#dNoy1Of?ie*HPMdIAeIRWC1rz;J{A1%RK^2H-5s%R%T-a+Eo}>Cb3iA!
zLN+rHY%c)V*b<q{DjF$tddVp3SXlF7Y`64!yDDM+7zB}!vYLj5;!SNewv+E*?ed7y
zp{s?#(KM1fc}6?f99X?gGo+`Hj>Z1~Nec@El?<tKANo&~wbx>rNL?d^z7|fQpucsq
z!gm$eBAWr$G`7^Y)MxAe04Q306V$M~@7RvY)KoSzw73hYDXRSnmc54UC)_?1WZLMe
zf~}g4mY|wCPs>g3h2z?M6{gX2%8Cl0Cohr*WFh)mu8quPjoNc>3waFGwG@7s47eC7
zYkh_3XwT}JT`aK~pdcG$ER@ndmT>0aUd3s3tw3o`bDx%l=e<qTRP#8=6G&sQ;1u#f
zHdhu$9{Mh-Cf!{eWD?m<9Irpo=iJw^hm3*YWBLzOZADvX>WD2T_)b6JdlrW9&?1$)
zhhn*<H3!9_(vy2eRvjiNBoz`zwb$m|)s<5N;SOgu?cHB$v@y7rfHpgVshG(r<`j}N
zmbhJ}*i^?gJriilYUSmgqypuKBmNbpgFOvxFSG{A*8c#13f5gIrOtn)YyP2bP}CX|
zVXO7&kFfrx4?a~m@j`R6JFe(Lu17twfbXKrQc^w|hs5Tc%r+r=9;v6xPS#bio1!2G
zg_zd*dDDmLG%dS`xoGaGj&v;5jp(galvA~iv15<873vM5rmUuH(Uy?maJ&Lp<fVVA
zE&w)rd@Ywu^_!u9L+f3(#m@@sFR2pv{i5Tk=mb04Y%e0}rnZ{1)QlF8SE<+a3>9Z=
zt^m6MVmiM|Wlq<#`Hl*Mhwo^#U+YW*NYsBfOf6=;gCqKrs&xibK=@tA#fk$>)9PsE
zv1tQ~qw93*0W$%y7rMKG_C-v~AI!yH>}epL0`v}^g0J%In{)W!l|w}vV5wxXusNXT
z3($IgN?G7<r*D9RifVz$r=q7)G7ui%K^Q*@r&o|qNY=f^z~GL{YpGB&NL?W3xL$Lv
zRf-v36TQ(Bkb5bp{{Ta&*xEXcgu>%v*r4@#m#{cF-MLl2o4rdwb>ngNyTV;=Ihx}e
z@-buBh0z-5jG2?wr+oDeYYE9$eHEvcR);?(*CWc4{TZ@TZj4#rU+SHtI#_2BI_#0W
z6uA>hgN>x@^_@Nz%TF8FOJt7Q9Mh1mnLK)gTPgsKt)ju*o<H)kT{T=EPiY8ifEO3#
z9apHw7{Ok2w9iH_kshlC*^7_0%_^d<cuY?vq0Jb3NdDn7TGgF99NXv0t(v0rt#;eC
z)+K1;y`Z^q1+9UMiPcoiE{&%)<*4l^QW8^$-gh$m_Xy6H)28&_E+wXrZF5hBThv-)
znmq2B0DTu6j|;XJ4M^ml?ye@cLwrwoj!QYNHoCd2&?26lz_p|v4VRpB=CmS|HO?is
z#rrQ&(Dhcnove8UgnrAm57EUXyF9z7^jWAXy+#59P1@nvZhA5;H>|X0>C<dxqYG?X
z!FR}0^;|L3(?|naaefz;&{x-JI@>DgBy?|$_iKmvQOO^okZilxI(oB1)ZIr|$Fzrk
z4oh;RrJ8GOdyn6R?38n9e~G;t>ITOauLFOG&@xTA3(DrxrKGBsj;)20#%yuV${7Cu
zeS0*WbZ2$ySsnaVxPr4Yhmv<2mYl7YuEz$JzUJN5PP{d)-VRk9MYcALrNO{w3g1S9
z)@I3F?ROaAQ|Q%9g1kCFHai3@#XUVWg!Hy_Zv8+G6f!o8Vo8;5(kG*sJ}k8I6!kJx
zwlTDuEjFJ{+K|?l0tW>?uS;PCwgD>rqBN;UuIXKRT56`pBdvT~@Vyd`U8R~J=*`GB
zBf(xtUk~MH-E5BwW71}tvL?N+0#W_`7d^PTD$;vBKSz{QLL?(27b^Olu}c=$TX5sy
zWb|s5Ld~NF*+tcAZioq?c1I)1&Q`_aKpl0a#VsqE_KVvF%K@iWOQ*ZjpK*vAT=rg}
z{-Z~%(z&J0+;HZeLd$DfEG&iLpcdN~N$hmRpwwb^(dq&Z2I}gTc9C%4u(4@XZ=y9i
zeaw-cd_VY0L#<u{TH@IwHhT^TKPr|K?DSUE#L;IFbxp0!46!+mu?MovH(z9p{dRcd
zD&0?AvkBdC{u3ZFo2V!w6B8NtUj!<)&RD|~!tK4dP1N<sMNa3q{CGpUv6DZ0K-%tC
zRyS*BG}iQJG@2M?U~BB)e@RAFXwb9+Z*cL!S*m)OX||TQx-fC@wYp7vD{1z<!*!Ih
za*MP)IJHGNE~S#g0`^Un<%fJg8;@}Et!v<lKw3qd4=RGDK~E`Zb~_`ESJ|f;6h7^<
zvI)REgxAK|n`3K^3Pw4yI_)`9w`)07BvaMVh~7(h?hwK-MTl3DGt_l~OsS!00l-_x
zOqjG&z82cxsh~VH<BkfNq8CKlw#B|wEg*~9_T(eksFo=m7t2pAQhIGC9s4N5uFJFB
z-|n8n+#4Wj5VXeof^pqB<JVxbKyc+s-{Sj7vw%wje~Gst<B*n4wlr0PdL({<kh!jK
z2M6U^#TMhZ45A&Uwn4lLKf0I9y_fhTXUC{b^JO8Y-Dd{-O3=lpHNw`iansCafn~mB
zVR$UhLl<M)f{CY?#r!#eb50e7WeZrs=4a=^0pYhTamiJT)cPSPN-tzJ&=$MYiPsjw
z9j*k2gJ%!!kEf6U=*yA(r3*7`^Rxg*1u(QYJJe;GY~hkS6$7_k;{O04Ihc4PTRo9=
z6vfbb@cW!UP(tX`1V8{ix5iYlNpc?77Qe_*w6*QQ+Tq9{M`tnj<H$^A*=SF#X)S46
z+;>pdR6bbtxxV4g%8Ch&`-fn1ES7Lc502*-O42p58fi1KKtMcqvXWR_4cUX(`AZub
z_J>;6<vu%su;g|qgaX7o+<Uu)9Fg+jfUKr~I9-Cp25#GjXUfK)TL5yH_<$wNx*|y0
zI5!EcxcLPy`T+}UTVhmm4A_slCRoqvVuTxu5tIT5cAPr|e=>1sZ#l;!x^vha$34?C
zYZ3HCfp#GqMZmc36I{^d-M#xMSTkdQRKkhH+lT)E1x>Z=qD}M-PW`e5JmboPSfIG|
z8^S!%IN{jwWJNPv(kbei3tfQnp(n-iMWfX-Ij6$s4)+CEG+PcIWJN_2=_*5meT3W|
z%E^=rtb*)t5A2)gUcoOPS}7!qJ1yh5Q8kw*x;9v5rj*4rWv8|Kq2%^Ib47=6x)hX_
zj&~NFG9uF3f^c$>0ds7k-5&ODX9WuOIj3+7DOf3s8MkaFJ~q9$KXi=uVE+L4Q`u|U
z-({F|4(6Neeh&bsizJQPm<xxLYns=zhh-pXh}h&G=CalXMH`y&o_mDoo<XydpA${q
z%sC@%YaUii+aBhJi-ifWJ6<u^_fm{xT!gYTJ-AI)2FRMz9gA{2c}Kx8eK~0$f~%Nz
zA5G2nr-JC6zBBFr0PmG7kiLhEtFmT~P5$BSJXo%%g|ars2eDlo?33C+`3Sh<8wU<=
z_))*I@!44sb04x!f3hKubZ_3<*-ujo2)jk?+qxJK-c7=!UG_?Ai_v>WsMFQcifa6i
z<&(Qg7P67hKlL_P&*+i7AF8c5JAk-6q9Le}tspp-cLh;Lk3zXAEsuzs*t*BHl-{(B
zaJjL*2t$*L@SfLiXc)g_WUsSD(InL~`hoks!=D8UQpVNDOE)$4%SxTwh}!Y@P=Z?U
z544U7UMZt<Xfvk8O$|rAo}@(koA9r7Zk>PSU8-nymJ^w&M{ky@stU3sZs!I(aN)sT
zjnWkm)HR{4Y;y46KTFgnX_t=Go?Gd)%`b=%ep}oqUrX-Y5Vw|<>m6;-GS$NUV?&HG
zrK5DPkLLR?IfiK2C!<#hie{S|V#O~Zl2QiKB$|?K@w;!3R>MejCZit50TidV3XBQ~
zKo5A0$AjfRYiXVz>RQ}5DbA#aigE0pS?S4Ps1wEr9mwFKboyZEfIQh1LDUcy{$91=
z%p%u4k;09v0-}-PXdjT^cvH92DO%A<T|n2rW81O+0Lt$ws?}67`f|4yxObJj^rMz7
zvI~RX!mg{L1)iL&^<wNu;RNUj*-J;Lw7IQ)+V0;ds+b#C#}?SQcO0l|bW+IuNbXt>
z?1$3~t(-JGvOsWq6v-~poiKS@Bv16JA}$@B<vJM~Yg~Xk+bc}Q!&u)+b^#}kKSfih
z>F%d~_8t#DeyOc7RDqo|QZv$=^TWG@vT1?r7sdYoOoJe!sc9grgtde=M*gN1)KX2S
zP3TI~Ejy0~mZ8vFvc8nhODCl(PStS*np*Z>J-Zcg6%{pgHQDcPZ!JJgr&Lhi7is;K
z7EiKnDfAmc_lW^(zQ~%$VUearI5Jbug0Z!_m2EVqV@}Y2WaxEy<zcxP<Q1gZquCz0
zQ0jTy!rw|x*u#}v8iQ&t9L?JP%Iaqd_=9J(jUE30nX0y3B(eDg%>GyS`l)hVGVx7q
z9Souujo_A^>f#SVc($K#J^O`8BvY}XDH>cm6%{+`DCXSK>vsib8|Y;^(=>E76&hVm
z_+>7OxK^5kG`i(4s{m-IYjWQ|MNJ#xu8-7XgCw?F<e{Ugl8&Qu4%f8gB;Ef2W9jr&
zY7|4%bTT(%hmnv~4P89+vu$`H+&i&eku(&2K}uy~!zvrey@)G0RRpxJG+L84#!Z^=
zJ1fFS=g9|pGVODX#DLi0aG)~Wv9}$F#g+WpN4Iot5=493Ek@Ak{{WY0dCX^@gzc|F
zML%YDOr@%Vt*&$21@Kp*=+e2+v9b_d+=MhVG}6QjWIMkJ10|%A>;~Qx-8~GEp<`hq
zY^@jh?xUAak9O*JeTs&jrYhLB?%N>3R{GF5<m0{6+$<@y$m%Fb2X+e2>e@@lE^BvL
zYmIe0pfXYz^bL92?rVda<S5&VES;^MeKb`R(p)vgz3s?EQfiY@xH+$ISCv91zV@*w
zNwnCeVSF~vAS<b-*tFCAN5fqmV|NDvPa#iBQ0jRBiQeArJ=Sijf})y2`ezVtmZhfD
zWIoB-TH)Wq&mHs+lm7rCb{Pd+Vrbszr5+WQk*F6B%T>DNycLC@)r=Ab$ozJ2S4Od~
zXp%Pve1$$PBXLioV)s5ja~xdX3Mngq7Ir~d{Wn?nY;&+X60Is34OBbW;0f@J(2hIU
z9<xgoRD0SRp6em0QOynUc7KJWoAXr8J5Q+2;Qs)^jL8*LL^-1z-?BYz8mmTHine-J
zfbV=?JcV-q0L#|G9Co;Q9E297MX}CwIUYQ!xTKzzP4Sa%?XrG6wvEcW4ymDhV3^5s
z2ksE`(@Re<E@8Kjt+eX6su(t#NI7XoNkaudwixdxgl@FJ-GV_pQ?mza{&_@0Q7t?6
zNH?(fLOO}m@*Tt4JF5yfx3CtS&F}D*Rp{2yAY)ua&_2h)E;$=CdnahzI6ctDm`3pS
zou|)~=F4NYOdJ0I_E5VT(?i_>ic5@+#YpKJBTnGZMg}=fjp5C~xbxvhGg{MfaDx=C
zstprd01;8p#XMkxa-Aeidq}XiYbB#Dh1R|b*GMV5+0fI}Qa^NVHtq_zq^V@h4K@!P
zg1RR~J2uD%)kRT2KrfBv;Pz6KgGq)G&Ikxfx@e?nwX@kn9YdM?IYp0Rx$bmk?sv5J
z2b5ynh~m+n)%2E|z7e(l6)xw+C7ugjJFTr#8!T62fh#MlGi#3FW94>Y$ogb5Le-Hn
zr`!aXJ&GaD1-HGGBWhY7vO{ZkM6#r?ak;Cl9LzDqUls@9b0m?j&CXP9m69|Tp7+Y@
zkWJ1?G-MeZz}n}PAaFb?_LFiiYjB8T&At{0MaBFCqSm-k2erUhr-yebLt;D!bKMMH
zS;_8<!-e~(BxudT$Oke)d)-J)#m6XDH)%^7$i2;o@|eTqacLe@u+7EPZuc~kV|4@L
zb4}VlQiAqb?`yaOl%b&bx~_^>f-n(~zWkh~st(COHn>Z1!Lnue9n#zqO2!&m4tuCw
zcARJB5n?;2U!35qY8EMrc|51P+z!K)1+Rs`y{79Jn#wsMz3_gjSl%23?3MS;kJ$@1
zND4^Y55<!U4%^$5bD9Y7qH`^gaI@KvBd&WU+d1#y5ayG9$}O(GJfmi4YaVl9WhiiP
zCnr28%P@PUjlkOW_(cF&q8G*#0i~zPF^&XSk#yN37Qn(Oi6yc)WX-ex0EAN{7Uc)D
zwe~7jI@cIQg#;JwzyUSc7qCsejk0l+`;2Gmkk&x(4Zpcizc?eeD3_a@6g!#<!x0x7
za2Eq{o>I72^TKD}=$Q*gJ%b6m9pOE$10W0dQtof{Cb5eRa-vvjq=q>#9d$+4HQI%B
zG(mvfg4b__t7exiZE31-0i@+x)M)y1X*TU>eZO?E#F9;dd1_ibVxLX*S|29yCGyk3
zS`8;dr-r^MDq;?S_6`Jg@}|~mXy~;85CZqjm5!ZKYPQ57bJ%bVm2szJ@;gL*e?z6{
z8l5TA2=r=U4+8%Hr1uJt>ZSr78F9+8*1A_*u931n34JDuFx!Bji>4}C-IE&;*sYQ&
ze;`8oEi`VW6%J!r3t61|SD@$&n^11Y0?phxdA^xVPp4FeOaTD-TipX*ic#rPG=tm9
zf`ok{@|3EI&aCLi8rMEr-%{g;8-<zB`T~x9Y4O&37;+1EE7S!P+Ka@JIFc2%ouReP
zYm0I|6y-M;NXpvTOQ-aQP3csiO9*=p^Eh1)Vd)B6yi>(sIU#MK(AzC5qLv``IAk8n
z%s&u%2Uvj1HiqZP8OeyAK8a$S^yF^35B~tw9UTozVr&c&_8=-=q}BA9>m!<;osA3`
zcpQb~RnY6SdY;P43E_A)_csJ9x_I>o;S4c61Kb5zVQ_q#G^E<9H9D5HO*<oO2i(_X
zPe#pOR34oc_+xh__EefbPfjEf$X#RQdT&q36(kLh+SdVMS3;Z;*(qaXE}Qsu5gxr`
z-z&Lx<lSdU(loeE$k+>3rn^?#84Z|N_PWJ&6fLfG-uGv)ODxC>9GQmdEnX%_TNw8E
z9hP5YnuS|hZq}3bTlw@|GA0*PF~QzQ<yE=VRL?(_V;ye9D6EU5i~MwH{{RjtAkY{!
zA8d{T+|n*o{eRW%)}>=<XtuqhF1PquIA+yqvqaZzCe{nke-FAAdg_Sg)EWA$cH0(4
zII?7R%_+hP{hoYf*D4<y=_h<IjDj4(ZWg7wy#;=k>FcpZH5hQ(i)G(c>$=}VX!JUN
z<|1%wfXKS>UbY%sE|w#-ICw&Mzpz6pXg5)dSEJM0T|pnOMn&9X<ONMntVr@CV~f7`
zRXsV@x`vB8V2VLKFgR=Tj|)LrLqS@`>pD>MqLALE5B~r*PjT>uJd=y5{{Z?KV~gBD
z>$PWkWH#de0NH0@(QEbHL^?K|m*fR`Srsk|Ue{YBU0!G!_M4@_un%(SjFar=l4)q4
zMCn>uDowR!#@KN|>yDtO4Q9p{G~083m@4ges~u4*g9#1ns`STHYjvUq2V~frApZbo
zp_l8~r_(y5=}?BkLz+0hD$Tu7S*!-OiXTctf_opLwdwAU(Wv5KuMK!3CHYh9T27m%
zfc-JeBKHNjvJFLh2Rk#`j+3uf)47sWydQ&Q=T&_zRaLA$g0iH?D9mm=JK=h5cDXzj
zl2<jY;lX5ey>6PPQ;K`EIz9+Iq^f!uNwaJCf75idI%A=!hCf-kx$pE>G!w&3JJ|a*
zqmPAz{{YoxwCoW|OUSp))G<-@cDFA2SX~ockms9U=(@Kh`jJb!E_&CkVx@cO;Wu!_
z+OwTANn6%hi-k>8utd?Frz9xn=)GDBlUt}0BZ2ofuvQukd|EwYoeA51*5Ij5<Jm~1
zRDgB9iDr{r_}=jHea$XBk19FE3$(AwR8zFh&(k0Xt$SORuC33R+pK-2{3@o-*?6%%
z*Cei6XG+&amXj3?Wg{tT<n&~Z5y@`e6~3d=7tzIjmp7}o{l>Z3w~(?1sJ-Ehx3`sl
z6gsw-D;p$|L?>qG_Y<|l!3e1}(VT7Bo28^RdXQv*v^3bSOwj2x%|3yKMzlB!?(SAC
zo8Yc|uZ-G5asckGBh&RQLJ(T#HJz{FbmD(UHeIm(pz21oj){^08~Spx6&jQEDy@K$
z+gp@Iv(u9Zo?Rgi0{rr+wA;{<Uy>1&otiPEX<bzookRgPb(S|>uc@qSq>L9ZIE~j@
zjSEg@zdOXQHfX)R6n#aa!=<uO8Ed0>!+a3ArIjrm5rca?`j(zrnOnV&^zULoUZ>L9
z1r03=XN}I{=I4|j;mmqXZ8O<c10D}5Eq(2zu5~<8Ijq07&g3dJXhkiagGD_B1Z}Dh
zk7I?gk_wrw9amW$6QX2{VF!J?cwSc6^(jksdWDCJoGs7c-mvWwXR@)OjebMVWy|EL
zM;mCSIoywL(R8Xk7f+9KSkfD7D&0e<Xg}0rrhP+NUf|Y?@>X7>t0UH_q-7Ms(Veb0
z<K=kAT*;|BsN#*ak02Yd?K~T=n}3g%X<V7!vT=@&t)mgqv96G{xVTguU)EIGRU70l
zXaI9{g`w&VW!)!D6=C%yje(|OazI{x*3}hN5ID^<q>qv>fTjLEM=l8s2Abr}mYew5
zrcYBoomVcvE@PJ1`Yd-<{vf|mnekCfc9Lx1SC_h!RMrtp({~$LYPxr%XOY44G4>pV
z>O=83<x+M>{D&Jz(r6mSzfVo-L0chX#|}6u>Z|b&S*D<5Q?b)X&K%QVTBH8}rqcAm
z6u>k!whJOB8ijMBh=S5=mS2sGrBOu|WTSFDi$d!f9ebvn_}%GN!rRFiIr^-He_eVN
zE{&j)4<M|yR*hGuOv#~qk&-`@+jqjLG&0mqUuOfl_DK)HHIn7flJemg=+X5b;vH>m
zD5a!io~Upwmj3{x`1&mmKx!4TNXm-ocRX0%i>$tpr9xvR>;d+_)nDmsk}%lf1a`Py
z_mAP?!?>-UeoV5TX3wm(IAo#|!yqoToZIrew!V4l<Z#GvJX^BWKT4^U_mbt8$hwkU
z8Y*i{&;|Ui#zj9yN}7-W9P5YtqTv>}BKA(Ids$HCb7eIxq<4=A2C++C;q0*brHYDq
z00EZ@?@ZFn<Pr;q!n+g#7FxpJMDz|uOi~!54I?2TXlVIX+MAmhAON$KwXACi4gii&
zdIi}vL&#;fmbhdas3qF^Lsdxs0OB|O)_6WvXI0ldAZ~u@f*z%sI;XZL{-)TEAxcl^
ztUt2eyQnH7oNRu{80-+ODLTHi#^y>(+FOvbdIp85bylPqK-K_F+~*z^#;2oo4HHy?
z7e?8M9k_RtlgI6bFVZtLb@NqLg2U}4TT-?0$l0%gl9#6M)DD6>xJi)T3r(x^tyL8x
zW%S+!vJ=KiC|O3?n1foV(mIM7>UUj^J7tfvn!Oscsx;<NerHep61MM+*xFZ+>Qr@c
z>MfDXE@(FkK}}IhRj0Q*U28prsO4OWV|AjFsGc<)LRyC07as_|iPEX7brVe?*zzvZ
z<fd0sdQ$?=)8$`ucA8yV9N_J6I9m9`E-p^Zod%y%rPA7=yMe<?LaDEl(vj2KCk3Hx
ztEUlZyQ*yP*5G`vJJ)MjF6luH7yTh|<;f_&)ab_;%W?y)>Q6#BAa$D84{5TX(zOZQ
zstSg`hjG}U^=6u~8xXslj4K@@M4Zw3?Y`!Ip=H;C<he2#sxFb}v>K!iqHD{B>wAZV
zL$2%aFuARiTaXqyqf?%p?r!6Z6`QV}y1rNbUO5~Au_J}n=V;|nrd?Lo&8XHo2%U27
zE!h&yFw@2B*qJ$UcSdM+V)BTb=kiB&ua``cN_iqIES=1|2LkFdX-BfS*X&dsakTUd
zif031?LE~k1sz_kskP2=^xolX9N9Ze(Q4(asEW0OIi%U7cUOHS{{Z4`NII@EU?$f+
zmo4$OyE@nG>GXP*i_?-rr$_mA3l{r_&6Wr84bf1s^p!D}dY*d~>b*a$z~~GyxDes(
zD-Za;O9a$nR{+=YaHY-7sT5IBv}JlPPW<azQ3Hco(_$8nSNzQ#A&=K{n{GI=%5;5k
z(|~w>*qm=`t3Iddx*<=oqkD+#7q1*~YT4#XBTkW()oQ2pT<6H(;7y1tH0PR~L9LPb
z-GWLcwywUp?iBRSE%Ri$W`S2MqIss;;gA4Pl8PQKO!Xds)EhxfX-EZ@Hoq%rQPnhV
zq;>WSixuZueFSq*H*}H-7%grtj?<#2Yo7$M0xipwWsxG0#q7;>cC|fbsrfn`#jbUT
z9u}vi^qR=2n&Jo{xhM*aA*|H|kT3vvBeKyuP-dM$dE^ZsSp1=ngcYP5oTTVBgG~J0
zP_;;pZ*P_8njJknGzJ=p1hyU5g$}ENlT!5|l*rd|8=EWB_@7S$2KssT0m1HuPb(r{
zsFA{(*#7{<4GVUnYbaP6)|`MbWuWL<2LAw~80QUiq<dU5h37i|0AAE<6Mk9<%rG8L
zbMUplhWhk0<Wki*?7ibB$Atv4O<8F*5)P)&olRI|sAl-j3WBdfhG`o-00Q3ETYj*r
zWb(@L`@}y@my_3OwK{g7=f^Xh3yxdiByeVg?({!6N++S{42B4rUIp9OqpNjFVH=yd
zqwcT~>oXV`AR}vq@Ka)zdhO2KY}46#ag%yE+)~+Ltm<TkfCap-I@jwZ^$Bh4R<BWG
z>`m}F3p1(0$qC3!C<)CL9SN#SPW{H^r1@T#N7QhLkE;IwWwHwK?IKUf%o^{|<NGVe
zI(H51dDv2>qGp_i^~R+L)qPq+cD(lTj-=Bys?8;m$xh=9?hkt*D74tM2&9ee0!HWm
z01MYY467-tbno=a_{XUWLvBYQLnc(1@Pv;i(&%NS)tJkEqjJ@}iW*5HXxW=*9IY2n
z^z97N7g81nu<mPzKSTvBBN)TDS>Z}|k!b0M81@ZM=)f^x2lrAtP_QBxi9S%;%^byo
zNR5c>f}pJ%eK~9o%Hn=BoBfWc=7ngx(sih1n6cn);lXJsX`!eWU=}_Xn^wUj6(X*j
z?#^1?=*mv1sic=-y9;|B%cmYL3wt4we4d%E)o6t@qma|x3?pk^G511C)iBr57D(pr
z1D^`Ilc;H=W9i=Uy`QJ$7ZjbLc{a9NYHkp-b9^l2KD!=|tjAje_OQ5mjR;L^r~rx0
z-N3^0+Koa=-9_;FgbVvqLgd7k>b8AFRn*#UtD>@2mbjMlb>V-BRdnWeIy)2OAi8f<
ztf3|;9OE0XT2BZrx6<nv*48xouu1N??RB4xCo42_B&ek6?N8CKaFLgd_$zy-!pgTr
zJtymo?%U)n4woElBX@oZ(NJn~>7|c>z}WGA$m9+;XRGOPdhBenH17)8vC}eE&i018
z>B`S^&bJj^9B*;j=L?Z^cBftZJ4QE=+We%t4gH&{87L=!2QWJ0f~K2K(<&k@Eyx&H
zjVDm8k}(@$EkDbY9;4LtbhAF1NSxVQ&CUwVfi`IB^qL2UM;-{{<!5y*G8czJT;My4
zaEGGmYPyEG!UMgI0?3&)Avxb9C9>MYc}YpK$+HJpqJB#N;6NY0Q9A>qiO$c$)Y9m*
z@1qjN!Fy*2m(NctiF6VIJcTo6m6WCNM(<1Lx}w^N2`iS2rlUgIDxX!L5qyN{YGaC=
z$q@!K`kUaP_1d?(t<brT8@M*WC<#QLmoaT5k>M(jEu%NbOmw<|7Y{cF^!%Y|G>Nr2
z?pj*I{m`<*I5u-gBY|bC=<PsmWEBmw!NOUjm{N71DqfPFka}<TH2#uvbq!}mMqTQd
zuh`fxV1f#HsTv*uzFL8<rfIY+XxvoX+Ik9(k3G_QZQ68<l*S)U4~`a(@={W?OG{@&
z?76*`yGNjGl;)mxG}vWPYj8=XZ(w!eAnnHmS`u>87ELXo`U7cak<rU*gNvqW+GAmy
zxDVl+tehH@kXDhuYq|I;(tfa|G@+A7GA+syi;Dtj=+Mx~OD!qW>H}=-vEC1bg6f!`
zr|MpthA+9N$Vbp>^wlH{;k&;{x(lfpEp&|B33ET2;U1Zz(Pz`u)YGxHwe65qfiT44
z=ClT%h37F(Jq1X6Tz1~eRZUqgqozJeTRvEaxtHzaE{OC7*RYLku+2{69j|W7&$Vcc
zGwu!US8JN(eLLI+=74fMA>iGqK-U+N?o!E($t@M~LoGx90EP)8I944q2dhwHm|eq*
z_gcyg4UD0RrYw>@;@_m8^$G(+J7$fWP3}<DlX8%3RC3ZtC4iQBM7ODArFd(ecQ=rq
zrs`DHbcM2(i5fDo-9$?!dzx|O8Dd?bBayztI`67os6ZOR8e8D<vwC3s)h_pC-^>+8
ztoa0DQVz%99?QCJx>{O`I2SS8sLLLTMq4#n6MZ_CwT8}Xw=}O~>0NP>N3x&>${S;R
zFDq>!d@QY}0D^J{VvcU3D`FBb?R#)kGUDd9*=V{wnUx|^<GdE0-W64SOPf1G_-VUJ
z!*u@uR=vc<P<FYa+HcCSlc=dG+(VyZ;I3r}Md+`so~5Ex(pOTouG%DM%B$8SI&DX-
z5cc1XA!Bq+UP!A0>E-r=Vy?9vU(}Cm;1EU$T`L@#C(bC=>3X#mr>D9bwBv%avepeB
zP;(@=p#K0oEEQ(2B@I!QmPaz&x3U+gdY#quEoJO&lk%vsx+dm}{;ATas^os9rxuV!
z<cu7BR&Pzy;{3sUZXvG0Z-S_!>T1nCK=w&^&KwRwQ|bLd3+jDlJ7~S!)YT-m4okFH
zbsaTT14Ds%XgF4SB<EAoy*Jp9FjW5l>e^<fLii+by|77CJt<boT~<m*JZ;@}=dw<8
zS_Y#>jydm5J4dQGcaWyk=ot_!+wDAr$)6Q1Q)az`jl-3mpzqDndW-{jZO6*IGICVN
zWW~kWG81|clNlK7f{Rp>NT?FV;^?oCpQ|6@xH|12Qfe}_(H5T=DV!SFJNq^RtA$lL
zEVv_^6`s~9POKc}TzLwEOsZscVi|B9fL7~CV;JBrE}AVaz}L}}JttorTc8Et=E<;^
zk^Y&fM(Cvf0NZ=J73^9}F;5Fd(SHc8qUd@aq0$SY0hN&pvA|@ZHCslEy)($D>7}NT
zkyKj8f;cFxS4@ON*`sLnhmPSDG!w(>Y1)fRY9Ko=#m8b3B9ZYuwAF-X{kQoE9!^m!
z3~5VcT|Dxzg3?;%;>f1eK1;FOpX{xtp@r<+&;#w;y3SWQ^sgY@Mo_(%Q{w1NOv@FX
zb9^auIoUJ4#_TwAQ{y92rS#7rVE8IMHi^{rS#I3qdHGKW@$6Ykk-5@Kbe0DJzMfp$
z!nD>jx_xg%k@Vm>!KUr_Rdf<ZCY~ZTb%L#%Td2_LFB6Gj?bxf$DaM)42IDJ7n$F3z
z%}z>pZfI-qb+_qVY{h8iIP6LntSKq=x)y8tYex2)Rlqr6^KS}=Op?Gc#@6na9N5_)
ztn|8?!z5<L>~Od%FRJNmcyq0jkc!YN*y3rYcW-NxwO2YTkLB~>R!fq!MLr-s7t|G9
zC9lC)*SJ6&8z}z(wR<mJ=@4}uhZj-k;jWlQ3&VeyFQ2tp+V(h`cwU?T0P6SFE@^&+
zSpCcw^!IVJ_EDY3_FayemW)=fSaz7DZr6-tEVWE-l$U=fI9}=atI-thk@b{pv{D_!
z4#jx=RRq*>m?mks{U^$<Jj!BE8;;RQBw#ky%ChOLQlgfqLR?H|2L2RNQxFS=ZOBt;
zjEqXxi*5@|C)uFdX8!;|tbwJ#I>GrP$I)HN(IWwCu6(LJDuOE7W>nJ<9^cf_*<DgK
z%wc22hzpU)<7Y;sXLZ_Zf=Ia>g+-&*%R^co*AZg1dc!vo0?F4?S>@nZazY%VCNfPU
z(lp&_I*3~G@E>gDPg$-)$ebMU`>!meuQ4A<(pleC4Q%yqIeVPb+$Z>VX^GG5(N*;=
zRX(mKp?MZQ=HCtrSx41TS5vf;XAzd3#d+3^r^`@41noW6iVZALI66D-cO^?KV!ADj
zTG_kMYJ?SA+wI-TldQT@9YQB-x-&gGwvYOVTg0Q!)n_ScBy2+2A!|B6Uu;tPH6G@i
z5TxZsaXh<Jp?r`Uig_Irjll=8@Is}PwNkXT=FT0Db?TpqIujzkwWNUPUH<%S&Ax2B
z@Az*w3$qJSL~=Sa^XZO|66V~f=^>Jp+g)<SqV~1^;h#QJDrwmG%YX%^k>OvWOQ2X@
zBLLVsGs=;Unw|UU$s@K`K~Ct~pL9pzbgnP}K-|OFtirp{ORK6UVGlMVn-vVP3W)6M
zk~^WFDK5Nb*Iflmn0dG-Bf?adpu2sG7W!ufy7nm7O4mn`aCj<4h-;zREF=RNLPktd
zIw=PoiYQiujqZ+3j^O^2bbK>4?GedqjtUM|jz&fQ0A$GUcDUGfTcZWd5e+2T-TW0<
zJO($1u;BjyWn|gNgv9Z1P&3B%w)eYF1uzJi=d`I+S%Ovt1yaIgot{{WN}77oq`
z?uuoYNgeqfP+>*S`g0_wyA7U3EO=E@G43W8k4koamw!?=hOzL0-M`@*TMQNO2^v6<
zaqw3=Z9SGzO=zgo>vt0rgJjMAUn<55u+x9+s$UCbe#g6H&Ed(SXFGEpi5vaWPYt_8
z@#m#dH4xNBS-G~{r}blzp5>5+x$zNvf{gs@n$aT(Bf68rBA+x_XH_7L#2mD$n&vU>
zFOMg(Y}MYdu{OF1vdrRIZ_n<pj~tfB<;xi=CTKFZXg7GsP<n)u9Idl~uv0}%Bgd@?
zKB(>GETOeA`-a(@{nt^+WG!g7yN@WUS&U?VbSy4Dp^fd&a8u@Hz#SRf&i?=if3P+a
zRZPi;tp*?6o=}ZrBqTgp!xvJ;C@i+^gnu%INu2pMx!&RZ&`F~`kNml7fxWDVYj4Nu
z@#RHLC_c$9M;Gv?b9Ur*@Q+~V8bP)A!6iM0<OBMwrI0dMiMP0RLq>hzIN13_Vp42#
z$7KY-J-`qF_)|P*I8Z#?A0zvvF%w4Hj{g8oQ(VA!7EUfC8=tp?th1U)Alrl($q+Xl
z)0UMDOn=Tha8YHgHU}OGh1X#qj2_Dwpjg|w_{i*=BR`u8Ng6}9Humzm;ozPRg@w>D
z1*XR#U1&4MAr#YC4#ibHxW6eOki_ue*z%VoRFKe{i?eMejy8!H1DoY^nnX1a7LmyP
zijSvt)|lG_?zlcx%+F~4BqUq7US!<j>7DW8E{vT;3*i3%rK)KxBFuk;B`2w;)doqH
z9v#_hDrJVUH$*@O=dz)hvAxEYqQgGdcT-Ki%Bn%tR8;z%CAN=J-qJj*Wpymnbw(P7
zTQ&#EyKPNYl{jRCx*~n9_*PXeqSYX?z};?Du+CWD+9#R{Yx^^luviB-Af&3IX<>YL
zJ;IsWsHQQSmfsge##uXW86>WmN%oFa71J{B4v716Zb43A+%R&jYv~wXTs^Mu@~cc%
zH*N^zE5de&&J=b|cs<t=dyIDpTWs#ZPIF6#%62VT7#8<4E&l)s)@*|OIXW&)`zFfL
z4&V)z4GnMVusKd?<s$%aw+G5|nPXxt;SpLG_`w+;M9A7$>vld=tS$%0TtFuo1u=o=
zgxo!Zf)vzsZWd$i*MF5GTWoTpngHRsyoD*jNN7#Phk#zof<Zw|8GM!k&+vFEDtgz%
z?@j!9Q%NIb7Y99xg1Eh%5=v+tzT1LGw`5flgJiSv5RZGkLA+<rl{9uBE|s)$wNGWd
znseV4_&x3B!zee!BLVi1?*&h$R?AB8TJ6p57LGXR^(ZdJv_9DZ2R9zaQ038<iR84k
z<LH#_c-rA_p9<4Z(dK9_jB&!MdtVc_$kNh^Y3&N)*JGN;Gyp*@?BK36O;)2$m9Dva
zFU8e<pH=8QdW;fAa#&T-rKGHY%TC{E<O7za$xpH2evek@j<BPvjj_uv(lK+$_$Uv=
z&WM9mh5ELP);6dO#iR7dyq48kZAh9YxLD&nuR!Sjwjv=E@3H=7IN?RZj?nz6o^9`j
zV+BNJH?-|@95T|5f#s~)<`>3B4}!f5t8~pTU5E3u!HlQ^<g|XJhMEV{U7k6zoT(Oz
z<ONwpvN0@2a}Q!TP0@8~%_d^{ce(MC?}^6XsoPNa+ITJQ3Kps+%F``BZbDYCu)o#l
z^bHqQqt#j(%SAP^#~x8~$RKfR#jnUc*OgMsEOQ6KT*+E~>uuAWMNO!*X}Yt7b8#HU
z&w`~Wwb03?T*w+l<NYU)RW*GhL(Gu01IY-zLMn|qeUp2mc3SblLR8j=GT8dxDPr0w
z!FErjNXeWcd$!0py0V^&)?to9FW9VBp{Q*?t7DtP!LqgK&aH|<+A8+}Ck&IZ`lo4=
zlAxKi*(qk;(_`7e6&xR$Xlu(`AmI5^RnFIq%{zhZ=jerwSj>ZC?BICtiW1uj)15w@
zQ?#_O-yRClHh8O|+V+M&$6~2lJ7j}otq$;fD4?s`H>D$myAXpx3a--W<Z)}8WAs#&
z+8CyHsS_^WkgjB}*xi*EBeTb3$TbkzeK~-1X93G8G;RAcGf~SEgwZ&(_Z^W`^>Ms<
zZUcG!OgtZ=zpB%jJ9pE#SoQ@}Rp{m80?!!)a<f<1$=5(tQMHyL#hyF0b0dl4WXu*k
zI4R;}k-O5JruVRS{!viEMhkA!;V&8urc_C%7-ZcGi*LaS8jxxm>CYMU2M-<AgV8aI
zWV8Gvl7*8t?gIUsjj-J#4f*Q56HwmbTEcn%0Ls}@R8VympJEs$w-^5EElW#^s-MxR
z06hMeS!M>ETcgzpX-NPZk$%akOKVJCZFkXZDd*FwOj3g8Uf2Hs$~4mMXr7VTKdLlF
zov2gl)Z!|T1f%(nE1OE{SvmIq0A-Z7vD|)$BBz{MYFA(S;wYv_W{SnW;mACqsfOcl
zZhWGDEgYwQ87LSw=jxqP?1Y<4p{RxIczkzZz7a8N5yu~=R_yQ`rPN(}u-UG+ZVJxo
zkcn96-?(@oYOM^PB5iW7Yqzo6n0O&m#nlg|COO}_JF1CIbsOCrj&zWoFWFX1&F{Uf
ze4?=?XD89Jb#SO>t4{Ft^KS{1`iT#_WC6nj9_u9p)6$!<?gPhUO)JGy_Zc?7zEF68
zvb1a;G!;#_8((aT_drg_iT5_dcPKhY<pcGXcs>zRdYcPs06rb%B2Fx?B_*;sDH|+y
zWBEe1O8q_d1<#Ac*9puL{;VqqWn}T;!y_ZgvZvZ4)jLFxRW_lbSlwq^K2?nlu_QQi
zt_PJs_@7Sl=)t#eq;A<+xvsax(3Uhh$ogibn#6Lp?lvFO-8M%DKh%Z6r~IsBv&j^h
zJ5O(wJwB-<WCy$Mlj5zTJgN3-$ZbSqGTYiRJE}^!i(W;nQz6ut>04<wyRo{mJ1bfN
zk)mG4_$w_LQz_cX86cJ%IbBfdFLOk4v<HspC(%t4h&Q@!$6PhQ+$WPw0Y;1XY8xYV
zO_rYN9TA34QW-A8`zo4Qw!3VG-#wAOvja$Eql~Dy)6nW(jSU{jq78FJ?R5=Z6G^jy
zE$#5DsC70*TGDJs?zEIOFwW7q-{k}=O>|K@mZkyfLgMC*+@+4Gu3>B2W87Q1(n$*d
zC5H#Ml~-Fy43}^lU-8`<MpCkhq0+{EN_@At@SRUsByYHTf}Uu0V2^P9im#h%^24>^
zYOuD$*;*Pf;)$fy<c<4f8<?}6tBdx$?IVRfJyRG%Bo`OW(!6HmYveTbG470v{^(Kz
z8d&UujFp|5qNWeyQ#*4xARZLd`n+{b*yFZE2MHpIN$5Gunl~3j;#=UMH5yjc#BKv$
z%2;a5Z?m0_;Hw776wTb*ZdQccN#s^}#;rv(GM()$vB6POPWF3bB#$d`sMAGK(%Bj=
zd#skHrpZe3;qPHM_+8lYsVX?<j*eudjt`C32eLYvp^~?4^Wjp(A!+9x6yT6|#_y`S
zWLl!xz_&bv_Q(T;#ljYrsyRSo$PQDvyIpa@G;0cLLz}sm2gilM<U47?f;k-1a8U)!
zlGp*rP)S(fe&Xrw1B2WlZd-ydp2;q9mt%H0%{T0#aLME62#gV&sGi?;au8q`(nldp
zVC-@BQ8x#SCyohe<u_)b9T+(lO^ms&vxSt+Hx?_N0UkmoL)z=)WjGQubUSx9l^}K8
zE^@J%A$9Nlmtc!uDGxWgYk{@LWIHvDb%!S@f#;7Lr@K6q!T}iWjRM7K$NZ<U#0;qY
z%{S~Yq-~Es;b4-q_(*NRO3`eCgr?aB<K-v_oXdk?0*%e#OhK^Z__{&`#nT$d3kAWl
zYoo!wPh~Lz_~kVC`z&GyH)sGA*V}OHsSU4dl8}J!m4QP`Lyh>lh4%#8fTnPD?3w_%
z93y6-t$VTm04s_5-7dgyZW0!r=%#?v70$)3ZkRy5z{kN$Yy*B$J;RPZR%j?m2N>X{
zZ2+A8lbqm4&pr|Y0LFf(0ro`y0Bf)Q6L0XOlP8b5j^9*KsNcG_Drj~B2iLO6bzf2j
zMI&N=ynjLuRI96d-qP3e&tz{-bRAB$YQI<(@>+RRb=xMidC8imRMf-62_&z0{3E5)
z;faS(jfZ#j4is8{N$AkQ6Pru6W}7?ewBtvof&k{0v^$F>dD7A!k0V1_U!ubkplc(y
zY%eD3Ce+WVJN-VH&u3x+^ldw*<Ea8i$$O3#qe|(T7_5CZxSxd?N-h13AJqBY4wBb(
zIe~RKV81Q}dY40VE9qm1)Hdz|n=e(R(&*wAY-|VUmZ9|Y?Z(k$Wt)nmZ{$<abnPuW
zZHuDfpo%AM$I6A;wL4@X^R~l*b(QLG#62%e-TYR$<F(XxCO29)BBmIaabOirr>@XM
z36QWa7}q})=bkq<k&Ye<yM2}mRO(%OR&#);Ed=lrJW^&-jqLU=vFc8odk^L#f$tm(
z3#>hVRq1iCwhC5(d>y!6RjktLP|nFGmPs1(gLQkQK5;@>Gy&|}lWc^`3QKOn@;;HJ
zlc`MN@GuK_<y&cxYP!f{;&F|a&z0udbxEbwz!$ad7r693tEM+i5|_1){%}>{2t%|a
z=PC=+Iye>wR7&Tc`-xZ3bj2ReP0S7ect_}!)U~pK49#)ywG{C{#)3flBRuhri6}|!
zo@LgZBHGO#(5Hwo;QL+SdDFiR-ADX-il;rG+<}Gbe~SG}7Kx-tVzH9m(ek_}QR{6=
zvrR6kC56O;Z~0uxbDOxW9UN3*t(!iPp`xd(*&CSV2VCWP1#ehsIxQnc_B4jt_s!RV
zXx%{iNY2;Y?(cPJqv`W&^@2*799ewd!s~<85SqQ0{ZrSvzP$HArZM6-V{y1y`hUai
zUt2rs=X(pXJTFnu`g=^FiZ4a2xE3JgXoOM67;AQh_P1qE)Jtol#9;h0exE54JAaGi
zPfbZKjQ6kr_@rrMj6K5jEn1=&8eJ=Zw{_(`bJP@~SNbj&9uF!Lr=qZK%;vX8Jv+ZM
z1D)x+u{<pEMMSS5&NsTWXHYtD`bh@nN#$DT+B6!45qxrwRi`cQbuLaNV-(6LX&zq2
z$OznRa<&~WsnF;yESaNl<l^OQG|$7@ty8At8$XI$c*z;M%fa|-tyfnT>Hx9r8(Lf3
zgj0RkWfdhw?RK*Ur%cz=%m5<WZ<U>^)Muuf(e)nVkVWpZI=vRB)0+IcMMH>tGA+Y_
z;Dw;++DBE)$)_Jw$-iWr64BFX+UB7Vsr1Q%hXdR!{;ku|K`Uj7XEo=R6Tx2lMfo;p
z4vqU-@Z2vJ>Y3PeqBnB;SRpwsRD+B7u#Si6@a;kw<@dJW=ZmkP=p&_mlNgRBhqPE0
zjtcSKo_FQj7Q<k3^<JB&YZQ=Zj`buAnWE$px-rW{CbwlDSl2oT+-D4EwTK<pjO*2~
zwx&nK`&{s@zYzMuI*HvJPX(8^-FeMTOqEi5F5`Rvl5)Kd6c=5ozh%k7FQ?lkpytU<
zAr9SVHFlNLbvmIDy@k8DUWL+qBTJ(&O*4aJ0^}08vP~p(LJgAWy)V4SJn`*tA>1!Y
z{8G{3ABVJB%`75E)0UU*7a_gYBUab_ZL}I!@hTiF8q=Sm(dgY*Ed3ECkE_Gz)J6+j
z$q(uUP7-ogMWsomWcqVWk5-kF+XpuAwiWEB(=>wUzy*T&RC-l)CY`uO0~$^Ki!;^z
zP3yVriR7^31$QcpXyKD?Rs+=<!J0>y-IB32nt%*-&&qXlwGz0wm$!ves!~-pm)6_u
zz6k85)r_=lIxAIhfwM&5*R<ORPOq-3e9j=ayEbptXS!~OS%y+zVQXA2dx96E>3SdL
z{TVAqybe^pAKJ>SzpXRRG%9^+nnNphM-#F~b?ALPpu1FQlA___&SRc`veHm#)K9OD
znnn%h2f{O`C8p4t(BcR5{Dp2hvOKAklbU@ZAjzV;NA~$teM6{I%*)e@G2_Y~t2%}%
zx;uj1?Ka17sC4M+btVQ=0zygS=cF_xL=?5Ul@6imQ%L5v`2&I#-63wHsl!%xZrnF8
z@%B~}eJx$+2f90v&B7X$pOCGz{{X{tP61K)Vx6-803`Ue==2KhLMZfu5Fn5(Vcc1H
z^(LTZ>RNhvfi$weY=OfBBQ;%KHoc%YZE*V_MSh<<T3+@tNR8O*{{Unb810I(G->Mk
zI)h2ny-G9cK_J}1dmjqhNUCg;HkJkhF9ePP%2aE$b%H2F=W9r{mdl{o8LAUGpbLUY
z{^-`OL6oe2RQ?{+SJ4^YB!t@F4g$eY=<d<0{W%-_NX_&7!F?B~>lCii%u(&#w#9i*
zRrJM0a~-JDR6Mzd+}n2eS`uo1uR%+cYD8MQ1$L1P@EzP<-IisM?3CPD{lQj^qt<lT
z3u0-Wox=PquBEGp>Rc_hLC9UsX`_)sNty_1;*Z+$2Zf^PS3^|d=Qv>7j?2eu^~Xse
zV|QFFA4%)gnottfMEKb!=yBkrQdTpAquR9-O-jpx*8(mI!)to%QVA)yZR{=OQEOdY
zJn^xSKJgr!@KrS|t)8QEopR%nQ%R;xBI26!?R&CsXA{X+dQ}`{;JEN|FUq1}^x!UI
zPCIx>{{W~A5rPGr&gZ%jkxD(QrlX@}9sQ!nUZJd`^qg4si*f-A1EqBhMO7Fu8xzft
zI)Kz_ORppDdjf2qlYJs}_6^kf;~HGno;$1-udGV@`e!9v>XZ{ONfgB2o2>jWHPsDd
zOfEaDpzg|~t3^{I)GOr!V~Y<q<ycbmeSfUkZ05%N3x(>vE7Nq}myWT_{vjD^)m6~a
ziXGcVJ0?+}S)cqMrEY^MWbum=aP!a6U4ATeH4Q8@@y5btbHk%>JSxh)LKvd}5Z7Cu
zE6%#6ywq=Ou5*h|w7A_*BiQ)#?A^Y$2&!qdSR>l!H~5|wvbU)8s?8s4l7jNvTK(6I
zXkA9hwEqCe&vMWR1q%!7Bh+>>M+n`P_)~GRoVIEvm9MRQQZN`CY#nTZjp(kNpw%_X
zohGMsJyh+zGw)`SsADcOnI8LZ!D#d4SV5?IQbr8!ilzq#Q_fASM`X0n>YEDHv>MGL
zQI}2Bq1fonjmPXqkcZQ%r=+P7!pA<`ZC<I=4yWs$gojY}GghTw4<q^Q$XITkf+tC^
zi#evp>XsEQ#+U2S7NxK1QPLQtq?2pgYpi_r6I2IS5aHQ-Jxv~+CZ0s(ZUeIOy>1Ff
zs$A$ciys^+N)aa)CW>tagiTNRxb9xp`++<yizlb2r7p8Z@n;Ksa<M~D{{Tv>bn#+2
z2f4kJl-jdu;*vMW33bbItBzHoStIS4&a0@|UgH=56PqnhKtV%3g6U&(UnGvSqS<L!
zjeWpQ`<s#7N6`A+R+p+gKsU!G9Mi%XHneDI+3UJ~tw*L*mKj;OhQxPTnp(XxQH)eY
zD?LW!fV@4%qDrZZyMvzVlD3^4rBuk^TH_tZZt60|+S4qiucJlO4v5r>m_tWrSSqT>
zS*l0AHj!atg`#eQR88I;wDWXKT5J@IBme>C>QtcZmE5$7j)nZy4Oiu=9eDo$k;kz`
zekM7mPmz+zc>wm`y6Wn>dS(}H0FDUkuw7%+@ys^J{l%jfDo-x|08~;qy|z@y=f_FD
zB1jyIaGeD)si1Xh9A4%hdo6npDz8n|1zTLk4bLZqpy?Q=I-@BYwWe!;9l^&7(Z@Sm
zI5I&eqqM)`J-(S2K1$Q+^z?8x(l|Z*?H!hF`gGcEwI{4Lw{{0*p>&kc!YZyemj0eD
z609oinp1sIEk$<MkqjVP`H8_)_4?gZZnntV@(|V4h2Hj?H1TCms7WM{mjFvgB^hFX
zvB@hh2C-PiiN7#j&jYfynwC9Am6Gpsqmj1+p6e6S-n6wQAPeGuBf|Bbm+8q335l&Q
zaTfs?;-#R<cI}xcba4c3WKjK2l}oD8n4DW9fbr#eq}1k~H*SvaZU`ZH=T=gf>wRe)
zULC?$hwOEi=*vd%*>(=aXf(>#MAq1lM+WMKy{v0JMhh0@O+!EC8U$v}wpN5xbO}CN
zHWiwrwKN5up$`KY<zZ^f)iOFK2LpT+eWynueWbnnEk2*4Qfib^MCLWM4a{%1by+(W
z5NVVhH%uQ$Ae3Kk0Qg!hJ5OXWK1j#3n=IpJc9~!KdF;tp>t_o|rB||8ofv(Z;oV0I
zZbfq>k(}y@+Zl5jEaI|-j+ES7kgj@~b1tIxyZKFm6G@D^d)nakSCoh(Sai;cYpNR@
zfNdux%VjT322qx<Uc(5UgQ1P}CM*K+cAqOnt;znI8H!LrwX%;C<FR>D(d6^W-73Ds
zI2M}~ccp8@OeKZ(lY#~?v;AE(a!(|!KHzS$$5xh|z{cwvu1VrYL^B?^I)bi}b~)rZ
zui%rLt2uRMI?}j{yWNH5T1?eioiUM;I#&acei4-Vl~Y`4=WCi-#nFODdF@&~HTsM*
z!(!ob76+=Tzb^N^jxFzkp9Mu*VKSV@^;zDbtu>LGUwGv-wj^B|Kf{e^O<MRW9%L?d
zH+EW{t<Xe()zh0BUme$(bX;#0tdcTA!+>7jNkcZFriiXdw*ej|<+I8srl<ghmwk$+
zs}+>edaWkmdsBLCquOJ+9OEcGQ>5aO7dXR@qFFSyYiEnWSv6#ijzVswr_v>RB&uca
z5z4>S`g`&frdZo%lba3^8eG1F)_XTZ@wMQ09#VXfOGEH&>~5CWYUr9IAH@dWWpL`+
zcF;*dRK~g|3j%p*RC=pMlU&wD@>w9<!|<!CwJqS66USwEO3^8*W@}TZWhHE|M*GGb
zcKjh>)M_0608TPaQ>y7?sB@oVd#i4d(O)G{E{vP-hXmL;QKsnURMfGs7d?luzYASe
z6?9M+<?m?X`1+!{b3|=4ZE<GPWuuZ9T?X3^st*iU-#n3*>3*V`37r*a+a~Le3hSzA
zq1H6xT~8xK@eBKVj|(x?I!oS5>CK(w9H9C@R?*h6l`_5b<k`)?Wy?6z(a|5<VSP0%
zWi*1Oc*ud~*ITVVk~-;xuvyJ;_hb914Fx2T1~IKP@^N9oLr@8HO3@LM_<g>KCkl3l
zjITw@w78*jL)Z=YDdLs}-HvG5ab;#Ef~JTP;hqnLmDjZysiSz0FJ?!|Ny*Ugifn^b
z(4l=rp2nQrr6hVZ4vOY6xOY_X^+|gV<}M^@!r|4?hh^CA0^<2HC!?jtEo`!rr>W+c
zNLVnGXfVd`_BEi6=^)o4ENj~(+U$g~>y3@Oq`*E=c``9#qv*WSStMjJ?z?*{X{h6M
zq#W60=ym7~fpE_X)a!BjLhiz>d9)+onV{2lO?KP~8Z5HCX66W`WR}K3`X)bKWKS+*
zwzzk{DubzYcr_{+A#}SXKkc8D(S~x2m7*CV87&xHdT-<1j<v@tJy9XOw^%ER_RR0$
zR4}q$>Xt~J+OJAhkblbbB`Y};J(AH$RLX|1?y=!|Mv)_>qG6rB;4De-vKnj*dq&}r
z!CLJSX3ZIdk9ffOQ{!l*(Mi;_ZH=a8GVzm=J1Xv%)m^6Q43K6rbDl!D>PODT$x6oi
zNXQ{&G%86Yt9%dK0XRLtS`y;+3gl|K<3f(TgHzL*3~~>9M`E)Y9URn^06H?*&ycsB
zFzI7y(<?4d@}ABJ{YyrR&~pnzUHqjpsR7#2O$MOKXElQ@b8O`vuRT3|1F2$o6Il9A
zJ-!N{*4+A1_B#%0tB$?SdtM2<Y@njiRU{7iD=F$-4U1%9v%C~-O(jKT5s~e^hH#FR
z@YPhZM>GdHy!@+;HGz$D9?(ODh*wgyMaG$f(;<pEokd*D^wQ$z`A?N${{W@g2rP_^
z*1Hd91$D0I?229OBh!9C0Y^_)B|ST1dEe>&pEgN9v@}6_cCp%Yzn7_L+j}{sTXh{1
z8%QfCtmZsi+p>pMrKZ*?8&^g{Dxz)P&+1iC)>YHP=sSC(<7pf!LyY504Y<2SG<9Yw
zpL49Qnpss$+2J3=XwAE-sWg*UA(@2On~)WbmlTwS+=0kbls%P$Y`V}Z?k{b&HX&Ti
zs5R{j-JZo~9~g}OVk`ra6m<20^6exGr;D;ujXi{G5}5<t9rw4Nm5<aarj5kdhLy50
z7n}E0+NPA*VkLv!+*xY}6DdPn$y{Nm2Wyq>28eL@!7V&nxKy=zMA13U4LiP8x1x13
z?WU+6@Nso4jmK!NG@GVY)ag~!@(C%+jBfo+2ZS9-tEQcmEe;Q7H}1V?QL|yHWP6)$
zdu_^eeLbe?O#T~N?(@i8?sitF%TQ{p)iie9*K<d^;ag}rpQQnYcifH-kf79hDyvVK
z($P4J{-$;+t+W-i^#PJxwZ|U{_+ps3r0AQfrH)hUMgTUmt>I+qC2N{PtTTn6)%QcX
zDMgLB@)ZN<W}N#PcHciMvACt9iKhE0>p^vh#f}`k3#H7Og&b{#;8aG;f7}Ah$wV6$
zp!VmnR$UzVG~GxCxP~4L*F2r{Rw<-!bX`_Pe-1{vIhlt7uj%@M@HviSj(Jq|RPk08
z)xvhp8}GOC1zAxqr*iMp+;~|tG_17zL57o6q#B$Btg4J%*8XLT4Q{EYuwP`c9DEfn
zx2V1fXKi(wMS<|L)S9c|pL<W&<s>8flyCJk^wLcZ*ykr5(3<dx@%om(l_f=VRdh^y
z9qt0fQpsBF&Vo`lo(k;v)mhK-HUkcz>Kcvg%P)|xS*pcT6JEkM-D5R&x+zIvC52bT
zUp*zu3#_K#6*kXWqN^-s<~rVNRcBPn$>`qj?6;BNtgeaFw{FRKL~1oIk)*KPJCwEP
zqLpm~bl#;rGda;Z?gMMt+3oOEokp7lR1U781OjaM!2JipsL*K3YS}wQ{{X0Y3(zPu
z;ZDI-O5M>&KZxEzT=Ho>7mC01VV)|fKy{AM!<CgjtlFwyLUIGZ!CE@qJ}Acht#lF#
zeG1F!`WxxNmJ@cnAhll(e@upKRnbmiWn|BU$!P(`QGGW0&YjmHo><Fl;BGuBwz1!t
z_c+Gzd0vszOr_TJ{{YL?HHM-wV0@{05@TY5_IqZVEL!(VvQ`lH7F>LV<XvT_Mjs?@
zXls~oPa$hR4z*c2dVlol!FqCik34-7zZLYR%}#X+E(qLgx$#P*JfL{<slhI7fN>a9
zlCkvF7H}XFgW+9NJ^S|$<=}*}M-6Q`1X$Z6!tZitKN=3{U0w7wEOUu#Pb13P)Ynqg
zKq??}Z*Ox)W#r+{h`JY(cHxfrPo&kVDJBgsA*TvCA<LqXe`fBcQ6=q_NnSTyj`q8;
zU8m~IbH@97xkYMlHh6@w=ebdiDk;dyY7~<P63|KSWoMznXJ`}tn{bSzo*2%_K)CXb
zr=(`x@Ee2L{3=Pfsx(q;eK<6a_BQPJ3hJ6@=4G90eRx4fVHVOp3JzIKE1c`uxi-4y
z+>5$J<3m|g))xQ|8Rc0yv9dkvHgNE~*HzbMknCfK1A;phf6|>t9b_Vkt--U5HRR#w
zI7uOSCiY*))Ur~_=%)8ZMV`lZ3qP(=(mGdH>8}C_4a{KvlCE`KJ}QVq!5*OQ7In~i
zPjf-rep~+lD&8wZ^TxIS^5S+sj>RNWz9*R6euWn_B)4O}prN*UgVKH+KS}IYb5?UF
zM6kbOw~Vy@pr)P%OA&hx=8?j#d6olbiviEVnwq81J9|#}&meY6(>3o!e36*mS>FEu
zx{cRsgPJkjURFU3TtZl^4>&-@2>lP_e{>QXkTo>VYxl=-ZfvghN2pVo2GKi5?yDV7
z>BtOtQo#2`F?%i#cBWvmXd`hXIAgkWl<h4qXFe3Jv*HuO$o)Y*k^0trM2GkZTd=At
zi@%lW)aLRS-In~KXNT2|&bHT&)Y~BA{{V2c#@-RF0gsZHG4Afu;YA}1W84X8;P^+=
z5L>b4=dtpi>9STBo-^5N^lAX7d!u!a9z3aJe9Rl6apL8vl@ziuzTAP3lA2OLYmKen
z!VOqcXoSl7UL=3D?f&XnS?k6g(`UDWrm28Gkz?`QMNa2NOJ9TM%4Piu?2Uo4g2@G>
z;QXXvF&|CYVNb1qya{7Adw5NReqtvF;oxK}=*f(HJ5Q+GwaQ`|_5ux$Awx{_6U<W_
zc2m8fxo$$;Xe^Qm9@h=0Y=bI#s2f=y<{%p<X#OJy^L&LA4G#eD;lWZmU5?&8uWxbZ
z$_~tuD(W0=2_E6WQ$Z_EZ_gvjBBV!9;@}6WMaxGH`5!1LB5=87{zBb?hszsAK)ZX7
z2x(eD+%89AiG|k|aLtrbFvfQbwDK0Pi%lRe4LqC!<rL>WF}0xD+;~;a_PcXM!ZMz6
z;NMX5!C9DZtmE)P=8-g)w$~0qDtcDQV;I`+@`TvtJ3iNim{LJZXnQs|obXWdvGE*&
z;pf7VH|J}wbt|2A?L2lxY**L|hWn9V;n_x7K@M%MJ1M4y#J)S@kfJUG1KkrQg^U?l
zc8i|jM&ceeJY;t&Se!$HfwRABsVW#}jJPvwgP)Z*raswUBV7?7fI^J44|Z&Oj>v*8
z3miV53Nv`!XMU2Jgd!v9{{WQ7Fc$M=Guj$2%MbQQN6_DbJFQ<vA%<7P`(KXg_Jdb;
z(AT>vmGSPu<wEv3gOh&6PFU3Y9y4+1(NtHB`=fP_`Bl1wVUTVZdriRzILn*>c{{wM
zEwQtd{s{C_=ViW!sZ(l^8Va%m!wo083sR-5(k648a}PLG)fD%0XQy__SZ)Yfj-1r#
z^@@M=?L-FE0bt|Zb7aQxJ6#pWl}%KNBdEn$9i$_7Vpmg4_)g{=CUrK2KABSKVrlg6
zkTdsHkkm|A3tR~LE{tk3j)`Qry_eM!wsvIgb-7iOUv_Ze-9qnC{{W%ZDbUFM+hoZd
z)4~l1=9w#7xL(=rm7d>gxbl|33%4WuCv$6y{DoG8Ok?BPFMEQV({L}skOOXR-uPYV
z3jzrs{{Urz$e#^{;5b|y9qn*a<)Y5ZRBwy}al*i|2RC7{{XSDg+VB4Ir#7{Z3Kz7q
z7svQnGf?(`M}oNAkLe?V6Iw5C_)g9@U?XC*16IQRaO-jq0(l{R*WTV$)RBXIz<rf{
zR0Lte+t{UXMI$jInU5B6!R`?eIm~v~40bB3(Q_PZaot+!&l`O?1>61+N`T#j#PZ*e
zj-;r34iZH22<(G&4vcPZxrf45k`2cmQKZGTnWv)GnDQGpwcYRC8BtF~T@Bk}?}eI$
z(Mul52GeX69FtVhy6kzkV|51#=;(~?e#G@uQb8$b2HlcU)XhaWdoDbK-AfL&9PRY#
zTW9uie7=;z*uS3$#&@Y2SpCJ8tbI161;vBMEmYN%@>0vamuS8U9p1GxyPD$D*o7pu
zl@D!+4;IKFI*oPFIZM+Dpw?^Y9lj|G+ufw)7X4NVr*C@$N&REGqHD$OE(&lSp}TPJ
z0cm4Q5y;|RKAnZT;um4%3icSD9KmvXfP$v3nip*j$8et|S#Ts=d?<W!Oux$+BdXzS
zgVu!lb2qYqjE=kbZyuFXbCYe~MJ#U;Ut_G{*r&l9RiDC@!YP6FKjmizjHHWg2dJc`
zhy5>F9<4V4&OYXRf}5>I`d50;$|j|LTJUf7RQ2ry{!>wDj!qdbXCbMo>a^f#<sPjw
z`yU?)4m-47Gon3GsFvJhcT~~TUDhX)kA-1h9C91N^RSE9_EfbHNgM7sT^QA(IT^Ci
zwb|ffVV%ZEzm?s>wwAGykoHSwTiWi&>acosL9k=;R*O&ETeOd9O!1;hMxKXOZM`Y|
zvJU-<eDy#-csD)O1eEfS8vB_0JHm8Mo(2fzE_`3g?%^xP^fxDFk_zTb-Hsv5;WAj{
zYk*^cjPMmTG=Z`QG~WE#U(t~)c5faO<pj1;Gb}WUsUQKQ+;;@4qGFkw*fOYLh_sI#
zm8An@Zb2y=LdVNZ9EaY{d!%J37y}Byj4yAwNgQA%;+U>QJhX2I{?eoLB#2<+!CC<r
z;19Bfcmd#Ymw<U$K_gyUXR_@+6fS|TU~H}38Q}O=5<pqo39X5iBWU_9#5QMV(ptv}
zBKErYBf2V<Nee_(3?~-Pb#mClMXiqEG4RIY!Yx^pnkuA-!0%QsdpnN`c1^lF?aCm=
z=$u>*JEr<gKIT|?33!dB4A`QT_IS_AhO&k?G>yO66j^5*^VvK+aQ^_YO=7jZ82wXC
z8TR0;y?q1VB!=C${g<fLK*H0DtnR5rYmf<H<OI=XlC)r+(fVEA38sPJ!ST3*+RE2Z
zrj9u`HqL41;WnDrAXv3mt)fX=rb(vMO9QiSoA6eK0S#Op&^XI{Do4f(Zq+p$l0fkG
zlk^2m#ZRHXXc6k#JKK37KV?$SR-Qn8&9dB6RYOx9pR`He<yLC65jyW+w~(F=oiQZu
zXsn93O2FBFbdtsg@gjAP*OWZe?u^}{<K=WNAmHD~RpG4(@_mE`vUZj@0OTb_Hq0Ie
zbt8j^y@&q*g)DNqO9?G|bLA^d56LpNT2kSHZP<dOrmCu@vn6pX?Ba5YdkY<Kap62R
zIU}`&{!+=R*vT;JJ!(K39Z&Hi?Ip54sP|12mUZxWa9P$wV|9jDc?gKu_+7dulOJ}d
z$_unwGNR~56wR}q2ZD!^npjB<b;2Gw!^N&I@}`QR?HN0p^;4#b2`=IV#gCOG4zE#2
z;K!S{%8<)|T+rd>$a$h`+kVHCQ(nby(Xi7sc2vYRyx+r-Q_2V=tOO5zESsZwvb2X<
z+|9Bcd)*fwp>OQImRO!_>sr=TmDKn5M(#81C|6do=Hb@+s3xp)a@S#GgJ_PW*7i)(
z@IoHWCm9JRtP%no?5LSi*v0<<Q&XivFs9T=7bMvaSqo%7y)3&V8Ml<Lost8zp&m;l
z+}ni8DTotGsYv&FH7&FI6kHXO#_?<0%C8}kk9f~wrGer<WT$g`9|;^QXrhzpnn)%U
z5sRO7u!pXtGe%qekT6JE1&zm*XG1ehn;;|}>U8}D#K~$Jbg)QET6W(d2^rdP`z_6T
zBQ3Y;YRqahKIc9G-?He(k@U#R7!hc9xuiA2x-OEiv-or5c~#buCz3%4?UAxH17KG|
zm7MN0URkdJ%|6n&8ykzN+G(E)fW5-9jqH`TYqM?>`WDF<I3mvn;Y!d0aeE=0%o}mt
zIvER1t}S#ZAuVxkFL0bjG5aQA);9?Qt$oQ_3w9~D2fAkWG~}rrvCZ&&D2@($qGD!9
z2u?1~gfl_0wXUAm5-fPS#s~yBCXt^CE0*5L;rF%95a<+0(tn!VB@VyJj`;W~GC1eq
z5K$ojiwoT`*R}g3Ylz7S#>cY3=-_U4l(ryV{{UqjtS%RNgbd^@MkZ^mf~9NjMetDj
zfg;5?8*qN;c4Be?1gMBy!hHNEZoxN28Ic?T*(N&>mB%LhD9Oi@bXksfwBMACBId~)
z;b0S7NIZnB#Fhke*)i?qG13<N_(&w&4UgFx&}>H&e|HP6G8Y~$Fn&@154*a^3`<_*
zW8pQ!7|o7T^M3p$5t48$dnYjoHXJ7h3v*<S2Ff#g<CTRZcevlR@SFE30U+m;x$+h<
z>J$`uOwzfMdPc_AHd=m~(`ca7UHMts);YNzSB2L}snRj>iJS<@C=C;?bxLa8rg<;N
zI8lsd)22L>TC{yLs%Ui7^ix#AT3pawh2b;)A=Xsu52S?JIOQ#|_$iZqChLx4soL`G
z!)W<f{WnXlHPTm@jpT81rYudT%?l|~J%)p=>L_Jx!Q0y_Tc&;}Q0)SD1{-%Pz_l$-
zSb%KJb6zo!spYS#n{Z(^JXj@`D4@miN7B{5i<&$PB+f9r=c>OMoipCbF!FDLyrfgq
zRJ8BijzI{$KT2cYz3ny!zjc;4Uc*(<uF*B!cc`nH9aQL8<ABp|-5=IkOnPKqtyIQI
zTraqlouSmD(jV%w&DoHt`lqPt`iiNsmpfx{7jjWaR*qYgo3aUKmRU<_qutu-!$Q)v
zV?VEFHK1PHtNw=5XyJvfstqKL7KX1_q@-h_h%umoFcQ8rYj#uAX>F>fYv&Ez(hcmJ
zJ1OayBWrNsVpVNsw&oIA>=3GI>*}g(*kh5z_W?=A=&EnoCZ@`G32-1A`)q)ItuSzG
zQWjqrJfy7B^~$Dy`7^_Okc5Xp)FXKHnpigrT`yg-i8gw_;4Y(9?x>Clq<iAAHa&{^
z5}?M|&evS8pZ@>}8xEVOG4naTqrlqb>@3u&{RchM3tr9_;c@557VLEvndBdc`jaa<
zrd>L%*Nuad*sm$-u`M-6q{1B;b(%*DXZVpN`rlBKb_g4ORySC2k~TLF8^H^w6>&o3
z{$X7=q&h(y(w)qA_FjXc%^sZHj3XV@Ur1^5O-Jc6&0+l{skOa6S~k0UfH-`n=TBtR
zTQtyX1*AXM01nqtYaL=KVmoBNjITDW)n6QCtdy5{x{FQIr_{-O^AOuyHtChf)Rx(8
zs&yWvtjg%2nC<UnoUNsJlm4N_#mADhdKQLRF>3%9X|`0=y)9DsA3N?#dlc#vFC#q+
z6u;@W5&r-gr;s@cUY>@dPuHocnCCh(ATN)x7f+)Nrj`Dv7H%w7ucWD|wGCd9H(9K6
zg~{Un62?5GMIx##p3wfHq|)?QW{rR~(SvUbJw^DJr9V+)Dg!`q+DRNCKN(?ugQUSs
z;fWYFIB-JnTAH6ypgVcxN?2mMDH&W%XX13t*1Fu(QrN{8>5;!G-$SSLAz{Ea%EUul
z>UTBv2hIDdx?ZD%pGwxdadMU1RRR9pnr@=i<c5RNjF9p>FFc{6tJFGzKUz1nk9Dqo
zsG9A3wz<BcX$^Ke;b<uOlS*t&v{sQyS9e3jMyTy!^&K}eVxHD*iyV7}mFmu|nx;Ll
zNcNjpkVp$#)J?4FS_qtBI~qNY8N$z1=x|3u89N5{;{I1eBQ&j|GvRcZ=I(scNs#w$
zJe9xvIML}Rm5rz%IpY^kj*CrgD2e-8;B9+yJgaRlN|nrGX-N-Z1QFd!BXZKwSVk*v
zX0-lCPIDLo8?f_bEoC%1+##_|w2^`hm1d{Wy3JiHE6q#p1)MhUvlYiu(B$;rD}}#H
zk}NWcO^)WCqFFaXpQd_-pHdSU9UJd*Z*Z+Tv#Dsc30Po+GC^YS1+uYPr&3l`#3PZ;
zE&|=qx_t(tQ7Ng~;txJ-sg5(0tVvRhnmt0b^TH%!&5LYos2v$|cR1hRtKp=&I&kB^
zb*|v58pgvr;g|FhY<w!p*JPu`m6cC)55q3g$yORw1iG7BOk=ce?`5ax?G~R=s1Z!f
z(C{zH^onkirKFBONrA2GhTlQgv&_0`PxQ&%r)m`6^!N73Y=y9|fsjx~SxvXlI3RKY
zvDG?aIVUr?1CAD3s9z?R35ZB`k!ur$IdhA$i;TJ*QC!FvW{vl7{Uu<!%U-Y5CuA}`
z!*A)bv5KZj-PF(r$nt+nLN1e|HCmYi<fC%{$hggwmntCAOw4H-Jw;@}lLuIl-Fk;b
z=&)&}rQmJ7?iFaDI&4fYWt=%SQp2jgN46M2C$ebDgT|iEMXIi%f}Fet40m2D_^GW@
zjX+CG_O-;=fVTRLB}=r!BjhII_Fgg7^b@+g`fYTVHaX!&Qc{%{T8)}bFQ+wqb5D+;
zjs#ne0W6&rT?<Q0j&u7q+^a9cZDUi?H1@$$7Wj?{{*bQe^_k_>ZphkL(|eGSxu;YJ
zD79?Q>3SZeLnKD3H#Lto1om6XQBy;w`mBk?j2Ceol=V91p5_W_veNlQf$&sRy5tcx
z?0u!Dkos}}FK?AO&9%^4qRT+5exTE}#q71*wNyZewy?AUIP$!gPU<1k`m5rEIrPED
z1a>89sQSvC^WFy?q+A1!vaA}efbX+ath4<)O*Ky=)5$IHzJBY;>8f>;E}AYLZsFkg
zTkfyx#=e4TMzon8(mCVhd9Hy8bz7<`M&jdv*d}V;f|^R7WWSM$I%w*pXx+nyj4xNB
z&~*Nx{3P`NZ{{E#*A80Y{{WTe)jD*#g#Q4RhU7oO^q<3xKBGs`Ds<_Kj8iuk?R1Va
zYS3bmXOoQ{dRUnx&c5M%DH{Q}EF=$wwd$H?>DpW4Fc+4awZwK=C?<+{43W44{{Skn
zm!eaJY&Mp1AlULrwZ6y?%Qm7%MSpGAGC`c#Ei9q3mmBT!iqj|P^$v&7Y0jM1#zDpY
zipsiyw1@PIABB$Texx)-u^D~54E9<{x{{W9cd}Q3j1s%z(^hi3Pi8l-wl%xkVB^SH
z9+M23w&aV4T^ZM!(<Cq2```4c4x64xTkEy1BKJ02lYg;%eQfud37~G6*T!4w2H1eJ
z`i8Vx$rxTOb&-pxWNaIExLfARi&xg%`5ZyL`S7PH4x(D?I=1M|pT`Rot!jRxo3~u|
zP}k}%d3U&#Ls0o1`@0w6C0iS!+e4~9oxT0H%G=QIaA+i!_BL3J2951;b*?XQb?IFx
z6ncY2Che{U#P~u@A>(gEGqz^R*9crd&f&tcW`$o}NNX7w5rJ|on|WHgZ46Vy8!6r|
zaBQvg$J5aVx<U+Y!<vUbNG>(mn(1oly&j$Ly`)7ju^xVib5QDMxy^U#aU}OwTD$2g
zcg0Rx1Aj-tpH0!J^(`Ini#Dd$Y3@p8f>PKXWdfF~UTbvs2ROKqgLQ(RRFZ0k2fpfF
zpo3A<wFxL{80PIg)daM)515FFbI)XWP<~ZZORLvL=u3BHRB6?+`rpD1aR;(lwA#1V
zx}JNr&B+UK(S1Enak?>ga!RBi<U(_!9a{xeTerEpZ_2#r%_53nBoa4mLCX)7tLkkM
z8Y*!s1)5eOO+)gPJL%j*+HMLHjcCxHv|YXIj<?aAS<E|Jy%VIW>EhT6+h7KKuOg?^
zCDkhn=FEiT+RI~4LtPC4o(;vLAcCUc=(?J-*yq(Ln@Be}3}E?Qf7Lxr1v}oxNqg~S
zldkG2w$hf8=U6H#8cLmZq_cTzott@F)57K1(HxPA7h38$=X09JW9qV10=l-M-jswM
z_FDZbMEt(8VybWHHamj#%{M^PCDZQ8ctLZ0uD1nbp^b|vxt<lF>2*{!ZJ%wLe68Cl
ziz%SgckGdlyKV5L>WC@y=^P$IV>tR04v$q1r5w6@B?eZsmJ9NpIXSHhC@5{0+Rmw_
zY8q5i9MzF)0OLR$zkIB1ZEWnbUhFj5%Bl4=aaKtK+U5w~w;@=*AIw3#d!9QhMbaeV
z+X&HEYwQ02Ecfi(F59BDnt#cYP6gR~qq<W<byXv(noBApH~~Y|RXf-i_HCSCgd27=
z6jEb)Ql2>KLs&r|-~RxG?ENQM6B^J+4rs#hZkPfFZZ5ol+!eIxy1I&;LA3EZZTqg6
zPP;ksM*2NVU7)AbsGU^}grs|#JN&N->ejj{>1pM-vAb@)mZCbkI%c@J-={X=d2d=#
zzfh_&F{DTj?wcgy!3Z-3DWt2B)XjCBVn_ZJzemtAdTFTK(Aubvw;6Jlk4mhHp|t`s
zUe^L_IbMOMbmb&6Q|j>-Hc~y~vgFApXG~&|k~C7mv)7HxeeK5~6xx}o8R{{vA0ceD
zifF5&E@*2@Mm`k_83`tyVB0$vPX)<n(wdK>%evaKZBJ3&J+hK6d#k+#)15SL1WLi5
zls{DIf0fp6%Ws3&g}dm8bo%NK$xhaZhFE;6<A?tMq%vgx0PypDd`S5{P%i8Hg0RwP
zrF}apBW0Z4-PO-oXcFnQPMNK7grC_1)0Od4&*{oW(~PNRQjW@Elx~@OqgNPYiR_bO
z*lre|uC)q%U#I^7FxQ6F!q0HOE6#P7{#v2(Q%D~fHv|<~Rj(Q7Ulfv-I5!8+)mI)%
zi7c4fmW=kVUo)g|<xop3lDPX#uC1VHo>E_no=Vwt&rMM3kUl3LPGT<`t%6XDdAc?6
z?4kTNs&x*m42>>|OgLR`x{iVuJ+njr5^$)s9-f;*orXr8r!8<8D&BoXwfaL?+X-U9
z7thsm<%^80>c=G26_oQyLr`g|&+uMtp32zttToWKYAIUgxaP=BdWE%GELD(_`54=~
z;Z}5Zw>FJdH#zdbBeKKUPvmk#yh;xJ7Zm+HHicarvSugbp9OlCN$OF;TGMU4ilKDW
zy1gNci(Gz_$WmyKx)yp;6YV%YRdKf@OD7oY^lF)@T-MY^2JZg=DX*56s+Gn)wzY`x
zv3iE3ED_y@+iMkvuIoC@H&U}s=-h2&T746XPi600n4&KhA4TSqYT}xpXW9;ai(9YN
z$*I#ebA83PE6uffX-uvGt^l6u5b@-s%RI5I8o6W@ZH`A>?6<f6)Gc<JUe?ILf1)3z
zq>@M*O!7m97Q0TRk+u$LEhClCqSlGFp2}?(ryo$}ytCSJR{sE}dU7gKAG8C{3qjMm
zL~NvE!&+~gBkNloBqi7$63T8pnMFvfuG>iocV&pxdZY4HMm^rbj_UrPV`=1If4bgR
zlIj(Ytd!pQDKW}YV@X9LaaGiAe2sfgu>7md3ZkB<wEBZQFFBxv&!!Q)n~oKQB(u|I
zCzg@OMp$lEG&6BjdUYRAN2R(-YRCTo4E~aP6eV|13YRs-!NUI2b?1FYs7YC;?{l0b
zV95whmYSwl13ab7{!o%$Je$)V8KSn)>(n~i+`${9vuvcSt*3lMyn;`4g^GDu?Y?}W
zYc-mfBQ2By0-XGL)`~|wF4=!s3>6aZir6T9OG9+D-nBGtdA4oYWvF$^fjf>%Z*Ui)
zbS|?T(uitW3mxS*kK;7zK=M3@wP?m^wKY^TdNl#TpyK0#v=UZR>Xb**arK#k7N@Ct
zcABAvXqwOtM%CupgJ;sK9O$q{4}!Wfc-6C(8TL&bU!hazNJ!2N){c_AIhH4N#ftN)
ztwqyRI!UnNabd!@(sc&8frY~M<wd6g+Q?m2*FFhIdx>rFl}V^q8GY>+7rqlKs+%VG
z$;bFXv=M=u{{VFHk1dMd9U6x0)u~{6>?Di^liY<pc8tm4X$%4E7<IC#^f6Hkn}bPd
z<XK<Cs202UgyXSBP-*rRHCrn*>R-#aws3x_MQf-lnJ738AAGGAlT}4rC8BT}pZXv3
z;bQu<O{YrwdDwB5xpXKs8#&yS(Yn_tzcWhOsDLDmz>eq*A5Ev9WlLHEnsfD5pNIAF
zYaJ;BMc>2>+4mjRRr<X8KC>kxtSuYJKlxmaKe5uC!p-zLd@@AW5Co0OPlOh`Q7d39
zb+@!&j_L|sZZiu>a3GFTH7Ofcr#e<0&Nty*Qbb+8&oJvPNX;NSz1Ox7x-2hjt#qK+
z*%7Gd(mt`$yb{+Od@H>Ug|fmTkOs)l(|+k`EsfrZYqasQ8R_@~Hu9#1vt)K4mk#KP
zSw%fbrj&b0Lsi5DS!our<I1w)(Klc^o}l-@=+76z&r4cZ>pkAy#a`-AvPO{G18fDA
zu7+7J7H*NG6wP-@Ir7!8LT+BRRoyoeqx{2JZQ}07b>|%qQ0iKyG3RWJHw)Rc>gcMd
z_TwWcan^>6uWZBr0H!vcQuyq9IB|6>v~V-{xY~cRH>e&c9$pR!!pLfR!Ly59X7>sb
z<!4+}R>jq-n@k)U?`h>`r_^>5_P7EQH9bU3!)IR|)e9q<rRQNkM9@yjWRg7}r*#8c
zP6*AGhfjxe&6(}o-r;8Y5`p58t^&kz7V3s3FowKYjvumoiikykbuNz_z*a!PVm;!^
zEe@PnR39DMLAWEb^tj^@w8tO@A~04qx>%|8<4!Er6Lzi{O{Yg@B&FG@(Q01mMz&V%
zb*xAHu87S|UMGtFpYt$x`Bpkz8*8-tGQvPTq$<ZvH8o+TorE}WPjxs;WhW2T&6Ndg
z6>zpW8ZT>tRCDO`l`k%6ZTpW18c4(8X|WjOA?md`bonkxHs|QO@$vL=O2+jUM7L6;
zb7LOn<)kk@rKO)suXdkb7-0w6@-SDhbpHTQ!z+L;ZqloN5Oi8iQUf#~Zvyy6cDe*z
zx@VSaG|bvd0Q(*lVXJH)HQ;XYi>a!8Jnqx#m_(d4-c?woboCyL<cD7cN-yZEi=$7Y
z>kkdLslc!)Dzz6m&vCcAkg5#@MJ0p5u^2v7exsNi*IbgiQaRn&-AZuy%L%(Ycv+g5
z+}W=g#nt?fx<hlpLQP0JEyO(m$0VjQBY6(CLWVX^Q7dDRk#lRJWsF5<0&WzPbuqly
z*f@DbwvZH4b`>^>GhlBo9NyPeHTqC3Br?aivfgyQp$_)bRN2iq1gmXtL8h87%tFvE
zKXkBieUCV#c!Q}Q1wbGhEB!BYtqcG=wo&@-o++Pl%dnnp!mg%xiT91c9FcS^B)yuR
zorsCU95$`yl;=}{8;7yoyDvS^^%!K7M)CxMy4=xJwt8U0VCL{w9HQGg)RIKivcVf(
z(_<OIZ-t+de@s3MIx<fo6Rx&H33PWa1A*OVBds#r5JQ{DPl-QbO{Rc#h#S4e+g;fC
zQgo)GV5k7UX$HXE6R1QhDadKF#}-tuQON{^n}gk6aO8-_Ni)`H^;W(HnLvM%7KrN5
z)ag#8bA!MaVJpeBS?3WJhw+OPOnT(nbI6cxgz`JCSC7%q-Ry?7)bVO_)7Wezk$%@y
zHImOsTEfD16Knh;dYZPC@`~6VGE{nfOf_w5WFU{_y6nc&j?P)8o{40DRF=xp1^G^@
z(@*8Y!)~I2Uq+?za4*SMR5c8HL{c1fLtPG+vohC73&1xS?p5ZOs%&qkE<wT@U8HDh
zp3Xjsn@<j@suaQdUVl%@MA~%5aZOq@)imv@f2jk2C*>_2O-`KRY60}`Yn~N6Gt_DI
zW*OS%=f8EUqWr$4N?9Ol+Tmi<TvW6z(Hwfj4jTal$AX5MU(6C*>)W!Y)--yJCVyt<
z!0*uE*#gSx81or--AWkgm6YuV*TB-^=6%&AVSFwRW6NCAa6#c%nzOW%lBqQsjqk$g
zX;IB>vtglii{*i^RG;EA7xJy&RUK13b`f#P^IA$-Bqi}5qS|!TH1bn9gb?d4b&fH1
ziz&G(WxJl)Bk*j5ow@%2l(DhwZpQ)$E2JX!b=OVV7p)ACi5LU2ZEN`oIAZj#w<Ez*
znAkwI!fV5#XmJ;5{>Y{)BZgl=<TLc1T8eXHm7&ZTQ3wRAbJ#t@$8`)6hP~0rgV_dx
znjbJA*pA60ZsvmCZOW0-0yew9bp`!0E^tu?WVBMgGDn;d<rN5fCv24DXCwq1&DhZU
zV2(nbmRCmRxu+w7m4#?NsD5V7jhiMMkLp!YLB01jYsVM=01H7*=&IYjyIWBoBa8hI
zTAWsCoHsZ3j|o$u+O$^0cHNQ-5y9}E>N(>)x4K6;vW(>Rca;;QbaH|QM`PVOp+cE9
z@p3Xb3A0iOBXvbKNAnK_Le~igs~7(Oq~8Te6w*_>)`N$BwxVk~89kyWpP^238bJ~;
zeS9a#*k&SVLANh&aq^Z{7P8|l>{6Hs;z(U%?qT4lqz7<&EF3vg`k-BzEIxY`1o6A|
zG=e!y0!M*S7U5v=${q<^$8B)GWU;u10u7IZ=eKa)8iPS(?RMsp(_{Wrv5@wbKMw5W
zTX)3Z=8{@bag!r%4p1{XMix58_6PP#z$7KNvyTU{Q9fH8k2vgCL<RSM&kF*Dnlj$j
zAvL#iNC2N95ciTU?4HNUj^;T8v5Szf%V4udZZ4ll<_SGHK-zF_jFqjakJg6Y_p`V`
zJOS-^xa@m`7(=8cn!(O4hnBy>Swkje$@d-)kc6k3)BYT!J~Q8y(g8~Au$RQ{Gr~nD
zbjOr6Xjeu9#^Y;uT{~oeZZ6!%ckojT?KeDx=;kc;JKYfqgjoZodmqkw6tCGMcQ@Mc
z$g-MxR=O}_v1dO-G+TrAAJjPc35<rhqzsG{Welx*eJM?y*!fZJYek;hwDLSC<%q^Z
z!MjfcC2GTA74S8~cMtxrKL`tNZqfzEBf_wzsSh5Mpb&T}I;wCTzB6R1)`IA)v19CV
zKgvuu87%(*2&cDrE**|VxJ+zC_h`WZP)DLSH*-@XAUrlfk14<yO`OtM-{Cm1ukY^c
ze5Gh9hf~o-I1RWCwh;P-43yr-<Q@u2dEWzt?~WDq6p+=&vS1t!b<H_T8^1?HRA!8g
z+{XY@{{Si~Ej=rXDkI3TR+`q9>Q`@TOX5BJD!8}9Ad)9og;dnzXpEN^Ow#Cjq<Xz6
z)3pEu>=wBhD>c+wEZSvLrirA)PJCG$*0Qj+cn_mj9&P<gO`}Z)vqtJlkQ+Nih;rh0
zhE}>d6qMsqJoY<0Z)Qirm~D8m!-sTsy`xlV6^GbNMBk1OKnX_RELU_UrmY;(TwODm
zT^X~0vYn(G5Cyxa;mP#g55Z1!Z;bG&Es_?wxf~?PKGXJ6K=AKlhy%}rrZUrXp%OO(
zhYzahVk{SKTBA1)1mN~6W=V6j<H`o?9!7h2436qB(0RHc%yUiHKE*`vGht)gAy?2-
zq9GA3_8j*4QV68Aq-}~E%wl&c(vGegn6^H_!{G+n86@-qSXwMeQA-&h++8100gT*S
zx5|Z}Ufq#QR~CxH3qikSBO%%@-sq_!vEI>tg%}n&7(dxiMomjGVA%2PK2)!SJKr7t
ziXDw303U#!*S<0=fA~r7LnmWE_gLWH1x@PiZ>1}KiSUT(92)!*dnqd@Wr4o&x-*dA
zi>VnlnO9Q-qW1y0hp<d!lC%#@lF{Vwi*a~n!=D8N()LJC8Oly2IeRQ=D@3Exm;!vM
z9SO;1NBBZV3uFRF+hg1*fOZbz3S@<CKE!h`f-FKtIJNdTBf6Y>#f}~2GEs{=7EVlS
zfOY=>sWg%eh)Zj8$6}mD@owuG49iaTouqMY=~({&P}#=M{{Shz=6w?$H*wFKp+UAD
zD%m_=k<_E!&KW0ms{KL=iaSLqGSeUS-|(Et8sV~Q6WEk(6-yYyPg2n}Gli^qZ^%)c
z7ihdD(MKyC7~PW7!i#6-9@fW_<6sK3tAIfv4Ljg@_MZVj>IX8@MoZg%-H?R_ZLnA<
zBy8k4g|7!7ttOPmFo5B4YbR-yRQ1elHF5OkXtZ<Np8?<bR!ygUD}yCy4j*uSiSh{!
z!>Q@PiojeheGzEj79WJ#T9F;fvWBKNi>_;FmP*QTMd_P>Hj=Dpp>%E!Wv%dvK8eZU
zOAw8jZHVr-F!7+eS29Ml5w-o*oD6G6xmCva#fZ1rNNd9|K_Mq2QFOy@I8NPu>WpeV
z!NK7_{X|$?rn6Ca(i5&YJ=H5UCSNBgsB5Emv31tu3JZH$;bMiBJ+34a<2y(yC%tAG
z8sUESDXqIxgPKC;5y4u<7;NG4hmaN=T~6m%;W6YmdHF$upjlkg$T#w$cY>y!x9*{~
z-g_kth{q6ixDwSBeK>SQ@#GaFpPXeo)B(0R1w2J&A6%euCP+XBxLN(O!zIBjcZKN{
z^v!TCj9&R!ZCZdEyfVdAOVEusv;j#_$wt>5uN{$Pj%W@7%Bhh*eZa^(tBpQQ)?}@?
zDP<lm(9xZ$VgT7d*!_}xcU}3JS^PO}Nb;qu)1SB0f!|LkP)vj}R@uY7xm1f%M5LM{
znWgXC4tt^Gi}{#r?+BNJ87e6T;db(>i4ZZsn|_ytBU%frMV<asZvp1~IjLiRxHaJ8
zg_stJ_L2)E7EwzCjJue34=Q`Ov~Tx#a%&#un>&R!6w5|#BrrYBHgNl*SmHUrNLUEm
z%U{AqzT(FvL8lX<6Xns*iPAdl8Te4TX<<7^$I2oZOfm;s2+3lGvNBizb*@p<><zWi
zT?J%~?{VQ16-!=j4m*pWDk)@z<bX&D2?2IvBs_Ro;uTD}k_JxF=-xr@5EDe^I@t(F
z>Su-F*CFHfD3@vic5IoYuIx}sNru#gYo!DLO_G@%ko)~oMC+ShDo|SMf-F@#C)S8V
zH;ec3r-`gB+D3oMd?B{CAx!9r0pJTD#)uQ3a|tZR$Cbk)-E?zp!>pCmUaM}~6YzqS
zb~BIA3odxT2}w4!%5;>oMRQ|sqKLdZ+Hia#*R(2sWYA9N&P~F&qMfd_zhy$^No-hz
z$ftZSxh@KPY@%kg#^(#SAo3JqnS+7PAqS=EAlq?QQ9e4B-L?+0M`&)!%B>z6xJis!
zKs&6)p{Gqs@*dI;Y%SPpqi`n{@7YOF6*X*TIm1J(f~g6#N^rBz87qUV>yN4~2@4MP
z@_9yUx+#J}ST{G2LZ)M%6NqrI9#>RknmMHgnR^VvPzCH%j%$Zts-cwa+zwThG{Q#g
zb_wp8FcL6^k!}$HgZ24PIh#h|kT^>lh0XavqY^j}Y@7|izbWmrfxjohW8-su!pGrY
z*vA45$M#En0o`+5bMD2LJ~41XN?~vb1M7v?Jl#cb3AeWY013c>YZZ)4#~Wwvoorlv
zlmWw)BMImCOkvi!&4OtqyjeBG<b(DJ82<q37e6ZikUs;;Nj=v9Sw`!dk#2CBT;M@i
z!j~52_ys+ZH1KkxcGn9VfSN2XZ?eW)3u}$;0$s<qWGf`akKZal>;Mq3(Dy#(*t%)s
zK2u!aTk~R=Tx^eE9P4J@QeOn~^-;OpF5EoX5Oyq?7CG{v1h&>ZsSWH!)J{0ILB0{N
zq)f+x&@W`5p~=YHY`by3EP<FyPqgQ@6I?7WU=(e6Cga8vx08aH#BMm_?xJxQ<xeKl
z+wP%rKloV+Fx;kG{{T__lk(GqmOcU|MYRO5YjVCfI5DruC`#^)WOZZFXgLPpc0=@x
zMTM>xHeQ7lR9=Hin%&?kV#K2KM<zozP1AJnHII?EKTcJ_Z8bF*8yeejjslXVra60$
zXu8X5nv{f?S#x|`c2;yvTPwQON=lkXwU+e;LZ;BE%#pCUru?h;Iy%0-2G+U6#(OD0
zEB>0&$F{^^E<C?T?8d0H(e$c0;&7FKJd70!sVM21TKhB%eHBF}wIwA+{{Ym{*->ly
z#Z5$y5t2dhR8(i^qidlxxuG>~h&%Xq!XA`I9Y76lw*)Hqsp{$;31hkBuS@8jm8aAx
z_sUC1uyVVX75g#{JN-({Hd>m82w(*6zyWHsf5V+;Rg6mOwWqfwXnJ#{==9A<aN*eA
z>(cbSVwQ?V!5c-b*>9dbA=Womd94rO7=gQ|W1r-ecT3RJ6c1+Vb_?)r-EZnTl8Ldq
zaTc=2YyDeEvEzFz+_yQpN0G>W71}Dgjg)j0vR#c1VDJ}-^*>cR^HNi?Fl=rJ94(%`
zs@3&Aq4`=3)^V|Quob?E_&porWld)39^rCamKZPgkY$xeOS8<nYQI;hnXieD+R_L;
z!t|Q4snY2!uY8Vpd9<wYe(PI7(e%1pWwAohY#b>nDWf$10G4w-z7U)vdP1y^v&pLZ
zeydTe{KT(uYySY4^JUeYGf7Iv#P_sF*6wZp0GWD_q^FIBHvrH$D;w2Rw6&848H{fp
z*0>%LIW<bmsqLBGm)9bpifVZ<9hN)7wx!Y?)ink)Sm?!#h$uZLr6PM}Z9~JHJ=eY!
z){7ik9Glr7u*k~jSe5dzUQJRcE58e>wED3tr!z$3f_Vi2sX%ns7#iZ&H<R$Udf!&D
z^e>NbcZ1-sGS%y5)pZ87g~j|EcL}81V#eQPwKl3~V;fu@aeLn=O;@Yu^d83E?jBZy
zNa(>+rv7GEd&RI))bynUFdtEZ<L;lev06!<X-!>KTUU0q+Z^nz?@iAfW;mTErs0;K
z2ePc1il0xJ;i0%U7*)EBUeHWV_jm;e$)}-`Hva&Moo7|4=(L($b3vAu4VTF5ypfYW
zN$kK)&t-ia6*}Vqd&`S?@)LCJ3ZkB8pGERG8~_$=Nru{u7J3yd9*A{iuWkx|`WrP3
zK$>%QUmHrKe6<yIzm#K)Kpl?91#I-UNz!wesx0<P7;|27sHY32MaFArhgIlzjWo{C
zHvxm)XB(sk)5k1k(nRY$x8-Ve4!UfxIt`%Tg0l4W&XZDe!Lwh;9#Z6zTSH?~eV&cc
znzU3@jii~4a|q;)>YuJ>j!8r5m^SzUE|&`&*2}y!gL@Oo*XdOnMNK%0rLej2pXLK0
zRt-&Tl%U}Bc)Y)vbf6fV0r=&52S?R5nmAoCXxiWn`5|s))4F;{Z|Kty;bUMhyo;);
z4HmTeN?8Ni*ZWIN@TZd$S4DATK82rGpm$9MLf{<cuLbMbrkbhy{{Y(rfV90LYh6zh
zYMkQ<Il9jNEtb+%T0e7T7`I}lC^S|xy%ahPC+6y+e9gOWk>z@<bozY`p4nq#K-qG<
z<D<mKPcjzWz+ib=s(llv^@=+~8{=ndl}vhCBR#UKsI`_hGRWU;r03yeY3f~5P+aGG
zL0anGfz<ssI%y<v9DuW0mYx2R^9!yGuBRuxjYpyMYuiW}C~!P2g=bN<tY{9n@Vtko
z^`}El*rg)fk91XTuIFMqk?@n1G15=7(CYfGHpWAo4~3Agim$76XsKyh=EhB=e_*Jn
zOxl%Lr?D3~Ui<iG({xl+aY`D{ZIkomGE24zK0O5f9R3>V^c2kXA#Upfz0Jv5eQ!yj
z)8h^e7U5pOP{^U$#}8=5mMgBhfu4)tbAwAyC{HCJVFu4H{8Or;f+>R>7}pDcJ1;o=
zKI$q*bqJ=Y&i?>lC$a3J{8-mtHB+JwyKHQ;e}`~IQK+@jH1FMT{{RYU+HI9-Do3*G
zdaEL9=%X9E6X8&e8X24>b%PzrLsuV5S1f#l-MMi+&^21*l>4do;BYRff-#D=E?G(G
z8fhb>r=#@X0J);Z_R7u8thS!0#~TIm6+88M$!86SIN!p9^3@V*Y??-Gzi;_ZHi^YZ
z)6&t)sLt8DjN0mYnI(d(eqEQ`Hodm~>H2%*hG@h$7ZxsB{*KXLmsD__rQ3zt;u6Lj
z-3=*mTQV|fW?inDGF()nM{^?*uzwM~hlS|<L8sDE(-y`Ds@^cO)Ri>wN?keH*S5pp
zs=RSXUy+_`sp+r$)1Ler--X(JDSVqE86_Fl8nq*3k<mWVFxtpohScDGpwl?^y~Do?
zoUC?wM?>ggfwD{if1ic4o+iZ57|;jNSLuxOy*i3;3rMlDKDJ``_i$78imep-?w<vH
zE8&m;964T9tn^&Ec#@)p?=9{x%JoX>rnWoZg_+m&BMlUi4gktYH4&?pk1W|<V|lsU
z)3mi-^yM+Cqne7V*dE>SNPm^Xx7||1tAne(?QZ5cn}9KOtDu3^RKiGDLkYO}DE2~0
zCq-m>O=+i|W;((z)AFii)T(xviyU2hFHzGdSsekA#I&~3H^<7(OQ+IE`D6^Uw-N$H
zmQj^HhIr!RXv=ARF;S~jwps7C`M+hqe@;-*X*(i~qRr;Y4KlKtnW8q9-QE&)Oxm29
zcw{@98@q)`&sq`@ZJv3rHac0J81Pz8ZpyxziPf}n$s4`kT}4wtRr$v@a`z3{y7V5H
z(W#xLda>EkG-Mt~QIz<rWjHqJ9$5MrTsJiC&73X4MM0*L17&CzHw5-ueI}X+D{86T
zO=lM#NB2VNG>wJUb3xpFq$T+_9w2&s5P^ctyL+2(u5`*us2?7qO>o`&O}wf4agL^~
zgj6?l5{nhSk4P-1e2k0!o#0;>zhaBoqUd!#yH4#jt#G`y$nSMUTd29xZ)<D^BK#<-
zU9)!38sUt2Lum{W)XLd1T+%k(GD<4U<lCe=mS<GeHpGnZ7UM)@w7#78+hDM|drdx|
z=z+*My4A_8Fj9z%fOr-F_g&bsDmd~**<1Lc*efDsQ&`bBJoyXGA|e`~^5JhDR->z`
z>VpGc!9TLY>NPBi&U1mjLY(^ybc=mns*KGINddClHP-GttNkNWh8>=rt!3s_mCmSW
zYXKMGX?i-IuBoOO9gpQIeB2$B<IhIZs^)y!Sa^2kIAHiI$tnw*Q1EVYy<V!GT5UD-
z^0Cr3-?z%e{#G~EhZYN7#9Ni6l}YH!45F!mbi@vIL6M^8!u0-?uZ9R+Nmk$^dF1w4
z?Hfq+CH&xE5PWw@txU+|CNs1i$SDQH52~9DHm5UUv!QV%z87>gJxyJE-A49<PwqZQ
zR8?|GQCirXOPEc8T3&>ssM0mDFmWw@91nJswaE=;r>W>E=BJ9bj2BESWd8t_Uk0^b
zO$nxL+QY-I!CLJ{@{pH)UB07UH(SD?k_O$|+R?b&4+<|5eUx)N!>eV~YwP4SQb=RH
zvw)LDrm53simoRR_K-mx!rp5dO*LINw0pwOP{iiUXxujtc`4LXbb#f{u<c$7ZBNpx
ziK00kKZpmE+8SX^i(Oj7NWnyQjJJ@hYHH)BVQaY`D7g9rUmlAsFIQ%jQYCZk88&b#
zqpm7qt<?VjHA3CYkPbU4D(Z*T)P^?YYPwrZ{umPE9xvG#Kv~H>l(ce95NUHrve)#E
zpap9PuyyViYC23iOSZMRS>{xoF13>|VXn$EOQS`fP3V7<)^saM=I`5Ym5A3mdGJ=3
ze<(cp3a_I2n9@|l?@)eTe2lI3t6fD`N?ab&Hry4@l69tZLKo4IZl6mCY=NMM4BxVt
z$rMzt0F9tt*HqfBwMkASVUQ9pg@DyMs&;RQk{zb@0ZW^gL&_Dh*1xP8{Z0B^J9fzK
z9exlMwJ(Y8VUYTPWORx;+TC<k1{O4)O4(}kW++8d@<VLp)dt{|ob4$#Q0sLv&l6-j
zoYwH-q|)nZs9zM!aR-)^eFY>{1M;tFbZ<9r)mXPhEop)6!*bO{k*QdY3bb3vt--2k
zu4P+J;@pe>0CnYkM1Ln%_O;x8mFYBnIZ;zg3`B<y)AaDL-EpE+M^wOAS#fSVt30uq
zqAL@R`ZM&J_R!d+JDLx5cVDGNQwuAphUUC*J0F#urs?^lscz%#y7dl|(B`M1^xQWv
zjC?3d6MIKSJe+jQH9nOrjdsCjw>DZ1pR0Wv+QWj=a6+)v=%k^j6U5tG=iyY>J{Cx1
zX$>yTuiYY(iyBHYHM+*9O|9t$nxUbSG<#k00?PD#6Dunvf<tGq-rILlX<Mo#!?59%
zaiVFiq19Vd(d{QGa%FSZvtxpbFKPOB@~}7(Oj3TJcv$^+LHwlu0GNrs-Pc~aYT$h*
zrdU5s)+b%Aq%h43#h;KqtCw+hbtx$-2<aBXH8_!{-D^7KT-G#3H#Ccd=3O_dPaRZ|
zM<Hki&I@fdbEcs-zTi1s(VC1-3B}4qFH>vnhBq?(t!3x6bp~leoPSZcD?zO3QrAf%
z%ZrKN4=Ipz<w2(f?8|r-O0rw9{8Wv9NkImqp)dkHRtq?P%C6TmnrAcBjC-$QEQaZt
zik&K~G=d^HD6LOXXsj;{aAWXW*>}cqXy%k!dMH04=w2m@4rYF<PoioORMUq$mf^#?
z&Q(=xncEyJQT-J7rqrDSz-g0%<#T0Av|AHvv(Y+xUu7^5xx--`lrL24MeTcF_cV+U
zctGkJd4-z;NX3R0Wsa$3MD+8>O^ye`=XEzs=zprTXZ0Cnnz6<1C9gI&?4dei7~tSJ
z%Dk%5OPVSg2#)^aZV?euvGn#~+<O&O6#_Qq%23Bf&{*5slv`=NR(gO~m2CwPck*L{
zgiC0@F74PXx9pE*TI|bJ>F<&^vcwyH=x&_?3EfWoI2<iDrs$Xf1XwJ7vSfm#m9d;O
z=E+u=@_d$!jLi*zxRJWbvPcB&b7dJkBD7k_wF)M=$KFTon_T|@M&JyD(vY!>qNhsJ
zUj0zhmN>V_SBw(rb-|7#G#)}{N$WJw>oLbr&|4#bx$IWQuCx;RL0t<?oG);v&x;?2
zB*)S96P-jMl#&4DX8M{)>zL=p&>X3$>ZFS8lJ*>{8b-E49eab7)$%DLn}srknn;$;
zExAzC(mt4ASd5D;z@uo1uV}KS*USxy_}ry9swoE6(UNoBQz2_lxD17^>ADE#rf8kE
zln-e>7CtFGI^R$?1oFKTr79_E;1HLF$^3-&_)=e~SNjKPH0>^u8319nG2K+_@IDu~
z2H1{Oo~>IQFS*ui%)uU2PN}N4vIdetAll=?Sw2BZiV7(!MP=X*1RH`ptFEMNR=c6M
zbtAts5VM>)Dt1x6ib$uhd~$d2wR${EZrK}R4<TL?Y9ywUW-IWjrcFKHla%dqU66Za
zT7DvF#%)46$k~!N9C8ueXQBRG!&=i>?rvmjd#lX~qKjV9Be@1fvfm*1T+{B$<LZnJ
z3!MvE&`E2!_*xw;&WxDOSmX_Up86d`?`ia$?2iRrQ&Y4;Hk*PLif?00@zVyIOO5gt
z+YZS1RW;ONn&e_g&DMr_eKw86ZX6P`y7g$9BO^!-XCuf}zehg6w>GYCRoHd>qpRqh
zH9KD&{YK;;DzisvnnNRaJp3(omc}|F$uLO5j#k#ue0A)?R<=_ErLo@6)D>k9rCC$D
z;jV5nwY@<~*q-vs3-Yk@MCwgL)Qs7#c0!~l$XVm!!)xhZ6+>zv8(cZE(P^5@tfdYP
zv)U|Fnq?T&s7#{QXv(FYl3Hn=3vFZLkf|FMPPT(9^(i$MdNMlh&fk?yU!u<TJ7vYk
z_e0i5=w=QE!u`7yrs?YXdG<D;!@(r~0CgOV$7M0eOH9Vl^zCcj=-vsx1db9jOP^1#
z43&kXI>!sz^!f@X3jo4M<y3VZg$(hy@hfuIc~Xvl*rf3)4CqP-YINqlCXMa=Kr3xp
zj6%)L9hOU>b!Tan-<Or!EbC{w-|N#sKAzf$h#>x;J13l-5lG9oQU!*dQ)1o<#&uJS
zwIH<GKycuX*Xn&K43VF3@!e&$D$`Qk+lW4XRCw~(>C-)L@XJsil5A7E-UlbT&}({Z
zTAK^wvu9|yA$adaYcetHV~J~luwIQ8x?_p6Z?l4o;?vRCrD(9z<(38-YLG+61cgb|
z)oqQ$IA-2fmZE4ijWku$k?OQ&%K_9=nTFT?wqxoNDYo<l1?;DTS(bvRpHapqAK7j+
zZlGmupS7}XcHS49O-ku5Mp}C)DC(!vDuaWFVLkgVP6@dF#|}ohXwY>Rr&C&8D+b_j
zLP~l_>nVepe~TX;R8<qhSjNg81CJ<Zt3M|#&BIisg~y@elFdGsEj3*y<f=<VgY=TB
zwY@j;_d9S^O>KJwf@){;&yZDs*1t7L=~RBZTI;71O;aP0Q_)WIvBWr9$Z2E)H&W{7
zVRM^uJ1R+P!QiGfl2*zKNgvq+))}HNjM_#Vx8X}2<n78Tmrs`dq<8x%w%<b}kamqJ
zbbgzSjjkNDT7J1x6NNofuD}JZsOg~$W$Z_r_EOdQa#QVnn<EFc$idUIO>$IR>u;j3
zgobSnBR?z7wOV<o>Wf)&!fw*8;F?|J8{tb|0G=D|7Yfpnk<6mvW@+Y?l?;`>*Iw(<
zI%`uiurcHZjt`ZRk4}-z-RYHUqeUe=>~O`6)S5+A(YBUO?`R<Mv%0M-M9!8F8cu$y
z@sIVOwT9~|%I(HCd>s5O#TiMZMO8e&ox|Ek>I&+X3Tl?N;1?|YI|Q|a7Y4t$?Br}R
zOG!Anv}gMuq@yYtoRyb#I#7lmS_|6Q9u{L*4s%`|%GXosu|5#TIAmF7dYUFi?@^8$
zU6EprNT;+INu^B1R?0@`&NG0Yrqnth1<npW5fyrK<d{goc+dGvZ4{A$($WuPkyaTp
z+8LWWZcUy$rwW-{ID+JRZ*(0j4h*=*{39u0bd>?p4{{At*kagZGE__*41k<l>Z__W
zy6RcmQwv>oo3w?v>HRUaU|ek=VEI}RrNr3%DHsUvg`3f@(VL}$ldAMqvcf9(MttA@
z01A&vbykt88fvDNIi}V<)`w8jCDSz~Y8rXi_|8D#&G3oqN?LtaNRL>f7ke5vfy+;H
ziO|hh`l_fZs7qePxsD#@_a7m7&a+GTdY6dEEWO%Q&Yh`{Haz?xI)l=DZjqc@gd1^o
z1eF2l3~h4@0Un_2fYvnHnre;3rr%CbwAIg}u59odIj11-LiEil8ZM>Nn)uoQ4ag((
zm0oYQ1q5SyW|l|0dmFiq!@d`)^zN9)(loW8I^6kLN?k5Z7QDZfU)<j#%G&6)kp?uz
z;8^bqmTzUF9TnQfm`>+0mV0?w*<!oPNXRxJdSHN70&VUgVmhvhS{+2atTsQXbYhpH
zIV0?+cyxKS!jX^M&5yAKByu&!W4JthQ(Qea*}&Oei6{0ok{Wl|WrXwL30n`SH#eSe
zh?qZVbA7<}P*Y0RHr@{&5kj&WS?)|S;EoD;xVt3%J&GE&pTykWLF}IdzN<Drmhge7
zvZo>Nn25)P7S}-F*OFR)NlvAd+&Q1Ey^*uBI;acTU_kdb$H-VVB@4@)?09UA$oWS;
zvMHn6DBB>zg}+jv8{l^);NYV@M%Kr<pf+}o+$ptV-iYgAYzNkc?uo}E`bvsn>oaps
zQEY9YaB#aw&%z1qbW#$|+$K!a4GZLgeZv+x9#w<OOMPg8u^DQEY;%i|wZN&VuN(Hb
zV5Ss^6K_%?LGk4kMK`F@-K5)=_+2C|Y24hj<a{oU?37I%gNGyff=95Sm9#R5{dky5
zJAkVjF~5x3%WbC34AEVK2lX`eRUJp7TJ_Woxc>m$h<}ikW!*5iG*bq()^M;X?K!sv
z4-<!{yk)oT*-Y05SUdF&>YafxgaGr5DLpqc+`)0l%IA{aMn?rtPD90;YmUoVs=?=P
zsy8;<knze`;@2ajWrpU99^pYOB42RJhDXZJW+siydoA0zO(SQ2Y3_qzdnDf8Tl#`3
zIa@qr4tupPMj9UIW#19Ahi=3vr({#YW{$v<?q#_7P&V6kyUq`V8w`<2u%DsqQ3E0e
z(|w)#4|O3f*<qG=PLYgoz!&bKj}F>?%Q&VLCWxE4uJ+pAQ4Dr3&ybPL?gh!o2><|H
zhU2*Kn8dNZNF8?j*hWHon;k$q0Bf6;{ZuY>hB!`&K*!&){>f+^oetTWT1MGNBhSio
zK()n=%Q>==q9F1mW33?Ij_aX#k(P68{{H|efWana!|gX|&C|=Buo5xY**->G5bh6k
z6i+a?$0L1*%E3n)w1*Btb2h!(n}U`|!*;kEwB!`VwcemD!RP9fEFsKnjo<<Y9#wph
zn0><Ko;)MLXd8ec+>Z%l*(7$qZV|Cs02Xku=dn+xmP&JW91cQ9#9BR~;G_o4u@^z4
z)iYaLMX1zUQ3aj}$9~F|sh`9yjkvx-mNy2waKS`^!ye!>+$2y?=yxYR%J>0m!`M$a
zRt>3@ld`fKwswA@{XszJ>_eGi)5r<sjsOsD3KN2wqee|=-RaKL`lCrPzTU7Fu^9zo
z^*)}TOVo@qu$aj<Hc@GHH9Ah9D=C~yf1S7GdVCU5^)8Uv0dK6)gWl`RZhkcX0Hzk#
zv&to*w7>vBJR2z_rE^Bd^Vs%Us@*ujE2DdI4XjW#P_@j!zxiH-GpVG|-x4y<gtf#t
zSdZ?U$C51LkMOLkX|CHF{16pjC8uNg^W|APMB1h~!y8;N<s+M7Ja#@38`{T@3Ctq)
zDa<vla5g9ImGQOLw;^$Dfg_I#n&E@{sk9vd)WLg#GJ(6{e&9$W`>V~N=EmG1YH9Og
zihh_JeuA{h`08WXDI2ZAb!{++daNL@s%Jp>pSigCvN{Q5d|{6_w`4d|&|Lj9n=5T+
zXXS8=9JFOM(Cu~Gk=!RVk!;~mQ<~QfEpV5U^W(~qwsEn+?3BiK<b4XpB4{nkZZfR&
z-9WX53X!@qjH>4c0vh3C=gRImLV>XDM^D(_S_?iCoE{ZvjjtSws|pIo(;H>+I9Rmy
zU8u)Q=X%ty0{pcLr?7!W!x$Su`Y9X%0l_tnzEYlU20SB17RJ}?JSA&`+h-i6I5~~p
z%eZ%HK;ZGYxIMxK?Bd&8U2}1f!h0GWZpmE2)NC{|*X2g|%Q68WN=<^`;96Qv5j6un
zyMX5EHo44pQAL?edjT022v9l+q;wS#7+!tc?LE`rh4jRMb05m6mNzhh)1Jh3R+@gH
z>P6{JKzP6;VEtD#;^VY*W0IDb>FER9WP;<!M``utkqTPi=fp7CKbfEWAzbIi{{U){
zt@W_+WByj>XfGWw$+tq`XNR!<hmH#G%}C6*vW^;A;*HFW*Nw*ZDeQ_uY+GcGy9!L1
zm9oe`Rf>45njyG2kcTwS85vG>JiBjVLKK6v6%MHP<Z@9>s`Um+r(_QOR<Q_}97Y{*
zgF)=FWTmGW1l-+BWG5q!@P&!k9n|f}!22a*(G-p*`$<iPx$wL;LO@ft2fO)g@R?Jm
zzE<14u!Wk78a+rm8?IG^buDoHT&!q<s*X!I65hlsN(!QE9dNZU(rC~ZIi}#;cuL7b
zxH;|+P|b{-c~duQh1<`R9fE=$>kovD2KNUZ7e)aVJfxEBw}fmIB!ec|3I_peIX&;b
zT5=O`;o$gM!9dbSZa7irfQyiS@}Vrh7)*>0yo>(;aD%LYvNXB9`3TuqZb}|PLAz5X
zV>MewV}Gj+gS&&lQqVRja~Rs;`j~qaYf`}Bz`0eGF_@p~GQhXGE!q;jmejFbmlnT|
zC|yF1H{WYWa!M-UHJImZkbiV_+arDC2M+6<xkZ(v%*{-1kJ#~!$T=G38?fbQE8=U#
zyN>FjNNsy(;dSE6eVp@!bOcYS@KZr)cx%WXDp_OOaxkEEoGjsGe#mqX$32H>%U2sa
zi`b!}mC>EA{V28oea$~aT2u=nc`Y|59#f0Mt!xzcV)qz4q23E!j08BQ8)zmYzu5a+
z@T6@uOinIiNdx5w*B1fgBdF`&84Qyx92G7cN^`aSj}9*(lC%u+P?eN>ZuVN=3f10~
zQ%P^?@`ibIZrLa#b}9Jk(44ojl2dE$?u2{WzRnm{b&)mia2%?-h@8X52X(lOWbsG<
zwei^-O(<})&5vTK+Cy?Ii-Jwox9UTPY`A1cV75<UluqbfXB&3<q2Qdi1agUJ60n0}
z4<88}e#eZyhuM-hb8vg9X=ZdT&PRn_=E+QNVpw<~5e-ywGXz|GDatImX_xUjmZg>;
zU*!X-X)(MPMTd5>s}%*VyGaFF&}uDk5zlLRQT?IN@{DA*RK#Samt?K|)YUX?oq|ZL
z3E^DV(8oJBw1)yOaH?3@Xyma0&AO~)r?uGzoPW_+#?MbU01`Ya-8QAz7hSR{mhJ!t
zcM1l^VKxAZEj4IpGeZ?aUI2BE-A6M){Vr8>^X{-bqC~G~;YB(tNrVC%&rV-+RSvnN
zHtv!fx5!qmdz^2<NM7L54sH|1bji*Zj8WeU_LFZYxF-j?v(%^=F)m=wg-0w;iTg;x
z>x`3Da>^|il+{+Sakxait#I7KbwdQi8x>(sQsK$R3GT$8*17F+A~{-3iXE?PqT`g;
zZehn9q7K5Oh&wzcu$JM&?xTug2Y<Sn;oxvW9fzT>j7Zy#ZIuCGVI%yaN4EJt3yq#W
ziv_=+ZN!286WHr=Q(Vo5-NHrz$UGqSWwcCkd|froCppIjCChROQE~{zRz{(hb6t~!
z;_ykn1(!Q5u@>y3BIMh*D4K`4p!0;6Eyteef#-u@mvFW$PCn~Vk;L18xvnIA5|MN5
zx^2EM^;pC2?E|t)jtE_G<Srop0A;KV3~=lUW<`kXq;T(V*)ih(06>poiMZ~uvBwLE
zzD0+^Lc^N`nHcPcVN7WR{Spg<$8_L9_)R?WFo*{+#2X6|oYQ_VR3zuIPHVgb0+A*D
z6V0v2`BCodY(i;umI$%|Y*|OOKKB>q!FIv&nK5dKsNMdXS{Oy+AQfY)YSA>0M%K3=
zpyY(g3*^1~VN@D<og<j*mfyN~x7ZvkC;etZ@*3hv#g+d6Nl{Z&msC}4C8S(AW(J+<
z)v&hq?yoea%ec33Ye}$La<!&t!JDeBcTLl%T?1U(4g&LDs_F`P>i+<T!3rLyj(Fme
z_@vvLtiGK^HDylgIlvVt!9Ceu;)`u0y0)WdrMb847UMza=w*?Hq7$|G2Fm;Jx29lo
zqIA(^!z7Dkdb~O<94xb%+kb`4m&%SgQCQ))o>l(<?D@=_)rJycw*)F}MrrgNU-I$X
z2ea(G;%!QjlAO2LY!{66Z8Un`u4<wnIfRQ37f*tJKWLo4<6A3fdZJirFDvhr!>lHQ
zQ*?kA#PM-%%BHrOoJ{DAgMtc##}#JDK-wK|vbV&LpEk5y^&eQxEj8c{2fD}q0I1hj
zy6%zozCkNz6+I1HQbyQ-H?Ymhf_(xiIQ@6nGS?lG#tIuV%;%#^_*YLyO}3&;$;rC*
z?KfD{rla)S<_7@2TaR6qmZh;$KZ9&9OXz6pYvXLSGPnnFI6_VLV#)`i>l%d{9Dj(?
z2))*RuTaz4!y}y0k1DUKp%ly;CLQhWUS-rLQ!<uAQ1c6i?5AnI&BlvvvFj*dl1S<0
z4gg@UJC~`Zs?=K3CBbmY16R{)cNe}weyD99OnIo>O~^M{V^?GH(Z8YADm@|^Nq82w
zl&=2(QK@5#VtM#W({w?uyo2Oia=jZsrlxEjxnSGg>gtg<evculf~$Cq?QpruveR_>
zdUm#QM&Nn6x%^G8)9B?6gtR;h+$;qqxg^yV85hDwE7?aHJyw%miVAI;fesuhT~fYD
zp?=%ktW$M4<D9Zni`*4^r&dKQL_FPAEm0<@iWujql*c?o2R6Wz$+}s_Gf}_v=ENhl
z9d44Im8}f|MxJbdm#8YLY0GKY;!Y7!-hs*08yz1>(;uhO*3lL+b~4j4<J>#p9$iCE
zDR$PI4i-P8w5?3lMOo^(rKc?HLGra)trRgw>qzF@42!7b@n+uG%QSj3n%1AE)Ktq=
zL>nB0-Och<U0W+UiSbb|lPn;$F0EPw;K6X_;Mnr5{{RoDs-Lemv8?tx^&Z6|#^R|x
zm5lFg87TA`sA|nD)b9>!wmS<~Pte506p#SN*b-d5qK`+?s;XTyku*x+300k2Pftk!
zbvuW&UcqR^rkGw!(mc;v(5p1MUG682M+(2C^yxJzWPh&U_WuAX*mWMi1pPiljRru~
z<(h9&)M*;flAXtEo$dpIF0;!v>OF!nj~iw0QC3uFdYPk}aE?~{NWN8Wm8A-e^{#)Y
zL#_vVEyZ;$Cs9&1rS52u4eY<l!PQrPrqoSJ$Kl77XDPU*`z2B3`kPU$Q&Z_}Zt&Lu
zZN2UmQ(cayUWN5P`)t5A%BQNT-tlQ}5BFEP2C*F`nNdqSHx~o99#XmJUNl?&9Mi_x
z*vUY_u?Ncc&Y5)sXxi3>@9$;vH%{tPvRAm^-FlBiYmyAk{{W#SWj2sp8%EoyL=nDr
z00!Z?q%W7h6sqNqTrf2IZf#}k-Eq}f*u&pxaO|>^bd-9m@zzY;;llSqE1ZT;g4yOe
z5Sm@Ae(Q5}>%A|cY37I-ecPLINb-!Q=^94H!qzl7qQ?lCC?8D$iI1>oxB(ovo9UVv
z5+KubYD!Ai%Mb(}3GlXBCcF7~y&&KKUSnCT%cr%(xSWw=;VzM`db2i7t_&wCYBK0)
zHQDVny+|6vypRWSyqocFs7vYtX{02&_y@Yx%RMcAi#!ad5J=`;Gk*RTkxiu4yHsPU
zWHSE%62xBp(zqt+vEu1iKTmXpUsTr#s~qOWGI7H6h<^;Iw7OQyNG0EEgYu21V|r!=
zK0wyB?YJQg7hg%J$Y|hrYeD4lpP&6w6-NI6X3YMn)AAch>SdTB`B1^p(NxOW9_{zd
z*21)J(;rd+dE1qOcU8|vE1+y+*hmDGIY%sdD5VBpNz(KbZQW)71;%+n)>Bc*Ei{n;
zeK%Rd$W%IqRMgi28%w?{R1~%K5Fb)UW4KaL$#%*)!l?8aboxpt+dF^TBKhoss_Lld
zT^rzb(9$z?i|P)lshXS7ibJ;Fq%5?r)T)_+^4s`bQF8QiG`*gW)V+D@`<XZnc+ZuG
z)cU32j{-vH_5iB*bb6`eahRSlbZ(KL!phJp8Xddz-+)$a*1(b|1bU98JL=@zS~6AE
zi3^z9u#olW(CL&zN&&Gktu3>xI4ZA8(!Dw5A`n>PVC!&%A0Wwb*{%FO>L<mgnmV~X
z@&5oZ?h$(LSW#1Mw3i<RdA6eIDeL_PIJCIgX8M{M_RM3F`vFaUimAle>fLA__Xr<w
zPYIM-hx(LTC3V{2X9Y*oJv92tX3E>T-ImKs&|;^Lc^={Vh0yr#Y!5c68MbImjz>rU
z4ZX#R^j?gHo;od(0g;=mon=UEXXTlO{{SkHy0oxUxq{6$u+J+_Uqs;**?F()Euor7
zVA@(mh`Peo>a)sZFx-pq5!z)ex|M&aJDlc|!rKm+qkTQ%fHaZMgo-z|Go5sKrh!pb
z>Gw+44X*FudQ++?=g~I5Z>R;p@}rNX>D^BDv<Aw~enO|I{{Wz4;*i|630Fpq-IZpF
zJwmf=AQ@eaw$0Xx4Fgou8?=+Oi`WGp;nAjlQ#PQqIlc<^9;j^_Xycj9Xt=ORk);vf
z+nM9c(c_k<)OgzW3lrT7sAvL|nI3n>@q$hEm2cElZiZd(fB^VT)9Pfe)4z;22Ml9{
zC_-;#XE?1gk4h0W>|~@ltav~CuVvDrqnktyX>P|ix#4&{dnBOL%tVnJire&7qgzuM
z)5OPN9>vnzYLU*??#e!>Z{>B#A!~=G<H{11uZFZZexQGKr`Nh>qw_wsTX62=AZuw^
zPXVw5+mtqz$8uMqZD*ybeJ5&dn6=LV&1efHs5$qF?{Jl_z1H(U>e?AJSt#`hnAu>%
zLyzhU5no$Ns#VJrAVsy-X(uHZPNkqYrmc<YJxY`P71b3oG)mlCzYEI5wHk#{Hg?i|
zt4r2Yvo=;iAR*1~<Rf}IhMuO8v6eJS!+sUAWlv-wi_jjKph+Vd;~6A#h3FkErT$s1
zbe3hjgna;|hL{l6gT_LGQPg5E?Q4TeafJzFQb$a2@pfHSx|z^R4VqoI80C2$u~6zw
zT1bn)W6mwvX!X5#ww02?PWBzH$02#IQtAe)Ru5@5<XKM~Um(s)jUJuR+RSsr>Peg|
za4+QpsnbneTKFJob6Rb6P0^6PSBXfmE7f{iO@*}$GB9l-;I4^DA~A)d4@aTBk~PFM
zI2EX+jyQuu!$ghw$}g(f7L``n96)1_Wt8fTWsPKYkUX@s+21N_J?Nvu^lXJoOE(K(
zTGv&zwG1~dHd(zhs08q};QLScMbff;QhkuzHvZ$vt9l@n0M<Y$zcPB7;L=N7f;;(8
zK-lDzR0fYwWZ7zHdMDPU2Wc-kxeB9Q(A}gwNXHjA3qJf=FC<foqN=}CWfjRIYsIa8
z3eD;tn5ZIP$8CGL?1kznUp+;dNf+U5`ctRswT&f_vxX6Ws%bkFFR~7n(BQ16F57t-
zm3=17J~6mkZ^sKy(_K0=7|fD_;_+e%tLl0eR0(4Zu#<v=$dWRHW<OZe<(5!bOIv)8
zDyF76>YPWWLr*JBrRc7jGfyZb@ta(&Ef-J5APg~$;AE5=)rK+jW4daZQ$qS@z5Ane
z<IX~~q1LNt<^KRro<}*dVXk*&Wj!l2*}Xw*bA_Agnuuo1AP4f&Jg!MiP18DK4l6}p
zRGR2@UqS99yj`vw5U1(=5LC_`IJrFCXf${!^(`tnE2O;fVW#;<Lr%(BTIL)d@Vc=^
zF(a03mbzYtNXmA$D1h!2UsuvPIzrnWw#e|c`e|z^!5zS|Zl^*j;B%bYk}?(N4oKvK
zX`W%zRnhvQn;78yt-U#IL|`ypON*a{jMlVQ>9wY!0c#t87LTB1mabzf@*RQoT=RSp
z)gRgD-E{RM8d}l?iMUyx#a$+vSlsqCtv!#*+%<w2LA9I)7n=ShR@FL!P{3|Dy5ojd
z%FelBxY96GE`|z*wrc`So$yxw079;&6yb&KBzf+<vbIObPA6%zub($s9+0D~t*71`
z;5%h{IOk`bIM-#jS5(AzHKZNGm4}uSQqoByVanBOv~Of~Idgof3UlrwA1NgzWfIUX
zhcwjshoa|Mx40|R>6;AtQ)O@K11roXF~IOhvAzn?=$hZ;+8H~EV~5!*if+MeXw=ba
zOfkMEI0pc177MECoZ6QYaOWv%>zyvHO+17~<Jn!*X^?7g#Vv;L+dJiNkCPeABQw)l
zRMphxx{TgNyWZa`(KM*xpG*xR(zUi#y&Xh!s`rO9h~>kAJ6tTFsP*aH?RH4w#XE&M
zU{X?A?8xf1)6;5!i~)c<g}Kq7g0hvfw#RU@hsyJPZm3q*mw+1f@)x827|RUs3VB_$
zk!zt0Df9`=(GH`d!ouqgbHdDPbT4Z?x42%jsp%p%7YFY8uRrQmh@45jaJn3LswK+L
zJ*sP&a!CXnB6J6q*2OGt+V;BZwMR2^h$@yU(@R+%(_y?}MUIbfsnlYw(i#XJvjy+u
zuRPRsR!vay=7z|^LF}ce)SVqTEO{H7=Y@!<teSmBM{q^K`BLL@ve!u5={k#NkWxNN
z$0uc?(zNK}d11>z!t?Ddl`xp*^qv`ehgohk%E@F5aNvHcsz<tFzqDJ_#{_LAHr#=g
zo7FWYMjS4W)+@g+5Pk4M^KPNk<#j`v(}Gd!Lh<$!scNLjw|48CWk4kS#09SxX+mh)
zT-D>$XmgG5w7O=EG_krM!-0`*3Y@kw(M{8)dP=WG=hG(OtLn}2f*dSD>Ma&%!F-^H
z-vi-XoirGPgk0Mwt@anKnYv15QrAIKBQFz;o&NxD%J$6;X!Q*r@^cX*OMQpR^9iGc
zk(lIYEh5D`raHx%H9?}N+~~u<hT+)^(Y2#up7v>Vu84NWPY&jv<_jnU)D?!FOM>1H
zmFpTdxlO23g6A}cg+tcbH8Yv{s0(+2aHR~6%1$VuhN>s90&Fe8D>u}!9qtV`2ZbcE
z$isG$0_V>iL<Gv=ag3|Ux+0QBbI^3Ot^fwe!*TM5rPQXPB0%ETH1TzA!UWbI{uP_*
zW|r45Mh~X-M3X{Wi!?Qw>$PYEm%QLu{TFE)q;sN>5FRj4{UfK|VY#;iT&={tK6W-p
z1+9=$N<TxVt%P*^%$k?|KCEA0_L8Nku9r=a#N4!StEO<K4Q!Wet-wB2WnFcu+$VPC
zy!&oc<0^DAj;)$Ot<_aVX`=z*;=~juPU(7vjjVocrQVE(-oe5PNR(66vFsp#Z)@Rt
zuTHX;Rig&Y-)y5OuFyHO%I$uN8j3$&FdSUVm7AfeY!5KZc93ung|)4w6ot`04Yn7a
z^{W}_x@cXtM)0|#ljE24RjzRd>T2-TJJNXEJS?3?qGVxfkGuS#g>k9g*F2dU$hr$_
z>r0F*CCxTAT@FZ^gEk#0cUjlCD@$7D#Rm4A4i+D$Yn?>#4A*O1c|D4`)O8027|X5-
zo<!TC&}xD8eNWY9*AH-6nuoTb&R`>ZMZofiu9eP`-IZj~%GrdhDY4>di<2s4=S%An
zQ@+OGqmZ>4fu^sb-yYr8z5f8=WW5H-O4^8U;rhZF9ZI5=#5DU4Bf{#8tFx9#y`sNf
zmC?#$Ao880nLRMqIl~w}6dI$=bgeDE`{iHhR6<%dmW{7w2q7y;nKpxTexRzRaDrzW
zv-CURXg~EWJxo57uG;a($yohTl=^LWy}|%Q=Q)lJBF8I{`0CE3nbynN=FcTjsBSxg
z6~2|!QvO%+lDnU6%4bipv%uCo+*<^r<j`YqE@1Zq%A?~{Endv#y7L8CG7@5w^q#>x
zr*wEVIbRD;>Ng=?SLqF@pmi+mxwo|Z`Az6eK57cBlN&vU_X<&IbW*ejt8|R|WI}p!
z>kOfxuASwOOyV%Tx%8Bpj*x9{Q*R5%daFtNm01iH1=#poQe!7bx9RHXXq;Hrdk-O0
z^(|usQE<1vkf776$RZiPS7N(gqLNx)%)|+BHXwLY_`iD@&-J1mHfBB9AcXyXiYckf
z;SDC)0aod;OwvPv7{W4H-yBY{y|6;`;U!ehI!WD`IO?XSpVKek;46x0{{T4&7r7j&
zn)tWR>a#h@pG@^&lp9@-{Yp6{#nF6mY%B7&%T9bNIt?}TWv(vTM}^YSmc}Y6!E+8s
zS6U3wG0c7d;N3xF-it~UM^mG{v3hc_9AVy8GhWjrrIg6V9k*W93=q}A*v*Z{wD>D4
z)VgycE{<mRvJ;zwvqCAO&ZuMG7?r#X5#evTK9-WAFHTLO_E{Ms{Dnz-0CZ;#YSeVh
zPhs^VH)DX<Lbf?B$<7y`?xWD#1>V7f<G5J*$YhS&u38T(*=QhxQ`3z-NweDAEKakc
zzMiPlNYm-M`(5y@K0TsPQo3d^h|FQ^{bQA7qD0D<h7o@ubovcVB|#%BKjBFXFVm_U
zQqgwz9#<osbaXgq(0`}G#(}T^N9=$!4`jz=S8ecYt?BAnS572hxb6zQ(wj<P+bxT`
z6nT+LbY;vgrwu$CWG7V8wx$y#Hn<+(ueDl6O43>e0?JQSE}v1q`7dVzsR`bLI6lfv
zUWxSb30ZLA#gUp^vFbGDDQqVLzjb#%<#jq=VFky9k*I966~)cFT+?(X9ze%BV%IWi
zDfWUu?S9G$9Qu~*dAok7y2;IRnn=rrQB=BfqH9IBHuneq5La6s(|Rhj@?n%kFuQNx
zy3sdCf~ElG4n_WmdYS;>4;J|0Hj=h#7lup4{{V1=C+K<OwP+5ih|{^uBNtIZ&`p8J
z;H#ZVSgRs3Ho?cjp?toR?bz_CC1{)_PiD`iYgo|GFyVqOwT5O%70tI<d3^-4`eJwi
z+|L7_g?CA>da(n%hkrAC6)4|Kr0T5}`o(;3g4r@W_*r&qvC-5J!VE7qk)A>msPzeI
z2@Jijm6WKCcFVr*Ao7_)nKtcFrq}4=rf{vKCDgMUi+>?i)4=KJi3grCg^y9Hj*P={
z_}zli5&8`5mN5(d-wK))*`Jz(hj4B?Ek8r*hfAptle8QQ@KF_daF7zglnba!Ky!tU
zkd{h@j?YQ0F;>$9YZJjkX)rz-y`bJVc2u1=s64mwbDV*8IR5}J@U)s#;ne~=XR%Rf
z6}F9@hUT<c`1wxiT^cP)o7IQ|BSwBxsHvXnP~bR3(oE=IXCG=+X_>1>km}lOl#{pt
zX5WMx++7~R4aWs~N8$}5C8c#`GeK|{cpbv?$yvA@bHeI`tsL@H$mwKe;}o{f7f{wx
z`Z5=^Se{Z;0`>q!o;&$OQcl{IHVMt8Z|QmO@Sea|%nN<v-R9~S#bfHni}C_Cc(%RR
zBG@4ZcSh^Cj|41bv^qHpcFNCb2PoL;z2BLH*taff5sYk?E$`VtchkIqeT8n!Urfq+
zs6_D)5A!#|8W=3>UA9$hno4*2jB(iRLbi%_$i}`ii+;%*S{XFXH7}-{+}pJNtEp;X
z1%g=a=-vI3q+@Dh+HHQv!j6_#(!9ecC8q>=3m^fxq+gu(L{iAt{{RL|I^NeN)yL_(
z)Q;|m{{UqZ;{IX6WCkA-ww;dS<vJq9OSJHE5V1(-vd+W16(EXP1=_=L-3Oqppti{R
zN&RS!Es@xTaYtDjz?F^`Jh#Hn2bWoo{XszYIs#nR5p_AkknxpvSZmr`E_17BEq7*E
zM}Ls0B(pLy-roq}S1~tZ&Bq{jL&^)T;LtCU6GGOQC0>MVo7<e(D{j|^v$Bc?vcwKl
z<~J~UjLUn4L2NJv&j^u*&lq!jp~xGq+<6`o81r!Wjfmta3xmz=W8Eq@V`PhY+}u9j
zx&~;S8~sS`3x7~nK$}>Mjx3_6{vf@8eXLKESO_C{nU`&Yhap1ekT#p+`zaw|^$51o
zJ1HiL=XJQ`d0MC>4gEKD&C=~Ru^0JV=u0g4&DeP!5pYErj{JkjTES!ub)B5pr#=nC
z)`r5|g!!O6w)XSkbRp5daXkM3bSxm?2@TtA-V_cmYmLXXSyWSx_hJ_E0*BIMpdJbA
zm|Gc3HQTU|LXyNf{{Z1Y`gca{%}+bbX2!&JT7zWdTy7ciqLHlF1es~Ta+aDv_T*Xo
zmj3|Cl(D6@EgMfG{#Kwi0~^0C?@9jX-Tjjue=jGv?v30PG_i>NkGY8cmmbO)*>>1~
z=ByM=aV3LDzhl^@Y;y(12XWyE9FC`P#^xS=5wXk&xX3&ejbQt%?WFRN!14u(bgdp#
zY>>3s-(psvSjP)wDFetLsh=2;o0xsw)FGRj{{YItLWk{k=HwniF|6Adm7qE^&%z61
zw&NZX=_+3vh#9^d-ziMp7j#t6OxrMmPa??8In_EPYieM*fyds!s97VTw9q{52KMl@
z8aAmNQ1qn$yMjEfUm_fpGLfkxQ>jx!tk4RoS2xuH>m5>DJw}nTc=>7Wv|3x_pqF$m
z-2;w5JScjzOJ#Ilo}>26(Q*fM=i-yaI(-E`E{ueA5mc8j`(7|dm04Wa{Za-9?4qlf
zvVGZP%{D!*qLNu9lhk+WUbH^Yl9i5a+A=P>z>q=3(vN++JHk-cUgPepDEnYvk197e
zX}1b?ex5Jzn=5SFw<G){u#q&_SfzFQ`-ha6wT~T&Z@H()?u{E_mI64qP4vJwZSJ1O
ze#yjlZwmlz{PLo8fyeBny}pZ_(DvlmqhMq<@sva|57Pet7(<WMwJq(+EFmB_X=%v+
z011wawCCL3#W9X8;M^%1`wMapHz*?!@NHvd&K<@SuV~wL<*F^fANzm8CSw4(zFO}d
zQ?70PLgL-ozuhBE+#2qC6@?T$v|MnTfZ*oXe0fj7xICzfNI1ywwHnDcg5ARg`BTP2
z+A=POxIEylVJvmVY?i2GPUagN{gfr766W#U6}hrB5r+(LnY06p6^srX(xhu|cHfke
zL<uE^$GAw-c6Sa5yA+OS_L2$}?Amd{vun4vYq{)D)5KaxwpQ;<+fKrCijjzF7+l}w
zcZGdVPaD7iyzyn6(?}26@rAI`BO6+73xC4p$qIIK!y{{A(^I*Qv$$3t>G8<h+xA95
zN*!ZhLOKd<qQEJ%-qB7)Lv*|g3xzv$yNhiD;a<Z51QHQ#g}5LEs)e&I?Hb<Zw0wla
zq%q>)HtSeo^JFx%<1S#z16wnU()J(H5pn6mlF+SSj^yqiWiVhC1B4#KY^W4~V2;V2
zn_J6O%c2BvgdIdckMNPI9z6g)C}ahXXg5H<fss1x05w>ak;qU;;suWvSj$6c*uX4C
zE{OE@3%1rmvf<a{BO#Dl#chH^1Feq9cjm{0vqnEtaG(UY2Iw%RIpA9yD9E-)_D*pl
zf({f<b+dFk2%+Tj%4j(^;WYc(%4pm@r8usKJYxR<vKDsPzTOmt<OAcvjK~};m;iFL
zb~z|Xh7W$o>4wpMN*UvDBf27$Q^)DZ9?X0rY3j?Pu^^C{JZ8rLj|dkR#_(Hv4nlO4
zw8d?p+2*+B{{RZAd2C3&dm^`bppZVOO1gKx<)DHSMhP(-^a$y}cn&$g3!Kp5dnn_L
z*CFE}PSEDq5z4<rdmwWStn8#?-v%;Tdm>9a@pOT=7InU;rUzt<k+LwB=ix;l4LHkG
zZjMM@zAhAj;$C_1k3kTAl)Fc6S6gXH+m1L&!Lih}1}C&0F0LbVRT0?c>YvgNWrhh|
z1kZu{b7Z?)L)v;|_4HCl{6-DU?eMGQj5(&`3g$Y~vuPJ^lm%goxR#52C*+@ExVV)Q
z(i`2DKLJ9(_=&q*tV^tJ(S)Ilc)xz@G-WCoOE0JZdC2aJYn>iAP&NQE!DT#UulBzV
z;VlKQnC0BvuE;70>3^Oc-IBGXhTE>BW8Bg#Zk49G9ZJgJ_qEm_+;WP6;q3$qI?40K
z*#nJ$KMDZHNB;nnt_h-%n?<&tsL4v;9d|Q=3b!q%t%SZ0aka~QEWZ82Hwri^=cJrT
z6WlC#T=K&EU6xZ-vesyyO(-nK!Zs&GP|F)#bP`3XL2!1>Y@lU^qLNQ=a6IstHq}1G
zarT3K5Z7dV(QvdlZ6gR;T7f9q;5fpcabX@5B#J;;ARt_DhLY_hT$Ed+8*t?d+8z?7
zGb`TW*H~~$60Vd?3!2*-D=DEMr~oavwTiT5T?*2YGx9*@8xWDMb4gb-Md}N<Sp0=w
zJuz-t7gRDMmT;y%o^l8PqgzlMz#X5JP%bzsRz26T;X8IjvMxQ262~cPxw!6xj!!1)
zP&XTn5maWwn=a<u_DhT4@`Gt3o7qhp{kI2&xSGO24!cNENZq!#{{RUX{{WDj*IZkl
z3soA(&4{(_mCY8h&C{fgz`L?-#nCX}M{t_r>-RTHaBbiuCpJJmiL`#4T_ajM6u<G^
zJPpGb!WIFaru>ppw~&#-_as>$Xvn#`*Jfn41nwYz<t2{n4#}Iw26Cipu6X^C2#yyi
zHho2tj~59+Hdt4(GT)o1T-<Poako6(M&JX7g^);g<12{Af89v&$xLOpA`KBZatA%r
zcDYR9dz)C4!E1BfYYkA`f|1AjC)(K@CXsGOD;QRvX(Q;m?f#U~aJuaBiWbfE`a}$W
zr)${b%8G3&k`~?WXuf$_4MVFWl2<>}Cg%1Ew!5in>HrLL$@xy=-$z5yajsTV(>#Fe
z1wl7bM;lJZdxljlb2U1%ys}FkaD$6SsdRum5p&%SkL+1wR2fyQRaQ#x*R}oab+`O4
zrh-b?W2$HkJ?yHwcSeRe8rf~+sadEuOssH-+iQ-}gwk<o9Q>S~&wQw;)3mx)$x9<z
z_JMJ97gP0=G?Y!1k^mjemx$MOWmM;HsN;W?T{fj#T-!PC+AUzXSBGtKIu>e2r#q=C
z>f9v{0h!?h`r}K!P<gpIS<MPr+YhAXy2?FnTD^s>jp4sV-HRHBNax8ZWb6}C)C`r*
zkQ2{kZKF_{;LC$|5tTutQaX9do)601X;VW<2zJrz&H}d~IQk5iOpi*Y_1-`MVmimF
z-%`OzO7CbEAR;=~swS;-X`sH*ivp^&j-76#J!Uxi*1Lj?<hzkr#*qh0LPczH&g<@Y
zE7>Wv$S8Eyx)%WEh2=EVQ$$@6X=#j{sizfhVQH1t`tXu)a_D61vg4|{vU<s!#=NvD
zT3X#oZ*(kk!kb0udaYu)frlfy^^TwDgQvjONfq2VBqojuTQkWXk0oZ8sp>9pd~RjA
zQNyBCX|>Gtw+6h~d*JEF@9H&x8(86II;%*gWP9Y>ge003PA^6s@|qgCDV}o65PX6W
zvvoUYsQnGYY>oDicq=>A+MIC9>oMTHjM`6|DjhN^uB4Tew1wO6fP_~iY$@?7`m(xO
z`oGrqi;xA-np_gWweAFcSE=Zqg*8(-kE$f+n=NHe;f*vjTiY1~43nEJIYug(Sf?km
z$Xib>dt!4~MURB{Hd;AMFS|+d7Mojw4H3?Tw*8eX6EjepnQREf(8l8>pk%ncm2v5{
zdWNLdfaf*YE7Lk_rKzbY*!kKEhH?;nINC~CSot<!V;|iUuJueb(Y`obFf0o6AxRur
z8*I1LDyg*SiC_#C?S<#vRn)GK5XmeERNYC`($v3blHg;Nm@-XSC~e$D(n}$u15u#J
z{X%ix{I6!{QAt6kx;b`-w}Mxbbf_A8<0d`V!q?aT0I0kgnqebi+h<vFxXH^$N|LH(
zlc+kOw6zX&GLT0gEX@5;SE$J5MPg0}y2@76xz!G2t~Mo2p-A|(Hpdt)zZMr+<C9xA
zD5f)AsHt<ENai>_-=qZ|gV9xWR;Z|qx46G`=-PIPPpVW!Qs}>r83k+q04Wp@76{r1
z3!?@YrEju%GdAfSWml)y>H1WH2A#}dHV3zL<x+~u`q$pzmv{2Mht;ZSX`yqTT1Biu
zUNzJebX1z0lTv^~pSx%rWo(;$3kFqFY4w7nMKB}6nrgV<ki#G$$Ax>S>QK~B)6_MN
z5;K!-RUl<Pr&z*BYqw(yo42y*==A=I>AG6(lNE0PlFNT_?cq8t7P5kxTfcZ=<ak;d
z_+O@U98uFW`kt7;@}H#5Jo*$8OCPwh&je=bPEMOE6qOjBtJ9ebQO;aTB*+7?T0IuE
zgH40nE*WAKM^@9+)KG>**AT<~mON_pQ~*Tc?*Ug7v`-{#^w(;UM;nQF{nme2>Nv>s
z<9Gz({ni?%R;;Kbfbi4dTJ)}sQK?mlW(2Sv2v?2Bi%D!hOVFxyA5x-wmXdabtJ3r;
zcGCvgq1NKu6>+E1$3;qG4gUb}raRi=>)2gcB#|jL$|*FrzHO|Tz_r*nvaRZRdYvoN
zt1P=o7jo28Ra3^pA#kzqd#s;XYl5<jQAXfe@wezyawzs!9OS)(Ykfyasr3AGrtYX^
zfIbyAk4+6bzcGv6<RCN{;gPe^$_K92`w#e58a*Xk@jM2Q1{7gYWhA*HT@I|lrbyR-
z8s-qZXHby8S~Su-+FxshvDNBiqN99r5({s8uRX4qPh8gn?s>sfl=%`+aXmXi>3HLT
zvpfqB2>C(RXwR2WbPWWwp2__&tkpA5Wfe<_a|N33D`7_^IAdyF16^+Go(f!_BGPKK
zQ0YAd8$+b28=7)16xx=JM?+>Yp{=(n-%;xd3P>c0^0xbNp6knXp0BB`d*fliCdFN3
z)`++_vcpoWrlg+Y&I6nT+Fw?>cDkLoCg6pWjnh_Ev5wqB&6lfm7Lv+X+UkajTNenz
zJi9cX6bS_+@Uh>Rd#%rfeMKcJ^x_@0yVzO}f}`rXs%RKvz;&(`5&Eo!@<i8>bBh&9
zjCvPxDs^hlPQA?zE|Lj3CzWwsRTi<Q!r;xa2JI%?s}7&&^I03KUUxbE<8*BLBPoA}
zaN8TMY>guDO@nlns5E!&m>*1wAEKYAdY&jM3#s1F*JlcwTYNDv#t68=#ZDxWsJD47
z><L*<lF%iNnW?1I4MwOWChc*-S{+V}yBjky95NPPL#No$yOphmp{;<^&0-!sq^vYu
z1oZro(z|`VugLgXN9#;vO_8s&N!sABlU6n;ivi0@1+|qD%2^Zc9CLK7Gd7Lvy-5u`
zhR+1KVY<($Bc5U-H!j73S+uIzKzV6B>=aJvm%diY=&f_%Bgbyo{MVs+D_N3?s80K}
zrvR0`m#ZJCPaF=Axq$gt==31UchgIP&vQy1IA2F8A;#es2+6AglZv!&^-3t}3^Say
z#0L*5;*U*^l9ugf@W{CMSq(c^bhM%;X3J3hawh1(k9fY^{a0)fN{(5%He>qaL?4!b
zLBaS?bWXg=YR0^u_RlLn)!M7)GVKm{Wyv610IB*}^S)P?wceAzPt`_Bos^FIKA6|F
znhjs3#PL15nB4tWj&%=FM%s5YI`0<+LHUZfV*I#!gl`#WDw9{!9@Y}zecn{%`<04O
zGu1U!Rdo)ME8we*4kx;8{@`71dlXiOrZK}~g{}^MRLyfJ>Naj}3f0G>a%@hgm6h<u
z9UGfF2HTPPlIc2iXQArShX-3e)Ip7v^&XQCy!)B;Ucb;?KTlbp8CuXJ7<+r&K0JJZ
zDJc6qju%$O-%b0sdAfXhbyMW^4eWVdm9BK$5KL^r>JxwhtE{FJbficuJXu*_j7Yq#
z`#k$sqGWMxExzEenvEx?QM%ux-EDf8Q;m}rhhMM@38~ddEajIV6J<FidJ1pZx9In^
z@vyTC)O0Ggx{!wvc6VM&(5>_&G0N-j2Vp&y=StLLjjxHu+l9XCn>R;R7jB4u5%mKs
zMxETVEpqbe>e*@{H01DCrp=^3s97r;CFfwUYkR7iFT*;QRklf_b6ieu!BWPO?6zLC
z1JN2hwXrsxts$p3Uc=G-I?8xkxt1*F9I1Lcq>U{jL`((E_~l+#REi2x*IGBS;n!Mu
z8qgt)GR>8AbaeJ1xE42FTlkZ%&_xuik-?_Kv<^zC>W;H~b?>I9d62kT!?()9YIGW&
zuU00hd!KBuA&of(ZA7e^v-4VvLN+_z?ibPDgNBlqPGk-(FL22`uN&#kmz}k2nee;z
zTj)&s0~=X)ZEkS7TjHqYu1B!yRFq;D8HmWZUT>+?3AHl=NAQ_@6g+)qb!vN=b~ER?
z&ubk((NF|U+iw0;)3#kkk$>t%Pa%0C=fWmES|-Q(+i<aUy2q<cdlB-p4%F)Bn`BQm
zx_(@h1B&d~^)9y*t#M%&`m7aQe3HydPZ<jIP#4oZt~YbraDG-^nimSw9G3(e6&S%-
z(w)af+o#+erwWNq*q@A^3b)ege=$@koZ{fqgXL7{@cPt0l0T&6d?Ivbifu#Ff9hed
zK2>4-iAh{fPSWF!C>mwpC9Kq;Xnai|Tw@%p?Pk3bD9Cfg?d4;u`m@~THQwRDSDf{t
z5Q1gCt6d#UXXSsH#@SlVkkcDR_P1zjPD1j%0-}9asF^E44PnV%(Ms_il3d|w0A6R4
zmGpWzF|NY39YQwB7+eK~ip%v~BV`RFZjHk$AJsimBzlt?$9uQ!aQm%3v#P}YoMgen
zEE!N%md>SDNb@eE(_5$NWw!<ivCjo<KMxw%SZUvu-r;$NQ)<)7@E+n?*I=Kj)AX*e
z=%HiW;thu-dLB0=4W56LmpvNpwQMx(bBO_9v}nafr<}06glAjo?y1>l5(q$aoWNH#
zt_0lSJQH%VPfJFFsI(9x_1MdcV!>u!2p*Jz`*0VmR2a^ewd~yMcwS@FE!k4y#_bpE
zjkLqY<6zX$h~*A#_T6i=%9cU3<=0{Cv06n<<uOVy<Ijbz(&=EDBLmJ4b$BuoMeB8X
zM-jK46)#d(vQlH*Z)H)c#U%w%WzNujrB>F~`lJ^Tdm$%!HyQw*M?<K3jyJi_(Q5P!
zS=19pJPyGi*=1x6seU;NOVX4rnx-p@upe;nmzNRJa#VVrpVd^glnrdeHQ;9J8`afN
zPW`bw8<Itp&aI#aQaSLAyN6|kiiV~wLDA0F8yhu0&ZMYWVR70j>gXhscO;das?)0B
zt80TxfOW<fs8P@sJQ+i5mr~Oyubra#2Fea}I#1c0qoRJHMlLMiE?N{++9YyUi5$=y
zeWvSAqQU7@J7^x!f2wUsik<IvEOT!KMp?MX>W(!imN4m&3L#A9i!^%;vQ>O=%TG{X
zYY82ZI(DwfsoNW!XSae?=7ml9+OlMC9AlIu+jfAGisH<lQ$Z`~H|-;6Hw(|9iYm$F
zh3&}T_+I_g-8%UwNoc`mW#dlLB%s%1ieYBTaDGt7mz1fRSoLVO{566)de*^HhJ)X@
zUbz0Arl*8gQQ6IKxd3py&XSz5>~mT~jsE}(aiDc4<r(>E$61aRxm^ia7WjkebP<Ug
zHHSI*RGPI!RJLFsHQklJQfiPyHbEm^$$vq=1z>dw*GpAtkGl9vTN$*`F0RR25s+VN
zvI@g$k`Yn5*C63~ORZN$=n-<zu$@Ch>Upe1tWo(lKzOxb{V}dqP|DI|agO#|k*!Tz
z35>Y7IAY7qw3jw!m{>03!t@T3(<c15^|0<+^h}_e5w?{8RnonY$mWapv03&?;ZW$G
z-+;Ygx<h7+G&eohpLNEMCYMq9rnb##y4<PLGFG%y$j1|Lab!Jp5vz@^4fg|;bwN!X
zZklT$aB;=j4nj2Pl2Mpm_TD*#uA22|3cZ7LyF?Em!#2;+dJdge5Tw|04+p_nDKyz2
zB3MPi?hx{7@1$vpP6@}sLfY&pCL7fIWG-_*Q%_}$)M}e69M>B?ycAZktv#mgb;0Ca
zWh?88<#d2!l#OhC7kxRbxs`%BNgx}2SEcm-08)RXOxLmZh2x(K#&p=^ocgi*Me${}
z(jt}Ag_45dY+th0WdqYSuAyahH>}5kZP|IhQdi9Qo^DT(bas~a#tcs+v$B$}Ml~%i
zXt+G#MdNp6BV8V5=Sv+?m7w!~s@QZKFv(i!0S9w$wD&#~)qOc5K^rahRg`g0rPs1Z
z?ks;~)@s?V)%2*G*Gn9Bzc%c%mCcp5YqPXiABD50)TyP@e>Lqk7LmRdV_%jyj`3p0
zWryKB89C{UW|{e#VIyyQWep`LV+&l{I4cgG)MK$>IPN|ZHR}mW*^DmTHKUVvMLC?p
z3}D!IRrT^Q(|dd1r)n|=jl$rnKg~Py4ZFBEQfOrKX|&oKO4kwhTB>?KN-;D*UfBb>
zsL*7Nrj#&Scoz!#hNZDLWR@1<={Zp86ngX691AcA$ndJ^%L&JoKT^!oE8iAJfT7YU
zUsFoy7(a>+9#UV}>NH$vb%vUtH2#uSwi?qFrWP!4v9j~|J!tIbw6)FUUv%E4*V-A)
z+Hj$fKGA$>Ju^{LQ3)Qd;bWCkUs&ksW0o#QHt>hl8zm&3!b~pX;Q<X!+K?XGw)V<|
zV$&~C>d#Q=%Cq@aNY@d5R$K8gf%|8O*xu&d*Hh|Grej+Rt_`lH)S^0-C%h8ZV5&CL
zu_(jE1l4hg8U_a|Rnii&rXx#KKZ?O-{{Y+&=AE=-YeCpBZP_-S7sV&58>~US!m5&F
zT69mV>7SLA(>1@sas7(V>QS3|jNpEu{{Sm>RXD1kvzza?yBw@8w^8|dof}2lY^ri6
zRu4_5MLceMZFAVC8WR(2Mi0UUi%=|_Hux&`DWjSbbCKCfZL^~qqFoK*2bkss(KuV^
znX6Mej?=<_gyqmk#*L(lr&UxoN@Ekv+5QTYqwN$@-7<X#sJ|@X49_P20Hl>|tkuV<
zQtkv7f!n(CD&7A8n%L4t(}jPd%{yZalw->2gnmez`5y@oRMR|2THpv)-6>Qks(&v%
z{U>qoR25g<k&vL1_>t~uv&V#79Z;P2XQan55r@KT?#IfveH>cum`Jy;7{`_7nkKyH
zm|&g8;90I$+6Ph^I)L^`!?F~iCl^e+NygAor`lgjQr~+Gf%sKbx?}J9e};Y*zglcM
zl?c>n2;a-VLQ@A%M&`)dI0Vv3F=HmyiV7+*PQqiq83-D>_fXeF;!mbr0r*x^)VhwK
zhYx8~y-FdT11wGjr;*(WFJ?<-(m7+Oq!O@#2+fMf^;9<j(6cws(Ny%uP)SPjMKjLA
zeWacixvYw^Gjh`6F@Ea!F>)i9BZ8yOtEH&Zo+g3s*m6Khbx3t6EaC*s@8m0vq0{{r
zI61$=KO8J2Tu-9Z0dMJXSDrdKl&@x+N&-@8B=)?z@w)#2*=lq`=9g1c$C1s}Z%d7?
z3~?Vf@V1&;W2lL{u`30GyoDBurhqHh>Pd*(cwNCNy1po?smqu^eXz9})h_Kl*toV0
zmz>L6B^_I$aV4PPM~$<hIW$ELTi}$#DLZ?V9ch+2q5RRg*eKmqjHrlIM{DvzsAX=!
z=*})Lf}J<)5=r!KdP+!`;~bVOlNtX22)f>!baR>DaSV2B0?O!hPGo_m_7<}Ao}R6S
zrVq=`ZE=EB?~JTwt~6!k(#suZwA}enRA`oN?Uw~@UriBvp&hs=a}!v7H;<xhiKS>r
zHPbxew@ozfKHMtO9Zx^09q?{I?!6OOqGzT_x7A>^J5$uy@pU+4Z$r4ztkUL=yH4L3
z9;gbr^ZJe~k-J{p5UTW=$5P5Ah~77H(5&?@PNp$e6N6=LNdBbmMo}U4T?4_t(D++^
zmm<0bNZd%@)B?lG=G0S{Gz*6Cr|E5GqJmI!gOTJY%k2+#d&f`Jg9w5^E<32YjgEna
zSpNV?<!7{wUK)ya)I{#y;o(_TYOI!+vO)`O-7IBbYK(<`y8i%LN`2d!cv<S13njP&
zH1qI{)+w6G*SZ6Cmt1@*>VjO|q!8iC?1D)g?d(yqR@mEjVuG2jYt8NpcuHJBv#nxz
zJ(SF~NG-p-4t%N$WMXpv0DJ5l1&WSnukUU_QPf8EJpA&XPbHhM_VTg?5Z%zcNW+Vw
zfMrBQ+eQ0@8-Trt03K8=d!UlTAeESIh~#6VC8r~@mX=3GeTLWUr<e!Fya99YlAaRg
zk;8`zCT4=+kb%9oBe+C8&8lDn4jdI<3!KLmoDhf+IGyn1^I_R7Y&K03jBPBDr*HE#
z{{WPdMi@W_?K~8;@;0h6*B!Dq3Mi!!ywg-%G29;oV<FLjxC`ZKdSR5)G)CeB#}`>C
zOPKAaw+{ZLH5Fu$$#}_Zjp0W$T;rg}Ox1N(hq<P%k(O{C=7o)%ou#h97_#&}pVgz(
zsr@+|1fW=h-BI;!jMg>PRMr;#O<cG$xWA5NB?Q%@7wWh^z}m>B%Ez!CLJjTQ;s7Ds
z{ZnG~8eChSA$k-^lT8boXE5OKQFK!WjigxG#3n%_3wF4Y)6c?=NX$?6yS>3o0GZ${
zaeQ2OOoB^`I02g*Cq+AhM(mF3pBQj2jQzZ&qYrp2Al~gf70qj8_Jd>Croku;*)JYE
zCd?fZw*&3BWX9}`!R&vyS?%xTO&M&>@KU|ZsbB<x;4o0^FOE&F<abKVM6yC#?{0Bt
z4=8wCV|Ckoo;)H<_HN=c<H~|-KJSl?;Gk;zCuD;7I8*vfk}b?R9hFQ|n4Pfjc=%Ha
z*F@`qe<@vsX_gebgSMO-<K;4F3~t`v)8fhTNgYIfq<r@t6!A>S2G<X8PMMrRSU?ta
z@|Exp)ZXc3vrWLqap5{C!*17LAJR&3Xo6S?{v!>ZJA5T;gp43uIC2pVc=!lsun9M`
z*$#t42_S5D1b0Kdu8a_JJ1Y_+nmZ9^AtVm~vEugO$XWu?Un>ioZO17hJ3#~P5e;Dv
zC-(`mMW0qKdxR__2Vm>i@NdG7rG>fe*-N}0IJQFV!rLBh)52>5RzXcGn0e#-qkT5Y
z-&Q+ZauAbKmV26Tx(Ob~UB7UH3SkWH(~pG5LL4sJ2l?`(d1TR<1{^tRVR^myLt$#h
zLoAUx_Rn^wK1Q|TdUqDP$Au}0vNL}c?uC40919dXK<lGJrR&9vw3#2w3caAzqkdZ;
zEO&1U0?};$0A%3#;6AN8&;86La^>-qwuW=$sh3@4q%v2!rUroSNDC(mi1s)TT6?WM
zF0c8R3ns&@ZdER&2=z>i7CqAV(v*K$3dou_3$)qE;N0JbC|Pmt3RaNdJg)F`Oh<kf
zG2Y?`&xF>J*Kvg-njQfdASIxtLiP*Yqv{h2gFz0+>{Otg!Gw@}Cb^xR%41m_lCj%e
z=HK0MYnhHh?Vul<A<>B*z~=90IZ-j+2+B9H<TbzoRCRRQeeAIv?2$`!9y+jM(BXl~
zk8fkjo-fmIZ*D?YusB`3r?3zUj9G9uHtwWo>{E6Ed?I0Dk<B(d6t4l!yKsNXOKlc+
z?vnPw$SWA;I^2cNu^37~x0KsBAhu(oJFk91b`A*2j{fV8f699t9x;R65F|CtxJ_wu
zU9^=U1PlzMa1QO1K>Hlm5N@S?qyqSNVulxG#qOku;EUhvfWxniuDCslQW{5x4(a5H
z1(YruaBfHVSi+D<#t->Yz*{Hq<pdMwls@}h9zVi%?c&7Q-JF90p~aqr<2#y4)aa5H
zhKt-^0c5v0kk{aY$nLZ~J0{=&^N^)3ipTmldUc!u?5$$37O+&>VIssF5UtqYMgoyS
zc8hVskPO@?SnCc`!>z%(QxmiYG+bpPqZhDEWR@ysk!$jULnaF>Kyk{5iyNFH9s#-<
zM%e+ZKyC_(M&pE~<P?R#_d<dLQyDEb=iyP+$uuuFX(4GOZTUmZPaMo4!|sP04bh*1
zzCGcuz*a0H^)TFgD!p$@ER4w=!-p1C`ZliUr2M@_@r<p+7Hb-J4}{0Y3B8ijy{}_j
z#{v%sje)@m1%VjsK8h)$ByIs5_H9v?gUHGa2KH4t?KcTTfSj9s(RDE3mf=-Z?v2~C
zg^`=EiAD)POkT%x^ioArxLMY^WlMvbenMrSp`uXnl*bEO#n6v-*Yj+tVV8hK!gM1E
z5Vg&-c|5B6`d2jW0^UNkrFD;MDJx=Rv64AJ*XYYIIg;*Z_V`wmu}3s}nmFYPQyZdn
z+S}PbPpJ%edrgSsCzP8)ID16XY0=aIS}fp$mW}aUrJvbosl6(I*%&~1?4+I+Og6X;
z%3mv59b->u$jJuYT5O?w4%v2#wP~i)$iITC=A?WimW|Es3V7xgSgfaE02aNsYGl-{
zAifu1BkEvl^2`(rW$-@0U~(5ka$3;`3L?$+xMgrYo_QV74)muOw(o@t*jjeDdwVDB
z3r}G*>|~7&Y5OSZA_b&a+$b3LLhHALbaFOk8~{R#ZY;GXfClKzfw=if>phole1eIZ
z4b2wk<v<y;;X0C$Hx{%G=uOGB!bUS`@Qi64$|^cw@wv7M`3uFcD6flxoisth;8>%5
z0@fdI)F`9`3~+}daL^=AAcj15<w)>b@;(zJBlMKm=GfvKZq)i<+9qR~d#8rA?X{54
zBXDrYB|VZ_#3XV08A`S}(QP=&W1|FTl{;h)7C0-M%NyJFQg(~QsUip@mX<)~UmUF_
zpI=R=Kq8*O<GP_H?I57s;{>~yTm|?_(wUlZ+BCHkzJu=EwD3Y!5byxy2d3(ttU@_W
z`~s$y?0)F-3XGuFWg|3B=*w<yQ(8++`5dAtWo)tSb-(bUtBuVb+lzcC?J~)xi5s#@
z4pV<B%iN2q;ZpWHCn(xl!0cY-H8d`)k<dn4VlGOrs-+_Mxa_TCcsb|gbd3&gHwl!Q
z7Ev;lwC-WJ2w-k3d0M)fM$FeZH?pFx)1KRq2>ULGPweKD0GjIq;Y%E(5Qcu{dtGq3
zq#S~-h_&`uwovh7%6na7by(R8asddsY1-leBMH!<o~Ag#QZ%0&C|Usk-pAoQW4T46
zCq#l%fD%5$+!VoU4CHfU(&8>YQr5=34kU!(#qE^PM%;Z9UE=5JjRCek<AOiBb6>~`
zF_H1%DZVX)tpz$K1fJjBBZaeTD1jo`K2*@S7UtJJP@`EBnoF%~S#_<OoFWTPCyvRE
zX$OoWW<wh5*mnv+Yn&*Jz`qtt9ESbYVWH=oo2c+YkP&R06&spG?1EynF~_#wx@iDA
z9lR%iZ=cyA1F=nD7+fq#I7}A0bexPP2NLg(m8do;#qbgq<B*r1z84+|<p7bE_px2}
z3H^w=ZGvP9D(Lh&ih>P|iT#$-rn*&thg8PVZdR8;(cxr!%x!m!aI}$W<i>V3*zmeH
z(j_T<l;=g$X{mqNVaGP%V!EP=7^U4$5DoZVmo}dFLIa7g<xuqwolg}ji2zt&l#+#e
z0+!D*6>o~6q+g2_Q>w)I<lf7YRgSLavS&5DjuhQL0IHp>c*0bQE$pn&^eURk?8wWn
z;4ez){)n_8(#M~o)AWv)K}QQ-=C<T_<y=pxQb0>uKm)-}<h=>ID>UAirj9YXCfpB&
zQPuR?eLWk1Y<vDfD_rX;T4<ieJQoh$SDM%BbL$nLIGv>9!j!H>5=(3&r>NgOOSUlW
zCl*?F=;e{P8(fQEsXBGklynZ=w(V~zm7PIMV=e?1_*8PGqHAu<<eCIRthn3C=;Vh>
zoyCr^BF8+ZY8u>6aV$3FW3_6ks=9|q16=Q-oBg{VWzMUv#k{$IZYIjEn^38Dyo)yX
zL23F$W9J{3VQ?i}&jEw@K9|P`#iZywU$fai2C3nafK@oOy6e+ws^DZ+b4S&D`OsZR
zbZ2@c;6~$<eip~6dbl@E^&@e1ISHjEnIDbWtk(LPl8z^P+AW3RU4Pd;tE6O7dv9)4
z4!zWsm9Bl>{l5gPHEdNim2PM*b<Px;a%E!`5UKSEbt;{%IC1j5xA0%4qKa5+hC{ob
z?!1pn>AIR&n^h<_z5!n6&~>e(>7DFw4`{dpl(Ux@()K^QJ$@!rLl9}T`vp_3>eSFv
z%M;wt3r}_BHJ^wxM<HXJM$_G6ddIG3sGDqZ8+W&b%aSs_G*%5TFU1W~H`bFIh8(lH
z4y4b0+&Q?qqSq?st(4rj+@gAVf$|f$k@C85!-Oe`np~NycCJKL4<qPRCZRO-QV`PP
zZ<KvLp8o(`#%@|TB_1f55f^Sx!s$|@oy8OsIysz|OL9*DtBpHJjh1m78+{RxNeouV
z1a?K~lS3@7WyW~=q~tX;PeT(OGg#rbX%_ijp31E{K9-ofZT&NQ{TH6mMH8hrHa=Be
zzg4KoB$PC=I>#0Vvg=$_Ea#QVbd0XEshPD023!DfW$FI_f)rGmg>;eEH~7AvvB$E(
zXqqUByc)4{eBEEr>JQL0g7~B?ZLmj`80C$!(uAsyR((w-ji|f_0M?sws`{I)H29)-
zrz3aU0{pKd>JFyWHEl)AWR7*sfdLuQy+2u1Gi0a_c|FMCJD;&sKErGEElXRMWGsHy
zaILye@cq-&dbO-`%Z@iKZ%B0PP)N<}1d_J$Pe-T1=3R|@MZn=hCQ<m&iPd^if;~9G
zVqnFvyp#PfL9cC#E@SWe73kez)|AW=vN>8^ayedYp=u7Q>KDuo3$CFC+hw|2K91?w
zDfL|%COx6sST3I>B`gwtTv#-WSylcU*0e#f&b90ieOIZPO<qX1W00Py88>t#3^9IY
zc2qQ2U8Cx}udQim#-mXi2==(GuD`AbDGfs&Jx}tywyL%DdW4RV#Fr9DQRT{CsP(I5
z$4NGtt-q9<fOrJ2N788Fpr#IK76U8Gv;pW!CnIXVuj*+wh$6e1N8anR8{%@wTcm3B
zJzh8@EC+G5zzT~}*X8u>6CQ3afx@}yUY?Uz{{X6)q__*(=&f(3Y3QeXa(h~MOOrB+
zvGL-!O!D1lTGUG()-c%Q09JmEvZ_hXs2ol10qngOR-vMgaCa*(+G<8>aS#LJ-Zz2a
zbH_i(=(Mo$Rt-dDsnp_?gs=g%#CKk$)1Q}uh3%2RI17uccCSSSm#KzB9@yk)a}X7p
z)l5Ts8cy6ed?%Ht=t$FK--%UJvu-e!f(4C_D*({hshJ?KbY&T<erCE?Ij+NxlrEpA
z%^dBG<d9VHTGK0$bkU}z)uI%!xQj^9lk%gl>PopFF$cH{V<^2Nr{%ACiYDFGMC*MU
zEe4M2mk;8y#@`B-lcGvCWGSgDb(*F{9F8QO=Y=aYM^nuB<^4@L@UD7(mZwarg1PLp
zE_a2lZ5=M5s~IC_@XJO1N*t-sR2x=hx_eHEv&QES(%?a|+v{4JX()k?!P`e3R9fDS
zG~*piEwdfXyr)N{J5i@(#Dd=8S~FBl;%)52YW3B+joe!D;w;js^xA5l&$reVAl-Vb
z+BG#iVAy^8Ds4`Nm7vJmZyW$QQF*sTei}vJNoy4J)DEYA>bGz3v0Yu%H>;4u<Adcy
zCzX{%Mo6~{E3bOauXrtY@iLXik(1&#sC9=_29{uvl^;zBYNrB5JIEzN4woe5(Vg3^
zaq_g?F-@??8;EYxYn8PXLEN31w&?7Fg_Uf7sMn0+f~s|AO8D4exhy;ds%2l~>4ht!
z^&xQNb}GX_(dnw{MOUY}j~}P9SkA_Aqt7GKwOX;3IyRh_5T&7|eI0JcoD70jt!lb_
zanS%nSQtOD^UkDfW=6?RmiKqhbw@u$)J-0bs8R?TUO^)V2)fy+OhN1|7Vxkz%P0ff
zR*R%5Wz?!&9H5qrSfb>TwgnX@p}M_W8qnt4{T6%ka#U(eX^5E49Bj6_ri{vYgQR7H
zTt$^_RUA-GBx6R^ADT8<VsuwaO+6hjs61}6tE;Y_rdHEL;!DUD3s+S<ReE%^go}pV
zr{!VkqN$_Q#FEBE&$Oq<mCD7I6t;SoN%Yp9?Fw27h?^_wSVP`MZbHvc^r6!ymYzaC
zg5z(eWp_!g4Kqz)%cgL^Rnlwjosx<F0NimV;cRk~yB0}BXs*_u6gF@m*w~d<scI2P
zNn!=9aH@6PMoDIT5r;gJzzVJOnxya&@L1OH4|Q6hD&E86)k|(8Ho5FjI+3fYkUk(q
z`TC*gX=L?mPFs?+urY=J2m>BDDdLkBPM(Omc2`HR$Vicf#d`k$;nz_L8II=z6oSqd
zULmQ=`B!g@l22f)dRJJRc;CBe@8LXU#73<i^{eVMvr1}rgJaoYdgE88{EOe}2H1I7
z%FS`mw75L&?k>Fdt99x135;zn5sug8JIJUC4(zPfbrVrqY~nyT%8GI7`f^*~s`$Zl
zw<}%Knn&khX>)~-Wz5}nRVxb7jFHnZ);odr{S}PWH7=evZP;Cm6{ypCY=5S_HNN1>
zsG!ruO*ykbdp~v0EQz{0VUJeLm*M`O7MBYvTwNoc1Ds0J^#x5R4Xcfzj3VH8L-fQE
z9R;QBxnnR8`sSHcsc8-|U91kaJS^8Og=wCf)ACV2MW?T)EiI9v_VT>H@yb~tr+sx4
zg5X);Df&B8pFyCh(yJvVBGTxb<KM#a55zvQn^d3ju}kdrEI>T1D5*LOUj*1MO=;|^
zsBF@>x$kw!<$DKD^yMSrVf4WuV&QqGN;){$$DYg7^c`jxV`r##n<_enh&egzv>HV`
z48s~0XRLh_M(CbJhXGsb{XrCQ631Y#H|i}~qPgc_APg>il5%v4V~?{tPaua=6y@cS
zIoKgtR?)~LY`aUEgPTaInZBW8n0aZpb#M9TztY(R!QQ-hH}I(z;`TC+D+I5M$xI6e
z11bs#B4gO*v>TfrgpaK(h_Spoi*kpGSs@O4*!%VtDd~vaX`1b@{{W}R1DYPdT;G+0
zs;G)xRn87*F3I|$rPgL-Vn^M%w%>)C)GAsl%#mMfjnGkdVU(2{{*|wf{Z1GpAaC}M
zs?zEjd~SImyCuFI*sn3u{d$*2Ej7d1K?HeT-q;(dbi5NsZ(IORoz_W`PA<{0(^Std
z>jPf}Kedjq?h41n`O1e9BYE;bUdmvKv8FkjwZq!rLY|AJXsF10V-92Zx+^MunZxL(
z{3g<asbhI(@k6fbj>~z~vkDp@L$-~%Nz=3u>GGM_&>DFIvY`A%uWZ_U;5yj$<$1YV
zmP63PQGw&tm5#0IdWRcqy_!~&NYx)CZqnrU?iOGrV|MygEG;K-c{lF0-5;k-QPdDh
z;d>jeNkK{~EZ}o+lad=%p|RIw(Tl4O^r(iP`Iz}&v)Vt(+V#$mDfIT$!pnPZSDVpw
z8)<4Jr<4P~8R0BkqTEK6Npcv?JM(jhottnLmr3d4NcPHOAdISwI=U$986#|cz?=A9
zpGfLy=ouqOHy2$BL}a(1c%gHkZ?@vgGt@dOUf0Ohg{_9NINIo4Z-qs#>P(6^gTj-Y
zG15HBx|{OT--U6cS2{hXKL{OF@2Hi|U?h36PMmurm`3xEcvVtqTO}l{)oSoXs%hS<
zLG_p}K2}a`HN+AD!t{MVO%g&J&#jWwXz*-t004eFr@Prck>yns^3zEiyH4BXYC2y4
z=Rg?0P-GPhoc@#gnu*jX;0=6l13Z0JUP)U;E1Q39{i-<^BG}&(+_e2p3AFs!hYT#n
zsA4t1kO1uB7GI||TBk;0B<wsZy+!VQ7$p0ExF|;hZo@3Aq57ReBBa>TFUTu7RjoL{
z=$!kxynL$dQoeVR#}X}tnx1)IT*e0yTy15ZC+rGH+UQ!Nz>(X%#Ny~ar_>(|E|u6N
zz*!Zb>CT$6o;IIp<y(Fsbi3x$T3~0m3!8aT__;nv=~)yNKFSRh&#0(jj1wEh$HMjQ
ziik)fFT<E~^1P3roFRMZCm9$7_91$1hp38YHN)st9<)boS?T(eFuzT^K(TM^SB3r}
z)5c^aqiliKZM#`|%^tY};dD|w206GlURC&n_DxXtG2QGJ8;|aqFA09FFs_tiH7zD8
zg5Tpe+aU5sbtbi@2gXL#7vUtWl4nyq*!Wuxp`kGF+%G|<k;>i5k0aD+Dj@^{?`~~$
z1vzBZP4%s~8!fJ<16=0<IpJZoxLpLL%ocFUnr_2JgWX3ZiT2v<K0?Op)4IP<co-M4
z_*#t$cIvuY;iz`mS}wvo_*wdj2_UF45KDpgVGcjG#*FPz2TxMIo~$^G-Fojyktkqw
zfUsVBNwBf9n*!cet3}o0gaXnp^-V04iboP^k3{sF4~3cQtvR}`oc6R0;1w{}g+(cL
z`xdI{wV2CEFSsEm$fejm2A!UB(~qdo^=DJdxzIV*vEh1yp{CSy#)ewlx8STUu;^-L
z^;!Wp?4{7PhtN*e$ssZK7gooVN#K2(4Jb9G)YFTW-J<Is*Lq8$yW<$W!3e3f_|B^&
zt$o^mzse&~)gZ3Zp4nbEFcLmfywK^3@JqCL7Nu7+Y{$0FZ}(PRHA@zv-{Ld^a6t&F
zx=5;Ca4w6{Xw4j~m4KT&g$ZPhXn0|eRC-vTm8~qZ4neZiXaX1i01UKba;I<Q>ga<W
zGi)CPRT63D4UFZdvXnA!Wu7LHq@P4%ee5_qk0{+dG7{LH2ZDgowSeXb<|E-7Qs%jW
zSjfL(7gsdSeiAJzsNi&009b{B>dH1jDRT$3tuu8eHKsD`j>|386~b6v!l5*oY<7%&
zUZ*7^Wn^#mxLAv*=(QnRPx)z|ar}h#Dzj9MNeM0C3#LOLoCgvCDe)&;BbV(OT?Ru>
zsyBW1Zrbm^b+M|Xj;@XIy25K-H+fXLUYZ{Olnutp;+KEr%tYDojm$nrg=r@pk&99>
zH83B{IvD{DZ)H<er<PQ;;2o#?EhkgY44_p;JvrH8?$<y;G*xhigP#8Y3tgjCFs&4r
z0NPGCR?e8#KEUn%rB_1sT*TAzv>HtSs({ZC_qPsei<K6PZ=gA-T3i|i^Yl|`&2=Q6
z#*v=N;wX)*1)bea+ExHxgXMEPg?=^c6H?QnsHHUm!Ne?WOQoTzAY2|+(^9GsQkF92
z$Ay~IoB7y`rai6$!sv>$BW*DKH&!*2-h<9S?w(r70qk#;nW1d3)Rvooatgbn-N3nb
z`CEeQ4s5y6sv8^qIgaL>0#=Vq)L~$C8-_`{50#LKrH=vF2ZD`hF-p+mV$*iH8DmWY
zoAzj`s2%A#U^fHERTIwIGwGWUe@XuUg?pvzG}2RSn6x{B3FT$_x}DKX+K9<96LD_E
zMv6t>W}iyiSEUeaBv_8CrY+xbVmVfQJF7blxwzzcMRi;(s-XPbW86Pbzbm1_<Dx2b
z=<_(7=_L$l_YMlRY?BxWxesVnzSdQ5Xtj<)y`>RO!0rzUa&(G8TclUhYA+xMUj-3S
zU3l&|wp8^xa|tFklYa`bS}K4`NI$YFq_h^CdlH%EcbAcXY)aeoq;OQUMKBg3%ORpc
z`AWdbmY+rD&iKD|uhZ$I(rd#XnA|TL`w*?;$wFLN9Px9HBwXrUJ9r6<WDB(0m5bEc
z`ci$T9IsT<>*1Oa8_2z|R!^;T_G~o~H=aQM04ugoQb#0a){Gmfnq|Gfy13Dxbyi||
z^%<LAm6z2TV<GMRH%I6io2e>UCgW?^t{kwVsuFEk>6#sUv`hibC4&!Y*Xb>#u7t@<
z=AFRUcv(F<dTQ!1JT7kgdxg+++Kk!`rrDZYX(VtGH~LSN%O`p-8Emuax+5DTE@oO6
zo!8Yq?_hVgvi40~^t#TDWP$B3+uOSF`RI(Z&mP^bW5^=N!fol4anYPFduAubL0Wwu
zT$Qmf7ZY#ps2sr^SEnXB1bj3vjCzreZ^G!qkt3Hfvs+hRNnJ^2k-pv5KU$z<vI4+J
z2I!c^^Rf2_vX&je{+xhr9Q>=#HzHBRMYm3AqFM&qBoA`D)1eg77@zhi9R^VYngJF+
z-Ct@j31Do|+a5a<o$MVt31isk%u-me;d%c6Tj*Y$L8yRThr-s=%t$SA16-2yu8K^H
zSR|Z%qefMu%;Kta4s<TPjy{MwxJ<3~gL~kjHQ0<bMBBa*+AIR0t+3A-St~1NXcur1
z$lFLb`C5v4scD+lfI%4wz4~vZXS7&_Zv$hfr2ZxzJEJUNj!RU-sI^k#a(%#eQ`Blr
zsJ8*b`>fpeiS`GDUstF;B3#0LP~z%=%h{u?tS*hsCkqwSOmu*_bLCpn*T+`@A=Yr@
z6b);^=OCy&bnO?6ty3v<s;MBT4UiKVHa`mLXSt3386}R$Lbiu}q-I)tD+)LRTeZgH
z{3ff}lOxk)E|e4PH_L6xzMg@Oi`R{y5&D4aswIKUkVwEVaIC4TkELUR20`wnk`J^P
z$g|PqeJpNtPPn(Zs#&$r&{$n|IQijLQ&z^w_q5rkkblB;eKc<$n5VI0zf(e-KbFc#
zTyz}_!Ogih1o!ZrQyXd{1~cv)A3qA3f>%c&iRR<^N-#+Fdzf#Wh1#@nzQL+m9d;jU
zhanH|2iu7naEz{FW`xYo_XlgCA$X7naQ5?+K~o8V-<piM?X->kL&{^IH!ff{9Hpmt
z55Jz?Rg4jf-12|AUV_Sp2NrE3EjTE5xx|p+V|9I7OdQhq`Bd^oOS8{p(RL2bqj0ff
z@)1!DvbBWT{{W@P784une(3fwkB{K@1qL5PvM@`)w5{ZMPtq!x1wayyVK#Td8W$4%
zg~Uq3cDu+;n1@NbgTsQ<V)I+li$JZRb-@?MbxQdgQ4!qRNI3_UZ=h<QmnNE^?t%Ev
zWX_?|#7}KqGlth2i*Qo6OyAK}PcvQxG{iKI(&D2f@JM$O2;sxJY|Rq1J-*ksl;%t7
zH`9;;dlXEG;I5jUVN*`x*#=xZg>zNZPOYR4wn(whb)En;hPdakO9%{<fs67!RA+)R
zcE?hrG3_!w{{W@q`=kNRcc{QOw+<du^0lDff;dsg2tK0?h~-@qV;l({t3KfsOdC-a
z%i2NNL%Fgydr$uWP))m9{{T^s+V11Z%qMO!xy*J&)1#HlxxK;grG2X-F9y;N9ncLf
zW1I*-AfgmlxCvSw)9wl<?-4i>NF22`o=^tc=eNpqvf2BF2<0fO1JrbGyA7;vixW1Y
zBH}|{21k_@R84U8V-^RI;R@V42H*0FRvQXqiC_d0)BTg$Uc<N#Z~0E9vySGAp6xyq
zu3%^u%MbQS5P6#%p60h5!jIA*3yZh0Q@S@W++=ntX18+<$Jr19M(5K%d}kl!6zK%5
z62g7M^)*E1J|mXyVdvpO_}v?Xu$*#0Sj;?5*SCvX8Bsbw*O1|GbCnBSya{9HxJ`VU
z+qK{R1jY&yfNV|M*r?qzqkoWvW!da;J5L34rOmTnk=U$ipte*s$8fjN62c_`uKm?E
z;?gaGkE5t;jkAr9aFLnsq0`1=b(96-{@fABQ`AoGACNdgRC~XP8L>yO_1OOaMY00s
zjjtSpJH4XBW4KbqI3t@ozsgAnaoj%ZEgFQ1OA8wo{H}a$IbpYj9I?0p;rdcU`&!1u
zFbSfuHocs>c909LaFzR9(DvLO>PTGIdrllbx<I{=Lh?M@x|QHK0tLZLnj+70EEAx3
zck>+bv->d%qtCYmb8p;P<FcMcdS_|i_fX01c5v~>$|-_|z7ZfYL+y}q6eee7uLk|@
zrQYGe+Tf&oO{s0b+VTC;xURwI2mo)lj|uLKhKDrc%11!>-)mXj)Qq_AgUIlmXg!aN
z-vnJc+fBkoG+gZ_$>o<Dg{}S(&?sz-5;PtjI7q<PjgPQ!?z!VPCn?Shdq+FM!Lm27
zf;S7_`=&`A&{|OpcJ^&`gOgifc06<4DS<BL8}N>%oJie{0Nf}X#@lPY#YeHxKK8;{
zMKGsCvqE8isLYP)M#jk^^&>Yu$CQnn7VUmPQ3n{L-5=?{3oA28^dybu!o(&9hvX0s
zglXA4Wy}_JzjO?svDe^)Qv)0eUc$!_bcLHuuW{I}AWR7s4+$WUhk9}gqGC5;-{o^%
zXK{pNl%$)m+<g$T#^~Ndfd=bZH5}$QkfCraHwjDJ1&Wd{;x~+r-ctb%jr*J6q&B(o
znp?H^93^(^hc?II1QA`pzu87xv=>~3GaYvu{nt5y`S${ehQ%e0LLyd&GQ%N3ELIzW
z=w%@6cL-Uijli_zVKkc_E)kM2Ikz8V8=65pqA0C%TsD+ulUV9HmKT1Li=YTQu$JVv
zX}2k56wqTTXQ}A5QOOHl$Af@ut<1x1#lAxF4I@^l)8@9~W4=Y!{{TzXBdw-unD9-P
zEaKvHCYgWv)(m3{zdFuAS?Z}|1eTomK)$|M&55>9N%{_rtW}Y?V5!AU+Y#Mjsq61&
zwa4Tus%qBBPjc+p2F9v14V{h`1TJ%$;cTp&x`UvS`;C#*x}bhbuk|P@32QI3p5YE$
zdoC3$kYMxjklT=rAlWNOaLQ}&3BS;w>M9H;e`N^Nqj<^Z<puznkjYqD`z%*cY0in}
zSjKx0v~@LB7Y5-0Q&$|U^xtKZpfayP)}2g5GlOfbT_t=nv^lP|{#FB4Ya(%Tc)u&O
zjbsOUMc^I<%4Zwe6+g4nM%kmdAgE+*iMaYK=AW+mFAb5vw(CO;Wj$0|n)c**NW!}#
ze}^Dyp=+)Q$~s$daDl0Pjf;v}89OK{*yx@}z)-fNy94!jDC*J(BL4t&M_4wzxrBu4
zV=#%I?!O1Z>Uk`3P!QGbJ0EL=^70Mu*&1j|FJYF=7E&4S-r%Y_dc4`l!7aw&`zD}T
z2&rpjVYUsG6;}Fr3z%%K457mq!UIum_>L1Kg>UG7mtVQ#YxcZ$S_mqeGXQoTy!r2R
zQ*H*ta8`pyt#pkIdC2agmlbTLIjLyX#`}$~7f+UyNXrxjB}+)!<DZpjOzaC~LB@)y
z8O=(G&=U5Ks8te%NC>r@R^q-UNXrni`o^5*lOqOv`BcR(vU6H9(>3tE>`rA%9NRo+
zy6N8Lk{mFFkhGhNS$8IKzQW5v9?}bc!fl-yFJ=Bv(8}QMaEWB0%}rKh+(IL$4g&o6
zNg-o}xICdGW_L8M-FA_Dg(r@>9ZfOMbD4YPSZQ@lHe=6xd@5rzgZ8-n7dAq}xE|=;
zX_~CtG8RhATk3$Up?h7qxj<<;xnT^GD*8H@=4c}!3uB`_EJ6MO3cjirG}`9NOI=Ra
z4ed7aLa%%w_iKX6bSsUNk;+<Z>yW2u-THV^)X=<L%xSgM4T@G~%BpFSacG&Z$UVX$
zDMjq#&y@gf=G<VW65+}XCKTwgENQtJ2f`Aj17Zt#T}xH5!KaSu$8=J%;>(^&nRv?k
zDPv({!MeVpoEU>%Zh@K>i|tL0U57k&S+^t(C8f+y+|y)zEkh<@Yrr_RRWl{t!f$cm
zAakR5BKT62ETm+RcBMhL-5DhV8#WsrO0uS`Y>f<g&y^iSKn=hoO|3EAF<_I1y9#$W
zSX;uZZ2L`}ghX;~7X%x8rf5Ybp34e1jn+NUQqwY4;3}aZ2ep-j6;<pB=gOP3Gv7r<
zt)qvqxr5!{EWJcBQ#^-*ju)fK1g#cT8lIfV*yFb<`103er;pi<4h5+Li%r5KQPbq6
zd9~~iPI(wBt}Qia=WAt!Jy8S#RfKW}_gVIvsp+a68TeF8og(uf;>ngI@S>)juNf$Y
z*qej&TSlTiq#FRZxZ1?nsoA#QRL8Ji9guy63~9~pa-J`B3HJ6+Ypilg3}RM-;m6RY
zH{-WBOav2yj|xWQ0B(V(nm1y{vHjD#Tqs%%ymtyl6K{kb!O_w)$K62oTOa+DPT|}X
zgfyc=bO;G)Ch6O`3Gy&l<GO{{2gzHrSo7d;qjk^KD054=DaOXYcUfoz4&$GkCJ}Rk
zWix>!l0Fl5;E&iNVzop~y_12k%Hll#0A$-(+UWLS*0IV<4+V9=7QR<+cmDukWE6V`
zPcS$JoB*^F$l7LH+XJyxQAQ~UHnqM}bt=DB7c^fhvP~SRY!bg*g{*T6t>CO)yRN!o
z=-PJ+aE#Qns)<XU97X#m^v;@W^KO)jkfS`2uFFOZ?88ezQ(rraV>cyO>6>)f+Q~(p
ze6L0S07QdJEt$gYw{?W;Xkx0=qn?@HrKf$DGRtng7WnQqf@`{_N^!CmxLb=AL8<jU
zRD|8`H|`Y;JnoU?%HxMwH&~V^*du8hm2c3CM8bNi*+Jam)AFxjqVyw<VB2Eu!l&ub
z;_z&2wYr3iW}NJMwxHI)*;`wv$s8_YUCV52sj2EFl!liZ0*j)fsIQjMf<ar3p6I~(
zV(Hp9k^2<Y#cUR2{{YiOlun#G+yX15sAGapTA{6V!5LR|S}c@LbZ<YyCcu0w{-aW8
z<uEnbxyVZ`>c)euo9OANXQgbcjiVicSoA77mlrxQbKPWg?w}A;HJg@;OX`XvM(ytb
z;Cbb8B`EZC$*CZd(^_+6_geQ>fBJfsqfOfFu4fC(HSVL-sx?=NXP-{i1TA+<Yjsg*
zrYfhCD0RU-#g%5}qjoBaYy({BiZ(UDyBmdz&}dl>zau1RA+N!=WwO=lDrAw)Kct)l
z9+?C(86}Vg${q?BoSJ-%mMJY0bra!iVhGu9vY?^YYBcE|8(e)iV1Ty9nvSNatdYZU
zHgHtkW72M;o*J5F{{Rj`cMl4RDXJp0=*Q|3NvLWzk8o?<b7g-oMU$t;Qr2!H`<1?x
zr%=M^q;PKb^K!M4>l$r67S~A72<_!%B|^^Aqsgl}ayVoSds+xRks5BBwo5U%;T6<c
zv{UL$6z;g)$ndoNAx9ML-7T(DU5vE0XDcaRO96RdC&^TmRdYR|tpt#JuU6MI>UUEH
z;=uM;tyYGb4bF_;JT2(Srecg$lGGNESPku!VWd+}6VCUM-;{Kc!qPan@St^UEqE6J
z5QafC+lbslgRE7CkY5(8*=85L?tG~9cw1E~g|bFIt6`()@w_$F09=1`B`!;g6N+0Y
zE9peqhvs8x+C}(OJzEiLV|BB2>Jw7aK_14jpb^TU*7W)+iWypVm$Y1ckc?DNWj7~m
z&2%o0O*K!cFdK!ASF2J}(Ln=4O9361lT&I<(+H9yV`~t!bb5@MuT9j{)5t|c8L&L0
zo0awz6xpw?*XeZjVePw5b>;s6h~0BhElK>N&8@cJ*;nedl@i2cmF~G7RyMX_ETlce
zoA*L6w{3>#h{;o3F?{km&Nt<3dR~q?S=#b%fI&UhW(sGR8d}0hI3aAbib|=YiGhS!
zpb`~YYoKZNY&5-P^sj4SaR=&`U#gzIM$aJk0b}!I%_~e~EW6Fg9F&!{5k&-yb*{_>
zDLO3}rf0g2R~W-P2KiZP63@*L?*3JeP--FXw(N{7#I;08xvt94j=?{pQu%EanpKBQ
z&^l_s`5Swii>hq~8S4W`V~7|ldqqn6Mlt(&0O1)+R4ijm^?$;n1w5t)00V`VXYrb8
z^vda5w1(d8KM9&1srgsOFm~UNRNsnvg%+=(Ls0n|WDVMLmB}gow9be{a=)|2E48U7
z4rwOn?v1C8qfu+BGS?dwngNZ~-3UI{94$tc@5@=t?cH|x@Q#_wno{WXO3sa;)oCG=
zyuV<^c*67Ux9P@dE_2)Z9nMwWmDW|XP*}To`mE1g^?P+HcSPn5-dCe2#;D^`m6)h1
z;fhBw*1<+;?G<uJVabSYSqi5+*K>h6H^S2NJe4uldZs6q7VUO93x-(f+B%~*RC<Tu
z+r)E6ERldnu_wa2>pHqt!uXm4-0^E37GFqoqMvgdV{=Xb=F0L7B<dhN;qQIza;3sj
zm9o5&GqsMUIw67n*EcK)oj+e4Gf9wu0K(Qy(c)M`ow=pBvcq*onJ%328sBKaAR#!=
z&~{#Gy+IvSD<ULWuDy|6A*|EKDTYJsaob|NvTCWrwu8rIJuQ6j)VFbSUC7GZ9a0Z9
z^m-n-sDSyQYySXCur8qK%^J5{m~IYiH|0=LnQN+quOyReuWS50ik3Yx{?O(P$s+|F
zuum(hN0Ie5hV3f5+Doi?DzbVgD%dR0>2H;?{7}{Dovu2H1~uNGxjsCqjVg*bL~}aD
z&o(E*q*d%kFGVbRQ{b98wg6gg0<+ZVX~2%67PYa;EZ{piS?l{LqGQPd+^jyStC3at
zc08ENu0{AlPm`o*{;Ou+r{VtqP-7r?{XW+pD|w^RvVs=2F@~P&ANYSHI~wwGa;`P)
zd-9lwU$FzSm2qWL<Qdfx`jM9zHZ+XbuP@ZKI%uYnk<J?lxcaMYb6KdVr*wN<1+Ki)
zQ*86pyKy)-<z$?lhSF4RX-slCq}y%(0ClX<Ya`ONXl1>jnSc}EtX7P`{W>QBk!HL9
z04qy16#9;p8ySNbJb6z)+eF~0mmPJl#`b!VIkqjx9zw>_>QmN81Fx`!cK(-jW{D(>
zbGPg^A1gbcH_?~Uk+v;yX$4Lg(kspB8ZMimk?xpEE`OAt3QnM)fsuNSds;^qQbAKw
z8wqPfdoVs$E2{OGWG;?ZlHtG#&YGk>Q?|>QYnc5q`+=2)-1blD-6DNrpgr<BIJw7l
zhSTe3e4(wr(sI3bq5U{$StFbpY_eQg3AFkprs-Np+UELA^&8xdP<qW2Fw;A8TH68&
zwbweHnwmf$A<_|Nd=-P&^-7xBhgsxC{=r60Qk@{hB^zZ!TFCVW1`z9;D+f|a=780I
z)4d%e^n$3k6KmaA&8Iezpgp67=))6BXB_e?(T)EANA(+d2hm2#Xz7V)0DP;xR<1Zf
z4J#F`>fxo$joCs-3D}y|S!;+7BzRN-jjEV6jV^PIfF4&tB$c(BEM0yAywN&#r0Oh@
zzrz;<SwdZxi&aK-)G|d-TO&&V>{ipD=VNB{kA4rz&~-OT7dD=@7+mo70P7Cu9*NPf
zuKrwuhk|aB`7M;C7ijd3pQw$|G21N9(r?{W>eL38RGLT~XyiM9_$yCUr#6-##<T%z
zj4ZCTsYe^E=LZ4pK0@P@;`CZB%RLWWZ6t1rSqF<B3un^W{S@@l(>cu}HeWyM`j@3U
zpA>{P>hGdvmPrJWPW!*GE2%q;i6*X@x$DZ92A?B6Kpf5pIbI1_PS@)0bVbFEb^e8V
z&aI<YYI2yRmF2d<DX@MYIl5DfYz9`H*S1Q0aow>p%GDX|5r#M#>z*uC^(8~AS|e-A
zWQbYT?iF10^U@E?Iv0oD)*(Y2HIx;w&ijq#*76lHMKxsMcSeSu8p^tZPT)?{g0#AB
zff<dhd<}EEn<M&ODp?IY#0~Zvma|ccDrSizummZ^CUqpyn5xlYZ6$*Rz_Rm=b53Z~
zghk>##>B5m)-_hc3yHu!3i3X;)o(8LKizwb@RKKJMmSVmnjJetrKDqhOH6qLt7>`*
zO0k$&9orq&Z%gVLYK;k#ODkI|8)6C_-B~1HepWC;P4DF@Q*TEsoKiOJ=<01ko=8j$
z+*(H+)*n>-I+C8D*I~0sTRxBLKU!Go90P1^AS-{UnkxDuQx4Kx%b_fihhR}m@(zg5
zqK-)ffxDRNS$aJaAfSY_5E$WbK2{e})ETAf%$`5c=N7yKny*(=HLi=)Ac2gh<gy@f
z;>(>vN?};{ZUDUHO;4yco}JLh@aFQ;SDaM!J0-ae;UA^zkyq0g9)10fl{vxC>QQE<
zpR3v`%{e~9f>wK~YJWXe>PX$V5sQ4RmbX^wd7Rc88{HGqdW&i`dSNTCxxf-iSm90b
z8d-R%L3JHC_~@Tf=6@BO4~3`vF)_NWu8<4d0=3Q4BbByu1)MBaH%6tZpz5jVqlv;W
z?3GS`WZu!~J#=FK0Mm0uZEc3%viWORlt-y&HgftGtlwVk4oJgG-dndG7tfl$iK<Cn
zcfjqW@`Q56Q|t~efqA6Qzht-VVivna*QBSXFqtj4i<OM&>KWSc9O29Z;U8SXPf%hv
z1mGVlsm9}If|WXEj<Z~Jp5{20eNb^vQ>aK7>yS#%z#hu2j^OaU3#8~El88=6y}XYI
z;>4u(9GM(ehv|Jb)>AvxU^}udvQ_#-v^_}1!*Iu&73zYjF-jUp1*;vX)d}^+J)>}G
zx7l>&Nkr$y-y>0_GFoUX<8f~sA+;*V;sovmq#h3iUQxm&)5Y*Za<SUX4rNo}eZV5?
zf;lft>v->Gcc^s+?jRhjT~$}DKc-J7%DL*eB#U#dNxv&CLHtUf4?B}an-)=VR(f|r
z(|YjiaQ9xpUutmrOngt~*i~H@Ag5~{ac))DRLIF-^;mPavhIphb307)ePeg#UwjLy
z$_jGrL`%qSe(KLvJArUFQfYCqw0p&gzE?JP#wD<)DH@)Usg63Z;zk#v!s>e3GrGqX
zvherUnijf1>l1*rojuf#{EJx9;{O2nP{8%F{zADb2kN>8X<C@7h;3<hY?a#ArwdQ@
z1b)9K`o5l8z<ow$%RNs*>Y8&7StCaUPa@vK2cqIGpp(!HFC-2KC@p?zUr!XzB$ww3
zqA2E$LmZ7aX|V-f>Ct|26GuNFUNTcGOR#gT26P=q<*S)6Hr?1SVbmmpQ_>qVZR#{x
z!FYWnFQBX}H)v_&<!tn>p!8tcWU#e}y67a|uwJ2OrM}o$UZIh)L|y#LUDR5oJh8a7
z`B*x~zNPMDV*IE{Y_fKVIx(mHL9v6&t_t01nh<<muxoNNg@NhEm}^DG*EFwP(`p%4
zr)_x~h)pGEnsm=K)M#H#8-qV(otsmZk@hzMZ~B@s8=P_SusYQ=QooyD3TdaNS;?-6
zDY}wh_S*Av@|&q@b@4zX0nTT8c0khTbHh~7;B0a*wz@u$+2Q=XL}Y^7WF(gubW#pd
z?8@j`xvX>Jb?$h-l@&!)?Wz2`@3~k*({pKB%l9<x-FBN`g=wg1@kj*0gVY!)pyK3d
z^HH-gF`6d&mnt^u@-?BQ++gKsYv=>0_p}pX?h6}RNh2gXTisGv(>bG-R2bb%vQ5PI
zy4C0vu+%hM0!qqh8Z4Dy?r8-4Ee@BYPelB*@}rXuj)-Pvwq`TX1%}4ml|$tIDGoXF
z<r5p;8W`euRTWdP%vrn#f}se$j)#(wWaI2EYqFM`SDB~MF5wA5c^>%pdxLNk4yKq&
zWZG^HRpX75d86#ImbyUl<9w=(MpG-v1mzziOW+Q-xvGM?cf|4txH$;CZ2@MB5;}H0
z<*pbhkD?Jg+v{}<I-3LR=K*d}6;+LVVa+3qSge$m&@L~tNz*lr07T=9D{V-!D2&Z;
zy7O3dV@)tSyQ_z5PN;-k*D2iCpA>AY>Xy1)#h*~Knk7upR&0B$!-5urP^)XfXl?GZ
zwIG>;+S1c}s$*@USz?nmRMd_P62$wsX5Losquov^{YdOyY#!C;9Xnj<0Eyg=F1A`N
zsOtpLyzP_q50wnAyB`u>jaH?nJTT1{1ygA+bb6zy=0C5CtyrmwZ98aiB#bH{q)$BT
zou_Nq?aeAsYV5qOsE=RL<blnYu$Ue>w*^y4PRRwD-f@NN6x6i(j*a<gz%I6L=gPrq
z+Em(Rq+25n-hQLXzb$Bw8`+zz(+e0Kw1PM)I!(-V?d}V7$f@gSy(>3;tP052QAtT!
z=;Rg!7|ZNgAc(d}7`>5hiM22~Ghp_QVO21P#7QR}6u+F<_T1$eJ!lYLWld}6r<8)?
z9@FJpY5IdJ=v_%O#{Snq>cO)#O42ScRUD0$Dg8*CM|-0RXjy)y%7aP`lXD$&@T@DS
z<#j8V#}E%Hzos=oJVBBVcptja!8CF(i;VKSBNWli$)<UJx28UxV(<;Ss3|9ORyX>s
z$5GR;vBUsJb?176y&9&2hLWR`7RthY&5n&#8=lc11RQd-@@bUwusyM~f;kHVqaCw0
z?*1FCmFapL2!t`_;@B!N$HcSCWfgvn8`wiyFWSqr$wgf|v`X8F8ZS*L?0hW+XQv1v
z;10__BchW~4rl7U!SI%G8ZN`Mh^k^~hNj|H8y}QjqR-4}(#CT8aG&{sAdW|Y>NgHQ
z)DqW5=Ev*8ZU#@vtaHkVJSxv3)GjI}rI1?32sW|pW!MQLveb2+p2>gf>Hh#zP24_J
zE}JVPrxI9h9FFO^siAndFy5Qhswk=eYmU#Aqn}fTwlc?_dn~lHg``wO4#Sc>BAHI-
zus9QQ!3r|Qp2k;nX*3;DY6m)=Id?{Q1n`+(QyH!`77TN;;pI@mUmL+UxGG&u{<J%{
zZEzRmMky&BE-#4Pc8)rc`G|1tN;jpZ655ibx!@lvn@`jLagIW+bhpJNKrFCuI3pHa
zFp5m(o3v`B>BwILpBOvG7*sXXJ6u@dwnp$)%So&<LK^=7);alAolQ>3qBF!mc;qI_
zi&lY-bm^G?0L?y~?K`m3`z!r3Uu&W<Il$k_&c{ybnuo=U-?|#Mj-rZQ2(m~vX{7o$
zG>vrRzA`?SL+VgD@s>PURdn92THx0Z2;?m-VQo|bXo$GvDs%Kok2}|BWH)QspD1pg
zf90x!NyY3|=u^d3T*upgg-@vT<dpLI@VDFE%4%snmEhXZa>!$-rfb_{aD=Fdu&|cc
z6ds#i>SqXL#yCl;)-}!C!)xHKl<g6wm<4p!aRjOg=}zJ-t^{7a@7-3{z*<X4?v_kw
zqK-M_f~RvFK)(v&7rLQ<jQLcR%yVCWfAXv}Dw{|nc(M8JqcX8xi=7%zN~hD8F*w_f
z6~$dRgqJfTl}jsjNFLFGZ}e8wm125x3;zI682Led%R_$_LSDi_2ke<#&>AFR=bI{;
z>ZeoA;4U-5iMoTN8$er$t%;~=0g>E0Ylrto^zO1=(8oCc0Ngx<p4C_!!tMd(L8JQ2
zlY2q1@R7k)jHOK9O2)nSZNWKhyCtQVhk9@4%7aO$Y|yo?HX#`_K%MOw92H3QM5Oj4
zq_mRTi=gL?%>Fcde=rD#l3RYsA(5ln?l?}6jEi>mda;{Zx5~BCsy$Y1dH0Nqs%nOq
zB=+H_vXYJD$+?dA1N($pHQA<%Y>gxzssmA^4FT-qzrv0g-4&mYlzVC!Bw@|V9mw#J
z+6qQ?a5odkPl8hc*ndGp*3<fLE*98Oqylz7gTe5bJ3%L?X)O{)>-`igmvG(u+#i+D
zx$rw|hU`2Pu80{o#zxX|5dh%)fP3(dgHW0}Lr*uoovwIQ)3mT(wYjoqskm%+J&>z2
zA28hQ(R1NF)Y3XHPy>JPnG5zijCWSluV`Q(-Zyd+BnJM9X1us;kXViidAqiQ`tO8g
zWe{uk3+#6Uc0owTGX#5wbQ%J76vOLASaBf!>H-OF(kw#eNw{uqByaab$Rnty^#I!|
za7UEA4E9#Ixr1{)<H~j=VJss3!c&58_X;;g;&(-Rrec!OmxpB7g)Lp2?ZjEv=gR79
z$_vIMZV2+FmNNDbN7LY?7zO_Ts9fPoV(w0RU%GQ+4+XAmon_4f{kMw_#bXgQ<~c0v
zgM)Ok!qaE6);+u_<%;Bojl;3>nAqJ5g~2U6CIyUumb@MuKe{>+9uM^%$`{1h1~5{<
z=QY4M*~5aB>?Hd^_IB){XfeEkrj!@m%@%TixyRb?)IYiiB&{LMvEcboz9R@OW>|X;
z$<dsKpQ7iy#O&W^bU?ve-0qL|3Mp=G>v764@sNFJNF%sN=CYzP=3(8!#sJ(%&jm=w
zZ*JEf_)%HSCAP<8*D=jIvW;1loiMRYhC{oXIB=$Gn)?R~`B6SCrtL)58pnwlXLEGN
zu(h`2A1VrY3A<0V!-AzRb<13pX^q%4jB#+b4`by|7UwsDNan)n2PXHo_)}BJVw@g)
z{H9`T<~TH2*=gq-D5i|uJ)9m9^)$jr{dha_JRlhN3$%+{l(qB|m~O&tXJ3S_X>&nt
z2>!`ScDs8r3YnrgG7X%8k<gz}yHD!w6jC&U?7{F9wz0tta8kA=PaVPABY9fFMH|~Q
zJtw<syA(96a~xXhn{cHOKh?9pP|wv8=5JtQzgJ{#h1dmy$OPnYQ`la|ZNJK6+FIh%
z{{Y}l4<rVjdlbP4Hk4S4JIamG+>qQne{}ZyUA4em@$#f|LBKX}7X>O{=mZx6dmjow
z>wAZE=|`&IEon!N>JxU7EN|ZHSV>C*hqv$Wp}A?#)F(CD92^hXbHFXQcPkm}R}l7s
zFhWszaDQF@0CfN^z7yKuc{U+njyE3Hjufmcdqi)wzm><b=K%KS^>%la6}F2Jk-}E3
z83`l~iNqGzCLS<G)n!E_H4%tr!^RrxsB5Vm2{!wL6umIC2@9Oev+fs4_PMt_sL3NX
z%IgPlV0(o`g&0QH0@HOPea{4pq-$;49ul|McXBSYm(US+rZtjBaDBtFlDdXDqc#Dr
z3bvMiNQojOj!0K@^%2%Ha|qqxaL#ToXF^&r^>IEKHas4ADUExYcQ?0Xqtz*!P}>n{
zc;d@9EOJEst^`?M7F8`WbH`gjK#3c<r|J_yu(-;G5_esPJ;ET}+z)qkeuNNMkCd&w
z?BRvL=ZkqyV};4(YcVCZjElGBM<W3D0fjp@k+h4n@)Se}PRHD^@ZgoPmdC){UB2Pm
zD5_X5xwf+G#O>`k@SYsm8Fu}`%2a0*!3$FCBy*JKg4>%PqDB*on<uh$L~murN6@Ks
zy6Lp}!{c$=e1$A=`nbMVNkIE?amrU-##iXm((6!FFc%QlTPZ3w%+1Uotf-}tqu5CQ
z0F`B?RK6z$%5DPZlxt|Jx7cG$kw10u-A>&|w;+(FF~>VWXM_b!CEa%5gM^fr$<S<-
zqG<5!*;c<(eJr1-?Ee4?J*AH)KOsk51arZ-b7UzY+ca8Ev>pe%A1gyoSlJtgFByWm
zT|U3kaUwtPw%RtN=e4D-z7cVta<gY6gWF?kEZ(ymw61iq7i<~8RxnkUv=R<fvTT+z
z*R&8vbgM=(ZPtUmj&S|Z^Vej#rwT5v(dMQGs+1QnWPq{k)+GeCMvy|ZVxG{Bb=jn=
zuWQ&^`&g{jpeBN&*MY}tP1JJM8DC&X2m2|2kT5ja%yOh-M5QY%wC!Zi8(AZ){{RT;
zPN9~DVQ1a9Sy|~_8@DhJ6AtIMYp?f5<2N(aC_0)NxWV2pY~>W~N;w)u#rrQDh1C?3
zhsNg%^Obo^t{sDaJ=CR#=&W)Znu?oW-Gx_KC~+p`Rza)BJ9fF*`mUa%uso$up!3lj
zl3DpAI_h|8ukCR_Nbw*&lm=JE?B8#c=?i7v;d`{Asj3T2uXRaJQ-R$W$pg44s2q!V
zB^J1~)DE0D5K0y)GP+9}-2Kr}1CTvbTb;VtQ)#jo-(sYW&GtVa_ef(AzTjaqR;XCE
zq-Y@`Mgr0<tf*=TvmSD@6m<@X!#F*awLFcKVA%OwGK-5lBGX2UNFRgtLDxrveh~E4
zMlu^W({eI*vPM{BB+;atOqQ!fa_2B(!lQg;t|O0&EncJx2_q{#R$AwqkP7R@+BxRF
zfjtAua*#FcI8STc8TdrR8!vuUQzfu=y!UG2Z`+hi)UE>T7ejzrY;pBPG{DnDQ$`DK
z!3blxV4Nc6xVgF;c-@p*vnJNaT=&LFZdHzxslAU3E;d3vjd(jq`9VBB7lHy#Bl9;5
zn8?e5NVZfm+&gu!t28R$;27g;tFqAM+;F2eS}hfOI*Vk3W5!hS>8&ig8VEtg(#bb8
z*xg;}l|jSPeSuMvYiN42HCsmbU3RzVgL_NGh{#)N+BVF>S_ka2^_qLw@>_7Jk2UrQ
zV_lR_V~5c?8C@H)aF3b+`bhh#`iP53uvJn_n^YSV?R!ANj%EYKe(JY-<8`lOMLkaA
z-w9fvwn-e0jo$;5d{VYSlVX4*Ug0^e$RPbuaj<eM3wDrLeyEu0F5Rcim1}2kZM&%7
zGq+q^C3yJ_8Pf}`j^^z`!BFUA4Lm7es03Nx-6Ze{2Jv7)?2@?Ylxaz5v5Hp8%LA1p
zWzms)*;GX5M(Yz|tZC{4n`htQB%`A%MYSbG>=6<GTe(sh9U0!k{ndpHTO<Ll{nVPR
zk9I>@1ah#4G<aEkS55TEb5_oxEyHsS$8}Xy+ug4K{3~OdT@#cn#GTQ)#|l93NFNH*
zQlSLhg27YE8=^MgF1X6hX-0x0mCSzbRh1=G`6`w<IJ%v#?gjo8Nwi-!P1(3AQ1P6P
zg-=gWw*?y<pn=_B1(vk-&-qc7+Wpdrc(4}oq+ky5YheZ(A-V6$dr7~Wd?hTld!!Z^
zB><vmi6oB7P%Ji%3K_R+d}oy;PaA-D0SXP-Eu1?f-)s?tq}|sTQ9j^tgiJd3?PGM3
zx5qux1H0S{B`&$X-ha9Vs$>so1l@M?fn_lO=HtOpJOBab=F1w+X&Z^QJTADk_#7q<
zZg@+cZT*%5Vp}|>k#pnfq;MDi05(l=HWszMQL#}G801>%EIt#D9F*0DN3h8|=R1MI
z5~`t)Fqs{26RH~}Jvqie!t<`F)hf*8jV{}Ja<i1@pu#amgHq}T?Qn&pju0_*O!WB-
z;CBdaml0JkGFumXm3LR8)5^d^V0g-pB%L%@L^_9Ava*Cm;b+@|u`a2Y%ReMM8!L@l
zNQx-|VHX{f83Ym2`<gFhXyZ$wa-DQ!T?@o6Zo&z5#uaPnWR|e+zqI9PwHcy?#?k#O
zvvpPbCvg}ACVZ396*SEzo3fdpizn6UADF0YTddM7vy`=x)B-?05mCh}UfCURni_ww
z8a<cr%SoqwJ8C5W-@TU7rbr=;(ZpIT<>Wmt)eoT4%pm6I;nY>LN?t*+Jd|XcB$Gwo
zS?Vydk?!0#2XTC_9oBVUR;ZiseDbt?cU@BH4YC|Bg^Hx0b!@)jVpL+OTQBG+);k0o
zce1w9sA_9SbY#2WCQ;~QIjw$g<!bs?Hc-}v$(Fby$$AP+m;D{l#-~noM6s6<V{0p_
z&X<xZsO4mPVYWq<!=Y<wBZ2Uc(jCGtUao=|jCiq0C$Op3j0U5lGxGkP!*>y7FaDB+
zum=!#+ncF%ZDt6IS-5*ol)=>PozcX{3mhD##-%MGWi6c#O-of%`G#B;*c*4UxaxWn
z7M{^FcL3iC??}`r>FHZ5oWNWzRzLACtSH$==-DH8Sd10ZD5|17<tbU_I`w;^tdXpB
zfcaGNOC?^LHs=!do3vjlzG>yuD_r)HL3RHCy4ZBCkp*0hhEZ+e$0-&!S~RjHwq^9)
zI##&8&T;3-THPa9l8Q0Cg`f`M8tN#tJ$1BoKkdrfw3TPCQR(#>cGyb<fz}pD)Tx%f
zNTbws>Z-H0B2U>?dNtKAKB#?`$3*G)n#Rkt93yHdA`Kyo7#w$3aa2d2q<Q?BJfEn9
z4Q`6<o4_~b!Eb6P-@e;O7RD7tToS_f0^5&;H)v}rx_WU)=7}9`xVc)1x{@Z-feVJ<
zv6_PmUP$|>=-TNR=Zuz+6r6WsMe2*n&Z4Q5l3s1$Q`YO1PT;tYgl#6C$HpG<!?L=r
zfrQ#NUgN@b8x^`TRWsB{P#E)Om7&pf8jUU&h@WQ4+c<nK{{TX&ndA6w7UKx!bhT#C
zcDcyQ9j%2u_GUHeiiu)#A!~@`S7~}RME8<rxutqd7K<A_wK3%!XlX<h5yluE8E`w{
zO-)Bkt6D1bEgCn|#vIX*7SB$gf|4tc4Tmc+rPeYzgGm4*wXJ?Sc5Mz9woshCAz>RM
z)%7t2TVZ4UhYLB>x|gP0H(KpgTGqE4-Eix>%FF9ow3RLf<d7}OMY69$bvolCx%;B}
zZ%=)E{1VWpsbYOaLtC2?y<4I*mp~gKZH2N`5~N3M=)LIuHY!$wBWx{fty!cs5e7ss
z7IKy4vX(aZD@ml*G9m=84Zo6t#m(4dmx3uZDhkS4X=7&RdS`n|%h%6SQB3G%ee-ZG
zy(?YRsM!(R_WPQB*Iq@g>kw1cJVgE1;Zfj%5oePts`UQ=My4u&4o&{6f28Q2n(5P0
zK@M$+`YeuzJGChq$BTxXd@n`QbtovbNg$Qsq_rfa$Ds1PvkR#1q@D5F>^u^)x}`9w
zdt47H&!{y<PF%}aw3{C&Z5A^t+Q*(v!ZFJx7maok(tQ%@%ErECZjYRW>$(?3Qo|4;
z7J+MUyP^L8D-2Ny7|=jkTFq8C4TFGh!m^c$`_W7P0HxxJpzL7BfUYR0+er>vYhb8p
zHP{TcbJ`EpR&_T~K~EctWCO@TQ$dVvmKu($Pfpj}&B)GIm34lxO;l%KaNXHg^(R$_
zz1v^U%EPu=jZ08>q~l__+W8$Ksqj`y1kuY}T0E_0o72qHY2unQceIdD+8<8(QZ{1C
zl0D05p)>tFxuu`OesSel;gVV-@~g74n@c)fNRC?;k?mHHbp-SgU4VuWwaI#ps-B{l
z2D;KlZVIgFsyAv*nisU}y~oOmgqcSuwP41X+J#iLFK+1_?gWk(R#iHRiOkw}oCD!)
zVbR4TBF)If$XR}~q70{VurRFgXqwBtnHr5keMZcdLJtJpQB9^)f2(X`N!$S+MCd9S
z%JUxU=L>tG)5B0;sVxP}7AD+<3ga=HtulU>)2b<=VVXkG;a}I#u+#daU%HOAs-Bt_
zxyIJ)0s~X(R=Y=ejx)KK<B+QOt%#*3(Nn21FkCk@0xinNYGxRwbFL4RvQ}5>RYkFr
zv$0x=K9&>cf_DqZ=8)_8Nl1O5K7yT-R0!k&(YV^yUZJPO1P$73)*PFxXF+HNie|cK
z?n%B@{nUnS(e2=1r*TMCCiYfU>lB)Cm7?1Z0bqoY)aq3;!Ys$XaIjV#Z>85Wafltc
z<z{q=C5jg_hXa)^D(x1Gof`K`>(Kz-K(SeUV?=dL-HV@vt?1T8Q5)MPOM(5=nyeAi
z?!f!2#}%t5EdGoxm!TM3(Cd@rEemT+1sRIx0}2|QLYg*`*AHsV>$=22q_x-F5tcPX
z<B{0SUaQu7<=<<Z*rRk;#Z^Ifzxa(dSlFuNtf&yjjmFDe)4F|4C0JyQxWO1w`2Cgn
zJsz>pT9h%-ep+W(fnjx9*LBfCPS=Z(a6we{u|AQ4c*zVc2OXAQs%qa;2m6P0t&+Na
zT^#&2QER%<bdF~0-DaNYs^;4mxpKFr(j=|97bm$|PL=7xCL!$igMvbp+bE+*52bo)
zaP~~#OZi@@L8LK}#UN+^08!c=j}%nQFKEZYvvV682;g>Fa8fj6)3Q2w=|lpaQVos)
zRg=<F>D@v3$Xd|ZhT(7Ssx|4RY|a$G@9cag=^Bia)WHpV!=Be*g1F}{9?qn!*!3Q%
z>S+P=_cGen3j{QJirG)BNhdZ33s0!Z8&D!2pqndgI)*qQY^K8bC2_)B<k~9#091MI
zxzZ*|7Rh0Do7f=qh8-HIvYYG{a0}A)I*MrEdv4ni$zE}<RzS$z8%X_My6s7*(HAR`
z=(JkKolz7sG`DH7TkSp642n0#TIRfRzE*a-B^KsF`?tmTTQ9@@zLH%%)LMjvvPN$k
ziR5@q8=yU&wbZ>oO;G;;%(6BYG~WSY`i6nB)9r8o$L?t=@`I{{MKzf6O{{LKwV4@H
z9>#vBVHDi-jN`*>1EsZr`YcAnWqqmj1HUX|u^@1=6jaZntRRa3RGPg&5Swxn{7n>I
zOlT8a)n}R)f%<N|>tFTddAqC$TFQyHli;ddP5~rt4mLKz&l#oVHmCzj)93U=h2_mX
ztgopw=MA>VDS99>dRN6Mxn=CHX~a>@vCbC03K5g#M4W$H5}Qjg#Ng6deB;U{ld9*@
z?FCGw(3ATo)oKvKMCTF#3(NYiRuW9$9fe$wjN?p%B_z$6)M<5XdTM4$9LM{abHP#S
zy*TL_=SQ3PUU8t-%?)s>X(MS~kEL}N@dIRi+U$kLIJkckwi8m*D)em)=ArRaw4JAm
zCsgT`6je?j7B`lye04BBW>iPE{r*&aS2a870gldp!fbQo_6(TRR*yQ>r4<sgGJWLO
zt1S~tsHJl%nhl!ZK|nqL?L<v%M&WVgdmm2eP}ESy(#Gv`K^E?sfANDFQ(H8YRb|~h
z4NxBEFaz~U=0hxTY7wvp+ibQ^Z9k_(>Jlu_E~#{?=hIZwQ_ud}#fUwRVz}}_<XS2G
z3q3-mfvs$yY~tlW-5QQ?Po~#m;IA_4KB%fQO-T_f*lmKYKMy*du4)!i)Hs=2`doYb
z73Spdv$f3@j#w=keP^d3bsL=&O=H0146ixYH0frenx(j!l-ReqUYRDo*0cDc=HB44
zwNk|<vFkN}K|i(Q<$Ax5`BYqHj!z**?HM{)#Z@$NHMWookhC2+tBM!8IloJSnx{t;
zHEs<35BE0S6?U;nc#Mn|Bf|7yaCSmTNfGrQQ9e4yG6_Fd02P1H6n~nhZA^o6{1xW&
zut}%_;qD%MFH`(DnUT}Ak021KDRNsU7}GYBK<G5qmh)_^cChbOUr?KE!4_L8>gdd7
zJB}Bdbxx$pdEI9W_FjHp)#&cUvZJcK7gM>!jD_cvPifSPSbO1H^$w=#;w@vY0?uh{
zCbx0tu}y_Hv2!)i>HR%eJs><QJwmbHmU{uXA!9U}qZ@&}j|3~GOl4uajz$+;XGbfA
zl)99nFhSs`dTOE0sFIoP_PFBeEoeyh?Ery(Y=zQ`p{i?+GN+yLMQ|phTkCYP0%9WM
z94&86Xtge*in=&$vc$CaUDMRf)GOegXs;N<uibjqnMVaQUXW-l+x?e3Wl=4ae#IPm
zY!Sg7bSxJwvziAAgHY34+V9TBEYtd$0@%7(wE3RL<|ptxDt%W_rKb*V2yym>Dayuz
z*;%h?H14F1vYn$XyR5ThJ{d!q`kHW7&W!r>Pm6Ha?gxdI)Jr0(bbOY$s$-orN^xy5
zWr5SPe3*N^%8t6GMmR>-*xg^cph-%0pL0eQUcJqINs!x>-qNF%4cXE<XARDAHbWT=
zJwseSOZ%-BpGeA@M*s!<Dw^6&kxLu-VY?SIOQWGNl@R(;GO96lo>rem)SlSG#r-q=
zmMNN>y${Qep;``|oraP0vKww5)AF)Twr3;})Ov$n!b!OU_gG5$gCQZj_E-AO;kZAy
zA1fnP@X3vbbvGT28EEz{gP^9?^ho48T`L8S7N(a-iX1oq_T%cjkMPT>4wb2h9_vLX
z9|d~dMynjqdhn6CnIh|-Dx;$tvHGr&6<r{H!M&U;Mz2iDYG<9ca5)RnVbrPSp%O8|
z_Q+m&*R^pGx;KGy?h1INQ=-#X9T})K7{=zf1G^R}lp17n>HxTIW1On0Y2*jgX}BW%
z;b?kA{-fEr+=p<zE?-BSqrICQJEvl$^yH18#yQ7jYh9#4=$Eyk&KC;TL6R9MOj1|^
zFodkEiURsqy5G`D6LyD+X`Xx3QGQXz$GXaD40O_pmSBOKEiYNtM<(FXFjh*Ep~h0f
z`dqp3EtbhG7Ftx!W19WMIA;D<t|qdg7F0)Tk?spC9AHPeytjg_G-{);#9T%H0Ltm>
zXC-oFjdTr#o~v8zJ(f3JbbH*}fC$3X*3}=&J}2V~&-I5sN`nx+!NPY<0V;G-)l69^
zb*yfzV04a*Zn<d~MYE@7uB8qD?+atnJsj%TUlh*RTFbWl-@-<|hE01s(ykdKAY>3x
zv@pzL9PYC8ik^dbII%sh5Fh$tcpe(&ZTbX~Zn`Z2;w&B09{Vvb5;5hk1R~?pn^zcg
zIC$iFTB^REB)5A8>nCZtM3i+cdqvtxRgr(}(#I#?MJ}DD3Ujy)=-R2~k87Asns{3o
zG)74fk$_p;f!S2o>04UxTVOc4=gBnL(T)_fSakf4pG*}2#JR2nf>w%-vC^@nt+p0R
zql^ClF(nxowZhm?#wqRU3j$Q0hh?6PQzL5I8?G<Mg=y6kk!o5{uxP1>9k}P=3f4tE
z7<>)>BTqfkYadfI0!HFS@)cvzKkUHK)w+_g&3UkCwTeGfG`fT>cyRR^f3gRw;vbqd
zQ8#O(!-s?AQb#RBEo+_)orPFa5`SiZ&@xyYTapGs%+$jpDvSpi#nr}>sfNGPanJcn
zt<njb>cl{B%C%VzR8U9=4i4;uFE-k(n-Hmp;?HgkyDG`z^rS6!2-N|~#<a;#X`&=I
zy}J~3Hmg*|?rW|<LPaZEcD}`q!3q!dq|fNT_D7Rl3&l2EJ64vm64HL5W;G}b(iolk
zuXdHIgG{|6YH7vTc?cT14gULNDN8oXEGQ2^A<PiCS<U{-d7^5qY$BRN?`|4a8IAN_
z*_tdtu^v^k86j(GSbjoi%E`(V*`(I01L6+dZ-tJNP<&N;w{UnxYFe9}7>(Ds7%MMX
zGo145+$=TG=~@n<6>Jy3xD13%Ua<``OcESBA9d!s7Na#J;q7~XDD7Uq^Df<d+bLXW
zj~UqRsH=2NkTKVd<0~_xNLy6+&*>=o<1?UZ!QRi66i~Iz62>gxb7axbuG=*lI|Jh_
zaTYv;X@)qlVPLBC$q9|FX&{bOoR4gf7qpGQWGUoq>cbSu>dOg9X;j*^Q=1uUU1Uz9
zSR*C31gc889Wck)N;f82d}6ji1m;(?ZubJTx=E6m%#@N_-D8Y$LpZ&~&KBcAdn#ys
z7h%9I*e2B;Rz{PwZFI`$-%i&x%?}72Z&VP(@*SHj>~haZDU1_tKB=0Ro>+^dYk(uV
zcG^NJVD!3+n_cRMa_g;|;)_+&y;j)D0`kva(w}KJv0Cnv){Qg6TyDZ_gnpT&_K4=D
zl9qBs#g86U=9j5DHj9yKX6hcGsEO|NB4`)xsSM?ZxCl62jmz0#s_MU%sT08aI2?tz
z>1|SvS)gcs-RB4DypvZhdrYku<b=H|tIMa>Hb|Uy-z~lra$_rwX!R|7r9qUK#vPWp
zFFw{Os`T22MN-FXz8%=FTj@@qrPQEnWwE%myd>(q3ZGG@bS`KuaQ3>~DaR{@nP-hm
z@@ffz#qytB52)OX*-0joQ>9nBl6H~@=yC25Gc))$cj_E2o=K2V;>^UftqwbaBA$*Z
zTXvAy8^V&k;M{;N-a-aBq>fKgGmx@oldYEUNHZM6BMJ#6Z9Lc_*X0xhb+q2IPT6gc
zt1BXLX$J&l4mGrHccC?gvUt5%h}=6Wn71-ecqoYFEjBJvn42Smn$fs_bU|z(w9Tr9
zz*yUa4GDIeS{Wlo!h3~rK@n}8+;&rH^ikEpc8fS=Mox<@ps&h<Ox;3+U7SeJZbCke
zX3ZYc`mCzDLbghI3~~*?8$E~lg1xVyY%UeFZVrM>*ncTa8E%Bh8&-j5X=Ckf=y{q2
z$Uj9pr1cql<u*VIFXxb~OdJ->$437E)Ho^&nBE8^5TqapF5CT7?x)<qY%Ykj6Q|4T
zu-ez*z@jM}>UoP^FB|dnRPnl6dVwP`<at*@R#ZY92fEq#O2UxY-XkVC2I$?v@PL(@
zNdo1)tgJ@a7+{cI-=zGg9}}8vY)I^fLjpwh-_eu;)4@-rc!F<AOvZRVQzwS^aJop3
zv(uDu-7$+Aig4!GkXY~1d@AW;Fu&X^2L%~NJECh_Dcun~_)^w2k7bAjr-S7$^Z*Ap
z+r63crlp)S+|lg*VciE4%{<04mj3{ROpOg5t2pqRqZZLUkB@1)qbN#<*x5D`4Y(-1
zE|~sYOxJFO=Rfw9KBuLbATMG5ARgb8lFE~&WfsZ_p)7vp@T8}3dq{2`Ke{(fV`>`c
zWghn6g<oGyH7xtu2=G?rvr`gy$u|PtR8cs!)^H#cY!Wi1or8iJc!4(l$l1TyD*=hZ
zM*T`UKTdWBFo5Cuf~}4FeUBeSJP!1p9u6*mdM2x-8+}F`pxQlQw}ad(Q1K%-54b=}
z7pE&_VZb>72F#Krp{J8+j!Th$Y4E3-l2)^8n|2-#g>R(C9ZVtEw||9qPej+pvCX*c
zh2&=Zm%}<|Ts(CpqXp?n8@MLiVI+;+kSyWITWR!`i<Y+tSu}<`8?w%}3sqtHOj1J2
z#*|E?Pa@mC#X0Qt2Ih+ptTinjYJ0vgOGhD9mzd<SCkwwGSmak0LQrw+iQ(;j<JjNo
zq_~zbeE$H-oQ6vm0G}uc3*nQ%PuPf>Ho7BbA7S#FI~>P};kF03C1k<bX;0hg<%Z6;
z?wH*Wy^N@5sTG0#Vc@7p2ii@Y+rdjXbP{^e<NAV%LM0o<4~2}L&U<ZPYb3SD%9Ifx
z1dn(b`BCg7Tz<)n(HrBrHod}{5ZPEFb{;q-FuuotZOBT(*B!vy{ub=Qxu<s0J<Uwr
z+pzw~#)ir^INAM=lr>BbXxuRF_Cm}NMO0yvBoW+s2#Weh=8y9<r=CZJPRTAUdlXGA
zOt3tF;97YHf{BKY)8P0kp%y!V&xIu6vwszW$HIxcUxKhB*j?Kw7sJO1H$9I6z&v+D
zlYR+nhxt=SFqxt!;lqNJpx8m#I1U(lQ{j7F?XMp3{m>=FhWD`tl=Cnx2Zs*`QGzR}
zM1VP_&mXZ>E)QdfI0K)BbxBYqZH^oiHPp?N?rpdD^0IUu!KtKd-@uah{!$dLX>ctD
z&ja^W?_-+p7ATnJbHHqvAYsX<TWD7T{{Z_WYHPoV&$Z*il>Yz|oIlT$Jf_@>IC6sx
zk-e^F4p%UNVcAI=*hmk#Z}?8BrwswokXU#jF{opj*8p4kzsio*Il)s?$0NZk7a<`Y
z?XMOi%E8dqJlfs7C$NXQ#o0U`DUJjKacd+W0_t=d9sbmqzA&sJs%zpA$S>G9s@>ol
z9H|-cm8BHHWR(=zE+4DMlqdn&9@mb@*GO9!-Et6;?UwFo0pI0iXbf$Mxd+@i9#ckt
z<RuOu*ozU}IlwyZ0>x0wj5x;NLASzuQ%MuV&=LSX=BAe1XOzGk+YxX=j!bGpMr{_4
zu8yh_Hx|kjJ$*x5cE1h>pDC3E%=b3q$U)Q*FuDCoFvZ1=<`WCII_>0mR#dwsZqs1@
z04jz8_}(+^R<zOrLhG#(ZkYMwa~?ymM+tzFmf(->j}Bz<`f>|9u|Z1{qJGz7!Sb>-
z4vJpG1xy^-1&%@FAl-25@ZgoQX5$1P)rKu5Ni$s&f2o(p!iBH&&f&*|NRh8**90Vu
zbWb2<r7A-<6z8$vIC7zTKsOvHpMi|G{3f-|Va{3Q6=+*bA+B_Gb59w%ywfURsscCJ
zvRjWThzpN`xuwy(NWwuJ5SD7tV$C&0BUlTAZWV1@7CYm$(OOQX+NKDmu#kN6iK&Mr
z?Z~?4<kQ*H#WkX~j<wY1xo>oP>m!;wwA<lV)xr<GgWNd?P+I1a(nEpEQ*lz-6aAJ?
ze&M>{;Z{}7Tb6Nbgr2!!wfRET?~vGD#b`%+7Fy`7uVX67du_OK66t!3x_qIJarFLs
zDP2n-cr0lo{{VEd(mGb!NSzzUk;=af5>hq#UaK6jfF0RdMO+$gO7lu*)KE>|VdP(h
zp`z4;tOIu{630cOD>d()IT^Lqb6v<-ZmH?W{YO<&3wJFF-Wt-wYl|WsQrEXR2Nqf>
z#o9Efo^SbUJg|><2>KhweK)i@q<8GE^-UrvnrbP?-N|aE3@s&+H!GzzBy%-H(o=%l
z;I#MfhLVgEacq1dsody|j#_&noW{AgX}eD-vm%Yu_ZB0v4ths&0=<$p-rR)*(3bXE
zjb?qKSkJY@d?P9AWggcJ!4)+g;kXQxGhx{KSq(7klvEx;Bz&pkc#v3|p4U*a08POA
zDPoGw1P=LIiZzaF9LHE3BB`W*arR3SLABJTGDX@g@UU!}H-{gUJ4Nv13tmA0ixfj7
zHqLCb(U4qYHaQ8!+YWNm-@*~IIj4l<DJ`|lyddl(t~*WJ-AzkW=<G&3gc*{;;M{i#
zGav*xzEq^Fv{|cycFzrsuVoOed=J=NcAxC1Y3od8;Mo%_&6&HJeaoALGosX^MWs~j
zk|KG(b(qw{nDFM{9ucCU>}eiHbRAdm4cAUIa%9s7Z1(^-52}(W9T^S=;Xx}c?jL`I
zu|B|yD>O|q>V~ne7ANY7mV!E#heSYsHd&)1n(fUtN6>1HV}K^=ZY^yNq@QHdQobTt
zBM7pus;4cvXe&(}O+9R3roqJvQA`7iPEd|dOfDYLmfrZ^fGnlEDj9AZJe6lxLJjN{
zOwc+f8(bA-B+(}l5$aRPcAHy*uk@W&#0E-mRXZNpTe0HAD2OpQ=NIgjaZ*D@ZY<oy
z=DoX`;77tPFa|)%$7$M=qb+NWKC4GbTF0{C!Exlq;&sAmMfEjLv@z!=x@}V$;A{aX
z2Glj&6#oEQ*@B@(9RXIx+>>H_s+o&!TH$}HvaNfM848xE&IaqF8?sYWK~oz|_Jjf4
z$K&p-;UV1jQBP0YDk)JqA&OE(flp+Pz0lGJM(lY~#Bc2?k!0qmHIfHlpP^1IHa*bH
zu>#*!J0#B1oyX`^D-!m-l+eyafx2th(l2|co$NkPaZLqDrdR+Z2eM%fXu=v9oYQNN
zj%g2XKUL2p;&etzLPIGWlk`PK{hsEG*#=q%8B#IMu>R_82c}!m*8^rd{I0BHWgCY!
zD!M$Ii(GkA!%?*DH_7goj_nP|uc&L9;@!DGRnsy?Tm___7EID?E~{pxb8*>HG7-ki
ztkF6*6Juo7O5oreuWIS{Hvv@CQkD{IZ`pLlX`J$n3de3276nfXrGx@X02eUW;Y}Ow
z&vit}wd}NxYud#V9M;9kscVaHrewGmAQWr`xR5vkQeQU)!2=xE9N*}tWT5>Ppr#bk
z2)Q^)K*1S2sN*-lDa_Bo`XyrzWS0Fx{{U3&!N6fL<L`9AaNAu5k*tukV5psDyRud|
z7hgOie;NA}OgKKnfG(a+IsK6CBNp<MKF&8jEK;#(dz)in-7)tbQ-R(0E1VA&<K-I-
z5sY$dR~zlY7+m3FlW<ZC=fc1kdG3=5*8l;})hGV|d?y(r*Ls?+CPeL|U@t7y<rNhq
z2IlJj08pB$vjCD0-7`w*$36Sx1OioKfxVIBlPfe9NfXI!!oO`rL)aPtxbClLbU5QS
z*=r1885WrfEb9yX6;>#F5?NnJ%MB{3td|>rrf*D_KzF#4;DxY=K?^Jh7*N#LLmY3r
zhab9UNofhmv&=R97C1xi+q%T+x^!TY2tP&Wn(Xq{N?RLA7bBIMpGuGd=U<-dn<UbG
zmd6%n`hE*a0ckyeTI$^^eJmx7?Uh}n#}pMUCd1slHVCNQr*8J!XwTV3QdXKQw9h%B
z)1B(=b;ehwboPr$B`(s|WC9jSe@U|5KF5`BORb7HMc-qzi!P<Oke%LuI{yGmriR-<
zwYw}MgjBNni~v}6S3OUzO<L<X+;$z-KTw`+r`qdzDotL8k0SY+%R`#{0z4yWwNF-d
zIiwTtu#|3^M~06+R==h6=e^^8ep0+~j>l4L^iGl0Om5isZLsp4)m=`=#?v6&MV5O~
zZ{$5arrU-7t0}5WC03{D4a9EZ=u*h-0j9QF$31STP~#To8xxNKEhR+s?)O|+_gXH4
zp==}G20~t;(&B86djPTQ6{8mta+-Q(b6M)@`04#P<Rab*#Z*?-YIQ@^k<SF$#NlbR
z3I>-D=HXN_lvCBU%>vh1$*`iwNTzKxLgPKwgGiXgICM`S-?FNP8C@A6q_lTj%A)}n
z#gBEd$)P6@zr?LzRZB>JOwfBt2auCNtCpa)NnS{>!7DYdO8Wgzdv02;w8H2jX#n6M
zIV%cHMvqC-by%W`&mzMgMKpDA$uKQ=H}bsr)=2%#+;VP-qpgw+u5<W4cuuB`9B;GG
zYfU?2Yw>pZS^lA@rHr-3%>lt@H7#;yM&<%=eDboIhN)Xx^AjBBStR7ELq;qoTGb+C
z&H#cgfYLR6lFB!GU4eB>>S~IbhY1M|1zc%bNo#IFxa6siUq+iwtbE0-Wx#P4UXRim
z92GBXrWqr@V!Yc*V<CKZHnQ7jT}a4wfhJmPsTo#<lx-f79)m<F_ic>0d~kxRqk<NY
z8rxY_(sdDg9N{N9<u<EUY>>F`ZS92Z>tZC)N7SYkQ^_k1S{IzltjPwT=Q+n|7CBei
z{-oy_TGw)N786+|&Gj-ap*6FjFH~AdtFzYM8@M>ig1Vww<`Nu9;3_Q;3aY^y&JSg&
zq0`MMVUQnp3n&WZOv*)1HBC{2hYP4Gs3c>+u|9CMRTPecsT(|TpH09z!{u4CM)lhy
zfu7yhzrxQ<%1N!2y)mOQX2SBpyOOuBlu%O$z_Ht6v-(!uGf-n+mfwZ2)~Mptsl<>x
z2RWm<gyl||Ty$n()tenrCD<n`wS8^OY;w03IKCC6T|Z1%!?$ydu1c3%=~g<FNFByN
z@UM<vMDj&ln5|n}o~E2f?m1cC%G6d&Tw3Bgm9C#hV;*=0%HN|XDd%-mGO?!YJ59JL
zuk4yhbWwDuZ5zGZj3V`Fx4FfwHxA~-RoBn?TB#V`&M7Hs46*`pE;6L5QYzx&tRA;c
zmR2?4rybU#K+#(L9rdianlXm0cTVXvm0EL4;{>_5`l+;vXy~S%pKr0l3X_M?ILyrH
z`n1i1b4d<jO+#9%mJ=rTSPsf}>0$|`H^Ff>@PU#WM<gM;i?3h@bQ)-NOskh&t7|v!
zKSiI`HQKtjy|-{a3e&fytLj<)-oeSbob-HqnKOmUo9_ClO~yNsNJX`y&*<oCD_y<!
zTAc?=ijnM<z+mR;)@?Q|HbCQnWkId$ET`PoIDA=O6yxZINXw>c<kcxDndvua$0%qu
zp*7;cH?Ur1HnBXeCwb*w^t7_RrH^qo4jikg+a%#g^o<Whp0)etzSEEv+d|M;NZYlc
zpdosCq6p~N=Qs>r$=c6SK}!)LR@e_JwuxI|9Ys+EJuy3gAZ2*ZTy+?J_?qk^ddsXt
z%zGntIOmn+I=-U%iCp4IP{}_?tRgIRE`57Tdll*ZDOll7);Q;oyt6<X^%(ELHp=xK
zDgwxbutMjP^jRx5G!$aBz`47J%4b+;O^;0VVP%cIz<5)1&0vm3i`x9%Sak-X*3wN2
zoCr~KbUaqiCDFFgYJwR>n&Q1jK`}>0_FND}+PrJ2s)*GGrfp|jEw@JN2hb7DZvD3z
zMi<7$npS!Z0b^jht+*TnbQ+9pdr2dUWn<*jBzY1rkkV{a#yMnRa~yBT%HOjWiVo_X
zT9Qbljlf^IUS&q+zo{7nM|5&KB^}i*t&BLhlih1NA4t=yDB!E~hpIU?@7*ThwmfT~
zO=XVhy6Bx48z*Jk^;Ei>^=(RbJhjbhhi>cAy6Z)TzJ`&_XeI{&4}?t~l}^f0c7O=R
z72%uo*(u{nT09F@ps$2Wa_fLdy3AA4RoA_tmpQS|3)*`2nwBOL85@DI1H#8>G!Vs9
z@Yap4cI<XW865irprS8E^rIUqB$nm>04vj9rBgPN2bPWPuqvvGYHB93M_U0!s`Vs0
zOJa5{<z2Nz71-{gsfq|qJFHu5FFe&|iNj$c<CSq$Q6{G|W87@2I)_MfAeL@FDiU7H
zN9l+3V;bo$;c((Y-{^5b9e_7C1$qAfLKi!9PQe2i?zEKkvQt$(t|!gXr%a_>Pe6i3
zh>eKCt<-DdiNqIJ9ED5%xYkA-96mrRHLvStR#}eAcsEs)v`#B#f{LlNx{S2g!*_i`
zt*(jm)kaV()@JI5q;*Ld)G)o-X**rw#cj3Pc1Rq~{MmVV@xFF;VU_5t)jEZarG`jb
zx!{0L{Hwh`U;NII>Pq`Ljp2Fbus<ugr0{}|S9_@TM&d7m6?|AlCqj7_(Wut7(<m(x
zSX;`(>Xq($&T({2U~q`Za(4@=x_DhvHrEVryEyFUS|p~VnyM1!u#yf>!Zw1L)YCMR
z!B_n|PT1oub3q$yR9cRoJD%YaPTQLsau${$qm<EUb6yzbVYwI}EethnV+4|83n|jn
zl@1=8i5Bt}lD>jQ(Ff-C<H9(g;h<!nA`L@Tj(Zra2=Wysr(WXX!g&}#>MxR(W9~Lp
z;-JYObB_mv?bwPaHYUq6_KT3Y`gD)x_wKYBB_wi<%mDl=p+E~R;4#Ru$yhAOXgXu5
z>#i^yJ0;iLX>Qix&F;02iWnl?0J}~8RyV9_;tg|!ujk4Vidz{?^k?cTWvMNXeZ}lW
z&>F{2nuhw(--J(3HMKH0+dHtgG&J!3P_|GqKV<RR5xQrVY1BoRWvoH7g0nR8milb=
zy@Kr{!m!pLj*nM%%WRNa?vK;7*$t;HIqp|9qSTI<w9#2dT~iBrC+bvHTEypY87IoT
ztJ4f~ZVWpg#uZIX0A)?~n<K`Ziss&fx=&A&Q_-~<a%P3W_VO0<qV>(Xb7`DyEL?pR
zKjD;O3W}#&_;NHg!9}Xloj<6mjX67R9M+EnDCGT}7sXLldZVk^H36x=xC<5M-ASoQ
z43C%)1O1^xNvzcv9b!WWvw-ZXx{7yIQZ=j>wlJCyuEoha(Vo>0=IeySf=(UswS5&s
z>AkXya8_Q5neCabm$|a^4FhCUb|ep~=*JX7O_FLsrSEf2-NPYMM>AUT$9s=uKEGY*
z?hQHMtmo#Bsl1f>h>qE+b$6&osB#5`(ACnl(Ks^3!wQ;e!0LU?we4lvRa51YZTaUM
zq?T30XyauLtn(E>oHz8GtL~lG8vtwCN1jxDMWr~zNFLb-?5JpHB&Vc#bII6vQCU>V
zyly9;S9LgbJDk^ht>t;=Qfm&WbB64b<u-Yy*z0Ay6X8@EXH6rAapfzAA-VAxNZD!}
zS^+A~4L{OzNf}l>HK&HU#k{MDbn)Yk6?G9U$f1%q#UyWF<oklYr)K(Ay}iZ46VY$3
z)<_5!%G~JPD(6JUvF1o#H#Z7%nn-9xwr8vK##ZSqeLQ!WxF7`%kJ2(pYMQ&Y+1cfK
zc7xMmnse>L{HIGq=GVFaEH`BNQ&MlTttHSGPH93aF!0a?tOC5G)O{!(COcgpA4FXY
zErLHu_`X8Vbx;wK8;!=vr3zXl$+xnfsJfmv)Cj=@Uf1xcE2>MOE-&7DXN6C%Q^+a{
z#|U~VtHfC$wY;hPRkDgn=)2MSjDRD1tU$LY9Y(mChe^Bj8?5%COfs1xBWsUjB-N8R
z2Aud*Skvg6n@rLF0IL=>k-#05Gpl`Cg3xYUZmjxhh*d-HXmhW@Ruz3W=r{8bGxX-b
zCUf)%!uEo?YPGGWA<i4yf)IT}QqB9=Q-uts7S>XNHsS3GvsZ+cxPnLm_D7Ot<3%p*
zm4)BR<8`W{_tG`-+i(jdHb*%J!nV<?j5lk)ONEYA5h?!wL%NetYnaym06zs~++8EC
ze5+kvBRxx=-#7?IQcoEKu$G<(2_&~=A`Zv8H-|9U!-b;JdY4d!W--qs91y9UMI)FV
z-c^>7P9y?A+>AJQNi`O>QZ1*WU8icba7}XK=}G%6=U8gN^@afAcVi0fo|;$Ex(%d}
z`bx~|T5E=)B$!^t!t0(8joHxV>Wx25P>RhoHRA3K?uMspw92y6a4xhR3mBE{g{IdA
z-&7x8Kw%DeZJg6%WFa@th+J0-E;Q|S(F;q!QrA?SLV?q<#67pqb&lz}I*O@1!NI+}
z6|~ay^1xv?5xnQ%s?G5w7M{;E)ufsAE{*pGaz9VeWH9=~W1phg^)E?7`D0xH21XBX
z@)R91(fMan%rHlFd@3?TGPaqFs(<C5>5y%8CY0j(ut7NID88|y^dxXUWDiQP$xs0{
zH~z`gcSdbijRj0DsE*^CEN;6+By}6ZZ04Ka%Jh+^x*#QJC8zr;y?ad$fXdcgGLD3D
zuy4bvh^oPYKsU5^TlyG<EbW<qk0E&V4NLTmO|=o=UgR%NrPgAr)8nj!`)oH43LKmm
zRBalKKr%>$LqNCld=*bu>B`f^!l$U}kIO>v7+)NNXwL;>wVtNbX)1k#b03iJDwdhQ
zWNoSg9^Nw5H4Q9PEG@QHCrs)`)mzlNNabjBooSKPTMfUS>ytDR+B$Jby)#Qs0f1~d
z2pwjKNeO#KM`Tm0<C;Ce!y@5Q)N2l8uBMa#I}*9wwP!?L^hMLqvJG2vt+oE!_$yPd
z(>PLx$D4C*<I3~d^)JiSx!3l%-{`lxCan&kr3OnNFJQI&gwJbWbe*97ma1dnbY%Yk
z6}`NLYUyd%;PT<MdF^#{x>lzhL^s+Ay|Z!QYhO<7M@eR*O5?TS_6TE>Of!n2x2*Jk
zR(NYE#^{N(jUVMwRp~7dx+gaTU4?0MJytm${W_@oh7JD!$}XmoC$aH1+nbjBh0x>6
zaUiE!XOq5?NGg56hcy1-8$7ZyFzelpR~=6S8pgZ}Ij1W;XZ53eB!GJ>#kU=jlu~*k
zj<82LaktS$Uijw);0ydJJyNCc65IQSZzwulTY2w(;U8kjFG14EBg2Z3vV&%xJfY@j
zsBfy$4YOpSzrnD<84EEJMw_K|K~Ev0p2jEPw^q80EsdsD+he;dRV=q{?`JoKa_wK$
zp!8gB`&mj@?`2_<oiGa7HpyT`uC6+Ec1aPYc?2KQd@QwfKyk1rjS9PEKx>H>O^H^R
zGP~Jvtx%S{kQQ=y_PW-}+||B0wDR{6xCM=@7MmjngzhxNQcVNF86<2M9n&XljU~J|
zBlOEQYd+g<tTieozAsuZ2_M}nnz~~swyhPKEUa<-yx?sj$eM}=P*hxdp?*OeSqT&p
z8CxS5<K<}S?)qU*P}5`j2~v~b%ECOA05!ge4`KGWe#$xO9Ueh8D5+p{Cu7I3@KBRP
zEJ6DsrDap%ialJHzk3Ex`9x@xZk&SQd#6hS-7pPp?aI=0^&6P>I5!J_5J|j>ioIJy
zcje2P!d%gNfQQiHouR}F82<pe^yz3DB^YpJ?lKleu9y8jw|&2c^J9fvIa74bT)5m;
zfa@jS6J-L=Zc4bIbQ;E*V{XwaTVfCzjVOD6hi$In$XyJ{r&l!J+kC3!nn;`@W`C%(
zsc7bS+Cc?ZXtnOAt7~NzVK!d1)Y^46rKYy7J8rd|p6ko?9Xr#P4ah2Z@~NSv4lLEm
z=Fd*ox7^!uJ18ZGbOpna$_J-w3lHU`%T6=dT#(q^wAi$!jQul8Hne9XkX_Ng7sgc7
z8b;y0nIzm<Nv&zmF7;v;?h(B`IBVG13AO#f8E6ouU1&_2kTLAIw;_5ylc+~MGh>+I
z*gh6W(*{D?i2cBeyTWxfXQKNPXvxpQgrc8Cl$tKOmW~RBmP!D1uGcJGOeW8T->sYw
zv>LTkj$pg)&@ig0+9!M5<L(&xq=l^yEvqp4+g%%sqXoaHc|uc$$iVTzT77RzFM02E
zS4*e52Nv!2_*GI7s|JY42;9PL&AhIuoJ$#a9^uGGnti6$Ll^@jxEMTyWjYZ;^k=Ia
zUj5Nz_Xzz4Ib?sn=O~$|KP^@HmN#@VTX67I_L)G?_Dd6P4X%;oNoZw_-7*S_XF}%4
z)}5qfB}jXr4`|BWQ|R&3Q(JAp3Z}nFG}0K}F2mg?%9#HE8IjXo!Bkzt$M;$tInQW*
z*B3_dV&2MwSfiGfs6B()c(S(8Dg#^^;x0!XR^+bG)%wvbRXK?6W?RY^aR+sUyM>{B
zFRbFm0zt?MwyKHoN<)BY1$4!xj%I)#6I=;z2O&*MF7M$#kf)L@vF>Lb{t$9Bmu_Yx
zZyzbZPc=6DxAt8~(;3I?jiQy3G+&W|6Xu1Fys-YE$Uq9nO^62eJg#%D8sKh1kj5V#
z=H|#-mLW#4s)}(WUc6j)3bsZP<Jg69M<&nvqjw|17Pc0#<?YK{g;Sxd4i^a6Sn;{8
z<Q~dL2S(3L#F*XsPlS#w;H4K}*yFl0*>7fGA&1rU<?q2xm9juKl1n=&rDI;wFYX_t
zq=HXTzJ%l4Fb|Yl0A_)xm`SI7wi_)(4rJ`~Tx<?l@Az0MxL*smv$D9*bxYbQPtf>L
z$qQN;OJ$CuNcwu8%)|(hzo>R_R+RMAx}6YvGm8*=9|$U{_~vV&bH9qwc9MAtmrB<E
z0Mqp_+xs4U<Fb?#ny;bc(id6MrqbsX4F}RD*zNUDKGMb{ZHXP0-l|${LW}?!_Pi{1
zr9(EIHSKs@aPJ=q*yqbkSudgwO|rLhc^*__1hLs&ytCfUJB0ZQCXaJXo!L@^Olu@`
zM%TDfiAR3?g#%9J*zz!Ln%CW>ym&!`xasQO%IXbaH;LFGdOai~(`=0(vE9P*ts=&?
zvB})>y-%i`TN7b<y9)WA&f&GnJ)W0?I@1n)D_+Zhh7@A{(UovwG2@n=>M5fw_ctr!
zqn>bjJ#HzLpOK1I7QL4|EWWqXqtq^BX2-(a3rO5y%a~Z>>B`afUZ08iESTkXbLGIK
zk0Pzn>S;fV8%Z77qBMr0p1@i_Fuj7WM}~OInj2!V+Qx+?1ja@%>^$52ucyKJKapAH
zPsiOJX&{oGQql`t4sfJpK@Kkf-@4RmS~uq66%jVlv}Ac%DPxi+xvvBf<S%0ec;=0+
z&Rm$>I}G(1I}4gXaO58786$LK)nU7Pgxi*#&B5-aiRAl$+)2xPg>9l_Oq3D1pLHx!
zg8O#vp_zfF)Qj|<$*eZ9X}7{Xfs@q6ZR$pD6g!Cb54c3ZF4tQG9?6vu*!qm`*$W7;
zOm_|02fu`S?O}Z1gXL8QoxY=Z?h%xA7xqb({{Vzo6B}1ZHW_1XIdDTq`nDgkvx-v_
z?D9(p!BJIGw|4mWJ(jTl0ATxE%=Y@Ekl>qh%90anG2D&{d*c?ku_KVOW(3?1B}yB1
z?*TG+iw5S4j_awPv;cAnHUvDDyAB_91Fjvk-y9TMqOiMtz^I(v!v6sMg{;&zCy;ru
z3UM@qi=2cruEXU>$8NAZ`AWitnc`RH2fAU6!vr0@ihPaSJUhyDG{88rP72AHp@(&V
zJoYKTwnqlYGv!G3HYZz{&-PKx9}a21i+4uA$faS0`55?5hGQ7oKy+ua=Exl1PEWD$
zn&uWbi`*U%4Hk3;INToJb9^H;8VIVO^&tY_c2rQx=uO*^+$%~7=C#8(JcNxqu&U{m
zG6yjFQr_bLsIFM@3Bm5P+JyvFu==rEb(VUf86qW*7#tMQX_@GTcIM;vOB=8+%4-Xl
zY~gmPgGI0Wr85C5NOMb1*$X^wjn`@*0@Ju;c~ZHomAOAeEFhSXmjccSp~a)+J@J-2
zf(qgZ!p0gs+3u0R_bZDFNFw&|k;dJw698+P*I=8W<fjAN+>Z#b0XMR71N8t_Fc0Oz
zb0aN0qHYf&$;}NoKe`t{@3J^$vCk;COX@Rg@`jQt{+lMT#g_yetx21q(?;IcKPoMt
z{1qTQ!NNk(x5^<I##8Rsx0{rN8)uHiH11=r)s16IOI>l1;WM>}BpfNtp4-~RLt@kL
zl)^E^gtU@d=fZirPBPSmm*a%imqy|pa^BwvGYjrxgpq;>&K1s|s+X`bU)AMQ<-X>h
zX-(RH+-KcRQBSgwl`R()GYpYqbyrw-pH?GhG-W-GCOcmtKuHfL_X|QaX-I=}rIP#+
zk`YwzzqQyu<wGMbcQDwd$0lq=oC<kH#f-~(d&MJUXD!XUEkqG%+TACl_O?2ZIr&)%
zdVoM_us%^RRY^@dWMi!1kWhr0(=_3GLTfriw6nS?m~H&7whEz|2UEDZFmK^{R-IWz
zt<!#1t7w|oJ<85?7K=3$hugY4;mWNhBC|b7T<2M`HpLXmr!eH8ri0zNyoJ%a=WD`F
zBXTT1IPqfFD5vzQNq6aZQHaBGo9TwW?YStVkQ*3UTkLQ@1wEVFdlXP$m782W-INcF
z(Veas356nc!MPal6I*8s5T7UnV=6ZLUBbpf?Hmi)GH4qA0B{-q04jZ<z_@3^M&k)u
z_J*(_7Q_Dl3U)EC7Z@scvvrM=14tx`4}@$CZ>M4pB}~I{oFrjsusq!^T5s794Rm)0
zvTF%$4<1y%H(h4PY<XD6cE4hm9uq9+@I}H>ZqPzjGG{p0_fdc?&n0&I5(-HO4ZW_V
zB+5mNCfWI29L|lvgO2JT@Lon!gAMKl!dfY1gJo>2#tMpCwE03uA&vJOBU>Y7X9DXj
z0$V_?b<ORb>8@xPJf}+Ct|s>hrNCPGT?y!gP{KYF0K19#Qkx56{{Shr`yvezQ_f;`
z4T`j;)L8Fp^V;f}z#i$I;CcO&rv%50+BB_u9N#}G3aVzjTw6I+G}SUkVYrs77;3?`
z>nZVQt*I50(U9Ur!T3-*H#gerkgs30{{W)a?uVWRxNt70rb<xyDR!2+_p&yQszwp+
zE2W2LYo;}s;X6s7D_bog)Gpu)vX73imVtGiV+eKpBPr(Kclat#67*4JuFH2y*NYRv
zudE#R3C8xuN{G3{Sm)}IW1*bEV{v1F9n{X87|Fj1H^xCW;HaL$O~5x!<7D{_kO$n`
zDj|0K6)Ok^#B!eI2LX$lB9#T53;QX-7`?xA97AM-2!cr$x_hE-B-^uV;XR}tN*RwA
zvBGe5vJLKt8=_*;G8B-?SmER43+kJEB@$euk|_ewj%&cTKjALhbA%-%p{VwODD8VL
zc`7;+7!9pr6Nwi$%4Cta8=gBPYhAf0$Sx^d4Yy<bB7kg|1L~{WxC?FNOAN(?069I7
zVJDi8cLK+^%B!rRxZ>l!7KWALTW&n3O-u+R8=$7pyl=AwS4ctQx(vkTT#J>qtJA?Q
zHv6ht+9J|@y}4J0TO~YSMMQ7La-?Bxl1%|&yKkQ9fRW0)WSI#n2xHL<c(Bco8;@(1
zD<8K%WY#4XamqG~{>pZ~?&iv_IXi-hj!R_o@`;lT4;S*5{@;W<Wb>6Eb@5|zu*sY~
zp>v3^%0h4n@S0D>(zFwg7x0ie_CG0iW4+T`#nwXfN**}EQseNW{z3AQr?u{d44Ct4
l5p>hoT_APZQgdK@VG})zcC?&bHs|_^L&poZAL>}g|Jk!$A)5dI

literal 0
HcmV?d00001

diff --git a/tests/v1/ec_connector/integration/run_epd_correctness_test.sh b/tests/v1/ec_connector/integration/run_epd_correctness_test.sh
new file mode 100644
index 000000000000..55dd39c0a957
--- /dev/null
+++ b/tests/v1/ec_connector/integration/run_epd_correctness_test.sh
@@ -0,0 +1,476 @@
+#!/bin/bash
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+#
+# EPD (Encoder-Prefill-Decode) Correctness Test
+# 
+# This script tests that EPD disaggregation produces the same outputs as baseline.
+# It runs:
+# 1. Baseline: Single vLLM instance
+# 2. EPD: 1E + 1PD setup
+# 3. Baseline for (E + P + D): 1P + 1D vLLM instances disagg
+# 4. EPD: 1E + 1P + 1D setup
+
+# For GPU usage
+
+# set -xe
+
+# Find the git repository root directory
+GIT_ROOT=$(git rev-parse --show-toplevel)
+
+# Model to test
+MODEL="${MODEL:-Qwen/Qwen2.5-VL-3B-Instruct}"
+
+# Set 1 to use multimodal prompts; else to use text-only
+USE_MM_PROMPTS="${USE_MM_PROMPTS:-1}"
+MM_FLAG=""
+if [ $USE_MM_PROMPTS = "1" ]; then
+    MM_FLAG="--use_mm_prompts"
+fi
+
+# GPU configuration
+GPU_E="${GPU_E:-0}"
+GPU_P="${GPU_P:-1}"
+GPU_D="${GPU_D:-2}"
+GPU_SINGLE="${GPU_SINGLE:-$GPU_P}"
+GPU_PD="${GPU_PD:-$GPU_P}"
+
+# Port
+ENCODE_PORT="${ENCODE_PORT:-19534}"
+PREFILL_PORT="${PREFILL_PORT:-19535}"
+DECODE_PORT="${DECODE_PORT:-19536}"
+PREFILL_DECODE_PORT="${PREFILL_DECODE_PORT:-19537}"
+ENDPOINT_PORT="${ENDPOINT_PORT:-10001}"
+
+# Storage path for encoder cache
+EC_SHARED_STORAGE_PATH="${EC_SHARED_STORAGE_PATH:-/tmp/ec_cache_test}"
+TIMEOUT_SECONDS="${TIMEOUT_SECONDS:-600}"
+
+# Output file for baseline comparison and logs
+LOG_PATH="${LOG_PATH:-/tmp}"
+BASELINE_FILE="${BASELINE_FILE:-/tmp/vllm_baseline.txt}"
+BASELINE_PD_FILE="${BASELINE_PD_FILE:-/tmp/vllm_epd_baseline.txt}"
+
+mkdir -p $LOG_PATH
+
+# Trap the SIGINT signal (triggered by Ctrl+C)
+trap 'kill $(jobs -pr)' SIGINT SIGTERM EXIT
+
+# Wait for server to be ready
+wait_for_server() {
+    local port=$1
+    timeout "$TIMEOUT_SECONDS" bash -c "
+        until curl -s localhost:${port}/v1/chat/completions > /dev/null; do
+            sleep 1
+        done" && return 0 || return 1
+}
+
+# Cleanup function
+cleanup_instances() {
+    echo "Cleaning up any running vLLM instances..."
+    pkill -f "vllm serve" || true
+    pkill -f "disagg_epd_proxy.py" || true
+    sleep 2
+}
+
+# Function to run baseline (single instance)
+run_baseline() {
+    echo "================================"
+    echo "Running BASELINE (single instance)"
+    echo "================================"
+    
+    cleanup_instances
+    rm -rf "$EC_SHARED_STORAGE_PATH"
+    
+    local PORT=$ENDPOINT_PORT
+    
+    # Start baseline instance
+    echo "Starting baseline instance on GPU $GPU_SINGLE, port $PORT"
+    CUDA_VISIBLE_DEVICES="$GPU_SINGLE" vllm serve "$MODEL" \
+        --port $PORT \
+        --enforce-eager \
+        --gpu-memory-utilization 0.7 \
+        --max-num-seqs 128 \
+        --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+        > $LOG_PATH/baseline.log 2>&1 &
+    
+    local BASELINE_PID=$!
+    
+    # Wait for baseline to start
+    echo "Waiting for baseline instance to start..."
+    wait_for_server $PORT
+
+    curl http://127.0.0.1:$PORT/v1/models
+    echo ""
+    
+    # Run test in baseline mode
+    echo "Running baseline..."
+
+    python "${GIT_ROOT}/tests/v1/ec_connector/integration/test_epd_correctness.py" \
+        --service_url "http://localhost:$PORT" \
+        --model_name "$MODEL" \
+        --mode baseline \
+        --baseline_file "$BASELINE_FILE" \
+        $MM_FLAG
+    
+    # Cleanup baseline
+    echo "Stopping baseline instance..."
+    kill $BASELINE_PID 2>/dev/null || true
+    sleep 2
+    cleanup_instances
+}
+
+# Function to run EPD with 1E + 1PD
+run_epd_1e_1pd() {
+    echo "================================"
+    echo "Running EPD (1E + 1PD)"
+    echo "================================"
+    
+    cleanup_instances
+    rm -rf "$EC_SHARED_STORAGE_PATH"
+    mkdir -p "$EC_SHARED_STORAGE_PATH"
+    
+    local ENCODE_PORT=$ENCODE_PORT
+    local PREFILL_DECODE_PORT=$PREFILL_DECODE_PORT
+    local PROXY_PORT=$ENDPOINT_PORT
+    
+    declare -a PIDS=()
+    
+    # Start encoder instance
+    echo "Starting encoder instance on GPU $GPU_E, port $ENCODE_PORT"
+    CUDA_VISIBLE_DEVICES="$GPU_E" vllm serve "$MODEL" \
+        --port $ENCODE_PORT \
+        --enforce-eager \
+        --gpu-memory-utilization 0.01 \
+        --enable-request-id-headers \
+        --no-enable-prefix-caching \
+        --max-num-batched-tokens 114688 \
+        --max-num-seqs 128 \
+        --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+        --ec-transfer-config '{
+            "ec_connector": "ECSharedStorageConnector",
+            "ec_role": "ec_producer",
+            "ec_connector_extra_config": {
+                "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+            }
+        }' \
+        > $LOG_PATH/1e1pd_encoder.log 2>&1 &
+    PIDS+=($!)
+    
+    # Start prefill+decode instance
+    echo "Starting PD instance on GPU $GPU_PD, port $PREFILL_DECODE_PORT"
+    CUDA_VISIBLE_DEVICES="$GPU_PD" vllm serve "$MODEL" \
+        --port $PREFILL_DECODE_PORT \
+        --enforce-eager \
+        --gpu-memory-utilization 0.7 \
+        --enable-request-id-headers \
+        --max-num-seqs 128 \
+        --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+        --ec-transfer-config '{
+            "ec_connector": "ECSharedStorageConnector",
+            "ec_role": "ec_consumer",
+            "ec_connector_extra_config": {
+                "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+            }
+        }' \
+        > $LOG_PATH/1e1pd_pd.log 2>&1 &
+    PIDS+=($!)
+    
+    # Wait for instances to start
+    echo "Waiting for encoder instance..."
+    wait_for_server $ENCODE_PORT
+    echo "Waiting for PD instance..."
+    wait_for_server $PREFILL_DECODE_PORT
+
+    # Start proxy
+    echo "Starting EPD proxy on port $PROXY_PORT"
+    python "${GIT_ROOT}/examples/online_serving/disaggregated_encoder/disagg_epd_proxy.py" \
+        --host "0.0.0.0" \
+        --port $PROXY_PORT \
+        --encode-servers-urls "http://localhost:$ENCODE_PORT" \
+        --prefill-servers-urls "disable" \
+        --decode-servers-urls "http://localhost:$PREFILL_DECODE_PORT" \
+        > $LOG_PATH/1e1pd_proxy.log 2>&1 &
+    PIDS+=($!)
+    
+    # Wait for proxy
+    echo "Waiting for proxy..."
+    wait_for_server $PROXY_PORT
+
+    curl http://127.0.0.1:$PROXY_PORT/v1/models
+    curl http://127.0.0.1:$PROXY_PORT/health
+    echo ""
+
+    echo "All EPD (1E+1PD) services are up!"
+    
+    # Run test in disagg mode
+    echo "Running EPD (1E+1PD) correctness test..."
+    
+    python "${GIT_ROOT}/tests/v1/ec_connector/integration/test_epd_correctness.py" \
+        --service_url "http://localhost:$PROXY_PORT" \
+        --model_name "$MODEL" \
+        --mode disagg \
+        --baseline_file "$BASELINE_FILE" \
+        $MM_FLAG
+    
+    # Cleanup
+    echo "✓✓ 1E+1PD Correctness Test finished"
+    echo "Stopping EPD (1E+1PD) instances..."
+    for pid in "${PIDS[@]}"; do
+        kill $pid 2>/dev/null || true
+    done
+    sleep 2
+    cleanup_instances
+}
+
+# Function to run baseline for 1E + 1P + 1D (PD disagg)
+run_baseline_1p_1d() {
+    echo "================================"
+    echo "Running PD BASELINE (1P + 1D)"
+    echo "================================"
+    
+    cleanup_instances
+    rm -rf "$EC_SHARED_STORAGE_PATH"
+    mkdir -p "$EC_SHARED_STORAGE_PATH"
+    
+    local PREFILL_PORT=$PREFILL_PORT
+    local DECODE_PORT=$DECODE_PORT
+    local PROXY_PORT=$ENDPOINT_PORT
+    
+    declare -a PIDS=()
+    
+    # Start prefill instance
+    echo "Starting prefill instance on GPU $GPU_P, port $PREFILL_PORT"
+    CUDA_VISIBLE_DEVICES="$GPU_P" \
+    VLLM_NIXL_SIDE_CHANNEL_PORT=5559 \
+    vllm serve "$MODEL" \
+        --port $PREFILL_PORT \
+        --enforce-eager \
+        --gpu-memory-utilization 0.7 \
+        --enable-request-id-headers \
+        --max-num-seqs 128 \
+        --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+        --kv-transfer-config '{
+            "kv_connector": "NixlConnector",
+            "kv_role": "kv_producer"
+        }' \
+        > $LOG_PATH/1p1d_prefill.log 2>&1 &
+    PIDS+=($!)
+    
+    # Start decode instance
+    echo "Starting decode instance on GPU $GPU_D, port $DECODE_PORT"
+    CUDA_VISIBLE_DEVICES="$GPU_D" \
+    VLLM_NIXL_SIDE_CHANNEL_PORT=6000 \
+    vllm serve "$MODEL" \
+        --port $DECODE_PORT \
+        --enforce-eager \
+        --gpu-memory-utilization 0.7 \
+        --enable-request-id-headers \
+        --max-num-seqs 128 \
+        --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+        --kv-transfer-config '{
+            "kv_connector": "NixlConnector",
+            "kv_role": "kv_consumer"
+        }' \
+        > $LOG_PATH/1p1d_decode.log 2>&1 &
+    PIDS+=($!)
+    
+    # Wait for instances to start
+    echo "Waiting for prefill instance..."
+    wait_for_server $PREFILL_PORT
+    echo "Waiting for decode instance..."
+    wait_for_server $DECODE_PORT
+    
+    # Start proxy
+    echo "Starting EPD proxy on port $PROXY_PORT"
+    python "${GIT_ROOT}/tests/v1/kv_connector/nixl_integration/toy_proxy_server.py" \
+        --host "0.0.0.0" \
+        --port $PROXY_PORT \
+        --prefiller-ports $PREFILL_PORT \
+        --decoder-ports $DECODE_PORT \
+        > $LOG_PATH/1p1d_proxy.log 2>&1 &
+    PIDS+=($!)
+    
+    # Wait for proxy
+    echo "Waiting for proxy..."
+    wait_for_server $PROXY_PORT
+
+    curl http://127.0.0.1:$PROXY_PORT/healthcheck
+    echo ""
+
+    echo "All PD (1P+1D) services are up!"
+    
+    # Run test in baseline mode
+    echo "Running PD disagg baseline..."
+    
+    python "${GIT_ROOT}/tests/v1/ec_connector/integration/test_epd_correctness.py" \
+        --service_url "http://localhost:$PROXY_PORT" \
+        --model_name "$MODEL" \
+        --mode baseline_pd \
+        --baseline_file "$BASELINE_PD_FILE" \
+        $MM_FLAG
+    
+    # Cleanup
+    echo "Stopping PD (1P+1D) instances..."
+    for pid in "${PIDS[@]}"; do
+        kill $pid 2>/dev/null || true
+    done
+    sleep 2
+    cleanup_instances
+}
+
+# Function to run EPD with 1E + 1P + 1D
+run_epd_1e_1p_1d() {
+    echo "================================"
+    echo "Running EPD (1E + 1P + 1D)"
+    echo "================================"
+    
+    cleanup_instances
+    rm -rf "$EC_SHARED_STORAGE_PATH"
+    mkdir -p "$EC_SHARED_STORAGE_PATH"
+    
+    local ENCODE_PORT=$ENCODE_PORT
+    local PREFILL_PORT=$PREFILL_PORT
+    local DECODE_PORT=$DECODE_PORT
+    local PROXY_PORT=$ENDPOINT_PORT
+    
+    declare -a PIDS=()
+    
+    # Start encoder instance
+    echo "Starting encoder instance on GPU $GPU_E, port $ENCODE_PORT"
+    CUDA_VISIBLE_DEVICES="$GPU_E" vllm serve "$MODEL" \
+        --port $ENCODE_PORT \
+        --enforce-eager \
+        --gpu-memory-utilization 0.01 \
+        --enable-request-id-headers \
+        --no-enable-prefix-caching \
+        --max-num-batched-tokens 114688 \
+        --max-num-seqs 128 \
+        --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+        --ec-transfer-config '{
+            "ec_connector": "ECSharedStorageConnector",
+            "ec_role": "ec_producer",
+            "ec_connector_extra_config": {
+                "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+            }
+        }' \
+        > $LOG_PATH/1e1p1d_encoder.log 2>&1 &
+    PIDS+=($!)
+    
+    # Start prefill instance
+    echo "Starting prefill instance on GPU $GPU_P, port $PREFILL_PORT"
+    CUDA_VISIBLE_DEVICES="$GPU_P" \
+    VLLM_NIXL_SIDE_CHANNEL_PORT=5559 \
+    vllm serve "$MODEL" \
+        --port $PREFILL_PORT \
+        --enforce-eager \
+        --gpu-memory-utilization 0.7 \
+        --enable-request-id-headers \
+        --max-num-seqs 128 \
+        --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+        --ec-transfer-config '{
+            "ec_connector": "ECSharedStorageConnector",
+            "ec_role": "ec_consumer",
+            "ec_connector_extra_config": {
+                "shared_storage_path": "'"$EC_SHARED_STORAGE_PATH"'"
+            }
+        }' \
+        --kv-transfer-config '{
+            "kv_connector": "NixlConnector",
+            "kv_role": "kv_producer"
+        }' \
+        > $LOG_PATH/1e1p1d_prefill.log 2>&1 &
+    PIDS+=($!)
+    
+    # Start decode instance
+    echo "Starting decode instance on GPU $GPU_D, port $DECODE_PORT"
+    CUDA_VISIBLE_DEVICES="$GPU_D" \
+    VLLM_NIXL_SIDE_CHANNEL_PORT=6000 \
+    vllm serve "$MODEL" \
+        --port $DECODE_PORT \
+        --enforce-eager \
+        --gpu-memory-utilization 0.7 \
+        --enable-request-id-headers \
+        --max-num-seqs 128 \
+        --allowed-local-media-path ${GIT_ROOT}/tests/v1/ec_connector/integration \
+        --kv-transfer-config '{
+            "kv_connector": "NixlConnector",
+            "kv_role": "kv_consumer"
+        }' \
+        > $LOG_PATH/1e1p1d_decode.log 2>&1 &
+    PIDS+=($!)
+    
+    # Wait for instances to start
+    echo "Waiting for encoder instance..."
+    wait_for_server $ENCODE_PORT
+    echo "Waiting for prefill instance..."
+    wait_for_server $PREFILL_PORT
+    echo "Waiting for decode instance..."
+    wait_for_server $DECODE_PORT
+    
+    # Start proxy
+    echo "Starting EPD proxy on port $PROXY_PORT"
+    python "${GIT_ROOT}/examples/online_serving/disaggregated_encoder/disagg_epd_proxy.py" \
+        --host "0.0.0.0" \
+        --port $PROXY_PORT \
+        --encode-servers-urls "http://localhost:$ENCODE_PORT" \
+        --prefill-servers-urls "http://localhost:$PREFILL_PORT" \
+        --decode-servers-urls "http://localhost:$DECODE_PORT" \
+        > $LOG_PATH/1e1p1d_proxy.log 2>&1 &
+    PIDS+=($!)
+    
+    # Wait for proxy
+    echo "Waiting for proxy..."
+    wait_for_server $PROXY_PORT
+
+    curl http://127.0.0.1:$PROXY_PORT/v1/models
+    curl http://127.0.0.1:$PROXY_PORT/health
+    echo ""
+
+    echo "All EPD (1E+1P+1D) services are up!"
+    
+    # Run test in disagg mode
+    echo "Running EPD (1E+1P+1D) correctness test..."
+    
+    python "${GIT_ROOT}/tests/v1/ec_connector/integration/test_epd_correctness.py" \
+        --service_url "http://localhost:$PROXY_PORT" \
+        --model_name "$MODEL" \
+        --mode disagg \
+        --baseline_file "$BASELINE_PD_FILE" \
+        $MM_FLAG
+    
+    # Cleanup
+    echo "✓✓ 1E+1P+1D Correctness Test finished"
+    echo "Stopping EPD (1E+1P+1D) instances..."
+    for pid in "${PIDS[@]}"; do
+        kill $pid 2>/dev/null || true
+    done
+    sleep 2
+    cleanup_instances
+}
+
+# Main execution
+echo "================================"
+echo "EPD Correctness Test Suite"
+echo "Model: $MODEL"
+echo "================================"
+
+# Step 1: Run baseline
+run_baseline
+
+# Step 2: Test 1E + 1PD
+run_epd_1e_1pd
+
+# Step 3: Test baseline 1P + 1D
+run_baseline_1p_1d
+
+# Step 4: Test 1E + 1P + 1D
+run_epd_1e_1p_1d
+
+# Cleanup output file
+rm -f "$BASELINE_FILE"
+rm -f "$BASELINE_PD_FILE"
+
+echo "================================"
+echo "✓✓ All EPD correctness tests finished!"
+echo "================================"
diff --git a/tests/v1/ec_connector/integration/test_epd_correctness.py b/tests/v1/ec_connector/integration/test_epd_correctness.py
new file mode 100644
index 000000000000..69c4c58e349b
--- /dev/null
+++ b/tests/v1/ec_connector/integration/test_epd_correctness.py
@@ -0,0 +1,305 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""
+EPD Correctness Test
+
+Tests that EPD (Encoder-Prefill-Decode) disaggregation produces the same
+outputs as a baseline single instance.
+
+Usage:
+    # Baseline mode (saves outputs):
+    python test_epd_correctness.py \
+        --service_url http://localhost:8000 \
+        --model_name Qwen/Qwen2.5-VL-3B-Instruct \
+        --mode baseline \
+        --baseline_file .vllm_epd_baseline.txt
+
+    # Disagg mode (compares outputs):
+    python test_epd_correctness.py \
+        --service_url http://localhost:8000 \
+        --model_name Qwen/Qwen2.5-VL-3B-Instruct \
+        --mode disagg \
+        --baseline_file .vllm_epd_baseline.txt
+"""
+
+import argparse
+import json
+import os
+import time
+
+import openai
+import requests
+
+from vllm.assets.image import ImageAsset
+from vllm.multimodal.utils import encode_image_base64
+
+MAX_OUTPUT_LEN = 256
+
+# Sample prompts with multimodal content
+image_1 = ImageAsset("stop_sign").pil_image.resize((1280, 720))
+image_2 = ImageAsset("cherry_blossom").pil_image.resize((1280, 720))
+
+image_local_path = f"{os.path.dirname(os.path.abspath(__file__))}/hato.jpg"
+
+SAMPLE_PROMPTS_MM: list[dict] = [
+    {
+        "messages": [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {
+                            "url": f"data:image;base64,{encode_image_base64(image_1)}"
+                        },
+                    },
+                    {"type": "text", "text": "What's in this image?"},
+                ],
+            }
+        ],
+        "description": "Single image query",
+    },
+    {
+        "messages": [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {
+                            "url": f"data:image;base64,{encode_image_base64(image_2)}"
+                        },
+                    },
+                    {
+                        "type": "image_url",
+                        "image_url": {"url": f"file://{image_local_path}"},
+                    },
+                    {"type": "text", "text": "Describe these 2 images in detail."},
+                ],
+            }
+        ],
+        "description": "2 images with detailed query",
+    },
+]
+
+# Text-only prompts for mixed testing
+SAMPLE_PROMPTS_TEXT: list[dict] = [
+    {
+        "messages": [{"role": "user", "content": "What is the capital of France?"}],
+        "description": "Simple text-only query",
+    },
+    {
+        "messages": [
+            {"role": "user", "content": "Explain quantum computing in simple terms."}
+        ],
+        "description": "Text-only explanation request",
+    },
+]
+
+
+def check_vllm_server(url: str, timeout=5, retries=10) -> bool:
+    """Check if the vLLM server is ready.
+
+    Args:
+        url: The URL to check (usually /health or /healthcheck endpoint)
+        timeout: Timeout in seconds for each request
+        retries: Number of retries if the server is not ready
+
+    Returns:
+        True if the server is ready, False otherwise
+    """
+    for attempt in range(retries):
+        try:
+            response = requests.get(url, timeout=timeout)
+            if response.status_code == 200:
+                print(f"Server is ready at {url}")
+                return True
+            else:
+                print(
+                    f"Attempt {attempt + 1}/{retries}: Server returned "
+                    f"status code {response.status_code}"
+                )
+        except requests.exceptions.RequestException as e:
+            print(f"Attempt {attempt + 1}/{retries}: Error connecting: {e}")
+        time.sleep(2)  # Wait before retrying
+    return False
+
+
+def run_chat_completion(
+    base_url: str,
+    model_name: str,
+    messages: list,
+    max_tokens: int = MAX_OUTPUT_LEN,
+) -> str:
+    """Run a chat completion request.
+
+    Args:
+        base_url: Base URL of the vLLM server
+        model_name: Name of the model
+        messages: Messages for chat completion
+        max_tokens: Maximum tokens to generate
+
+    Returns:
+        Generated text content
+    """
+    client = openai.OpenAI(api_key="EMPTY", base_url=base_url)
+
+    completion = client.chat.completions.create(
+        model=model_name,
+        messages=messages,
+        max_tokens=max_tokens,
+        temperature=0.0,
+        seed=42,
+    )
+
+    return completion.choices[0].message.content
+
+
+def main():
+    """Main test function."""
+    parser = argparse.ArgumentParser(
+        description="EPD correctness test - compare disagg vs baseline"
+    )
+
+    parser.add_argument(
+        "--service_url",
+        type=str,
+        required=True,
+        help="The vLLM service URL (e.g., http://localhost:8000)",
+    )
+
+    parser.add_argument(
+        "--model_name",
+        type=str,
+        required=True,
+        help="Model name",
+    )
+
+    parser.add_argument(
+        "--mode",
+        type=str,
+        default="baseline",
+        choices=["baseline", "baseline_pd", "disagg"],
+        help="Mode: baseline/baseline_pd (saves outputs) or disagg (compares outputs)",
+    )
+
+    parser.add_argument(
+        "--baseline_file",
+        type=str,
+        default=".vllm_epd_baseline.txt",
+        help="File to save/load baseline outputs",
+    )
+
+    parser.add_argument(
+        "--use_mm_prompts",
+        action="store_true",
+        help="Use multimodal prompts (default: use text-only for quick testing)",
+    )
+
+    args = parser.parse_args()
+
+    print(f"Service URL: {args.service_url}")
+    print(f"Model: {args.model_name}")
+    print(f"Mode: {args.mode}")
+    print(f"Output file: {args.baseline_file}")
+    print(f"Use MM prompts: {args.use_mm_prompts}")
+
+    # Determine health check endpoint
+    if args.mode == "baseline":
+        health_check_url = f"{args.service_url}/health"
+    elif args.mode == "baseline_pd":
+        # Nixl toy proxy use /healthcheck
+        health_check_url = f"{args.service_url}/healthcheck"
+    else:
+        # Disagg EPD proxy uses /health
+        health_check_url = f"{args.service_url}/health"
+        if not os.path.exists(args.baseline_file):
+            raise ValueError(
+                f"In disagg mode, the output file {args.baseline_file} from "
+                "baseline does not exist. Run baseline mode first."
+            )
+
+    # Check if server is ready
+    if not check_vllm_server(health_check_url):
+        raise RuntimeError(f"vLLM server at {args.service_url} is not ready!")
+
+    # Select prompts to use
+    if args.use_mm_prompts:
+        test_prompts = SAMPLE_PROMPTS_MM
+        print("Using multimodal prompts")
+    else:
+        test_prompts = SAMPLE_PROMPTS_TEXT
+        print("Using text-only prompts for quick testing")
+
+    # Run completions
+    service_url = f"{args.service_url}/v1"
+    output_strs = {}
+
+    for i, prompt_data in enumerate(test_prompts):
+        print(
+            f"\nRunning prompt {i + 1}/{len(test_prompts)}: {
+                prompt_data['description']
+            }"
+        )
+
+        output_str = run_chat_completion(
+            base_url=service_url,
+            model_name=args.model_name,
+            messages=prompt_data["messages"],
+            max_tokens=MAX_OUTPUT_LEN,
+        )
+
+        # Use description as key for comparison
+        key = prompt_data["description"]
+        output_strs[key] = output_str
+        print(f"Output: {output_str}")
+
+    if args.mode in ("baseline", "baseline_pd"):
+        # Baseline mode: Save outputs
+        print(f"\nSaving baseline outputs to {args.baseline_file}")
+        try:
+            with open(args.baseline_file, "w") as json_file:
+                json.dump(output_strs, json_file, indent=4)
+            print("✅ Baseline outputs saved successfully")
+        except OSError as e:
+            print(f"Error writing to file: {e}")
+            raise
+    else:
+        # Disagg mode: Load and compare outputs
+        print(f"\nLoading baseline outputs from {args.baseline_file}")
+        baseline_outputs = None
+        try:
+            with open(args.baseline_file) as json_file:
+                baseline_outputs = json.load(json_file)
+        except OSError as e:
+            print(f"Error reading from file: {e}")
+            raise
+
+        # Verify outputs match
+        print("\nComparing disagg outputs with baseline...")
+        assert isinstance(baseline_outputs, dict), "Baseline outputs should be a dict"
+        assert len(baseline_outputs) == len(output_strs), (
+            f"Length mismatch: baseline has {len(baseline_outputs)}, "
+            f"disagg has {len(output_strs)}"
+        )
+
+        all_match = True
+        for key, baseline_output in baseline_outputs.items():
+            assert key in output_strs, f"{key} not in disagg outputs"
+
+            disagg_output = output_strs[key]
+            if baseline_output == disagg_output:
+                print(f"✅ {key}: MATCH")
+            else:
+                print(f"❌ {key}: MISMATCH")
+                print(f"  Baseline: {baseline_output}")
+                print(f"  Disagg:   {disagg_output}")
+                all_match = False
+
+        assert all_match, "❌❌Disagg outputs do not match baseline!❌❌"
+        if all_match:
+            print("\n✅ All outputs match! Test PASSED")
+
+
+if __name__ == "__main__":
+    main()
diff --git a/tests/v1/ec_connector/unit/test_ec_shared_storage_connector.py b/tests/v1/ec_connector/unit/test_ec_shared_storage_connector.py
new file mode 100644
index 000000000000..a58daa2628e2
--- /dev/null
+++ b/tests/v1/ec_connector/unit/test_ec_shared_storage_connector.py
@@ -0,0 +1,609 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""
+Unit tests for ECSharedStorageConnector.
+"""
+
+import os
+from unittest.mock import Mock, patch
+
+import pytest
+import safetensors
+import torch
+
+from vllm.config import VllmConfig
+from vllm.distributed.ec_transfer.ec_connector.base import ECConnectorRole
+from vllm.distributed.ec_transfer.ec_connector.shared_storage_connector import (
+    ECSharedStorageConnector,
+    ECSharedStorageConnectorMetadata,
+    MMMeta,
+)
+from vllm.multimodal.inputs import MultiModalFeatureSpec, PlaceholderRange
+from vllm.v1.core.sched.output import SchedulerOutput
+
+
+# ------------------ Mock Classes ------------------ #
+class MockRequest:
+    def __init__(self, request_id, mm_hashes: list[str], token_counts: list[int]):
+        assert len(mm_hashes) == len(token_counts)
+        self.request_id = request_id
+        self._token_counts = token_counts
+        self.mm_features = []
+        for i, mm_hash in enumerate(mm_hashes):
+            feature = MultiModalFeatureSpec(
+                data=None,
+                modality="image",
+                identifier=mm_hash,
+                mm_position=PlaceholderRange(offset=0, length=self._token_counts[i]),
+            )
+            self.mm_features.append(feature)
+
+    def get_num_encoder_tokens(self, input_id: int) -> int:
+        assert input_id < len(self._token_counts)
+        return self._token_counts[input_id]
+
+
+@pytest.fixture
+def temp_storage(tmp_path):
+    """Fixture providing temporary storage path."""
+    return str(tmp_path)
+
+
+@pytest.fixture
+def mock_vllm_config_producer(temp_storage):
+    """Fixture providing mock VllmConfig for producer role."""
+    config = Mock(spec=VllmConfig)
+    config.ec_transfer_config = Mock()
+    config.ec_transfer_config.get_from_extra_config = Mock(return_value=temp_storage)
+    config.ec_transfer_config.is_ec_producer = True
+    return config
+
+
+@pytest.fixture
+def mock_vllm_config_consumer(temp_storage):
+    """Fixture providing mock VllmConfig for consumer role."""
+    config = Mock(spec=VllmConfig)
+    config.ec_transfer_config = Mock()
+    config.ec_transfer_config.get_from_extra_config = Mock(return_value=temp_storage)
+    config.ec_transfer_config.is_ec_producer = False
+    return config
+
+
+@pytest.fixture
+def mock_request_with_3_mm():
+    """Fixture providing mock Request with 3 multimodal items."""
+    request_id = "test_req_123"
+    mm_hashes = ["img_hash_1", "img_hash_2", "img_hash_3"]
+    token_counts = [100, 150, 200]
+
+    request = MockRequest(request_id, mm_hashes, token_counts)
+    return request
+
+
+# ------------------ Unit Tests ------------------ #
+class TestECSharedStorageConnectorBasics:
+    """Test basic EC connector functionality."""
+
+    def test_initialization_producer(self, mock_vllm_config_producer, temp_storage):
+        """Test connector initializes correctly as producer."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        assert connector.role == ECConnectorRole.SCHEDULER
+        assert connector.is_producer
+        assert connector._storage_path == temp_storage
+        assert connector._mm_datas_need_loads == {}
+
+    def test_initialization_consumer(self, mock_vllm_config_consumer, temp_storage):
+        """Test connector initializes correctly as consumer."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        assert connector.role == ECConnectorRole.WORKER
+        assert not connector.is_producer
+        assert connector._storage_path == temp_storage
+
+    def test_role_assignment(self, mock_vllm_config_producer):
+        """Test role is correctly assigned."""
+        scheduler_connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+        worker_connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        assert scheduler_connector.role == ECConnectorRole.SCHEDULER
+        assert worker_connector.role == ECConnectorRole.WORKER
+
+
+class TestCacheExistence:
+    """Test cache existence checking using has_caches() API."""
+
+    def test_has_caches_all_exist_3_items(
+        self,
+        mock_vllm_config_producer,
+        mock_vllm_config_consumer,
+        mock_request_with_3_mm,
+    ):
+        """Test has_caches returns True when all 3 caches exist."""
+        # Test for producer first
+        producer = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        # Create cache files using save_caches (proper way)
+        encoder_cache: dict[str, torch.Tensor] = {}
+
+        for mm_feature in mock_request_with_3_mm.mm_features:
+            mm_hash = mm_feature.identifier
+            encoder_cache[mm_hash] = torch.randn(10, 768)
+            producer.save_caches(encoder_cache, mm_hash)
+
+        # Test using has_caches API
+        producer_result = producer.has_caches(mock_request_with_3_mm)
+
+        # Assert
+        assert len(producer_result) == 3
+        assert all(producer_result), f"Expected all True, got {producer_result}"
+
+        # Also test consumer can check if cache exists
+        consumer = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        # Test using has_caches API
+        consumer_result = consumer.has_caches(mock_request_with_3_mm)
+
+        # Assert
+        assert len(consumer_result) == 3
+        assert all(consumer_result), f"Expected all True, got {consumer_result}"
+
+    def test_has_caches_none_exist(
+        self, mock_vllm_config_producer, mock_request_with_3_mm
+    ):
+        """Test has_caches returns False when no caches exist."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        # Test without creating any files
+        result = connector.has_caches(mock_request_with_3_mm)
+
+        # Assert
+        assert len(result) == 3
+        assert not any(result), f"Expected all False, got {result}"
+
+    def test_has_caches_partial_exist(
+        self, mock_vllm_config_producer, mock_request_with_3_mm
+    ):
+        """Test has_caches with some caches existing (1 of 3)."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        # Create only the second cache file
+        mm_hash_second = mock_request_with_3_mm.mm_features[1].identifier
+        encoder_cache = {mm_hash_second: torch.randn(10, 768)}
+        connector.save_caches(encoder_cache, mm_hash_second)
+
+        # Test
+        result = connector.has_caches(mock_request_with_3_mm)
+
+        # Assert
+        assert len(result) == 3
+        assert not result[0]  # First doesn't exist
+        assert result[1]  # Second exists
+        assert not result[2]  # Third doesn't exist
+
+
+class TestStateManagement:
+    """Test connector state management."""
+
+    def test_update_state_after_alloc_3_items(
+        self, mock_vllm_config_producer, mock_request_with_3_mm
+    ):
+        """Test state update after allocation for 3 MM items."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        # Initial state should be empty
+        assert len(connector._mm_datas_need_loads) == 0
+
+        # Update state for all 3 items
+        for i in range(3):
+            connector.update_state_after_alloc(mock_request_with_3_mm, index=i)
+
+        # Check state updated for all 3
+        assert len(connector._mm_datas_need_loads) == 3
+        assert "img_hash_1" in connector._mm_datas_need_loads
+        assert "img_hash_2" in connector._mm_datas_need_loads
+        assert "img_hash_3" in connector._mm_datas_need_loads
+        assert connector._mm_datas_need_loads["img_hash_1"] == 100
+        assert connector._mm_datas_need_loads["img_hash_2"] == 150
+        assert connector._mm_datas_need_loads["img_hash_3"] == 200
+
+    def test_build_connector_meta_3_items(
+        self, mock_vllm_config_producer, mock_request_with_3_mm
+    ):
+        """Test metadata building for 3 MM items."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        # Setup state for all 3 items
+        for i in range(3):
+            connector.update_state_after_alloc(mock_request_with_3_mm, index=i)
+
+        # Build metadata
+        scheduler_output = Mock(spec=SchedulerOutput)
+        metadata = connector.build_connector_meta(scheduler_output)
+
+        # Assert
+        assert isinstance(metadata, ECSharedStorageConnectorMetadata)
+        assert len(metadata.mm_datas) == 3
+        assert metadata.mm_datas[0].mm_hash == "img_hash_1"
+        assert metadata.mm_datas[0].num_token == 100
+        assert metadata.mm_datas[1].mm_hash == "img_hash_2"
+        assert metadata.mm_datas[1].num_token == 150
+        assert metadata.mm_datas[2].mm_hash == "img_hash_3"
+        assert metadata.mm_datas[2].num_token == 200
+
+        # State should be cleared after building
+        assert len(connector._mm_datas_need_loads) == 0
+
+    def test_build_connector_meta_empty(self, mock_vllm_config_producer):
+        """Test metadata building with empty state."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        scheduler_output = Mock(spec=SchedulerOutput)
+        metadata = connector.build_connector_meta(scheduler_output)
+
+        assert isinstance(metadata, ECSharedStorageConnectorMetadata)
+        assert len(metadata.mm_datas) == 0
+
+    def test_state_cleared_after_metadata_build(
+        self, mock_vllm_config_producer, mock_request_with_3_mm
+    ):
+        """Test that state is properly cleared after building metadata."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        # Add state
+        for i in range(3):
+            connector.update_state_after_alloc(mock_request_with_3_mm, index=i)
+        assert len(connector._mm_datas_need_loads) == 3
+
+        # Build metadata (should clear state)
+        scheduler_output = Mock(spec=SchedulerOutput)
+        connector.build_connector_meta(scheduler_output)
+
+        # State should be empty
+        assert len(connector._mm_datas_need_loads) == 0
+
+        # Build again should return empty metadata
+        metadata2 = connector.build_connector_meta(scheduler_output)
+        assert len(metadata2.mm_datas) == 0
+
+
+class TestCacheSaving:
+    """Test encoder cache saving (producer only)."""
+
+    def test_save_caches_producer_3_items(
+        self, mock_vllm_config_producer, mock_request_with_3_mm, temp_storage
+    ):
+        """Test cache saving as producer for 3 different MM items."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        # Create and save 3 different caches
+        mm_hashes = [f.identifier for f in mock_request_with_3_mm.mm_features]
+        encoder_cache: dict[str, torch.Tensor] = {}
+
+        for mm_hash in mm_hashes:
+            encoder_cache[mm_hash] = torch.randn(10, 768)
+            connector.save_caches(encoder_cache, mm_hash)
+
+        # Verify all files exist using has_caches
+        result = connector.has_caches(mock_request_with_3_mm)
+        assert all(result), f"Not all caches were saved: {result}"
+
+        # Verify each file's content
+        for mm_hash in mm_hashes:
+            filename = connector._generate_filename_debug(mm_hash)
+            loaded = safetensors.torch.load_file(filename)
+            assert "ec_cache" in loaded
+            assert torch.allclose(loaded["ec_cache"], encoder_cache[mm_hash].cpu())
+
+    def test_save_caches_consumer_skips(self, mock_vllm_config_consumer):
+        """Test cache saving is skipped for consumer."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        mm_hash = "test_hash_consumer"
+        encoder_cache = {mm_hash: torch.randn(10, 768)}
+
+        # Save should not raise but also not create file
+        connector.save_caches(encoder_cache, mm_hash)
+
+        # Verify file doesn't exist using has_caches
+        mock_request = MockRequest("req_consumer", [mm_hash], [10])
+        result = connector.has_caches(mock_request)
+        assert not result[0], "Consumer should not save caches"
+
+
+class TestCacheLoading:
+    """Test encoder cache loading (consumer)."""
+
+    @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+    def test_start_load_caches_consumer_3_items(
+        self,
+        mock_vllm_config_producer,
+        mock_vllm_config_consumer,
+        mock_request_with_3_mm,
+        temp_storage,
+    ):
+        """Test consumer loads 3 caches from storage."""
+        # First, create producer to save caches
+        producer = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        # Producer saves 3 caches
+        mm_hashes = [f.identifier for f in mock_request_with_3_mm.mm_features]
+        saved_caches = {}
+        for mm_hash in mm_hashes:
+            saved_caches[mm_hash] = torch.randn(10, 768)
+            producer.save_caches(saved_caches, mm_hash)
+
+        # Now consumer loads
+        consumer = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        # Setup metadata for all 3
+        metadata = ECSharedStorageConnectorMetadata()
+        for mm_hash in mm_hashes:
+            metadata.add_mm_data(MMMeta.make_meta(mm_hash, 100))
+        consumer.bind_connector_metadata(metadata)
+
+        # Load
+        encoder_cache: dict[str, torch.Tensor] = {}
+        consumer.start_load_caches(encoder_cache=encoder_cache)
+
+        # Verify all 3 loaded
+        assert len(encoder_cache) == 3
+        for mm_hash in mm_hashes:
+            assert mm_hash in encoder_cache, f"{mm_hash} missing in encoder_cache"
+            assert encoder_cache[mm_hash].is_cuda, (
+                f"{mm_hash} cache is in {encoder_cache[mm_hash].device}"
+            )
+            assert torch.allclose(
+                encoder_cache[mm_hash].cpu(), saved_caches[mm_hash]
+            ), f"{mm_hash} cache saved and loaded tesnor are not the same"
+
+    def test_start_load_caches_skip_existing(
+        self, mock_vllm_config_producer, mock_vllm_config_consumer, temp_storage
+    ):
+        """Test cache loading skips already cached items."""
+        # Setup: producer saves cache
+        producer = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        mm_hash = "existing_hash"
+        saved_cache = torch.randn(10, 768)
+        producer.save_caches({mm_hash: saved_cache}, mm_hash)
+
+        # Consumer setup
+        consumer = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        metadata = ECSharedStorageConnectorMetadata()
+        metadata.add_mm_data(MMMeta.make_meta(mm_hash, 100))
+        consumer.bind_connector_metadata(metadata)
+
+        # Pre-populate encoder_cache with different value
+        existing_cache = torch.randn(5, 512)
+        encoder_cache = {mm_hash: existing_cache}
+
+        # Load (should skip since already exists)
+        with patch("safetensors.torch.load_file") as mock_load:
+            consumer.start_load_caches(encoder_cache=encoder_cache)
+            # Should not call load_file since cache exists
+            mock_load.assert_not_called()
+
+        # Verify original cache unchanged
+        assert torch.equal(encoder_cache[mm_hash], existing_cache)
+
+    def test_start_load_caches_empty_metadata(self, mock_vllm_config_consumer):
+        """Test loading with empty metadata does nothing."""
+        consumer = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        # Setup empty metadata
+        metadata = ECSharedStorageConnectorMetadata()
+        consumer.bind_connector_metadata(metadata)
+
+        # Load (should not raise)
+        encoder_cache: dict[str, torch.Tensor] = {}
+        consumer.start_load_caches(encoder_cache=encoder_cache)
+
+        # Cache should remain empty
+        assert len(encoder_cache) == 0
+
+
+class TestFilenameGeneration:
+    """Test filename and path generation."""
+
+    def test_generate_foldername(self, mock_vllm_config_producer, temp_storage):
+        """Test folder name generation."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        mm_hash = "test_folder_hash"
+        folder = connector._generate_foldername_debug(mm_hash)
+
+        assert folder == os.path.join(temp_storage, mm_hash)
+        assert os.path.isdir(folder)  # Should be created
+
+    def test_generate_filename(self, mock_vllm_config_producer, temp_storage):
+        """Test filename generation."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        mm_hash = "test_file_hash"
+        filename = connector._generate_filename_debug(mm_hash)
+
+        expected = os.path.join(temp_storage, mm_hash, "encoder_cache.safetensors")
+        assert filename == expected
+        assert os.path.isdir(os.path.dirname(filename))  # Folder created
+
+    def test_generate_filename_consistency(self, mock_vllm_config_producer):
+        """Test filename generation is consistent."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        mm_hash = "consistency_hash"
+        filename1 = connector._generate_filename_debug(mm_hash)
+        filename2 = connector._generate_filename_debug(mm_hash)
+
+        assert filename1 == filename2
+
+
+class TestMetadataBindingLifecycle:
+    """Test metadata binding and clearing lifecycle."""
+
+    def test_bind_connector_metadata(self, mock_vllm_config_consumer):
+        """Test binding connector metadata."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        metadata = ECSharedStorageConnectorMetadata()
+        metadata.add_mm_data(MMMeta.make_meta("hash_1", 100))
+
+        connector.bind_connector_metadata(metadata)
+
+        assert connector._connector_metadata is metadata
+
+    def test_clear_connector_metadata(self, mock_vllm_config_consumer):
+        """Test clearing connector metadata."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        metadata = ECSharedStorageConnectorMetadata()
+        connector.bind_connector_metadata(metadata)
+
+        connector.clear_connector_metadata()
+
+        assert connector._connector_metadata is None
+
+    def test_get_connector_metadata(self, mock_vllm_config_consumer):
+        """Test getting connector metadata."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        metadata = ECSharedStorageConnectorMetadata()
+        connector.bind_connector_metadata(metadata)
+
+        retrieved = connector._get_connector_metadata()
+
+        assert retrieved is metadata
+
+    def test_get_connector_metadata_not_set(self, mock_vllm_config_consumer):
+        """Test getting metadata when not set raises."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        with pytest.raises(AssertionError):
+            connector._get_connector_metadata()
+
+
+class TestEdgeCases:
+    """Test edge cases and error handling."""
+
+    def test_save_empty_cache(self, mock_vllm_config_producer):
+        """Test saving empty tensor."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        mm_hash = "empty_hash"
+        encoder_cache = {mm_hash: torch.empty(0)}
+
+        # Should not raise
+        connector.save_caches(encoder_cache, mm_hash)
+
+    def test_load_nonexistent_cache(self, mock_vllm_config_consumer):
+        """Test loading cache that doesn't exist raises error."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_consumer,
+            role=ECConnectorRole.WORKER,
+        )
+
+        metadata = ECSharedStorageConnectorMetadata()
+        metadata.add_mm_data(MMMeta.make_meta("nonexistent_hash", 100))
+        connector.bind_connector_metadata(metadata)
+
+        encoder_cache: dict[str, torch.Tensor] = {}
+
+        # Should raise FileNotFoundError
+        with pytest.raises(FileNotFoundError):
+            connector.start_load_caches(encoder_cache=encoder_cache)
+
+    def test_has_caches_empty_request(self, mock_vllm_config_producer):
+        """Test has_caches with request that has no MM data."""
+        connector = ECSharedStorageConnector(
+            vllm_config=mock_vllm_config_producer,
+            role=ECConnectorRole.SCHEDULER,
+        )
+
+        mock_request = MockRequest("req_empty", [], [])
+
+        result = connector.has_caches(mock_request)
+
+        assert len(result) == 0
+        assert result == []
diff --git a/tests/v1/engine/test_engine_core.py b/tests/v1/engine/test_engine_core.py
index 84441aa7d28c..4e852dca95eb 100644
--- a/tests/v1/engine/test_engine_core.py
+++ b/tests/v1/engine/test_engine_core.py
@@ -10,6 +10,14 @@
 from transformers import AutoTokenizer
 
 from vllm import SamplingParams
+from vllm.config import (
+    CacheConfig,
+    ECTransferConfig,
+    KVTransferConfig,
+    ModelConfig,
+    SchedulerConfig,
+    VllmConfig,
+)
 from vllm.engine.arg_utils import EngineArgs
 from vllm.platforms import current_platform
 from vllm.utils.torch_utils import set_default_torch_num_threads
@@ -450,3 +458,141 @@ def test_engine_core_invalid_request_id_type():
     engine_core.add_request(*engine_core.preprocess_add_request(valid_request))
     assert len(engine_core.scheduler.waiting) == 1
     assert len(engine_core.scheduler.running) == 0
+
+
+@create_new_process_for_each_test()
+@pytest.mark.parametrize(
+    ("ec_role", "gpu_memory_utilization", "enable_prefix_caching"),
+    [
+        ("ec_producer", 0.01, False),
+        # NOTE: ec_producer never allows prefix caching
+        ("ec_consumer", 0.7, True),
+        ("ec_consumer", 0.7, False),
+    ],
+)
+@pytest.mark.parametrize("use_kv_connector", [False, True])
+def test_encoder_instance_zero_kv_cache(
+    ec_role: str,
+    gpu_memory_utilization: float,
+    enable_prefix_caching: bool,
+    use_kv_connector: bool,
+):
+    """EPD (Encoder-Prefill-Decode) Encoder-cache-specific tests
+
+    This test verifies encoder-only instance initializes with 0 KV cache blocks.
+    Under EPD disagg mode, Encoder instances (EC producer role) only execute
+    vision encoder, so they don't need KV cache for text generation.
+    """
+    # Form vllm config
+    scheduler_config = SchedulerConfig(
+        max_num_seqs=10,
+        max_num_batched_tokens=512,
+        max_model_len=512,
+        disable_hybrid_kv_cache_manager=True,
+    )
+    model_config = ModelConfig(
+        model="llava-hf/llava-1.5-7b-hf",  # Multimodal model
+        enforce_eager=True,
+        trust_remote_code=True,
+        dtype="float16",
+        seed=42,
+    )
+    cache_config = CacheConfig(
+        block_size=16,
+        gpu_memory_utilization=gpu_memory_utilization,
+        swap_space=0,
+        cache_dtype="auto",
+        enable_prefix_caching=enable_prefix_caching,
+    )
+    kv_transfer_config = (
+        KVTransferConfig(
+            kv_connector="SharedStorageConnector",
+            kv_role="kv_both",
+            kv_connector_extra_config={"shared_storage_path": "local_storage"},
+        )
+        if use_kv_connector
+        else None
+    )
+    ec_transfer_config = ECTransferConfig(
+        ec_connector="ECSharedStorageConnector",
+        ec_role=ec_role,
+        ec_connector_extra_config={"shared_storage_path": "/tmp/ec_test_encoder"},
+    )
+
+    vllm_config = VllmConfig(
+        model_config=model_config,
+        cache_config=cache_config,
+        scheduler_config=scheduler_config,
+        kv_transfer_config=kv_transfer_config,
+        ec_transfer_config=ec_transfer_config,
+    )
+
+    executor_class = Executor.get_class(vllm_config)
+    print(f"executor_class: {executor_class}")
+
+    with set_default_torch_num_threads(1):
+        engine_core = EngineCore(
+            vllm_config=vllm_config, executor_class=executor_class, log_stats=True
+        )
+
+    # Check encoder cache manager exists
+    assert engine_core.scheduler.encoder_cache_manager is not None, (
+        "encoder_cache_manager should exist"
+    )
+
+    if ec_role == "ec_producer":
+        # Check 1: num_blocks should be 0
+        # NOTE: num_blocks=1 as BlockPool always needs a null_block.
+        kv_cache_config = engine_core.scheduler.kv_cache_manager.kv_cache_config
+        print(f"kv_cache_config: {kv_cache_config}")
+        assert kv_cache_config.num_blocks == 1, (
+            f"ec_producer should only have 1 KV blocks, "
+            f"got {kv_cache_config.num_blocks}"
+        )
+
+        # Check 2: kv_cache_groups should be empty
+        assert len(kv_cache_config.kv_cache_groups) == 0, (
+            f"ec_producer should have 0 KV cache groups, "
+            f"got {len(kv_cache_config.kv_cache_groups)}"
+        )
+
+        # Check 3: kv_cache_tensors should be empty
+        assert len(kv_cache_config.kv_cache_tensors) == 0, (
+            f"Encoder instance should have 0 KV cache tensors, "
+            f"got {len(kv_cache_config.kv_cache_tensors)}"
+        )
+
+        # Check 4: Verify EC connector is initialized and is producer
+        assert engine_core.scheduler.ec_connector is not None, (
+            "Encoder instance should have EC connector"
+        )
+        assert engine_core.scheduler.ec_connector.is_producer, (
+            "Encoder instance EC connector should be producer"
+        )
+
+        # Check 5: Verify chunked prefill is disabled
+        assert not vllm_config.scheduler_config.chunked_prefill_enabled, (
+            "Encoder instance should disable chunked prefill (no KV cache)"
+        )
+
+    elif ec_role == "ec_consumer":
+        # Check 1: num_blocks should be > 1
+        kv_cache_config = engine_core.scheduler.kv_cache_manager.kv_cache_config
+        print(f"kv_cache_config: {kv_cache_config}")
+        assert kv_cache_config.num_blocks > 1, (
+            f"ec_consumer should have >1 KV blocks, got {kv_cache_config.num_blocks}"
+        )
+
+        # Check 2: kv_cache_groups should NOT be empty
+        assert len(kv_cache_config.kv_cache_groups) > 0, (
+            f"ec_consumer should have KV cache groups, "
+            f"got {len(kv_cache_config.kv_cache_groups)}"
+        )
+
+        # Check 3: Verify EC connector is consumer
+        assert engine_core.scheduler.ec_connector is not None, (
+            "Consumer instance should have EC connector"
+        )
+        assert not engine_core.scheduler.ec_connector.is_producer, (
+            "Consumer instance EC connector should be consumer"
+        )
diff --git a/vllm/config/__init__.py b/vllm/config/__init__.py
index 7f1cc5202420..dd76a722106e 100644
--- a/vllm/config/__init__.py
+++ b/vllm/config/__init__.py
@@ -9,6 +9,7 @@
     PassConfig,
 )
 from vllm.config.device import DeviceConfig
+from vllm.config.ec_transfer import ECTransferConfig
 from vllm.config.kv_events import KVEventsConfig
 from vllm.config.kv_transfer import KVTransferConfig
 from vllm.config.load import LoadConfig
@@ -54,6 +55,8 @@
     "PassConfig",
     # From vllm.config.device
     "DeviceConfig",
+    # From vllm.config.ec_transfer
+    "ECTransferConfig",
     # From vllm.config.kv_events
     "KVEventsConfig",
     # From vllm.config.kv_transfer
diff --git a/vllm/config/ec_transfer.py b/vllm/config/ec_transfer.py
new file mode 100644
index 000000000000..d95236f818ab
--- /dev/null
+++ b/vllm/config/ec_transfer.py
@@ -0,0 +1,110 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import hashlib
+import uuid
+from dataclasses import field
+from typing import Any, Literal, get_args
+
+from pydantic.dataclasses import dataclass
+
+from vllm.config.utils import config
+
+ECProducer = Literal["ec_producer"]
+ECConsumer = Literal["ec_consumer"]
+ECRole = Literal[ECProducer, ECConsumer]
+
+
+@config
+@dataclass
+class ECTransferConfig:
+    """Configuration for distributed EC cache transfer."""
+
+    ec_connector: str | None = None
+    """The EC connector for vLLM to transmit EC caches between vLLM instances.
+    """
+
+    engine_id: str | None = None
+    """The engine id for EC transfers."""
+
+    ec_buffer_device: str | None = "cuda"
+    """The device used by ec connector to buffer the EC cache.
+    Currently only support 'cuda'."""
+
+    ec_buffer_size: float = 1e9
+    """The buffer size for TorchDistributedConnector. Measured in number of
+    bytes. Recommended value: 1e9 (about 1GB)."""
+
+    ec_role: ECRole | None = None
+    """Whether this vLLM instance produces, consumes EC cache, or both. Choices
+    are 'ec_producer', 'ec_consumer'."""
+
+    ec_rank: int | None = None
+    """The rank of this vLLM instance in the EC cache transfer. Typical value:
+    0 for encoder, 1 for pd instance.
+    Currently only 1P1D is supported."""
+
+    ec_parallel_size: int = 1
+    """The number of parallel instances for EC cache transfer. For
+    PyNcclConnector, this should be 2."""
+
+    ec_ip: str = "127.0.0.1"
+    """The EC connector ip, used to build distributed connection."""
+
+    ec_port: int = 14579
+    """The EC connector port, used to build distributed connection."""
+
+    ec_connector_extra_config: dict[str, Any] = field(default_factory=dict)
+    """any extra config that the connector may need."""
+
+    ec_connector_module_path: str | None = None
+    """The Python module path to dynamically load the EC connector from.
+    Only supported in V1."""
+
+    def compute_hash(self) -> str:
+        """
+        WARNING: Whenever a new field is added to this config,
+        ensure that it is included in the factors list if
+        it affects the computation graph.
+
+        Provide a hash that uniquely identifies all the configs
+        that affect the structure of the computation
+        graph from input ids/embeddings to the final hidden states,
+        excluding anything before input ids/embeddings and after
+        the final hidden states.
+        """
+        # no factors to consider.
+        # this config will not affect the computation graph.
+        factors: list[Any] = []
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
+        return hash_str
+
+    def __post_init__(self) -> None:
+        if self.engine_id is None:
+            self.engine_id = str(uuid.uuid4())
+
+        if self.ec_role is not None and self.ec_role not in get_args(ECRole):
+            raise ValueError(
+                f"Unsupported ec_role: {self.ec_role}. "
+                f"Supported roles are {get_args(ECRole)}"
+            )
+
+        if self.ec_connector is not None and self.ec_role is None:
+            raise ValueError(
+                "Please specify ec_role when ec_connector "
+                f"is set, supported roles are {get_args(ECRole)}"
+            )
+
+    @property
+    def is_ec_transfer_instance(self) -> bool:
+        return self.ec_connector is not None and self.ec_role in get_args(ECRole)
+
+    @property
+    def is_ec_producer(self) -> bool:
+        return self.ec_connector is not None and self.ec_role in get_args(ECProducer)
+
+    @property
+    def is_ec_consumer(self) -> bool:
+        return self.ec_connector is not None and self.ec_role in get_args(ECConsumer)
+
+    def get_from_extra_config(self, key, default) -> Any:
+        return self.ec_connector_extra_config.get(key, default)
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index df9a1fd08af6..60458b26944a 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -28,6 +28,7 @@
 from .cache import CacheConfig
 from .compilation import CompilationConfig, CompilationMode, CUDAGraphMode
 from .device import DeviceConfig
+from .ec_transfer import ECTransferConfig
 from .kv_events import KVEventsConfig
 from .kv_transfer import KVTransferConfig
 from .load import LoadConfig
@@ -103,6 +104,8 @@ class VllmConfig:
     """The configurations for distributed KV cache transfer."""
     kv_events_config: KVEventsConfig | None = None
     """The configurations for event publishing."""
+    ec_transfer_config: ECTransferConfig | None = None
+    """The configurations for distributed EC cache transfer."""
     # some opaque config, only used to provide additional information
     # for the hash computation, mainly used for testing, debugging or out of
     # tree config registration.
@@ -183,6 +186,10 @@ def compute_hash(self) -> str:
             vllm_factors.append(self.kv_transfer_config.compute_hash())
         else:
             vllm_factors.append("None")
+        if self.ec_transfer_config:
+            vllm_factors.append(self.ec_transfer_config.compute_hash())
+        else:
+            vllm_factors.append("None")
         if self.additional_config:
             if isinstance(additional_config := self.additional_config, dict):
                 additional_config_hash = hashlib.md5(
diff --git a/vllm/distributed/ec_transfer/__init__.py b/vllm/distributed/ec_transfer/__init__.py
new file mode 100644
index 000000000000..0decfd143e34
--- /dev/null
+++ b/vllm/distributed/ec_transfer/__init__.py
@@ -0,0 +1,14 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from vllm.distributed.ec_transfer.ec_transfer_state import (
+    ensure_ec_transfer_initialized,
+    get_ec_transfer,
+    has_ec_transfer,
+)
+
+__all__ = [
+    "get_ec_transfer",
+    "ensure_ec_transfer_initialized",
+    "has_ec_transfer",
+]
diff --git a/vllm/distributed/ec_transfer/ec_connector/__init__.py b/vllm/distributed/ec_transfer/ec_connector/__init__.py
new file mode 100644
index 000000000000..e69de29bb2d1
diff --git a/vllm/distributed/ec_transfer/ec_connector/base.py b/vllm/distributed/ec_transfer/ec_connector/base.py
new file mode 100644
index 000000000000..2b7b14d89b8a
--- /dev/null
+++ b/vllm/distributed/ec_transfer/ec_connector/base.py
@@ -0,0 +1,247 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""
+ECConnectorBase Class for Distributed Encoder Cache &
+P2P Encoder cache communication in V1
+
+The class provides the following primitives:
+    Scheduler-side: runs in the scheduler, binds metadata, which
+    is used by the worker-side to load/save Encoder cache.
+        check_caches_exist() - Check whether Encoder cache of requests exist
+        update_state_after_alloc() - update ECConnector state after
+        allocate. This will decide to load the cache or not
+        request_finished() - called when a request is finished,
+        free the cache with the requests
+
+    Worker-side: runs in each worker, loads/saves Encoder Cache to/from
+    the Connector based on the metadata.
+        start_load_ec() - starts loading all ECs (maybe async)
+        wait_for_save() - blocks until all saves are done
+
+        get_finished() - called with ids of finished requests, returns
+            ids of requests that have completed async sending/recving.
+"""
+
+import enum
+from abc import ABC, abstractmethod
+from typing import TYPE_CHECKING, Any
+
+import torch
+
+from vllm.logger import init_logger
+from vllm.v1.core.sched.output import SchedulerOutput
+from vllm.v1.outputs import ECConnectorOutput
+
+if TYPE_CHECKING:
+    from vllm.config import VllmConfig
+    from vllm.v1.request import Request
+
+logger = init_logger(__name__)
+
+
+class ECConnectorRole(enum.Enum):
+    # Connector running in the scheduler process
+    SCHEDULER = 0
+
+    # Connector running in the worker process
+    WORKER = 1
+
+
+class ECConnectorMetadata(ABC):  # noqa: B024
+    """
+    Abstract Metadata used to communicate between the
+    Scheduler ECConnector and Worker ECConnector.
+    """
+
+    pass
+
+
+class ECConnectorBase(ABC):
+    def __init__(self, vllm_config: "VllmConfig", role: ECConnectorRole):
+        self._connector_metadata: ECConnectorMetadata | None = None
+        self._vllm_config = vllm_config
+        self._role = role
+        if vllm_config.ec_transfer_config is not None:
+            self._is_producer = vllm_config.ec_transfer_config.is_ec_producer
+        else:
+            raise ValueError("ec_transfer_config must be set for ECConnectorBase")
+
+    @property
+    def role(self) -> ECConnectorRole:
+        return self._role
+
+    @property
+    def is_producer(self) -> bool:
+        return self._is_producer
+
+    # ==============================
+    # Worker-side methods
+    # ==============================
+
+    def bind_connector_metadata(self, connector_metadata: ECConnectorMetadata) -> None:
+        """Set the connector metadata from the scheduler.
+
+        This function should be called by the model runner every time
+        before the model execution. The metadata will be used for runtime
+        EC cache loading.
+
+        Args:
+            connector_metadata (dict): the connector metadata.
+        """
+        self._connector_metadata = connector_metadata
+
+    def clear_connector_metadata(self) -> None:
+        """Clear the connector metadata.
+
+        This function should be called by the model runner every time
+        after the model execution.
+        """
+        self._connector_metadata = None
+
+    def _get_connector_metadata(self) -> ECConnectorMetadata:
+        """Get the connector metadata.
+
+        This function should only be called inside the connector.
+
+        Returns:
+            ConnectorMetadata: the connector metadata.
+        """
+
+        # Should only be called while set to valid metadata.
+        assert self._connector_metadata is not None
+        return self._connector_metadata
+
+    def register_caches(
+        self,
+        ec_caches: dict[str, torch.Tensor],
+    ):
+        """
+        Initialize with the EC caches.
+        Args:
+            ec_caches: dictionary of encoder cache
+        """
+        # TODO: Implement this later for P2P feature
+        return
+
+    @abstractmethod
+    def start_load_caches(
+        self, encoder_cache: dict[str, torch.Tensor], **kwargs
+    ) -> None:
+        """
+        Start loading the cache from the connector into vLLM's encoder cache.
+
+        This method loads the encoder cache based on metadata provided by the scheduler.
+        It is called before `_gather_mm_embeddings` for the EC Connector. For EC,
+        the `encoder_cache` and `mm_hash` are stored in `kwargs`.
+
+        Args:
+            encoder_cache (dict[str, torch.Tensor]): A dictionary mapping multimodal
+                data hashes (`mm_hash`) to encoder cache tensors.
+            kwargs (dict): Additional keyword arguments for the connector.
+        """
+        pass
+
+    @abstractmethod
+    def save_caches(
+        self, encoder_cache: dict[str, torch.Tensor], mm_hash: str, **kwargs
+    ) -> None:
+        """
+        Save the encoder cache to the connector.
+
+        This method saves the encoder cache from the worker's local storage
+        to shared storage or another external connector.
+
+        Args:
+            encoder_cache (dict[str, torch.Tensor]): A dictionary mapping multimodal
+                data hashes (`mm_hash`) to encoder cache tensors.
+            mm_hash (str): The hash of the multimodal data whose cache is being saved.
+            kwargs (dict): Additional keyword arguments for the connector.
+        """
+        pass
+
+    def get_finished(
+        self, finished_req_ids: set[str]
+    ) -> tuple[set[str] | None, set[str] | None]:
+        """
+        Notifies worker-side connector ids of requests that have
+        finished generating tokens on the worker.
+        The scheduler process (via the Executors) will use this output
+        to track which workers are done.
+
+        Returns:
+            ids of requests that have finished asynchronous transfer
+            (requests that previously returned True from request_finished()),
+            tuple of (sending/saving ids, recving/loading ids).
+            The finished saves/sends req ids must belong to a set provided in a
+            call to this method (this call or a prior one).
+        """
+        return None, None
+
+    # ==============================
+    # Scheduler-side methods
+    # ==============================
+
+    @abstractmethod
+    def has_caches(
+        self,
+        request: "Request",
+    ) -> list[bool]:
+        """
+        Check if encoder cache exists for each mm data of requests
+
+        Args:
+            request (Request): the request object.
+
+        Returns:
+            A list bool where ith value is True if cache exist for
+            ith mm_data of requests
+        """
+        pass
+
+    @abstractmethod
+    def update_state_after_alloc(self, request: "Request", index: int):
+        """
+        Update ECConnector state to decide allocate cache for requests
+
+        Args:
+            request (Request): the request object.
+        """
+        pass
+
+    @abstractmethod
+    def build_connector_meta(
+        self, scheduler_output: SchedulerOutput
+    ) -> ECConnectorMetadata:
+        """
+        Build the connector metadata for this step.
+
+        This function should NOT modify fields in the scheduler_output.
+        Also, calling this function will reset the state of the connector.
+
+        Args:
+            scheduler_output (SchedulerOutput): the scheduler output object.
+        """
+        pass
+
+    def update_connector_output(self, connector_output: ECConnectorOutput):
+        """
+        Update ECConnector state from worker-side connectors output.
+
+        Args:
+            connector_output (ECConnectorOutput): the worker-side
+                connectors output.
+        """
+        return
+
+    def request_finished(
+        self, request: "Request"
+    ) -> tuple[bool, dict[str, Any] | None]:
+        """
+        Called when a request has finished, before its encoder cache is freed.
+
+        Returns:
+            True if the request is being saved/sent asynchronously and cached
+            should not be freed until the request_id is returned from
+            get_finished().
+        """
+        return False, None
diff --git a/vllm/distributed/ec_transfer/ec_connector/factory.py b/vllm/distributed/ec_transfer/ec_connector/factory.py
new file mode 100644
index 000000000000..bfdf51d775bd
--- /dev/null
+++ b/vllm/distributed/ec_transfer/ec_connector/factory.py
@@ -0,0 +1,88 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import importlib
+from collections.abc import Callable
+from typing import TYPE_CHECKING
+
+# yapf: disable
+from vllm.distributed.ec_transfer.ec_connector.base import (
+    ECConnectorBase,
+    ECConnectorRole,
+)
+from vllm.logger import init_logger
+
+# yapf: enable
+
+if TYPE_CHECKING:
+    from vllm.config import ECTransferConfig, VllmConfig
+
+logger = init_logger(__name__)
+
+
+class ECConnectorFactory:
+    _registry: dict[str, Callable[[], type[ECConnectorBase]]] = {}
+
+    @classmethod
+    def register_connector(cls, name: str, module_path: str, class_name: str) -> None:
+        """Register a connector with a lazy-loading module and class name."""
+        if name in cls._registry:
+            raise ValueError(f"Connector '{name}' is already registered.")
+
+        def loader() -> type[ECConnectorBase]:
+            module = importlib.import_module(module_path)
+            return getattr(module, class_name)
+
+        cls._registry[name] = loader
+
+    @classmethod
+    def create_connector(
+        cls,
+        config: "VllmConfig",
+        role: ECConnectorRole,
+    ) -> ECConnectorBase:
+        ec_transfer_config = config.ec_transfer_config
+        if ec_transfer_config is None:
+            raise ValueError("ec_transfer_config must be set to create a connector")
+        connector_cls = cls.get_connector_class(ec_transfer_config)
+        logger.info(
+            "Creating connector with name: %s and engine_id: %s",
+            connector_cls.__name__,
+            ec_transfer_config.engine_id,
+        )
+        # Connector is explicitly separated into two roles.
+        # Scheduler connector:
+        # - Co-locate with scheduler process
+        # - Should only be used inside the Scheduler class
+        # Worker connector:
+        # - Co-locate with worker process
+        return connector_cls(config, role)
+
+    @classmethod
+    def get_connector_class(
+        cls, ec_transfer_config: "ECTransferConfig"
+    ) -> type[ECConnectorBase]:
+        """Get the connector class by name."""
+        connector_name = ec_transfer_config.ec_connector
+        if connector_name is None:
+            raise ValueError("EC connect must not be None")
+        elif connector_name in cls._registry:
+            connector_cls = cls._registry[connector_name]()
+        else:
+            connector_module_path = ec_transfer_config.ec_connector_module_path
+            if connector_module_path is None:
+                raise ValueError(f"Unsupported connector type: {connector_name}")
+            connector_module = importlib.import_module(connector_module_path)
+            connector_cls = getattr(connector_module, connector_name)
+        return connector_cls
+
+
+# Register various connectors here.
+# The registration should not be done in each individual file, as we want to
+# only load the files corresponding to the current connector.
+
+ECConnectorFactory.register_connector(
+    "ECSharedStorageConnector",
+    "vllm.distributed.ec_transfer.ec_connector.shared_storage_connector",
+    "ECSharedStorageConnector",
+)
diff --git a/vllm/distributed/ec_transfer/ec_connector/shared_storage_connector.py b/vllm/distributed/ec_transfer/ec_connector/shared_storage_connector.py
new file mode 100644
index 000000000000..c8388141dcc9
--- /dev/null
+++ b/vllm/distributed/ec_transfer/ec_connector/shared_storage_connector.py
@@ -0,0 +1,201 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import os
+from dataclasses import dataclass
+from typing import TYPE_CHECKING
+
+import safetensors
+
+from vllm.config import VllmConfig
+from vllm.distributed.ec_transfer.ec_connector.base import (
+    ECConnectorBase,
+    ECConnectorMetadata,
+    ECConnectorRole,
+)
+from vllm.logger import init_logger
+from vllm.v1.core.sched.output import SchedulerOutput
+
+if TYPE_CHECKING:
+    from vllm.v1.request import Request
+
+logger = init_logger(__name__)
+
+
+@dataclass
+class MMMeta:
+    mm_hash: str
+    num_token: int
+
+    @staticmethod
+    def make_meta(mm_hash, num_token) -> "MMMeta":
+        return MMMeta(mm_hash=mm_hash, num_token=num_token)
+
+
+@dataclass
+class ECSharedStorageConnectorMetadata(ECConnectorMetadata):
+    mm_datas: list[MMMeta]
+
+    def __init__(self):
+        self.mm_datas = []
+
+    def add_mm_data(self, mm_data: MMMeta):
+        self.mm_datas.append(mm_data)
+
+
+class ECSharedStorageConnector(ECConnectorBase):
+    # NOTE: This is Simple debug implementation of the EC connector.
+    # It save / load the EC cache to / from the disk.
+
+    def __init__(self, vllm_config: "VllmConfig", role: ECConnectorRole):
+        super().__init__(vllm_config=vllm_config, role=role)
+        # req_id -> index
+        self._mm_datas_need_loads: dict[str, int] = {}
+        transfer_config = vllm_config.ec_transfer_config
+        if transfer_config is not None:
+            self._storage_path = transfer_config.get_from_extra_config(
+                "shared_storage_path", "/tmp"
+            )
+            logger.debug(transfer_config)
+            logger.debug("Shared storage path is %s", self._storage_path)
+        else:
+            raise ValueError("ec_transfer_config must be set for ECConnectorBase")
+
+    def start_load_caches(self, encoder_cache, **kwargs) -> None:
+        """
+        Start loading the cache from the connector into vLLM's encoder cache.
+
+        This method loads the encoder cache based on metadata provided by the scheduler.
+        It is called before `_gather_mm_embeddings` for the EC Connector. For EC,
+        the `encoder_cache` and `mm_hash` are stored in `kwargs`.
+
+        Args:
+            encoder_cache (dict[str, torch.Tensor]): A dictionary mapping multimodal
+                data hashes (`mm_hash`) to encoder cache tensors.
+            kwargs (dict): Additional keyword arguments for the connector.
+        """
+
+        # Get the metadata
+        metadata: ECConnectorMetadata = self._get_connector_metadata()
+        assert isinstance(metadata, ECSharedStorageConnectorMetadata)
+        assert encoder_cache is not None
+        if metadata is None:
+            logger.warning(
+                (
+                    "In connector.start_load_caches, ",
+                    "but the connector metadata is None",
+                )
+            )
+            return
+        # Load the EC for each mm data
+        for mm_data in metadata.mm_datas:
+            if mm_data.mm_hash in encoder_cache:
+                continue
+            filename = self._generate_filename_debug(mm_data.mm_hash)
+            ec_cache = safetensors.torch.load_file(filename)["ec_cache"].cuda()
+            encoder_cache[mm_data.mm_hash] = ec_cache
+            logger.debug("Success load encoder cache for hash %s", mm_data.mm_hash)
+
+    def save_caches(self, encoder_cache, mm_hash, **kwargs) -> None:
+        """
+        Save the encoder cache to the connector.
+
+        This method saves the encoder cache from the worker's local storage
+        to shared storage or another external connector.
+
+        Args:
+            encoder_cache (dict[str, torch.Tensor]): A dictionary mapping multimodal
+                data hashes (`mm_hash`) to encoder cache tensors.
+            mm_hash (str): The hash of the multimodal data whose cache is being saved.
+            kwargs (dict): Additional keyword arguments for the connector.
+        """
+        # Return if it is PD Instance
+        if not self.is_producer:
+            return
+        filename = self._generate_filename_debug(mm_hash)
+        ec_cache = encoder_cache[mm_hash]
+        tensors = {"ec_cache": ec_cache.detach().cpu()}
+        safetensors.torch.save_file(tensors, filename)
+        logger.debug("Save cache successful for mm_hash %s", mm_hash)
+
+    def has_caches(
+        self,
+        request: "Request",
+    ) -> list[bool]:
+        """
+        Check if cache exist externally for each mm_data of request
+
+        Args:
+            request (Request): the request object.
+
+        Returns:
+            List of bool indicate that ith mm_data exist in cache or not
+        """
+        result = []
+        for feature in request.mm_features:
+            result.append(self._found_match_for_mm_data(feature.identifier))
+        return result
+
+    def update_state_after_alloc(
+        self,
+        request: "Request",
+        index: int,
+    ) -> None:
+        """
+        Update ECConnector state after encoder cache allocation.
+        """
+        mm_hash = request.mm_features[index].identifier
+        num_encoder_token = request.get_num_encoder_tokens(index)
+        # Insert mm_hash only if this block has not been recorded yet.
+        self._mm_datas_need_loads[mm_hash] = num_encoder_token
+
+    def build_connector_meta(
+        self,
+        scheduler_output: SchedulerOutput,
+    ) -> ECConnectorMetadata:
+        """Build the connector metadata for this step.
+
+        This function should NOT modify any fields in the scheduler_output.
+        Also, calling this function will reset the state of the connector.
+        This only build for load mm_data only
+        Args:
+            scheduler_output (SchedulerOutput): the scheduler output object.
+        """
+        meta = ECSharedStorageConnectorMetadata()
+        for mm_hash, num_encoder_token in self._mm_datas_need_loads.items():
+            meta.add_mm_data(MMMeta.make_meta(mm_hash, num_encoder_token))
+        self._mm_datas_need_loads.clear()
+        return meta
+
+    # ==============================
+    # Helper functions
+    # ==============================
+
+    def _found_match_for_mm_data(self, mm_hash) -> bool:
+        """Check if the cache is hit for the request."""
+        filename = self._generate_filename_debug(mm_hash)
+        return os.path.exists(filename)
+
+    def _generate_foldername_debug(
+        self,
+        mm_hash: str,
+        create_folder: bool = True,  # <- now defaults to True
+    ) -> str:
+        """
+        Return the folder in which the cache for this mm_hash lives.
+        If `create_folder` is True (default) the directory is created
+        recursively the first time it is needed.
+        """
+        foldername = os.path.join(self._storage_path, mm_hash)
+        if create_folder:
+            os.makedirs(foldername, exist_ok=True)
+        return foldername
+
+    def _generate_filename_debug(self, mm_hash: str) -> str:
+        """
+        Return the full path of the safetensors file for this mm_hash.
+        Ensures the parent directory exists because
+        `_generate_foldername_debug` is called with its default
+        (`create_folder=True`).
+        """
+        foldername = self._generate_foldername_debug(mm_hash)  # <- folder auto-created
+        return os.path.join(foldername, "encoder_cache.safetensors")
diff --git a/vllm/distributed/ec_transfer/ec_transfer_state.py b/vllm/distributed/ec_transfer/ec_transfer_state.py
new file mode 100644
index 000000000000..95f516129e0c
--- /dev/null
+++ b/vllm/distributed/ec_transfer/ec_transfer_state.py
@@ -0,0 +1,46 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from typing import TYPE_CHECKING
+
+from vllm import envs
+from vllm.distributed.ec_transfer.ec_connector.base import (
+    ECConnectorBase,
+    ECConnectorRole,
+)
+from vllm.distributed.ec_transfer.ec_connector.factory import ECConnectorFactory
+
+if TYPE_CHECKING:
+    from vllm.config import VllmConfig
+
+_EC_CONNECTOR_AGENT: ECConnectorBase | None = None
+
+
+def get_ec_transfer() -> ECConnectorBase:
+    assert _EC_CONNECTOR_AGENT is not None, "disaggregated EC cache is not initialized"
+    return _EC_CONNECTOR_AGENT
+
+
+def has_ec_transfer() -> bool:
+    return _EC_CONNECTOR_AGENT is not None
+
+
+def ensure_ec_transfer_initialized(vllm_config: "VllmConfig") -> None:
+    """
+    Initialize EC cache connector.
+    """
+
+    global _EC_CONNECTOR_AGENT
+
+    if vllm_config.ec_transfer_config is None:
+        return
+
+    if (
+        vllm_config.ec_transfer_config.is_ec_transfer_instance
+        and _EC_CONNECTOR_AGENT is None
+    ):
+        if envs.VLLM_USE_V1:
+            _EC_CONNECTOR_AGENT = ECConnectorFactory.create_connector(
+                config=vllm_config, role=ECConnectorRole.WORKER
+            )
+        else:
+            raise ValueError("V0 is no longer supported")
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index 0a82745bf55a..13c7704f5bf3 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -38,6 +38,7 @@
     CompilationConfig,
     ConfigType,
     DeviceConfig,
+    ECTransferConfig,
     EPLBConfig,
     KVEventsConfig,
     KVTransferConfig,
@@ -527,6 +528,8 @@ class EngineArgs:
     kv_transfer_config: KVTransferConfig | None = None
     kv_events_config: KVEventsConfig | None = None
 
+    ec_transfer_config: ECTransferConfig | None = None
+
     generation_config: str = ModelConfig.generation_config
     enable_sleep_mode: bool = ModelConfig.enable_sleep_mode
     override_generation_config: dict[str, Any] = get_field(
@@ -1105,6 +1108,9 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             "--kv-transfer-config", **vllm_kwargs["kv_transfer_config"]
         )
         vllm_group.add_argument("--kv-events-config", **vllm_kwargs["kv_events_config"])
+        vllm_group.add_argument(
+            "--ec-transfer-config", **vllm_kwargs["ec_transfer_config"]
+        )
         vllm_group.add_argument(
             "--compilation-config", "-O", **vllm_kwargs["compilation_config"]
         )
@@ -1676,6 +1682,7 @@ def create_engine_config(
             compilation_config=self.compilation_config,
             kv_transfer_config=self.kv_transfer_config,
             kv_events_config=self.kv_events_config,
+            ec_transfer_config=self.ec_transfer_config,
             additional_config=self.additional_config,
         )
 
diff --git a/vllm/model_executor/warmup/kernel_warmup.py b/vllm/model_executor/warmup/kernel_warmup.py
index 28792338f036..95f5982bc8c7 100644
--- a/vllm/model_executor/warmup/kernel_warmup.py
+++ b/vllm/model_executor/warmup/kernel_warmup.py
@@ -49,10 +49,18 @@ def _is_flashinfer_backend(backend):
         except NotImplementedError:
             return False
 
-    if not worker.model_runner.is_pooling_model and all(
-        _is_flashinfer_backend(group.backend)
-        for groups in worker.model_runner.attn_groups
-        for group in groups
+    # NOTE: we add check for empty attn_groups to avoid errors when
+    # deploying models such as E instances and encoder-only models.
+    # As for those models, worker.model_runner.attn_groups is empty.
+    # This change is made during EPD feature development.
+    if (
+        not worker.model_runner.is_pooling_model
+        and worker.model_runner.attn_groups
+        and all(
+            _is_flashinfer_backend(group.backend)
+            for groups in worker.model_runner.attn_groups
+            for group in groups
+        )
     ):
         logger.info("Warming up FlashInfer attention.")
         # Warmup with mixed batch containing both prefill and decode tokens
diff --git a/vllm/v1/core/sched/output.py b/vllm/v1/core/sched/output.py
index 866136648bcb..20fdb3446404 100644
--- a/vllm/v1/core/sched/output.py
+++ b/vllm/v1/core/sched/output.py
@@ -14,6 +14,7 @@
     import numpy.typing as npt
     import torch
 
+    from vllm.distributed.ec_transfer.ec_connector.base import ECConnectorMetadata
     from vllm.distributed.kv_transfer.kv_connector.v1.base import KVConnectorMetadata
     from vllm.lora.request import LoRARequest
     from vllm.multimodal.inputs import MultiModalFeatureSpec
@@ -21,6 +22,7 @@
     from vllm.sampling_params import SamplingParams
     from vllm.v1.request import Request
 else:
+    ECConnectorMetadata = object
     KVConnectorMetadata = object
     LoRARequest = object
     MultiModalFeatureSpec = object
@@ -188,6 +190,9 @@ class SchedulerOutput:
     # KV Cache Connector metadata.
     kv_connector_metadata: KVConnectorMetadata | None = None
 
+    # EC Cache Connector metadata
+    ec_connector_metadata: ECConnectorMetadata | None = None
+
 
 @dataclass
 class GrammarOutput:
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index 46dc1071b839..8455746cd56d 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -7,6 +7,11 @@
 from typing import Any
 
 from vllm.config import VllmConfig
+from vllm.distributed.ec_transfer.ec_connector.base import (
+    ECConnectorMetadata,
+    ECConnectorRole,
+)
+from vllm.distributed.ec_transfer.ec_connector.factory import ECConnectorFactory
 from vllm.distributed.kv_events import EventPublisherFactory, KVEventBatch
 from vllm.distributed.kv_transfer.kv_connector.factory import KVConnectorFactory
 from vllm.distributed.kv_transfer.kv_connector.v1 import (
@@ -14,6 +19,7 @@
     KVConnectorRole,
     SupportsHMA,
 )
+from vllm.distributed.kv_transfer.kv_connector.v1.base import KVConnectorMetadata
 from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorStats
 from vllm.logger import init_logger
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalRegistry
@@ -104,6 +110,11 @@ def __init__(
             self.kv_events_config,
             self.parallel_config.data_parallel_rank,
         )
+        self.ec_connector = None
+        if self.vllm_config.ec_transfer_config is not None:
+            self.ec_connector = ECConnectorFactory.create_connector(
+                config=self.vllm_config, role=ECConnectorRole.SCHEDULER
+            )
 
         num_gpu_blocks = self.cache_config.num_gpu_blocks
         assert num_gpu_blocks is not None and num_gpu_blocks > 0
@@ -230,12 +241,14 @@ def schedule(self) -> SchedulerOutput:
 
             # Schedule encoder inputs.
             encoder_inputs_to_schedule = None
+            external_load_encoder_input: list[int] = []
             new_encoder_compute_budget = encoder_compute_budget
             if request.has_encoder_inputs:
                 (
                     encoder_inputs_to_schedule,
                     num_new_tokens,
                     new_encoder_compute_budget,
+                    external_load_encoder_input,
                 ) = self._try_schedule_encoder_inputs(
                     request,
                     request.num_computed_tokens,
@@ -342,6 +355,11 @@ def schedule(self) -> SchedulerOutput:
                 for i in encoder_inputs_to_schedule:
                     self.encoder_cache_manager.allocate(request, i)
                 encoder_compute_budget = new_encoder_compute_budget
+            if external_load_encoder_input:
+                for i in external_load_encoder_input:
+                    self.encoder_cache_manager.allocate(request, i)
+                    if self.ec_connector is not None:
+                        self.ec_connector.update_state_after_alloc(request, i)
 
         # Record the LoRAs in scheduled_running_reqs
         scheduled_loras: set[int] = set()
@@ -445,6 +463,7 @@ def schedule(self) -> SchedulerOutput:
                     num_computed_tokens = request.num_computed_tokens
 
                 encoder_inputs_to_schedule = None
+                external_load_encoder_input = []
                 new_encoder_compute_budget = encoder_compute_budget
 
                 # KVTransfer: loading remote KV, do not allocate for new work.
@@ -480,6 +499,7 @@ def schedule(self) -> SchedulerOutput:
                             encoder_inputs_to_schedule,
                             num_new_tokens,
                             new_encoder_compute_budget,
+                            external_load_encoder_input,
                         ) = self._try_schedule_encoder_inputs(
                             request,
                             num_computed_tokens,
@@ -583,7 +603,12 @@ def schedule(self) -> SchedulerOutput:
                     for i in encoder_inputs_to_schedule:
                         self.encoder_cache_manager.allocate(request, i)
                     encoder_compute_budget = new_encoder_compute_budget
-
+                # Allocate for external load encoder cache
+                if external_load_encoder_input:
+                    for i in external_load_encoder_input:
+                        self.encoder_cache_manager.allocate(request, i)
+                        if self.ec_connector is not None:
+                            self.ec_connector.update_state_after_alloc(request, i)
         # Put back any skipped requests at the head of the waiting queue
         if skipped_waiting_requests:
             self.waiting.prepend_requests(skipped_waiting_requests)
@@ -591,6 +616,7 @@ def schedule(self) -> SchedulerOutput:
         # Check if the scheduling constraints are satisfied.
         total_num_scheduled_tokens = sum(num_scheduled_tokens.values())
         assert total_num_scheduled_tokens <= self.max_num_scheduled_tokens
+
         assert token_budget >= 0
         assert len(self.running) <= self.max_num_running_reqs
         # Since some requests in the RUNNING queue may not be scheduled in
@@ -653,8 +679,18 @@ def schedule(self) -> SchedulerOutput:
         # 2. Wrap up all the KV cache load / save ops into an opaque object
         # 3. Clear the internal states of the connector
         if self.connector is not None:
-            meta = self.connector.build_connector_meta(scheduler_output)
+            meta: KVConnectorMetadata = self.connector.build_connector_meta(
+                scheduler_output
+            )
             scheduler_output.kv_connector_metadata = meta
+
+        # Build the connector meta for ECConnector
+        if self.ec_connector is not None:
+            ec_meta: ECConnectorMetadata = self.ec_connector.build_connector_meta(
+                scheduler_output
+            )
+            scheduler_output.ec_connector_metadata = ec_meta
+
         with record_function_or_nullcontext("schedule: update_after_schedule"):
             self._update_after_schedule(scheduler_output)
         return scheduler_output
@@ -755,7 +791,7 @@ def _try_schedule_encoder_inputs(
         num_computed_tokens: int,
         num_new_tokens: int,
         encoder_compute_budget: int,
-    ) -> tuple[list[int], int, int]:
+    ) -> tuple[list[int], int, int, list[int]]:
         """
         Determine which encoder inputs need to be scheduled in the current step,
         and update `num_new_tokens` and encoder token budget accordingly.
@@ -765,6 +801,7 @@ def _try_schedule_encoder_inputs(
         in this step, i.e.,
         [num_computed_tokens, num_computed_tokens + num_new_tokens).
         - It is not already computed and stored in the encoder cache.
+        - It is not exist on remote encoder cache (via ECConnector)
         - There is sufficient encoder token budget to process it.
         - The encoder cache has space to store it.
 
@@ -776,12 +813,16 @@ def _try_schedule_encoder_inputs(
         blocks and externally cached blocks (via KVConnector).
         """
         if num_new_tokens == 0 or not request.has_encoder_inputs:
-            return [], num_new_tokens, encoder_compute_budget
+            return [], num_new_tokens, encoder_compute_budget, []
         encoder_inputs_to_schedule: list[int] = []
         mm_features = request.mm_features
         assert mm_features is not None
         assert len(mm_features) > 0
+        external_load_encoder_input = []
 
+        # Check remote cache first
+        if self.ec_connector is not None:
+            remote_cache_has_item = self.ec_connector.has_caches(request)
         # NOTE: since scheduler operates on the request level (possibly with
         # multiple encoder inputs per request), we need to create temporary
         # trackers for accounting at the encoder input level.
@@ -862,6 +903,12 @@ def _try_schedule_encoder_inputs(
                     num_new_tokens = 0
                 break
 
+            if self.ec_connector is not None and remote_cache_has_item[i]:
+                mm_hashes_to_schedule.add(request.mm_features[i].identifier)
+                external_load_encoder_input.append(i)
+                num_tokens_to_schedule += num_encoder_tokens
+                continue
+
             num_tokens_to_schedule += num_encoder_tokens
             encoder_compute_budget -= num_encoder_tokens
             mm_hashes_to_schedule.add(request.mm_features[i].identifier)
@@ -871,6 +918,7 @@ def _try_schedule_encoder_inputs(
             encoder_inputs_to_schedule,
             num_new_tokens,
             encoder_compute_budget,
+            external_load_encoder_input,
         )
 
     def get_grammar_bitmask(
diff --git a/vllm/v1/outputs.py b/vllm/v1/outputs.py
index 5f65e4ee0d1f..e32d5bb608b1 100644
--- a/vllm/v1/outputs.py
+++ b/vllm/v1/outputs.py
@@ -8,6 +8,8 @@
 import numpy as np
 import torch
 
+from vllm.v1.core.sched.output import SchedulerOutput
+
 if TYPE_CHECKING:
     from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorStats
 else:
@@ -136,6 +138,13 @@ def is_empty(self):
         )
 
 
+@dataclass
+class ECConnectorOutput:
+    # [mm_hash]
+    finished_sending: set[str] | None = None
+    finished_recving: set[str] | None = None
+
+
 # ModelRunnerOutput is serialized and sent to the scheduler process.
 # This is expensive for torch.Tensor so prefer to use list instead.
 @dataclass
@@ -167,6 +176,8 @@ class ModelRunnerOutput:
 
     kv_connector_output: KVConnectorOutput | None = None
 
+    ec_connector_output: ECConnectorOutput | None = None
+
     # req_id -> num_nans_in_logits
     num_nans_in_logits: dict[str, int] | None = None
 
@@ -192,6 +203,41 @@ class DraftTokenIds:
     draft_token_ids: list[list[int]]
 
 
+def make_empty_encoder_model_runner_output(
+    scheduler_output: "SchedulerOutput",
+) -> ModelRunnerOutput:
+    """
+    Create a ModelRunnerOutput stub that contains the correct
+    per-request bookkeeping but no generated data yet.
+    """
+    if not scheduler_output.num_scheduled_tokens:
+        return EMPTY_MODEL_RUNNER_OUTPUT
+
+    # Convert to list so we get a deterministic, indexable sequence
+    req_ids: list[str] = list(scheduler_output.num_scheduled_tokens.keys())
+
+    # Give every request its own contiguous index
+    req_id_to_index: dict[str, int] = {rid: idx for idx, rid in enumerate(req_ids)}
+
+    # No tokens generated yet ⇒ one empty list per request
+    sampled_token_ids: list[list[int]] = [[0] for _ in req_ids]
+
+    # Pooler outputs are not available yet ⇒ use None placeholders
+    pooler_output: list[torch.Tensor | None] = [None for _ in req_ids]
+
+    return ModelRunnerOutput(
+        req_ids=req_ids,
+        req_id_to_index=req_id_to_index,
+        sampled_token_ids=sampled_token_ids,
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=pooler_output,
+        kv_connector_output=None,
+        ec_connector_output=None,
+        num_nans_in_logits=None,
+    )
+
+
 EMPTY_MODEL_RUNNER_OUTPUT = ModelRunnerOutput(
     req_ids=[],
     req_id_to_index={},
diff --git a/vllm/v1/worker/ec_connector_model_runner_mixin.py b/vllm/v1/worker/ec_connector_model_runner_mixin.py
new file mode 100644
index 000000000000..00bc909df297
--- /dev/null
+++ b/vllm/v1/worker/ec_connector_model_runner_mixin.py
@@ -0,0 +1,87 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""
+Define EC connector functionality mixin for model runners.
+"""
+
+from collections.abc import Generator
+from contextlib import AbstractContextManager, contextmanager, nullcontext
+from typing import (
+    TYPE_CHECKING,  # noqa: UP035
+)
+
+import torch
+
+from vllm.distributed.ec_transfer import get_ec_transfer, has_ec_transfer
+from vllm.distributed.ec_transfer.ec_connector.base import ECConnectorBase
+from vllm.logger import init_logger
+from vllm.v1.outputs import ECConnectorOutput
+
+if TYPE_CHECKING:
+    from vllm.v1.core.sched.output import SchedulerOutput
+
+logger = init_logger(__name__)
+
+
+# Defined as a EC connector functionality mixin for ModelRunner (GPU, TPU)
+class ECConnectorModelRunnerMixin:
+    @staticmethod
+    def maybe_save_ec_to_connector(
+        encoder_cache: dict[str, torch.Tensor],
+        mm_hash: str,
+    ):
+        if not has_ec_transfer():
+            logger.debug("Not have ec transfer please check")
+            return
+        connector = get_ec_transfer()
+        connector.save_caches(encoder_cache=encoder_cache, mm_hash=mm_hash)
+
+    @staticmethod
+    def get_finished_ec_transfers(
+        scheduler_output: "SchedulerOutput",
+    ) -> tuple[set[str] | None, set[str] | None]:
+        if has_ec_transfer():
+            return get_ec_transfer().get_finished(scheduler_output.finished_req_ids)
+        return None, None
+
+    @staticmethod
+    def maybe_get_ec_connector_output(
+        scheduler_output: "SchedulerOutput",
+        encoder_cache: dict[str, torch.Tensor],
+        **kwargs,
+    ) -> AbstractContextManager[ECConnectorOutput | None]:
+        return (
+            ECConnectorModelRunnerMixin._get_ec_connector_output(
+                scheduler_output, encoder_cache, **kwargs
+            )
+            if has_ec_transfer()
+            else nullcontext()
+        )
+
+    # This context manager must be used within an active forward context.
+    # It encapsulates the entire EC conector lifecycle within execute_model
+    @staticmethod
+    @contextmanager
+    def _get_ec_connector_output(
+        scheduler_output: "SchedulerOutput",
+        encoder_cache: dict[str, torch.Tensor],
+        **kwargs,
+    ) -> Generator[ECConnectorOutput, None, None]:
+        output = ECConnectorOutput()
+
+        ec_connector = get_ec_transfer()
+        assert isinstance(ec_connector, ECConnectorBase)
+        assert scheduler_output.ec_connector_metadata is not None
+        ec_connector.bind_connector_metadata(scheduler_output.ec_connector_metadata)
+
+        if not ec_connector.is_producer:
+            ec_connector.start_load_caches(encoder_cache, **kwargs)
+
+        try:
+            yield output
+        finally:
+            output.finished_sending, output.finished_recving = (
+                ec_connector.get_finished(scheduler_output.finished_req_ids)
+            )
+
+            ec_connector.clear_connector_metadata()
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index fbd3e5f31316..b14b6b1c3f52 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -35,6 +35,7 @@
     get_layers_from_vllm_config,
     update_config,
 )
+from vllm.distributed.ec_transfer import get_ec_transfer, has_ec_transfer
 from vllm.distributed.eplb.eplb_state import EplbState
 from vllm.distributed.kv_transfer import get_kv_transfer_group, has_kv_transfer_group
 from vllm.distributed.kv_transfer.kv_connector.utils import copy_kv_blocks
@@ -114,12 +115,14 @@
     EMPTY_MODEL_RUNNER_OUTPUT,
     AsyncModelRunnerOutput,
     DraftTokenIds,
+    ECConnectorOutput,
     KVConnectorOutput,
     LogprobsLists,
     LogprobsTensors,
     ModelRunnerOutput,
     PoolerOutput,
     SamplerOutput,
+    make_empty_encoder_model_runner_output,
 )
 from vllm.v1.pool.metadata import PoolingMetadata
 from vllm.v1.sample.logits_processor import LogitsProcessors, build_logitsprocs
@@ -134,6 +137,7 @@
 from vllm.v1.structured_output.utils import apply_grammar_bitmask
 from vllm.v1.utils import CpuGpuBuffer, record_function_or_nullcontext
 from vllm.v1.worker.dp_utils import coordinate_batch_across_dp
+from vllm.v1.worker.ec_connector_model_runner_mixin import ECConnectorModelRunnerMixin
 from vllm.v1.worker.gpu_input_batch import CachedRequestState, InputBatch
 from vllm.v1.worker.gpu_ubatch_wrapper import UBatchWrapper
 from vllm.v1.worker.kv_connector_model_runner_mixin import KVConnectorModelRunnerMixin
@@ -237,9 +241,12 @@ class ExecuteModelState(NamedTuple):
     sample_hidden_states: torch.Tensor
     aux_hidden_states: list[torch.Tensor] | None
     kv_connector_output: KVConnectorOutput | None
+    ec_connector_output: ECConnectorOutput | None
 
 
-class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
+class GPUModelRunner(
+    LoRAModelRunnerMixin, KVConnectorModelRunnerMixin, ECConnectorModelRunnerMixin
+):
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -1873,6 +1880,8 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
                 output,
                 is_embed=pos_info.is_embed,
             )
+            logger.debug("Finish execute for mm hash %s", mm_hash)
+            self.maybe_save_ec_to_connector(self.encoder_cache, mm_hash)
 
     def _gather_mm_embeddings(
         self,
@@ -2191,20 +2200,27 @@ def _preprocess(
         torch.Tensor,
         IntermediateTensors | None,
         dict[str, Any],
+        ECConnectorOutput | None,
     ]:
         num_scheduled_tokens = scheduler_output.total_num_scheduled_tokens
         is_first_rank = get_pp_group().is_first_rank
 
         # _prepare_inputs may reorder the batch, so we must gather multi
         # modal outputs after that to ensure the correct order
+        ec_connector_output = None
+
         if (
             self.supports_mm_inputs
             and is_first_rank
             and not self.model_config.is_encoder_decoder
         ):
             # Run the multimodal encoder if any.
-            self._execute_mm_encoder(scheduler_output)
-            mm_embeds, is_mm_embed = self._gather_mm_embeddings(scheduler_output)
+            with self.maybe_get_ec_connector_output(
+                scheduler_output,
+                encoder_cache=self.encoder_cache,
+            ) as ec_connector_output:
+                self._execute_mm_encoder(scheduler_output)
+                mm_embeds, is_mm_embed = self._gather_mm_embeddings(scheduler_output)
 
             # NOTE(woosuk): To unify token ids and soft tokens (vision
             # embeddings), we always use embeddings (rather than token ids)
@@ -2284,6 +2300,7 @@ def _preprocess(
             positions,
             intermediate_tensors,
             model_kwargs,
+            ec_connector_output,
         )
 
     def _sample(
@@ -2508,6 +2525,14 @@ def execute_model(
                 # Update persistent batch states.
                 self._update_states(scheduler_output)
 
+                if has_ec_transfer() and get_ec_transfer().is_producer:
+                    with self.maybe_get_ec_connector_output(
+                        scheduler_output,
+                        encoder_cache=self.encoder_cache,
+                    ) as ec_connector_output:
+                        self._execute_mm_encoder(scheduler_output)
+                        return make_empty_encoder_model_runner_output(scheduler_output)
+
                 if not num_scheduled_tokens:
                     if not has_kv_transfer_group():
                         # Return empty ModelRunnerOutput if no work to do.
@@ -2583,6 +2608,7 @@ def execute_model(
                 positions,
                 intermediate_tensors,
                 model_kwargs,
+                ec_connector_output,
             ) = self._preprocess(
                 scheduler_output, num_input_tokens, intermediate_tensors
             )
@@ -2699,6 +2725,7 @@ def execute_model(
             sample_hidden_states,
             aux_hidden_states,
             kv_connector_output,
+            ec_connector_output,
         )
         return None
 
@@ -2720,6 +2747,7 @@ def sample_tokens(
             sample_hidden_states,
             aux_hidden_states,
             kv_connector_output,
+            ec_connector_output,
         ) = self.execute_model_state
         # Clear ephemeral state.
         self.execute_model_state = None
@@ -2811,6 +2839,9 @@ def propose_draft_token_ids(sampled_token_ids):
                 prompt_logprobs_dict=prompt_logprobs_dict,
                 pooler_output=[],
                 kv_connector_output=kv_connector_output,
+                ec_connector_output=ec_connector_output
+                if self.supports_mm_inputs
+                else None,
                 num_nans_in_logits=num_nans_in_logits,
             )
 
@@ -4797,7 +4828,8 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
             KVCacheSpec: A dictionary mapping layer names to their KV cache
             format. Layers that do not need KV cache are not included.
         """
-
+        if has_ec_transfer() and get_ec_transfer().is_producer:
+            return {}
         kv_cache_spec: dict[str, KVCacheSpec] = {}
         attn_layers = get_layers_from_vllm_config(self.vllm_config, AttentionLayerBase)
         for layer_name, attn_module in attn_layers.items():
diff --git a/vllm/v1/worker/gpu_worker.py b/vllm/v1/worker/gpu_worker.py
index 19061fcffdf1..2b9d8bb2f25e 100644
--- a/vllm/v1/worker/gpu_worker.py
+++ b/vllm/v1/worker/gpu_worker.py
@@ -20,6 +20,7 @@
     init_distributed_environment,
     set_custom_all_reduce,
 )
+from vllm.distributed.ec_transfer import ensure_ec_transfer_initialized
 from vllm.distributed.kv_transfer import (
     ensure_kv_transfer_initialized,
     get_kv_transfer_group,
@@ -887,3 +888,7 @@ def init_worker_distributed_environment(
         parallel_config.pipeline_parallel_size,
         parallel_config.decode_context_parallel_size,
     )
+
+    # Init ec connector here before KV caches caches init
+    # NOTE: We do not init KV caches for Encoder-only instance in EPD disagg mode
+    ensure_ec_transfer_initialized(vllm_config)

From b9ce9a301341a4f128f434c874f452fb7767e94b Mon Sep 17 00:00:00 2001
From: Fanli Lin <fanli.lin@intel.com>
Date: Wed, 12 Nov 2025 11:13:21 +0800
Subject: [PATCH 091/183] [BugFix] Add fallback path in
 `apply_rotary_pos_emb_flashattn` for non-cuda platforms (#28447)

Signed-off-by: Lin, Fanli <fanli.lin@intel.com>
---
 vllm/model_executor/models/keye.py | 7 +++++++
 1 file changed, 7 insertions(+)

diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index aa0134badc40..2998c87918a9 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -346,6 +346,13 @@ def apply_rotary_pos_emb_flashatt(
         from vllm.vllm_flash_attn.layers.rotary import apply_rotary_emb
     elif current_platform.is_rocm():
         from flash_attn.ops.triton.rotary import apply_rotary as apply_rotary_emb
+    else:
+        # For other platforms, use PyTorch fallback
+        from vllm.model_executor.layers.rotary_embedding.common import (
+            apply_rotary_emb_torch,
+        )
+
+        apply_rotary_emb = partial(apply_rotary_emb_torch, is_neox_style=True)
 
     q_embed = apply_rotary_emb(q.float(), cos.float(), sin.float()).type_as(q)
     k_embed = apply_rotary_emb(k.float(), cos.float(), sin.float()).type_as(k)

From f31419ed8ba219d70a1982f238e42e74e0ed86c9 Mon Sep 17 00:00:00 2001
From: ai-jz <156989844+ai-jz@users.noreply.github.com>
Date: Tue, 11 Nov 2025 21:00:45 -0800
Subject: [PATCH 092/183] [Benchmark] Add retry support to fix workload bias in
 multi-turn benchmark (#28493)

---
 .../benchmark_serving_multi_turn.py           | 130 +++++++++++-------
 1 file changed, 82 insertions(+), 48 deletions(-)

diff --git a/benchmarks/multi_turn/benchmark_serving_multi_turn.py b/benchmarks/multi_turn/benchmark_serving_multi_turn.py
index 2c1a051cc9c9..ae9e9753441a 100644
--- a/benchmarks/multi_turn/benchmark_serving_multi_turn.py
+++ b/benchmarks/multi_turn/benchmark_serving_multi_turn.py
@@ -55,6 +55,7 @@ class ClientArgs(NamedTuple):
     verify_output: bool
     conversation_sampling: ConversationSampling
     request_rate: float
+    max_retries: int
 
 
 class RequestArgs(NamedTuple):
@@ -527,6 +528,25 @@ async def poisson_sleep(request_rate: float, verbose: bool = False) -> None:
     await asyncio.sleep(interval)
 
 
+async def exponential_backoff_sleep(
+    attempt_cnt: int,
+    base_rate: float = 1.0,
+    backoff_factor: float = 2.0,
+    jitter_fraction: float = 0.10,
+    verbose: bool = False,
+) -> None:
+    # Sleep with exponential backoff and jitter after a failed request.
+    backoff_delay = base_rate * (backoff_factor**attempt_cnt)
+    jittered_delay = backoff_delay * (
+        1 + np.random.uniform(-jitter_fraction, jitter_fraction)
+    )
+
+    if verbose:
+        logger.info(f"Backoff for {jittered_delay:.3f} seconds...")
+
+    await asyncio.sleep(jittered_delay)
+
+
 async def client_main(
     args: ClientArgs,
     req_args: RequestArgs,
@@ -655,59 +675,62 @@ async def client_main(
                 )
                 time_of_last_turn[conv_id] = curr_time_sec
 
-            success = True
-            try:
-                result = await send_turn(
-                    session,
-                    client_id,
-                    conv_id,
-                    messages,
-                    current_turn,
-                    tokenizer,
-                    req_args,
-                    args.print_content,
-                    args.verify_output,
-                )
-                if result is not None:
-                    result_queue.put(result)
-                else:
-                    # None means that the request failed,
-                    # and should not be added to the statistics.
-                    success = False
-                    num_failures += 1
-
-                    logger.warning(
-                        f"{Color.YELLOW}Client {client_id} - Request rejected during conversation ID {conv_id} (turn: {current_turn}){Color.RESET}"  # noqa: E501
+            success = False
+            for attempt_cnt in range(args.max_retries + 1):
+                try:
+                    exception = False
+                    result = await send_turn(
+                        session,
+                        client_id,
+                        conv_id,
+                        messages,
+                        current_turn,
+                        tokenizer,
+                        req_args,
+                        args.print_content,
+                        args.verify_output,
+                    )
+                    if result is not None:
+                        result_queue.put(result)
+                        success = True
+                        break
+                    else:
+                        logger.warning(
+                            f"{Color.YELLOW}Client {client_id} - Request rejected during conversation ID {conv_id} (turn: {current_turn}){Color.RESET}"  # noqa: E501
+                        )
+                except asyncio.exceptions.TimeoutError:
+                    exception = True
+                    logger.error(
+                        "%sClient %d - Timeout during conversation ID %s (turn: %d). "
+                        "Base timeout is %ss (set with --request-timeout-sec), but the "
+                        "effective timeout may be longer based on max_tokens. If this "
+                        "is unexpected, consider increasing the timeout or checking "
+                        "model performance.%s",
+                        Color.RED,
+                        client_id,
+                        conv_id,
+                        current_turn,
+                        req_args.timeout_sec,
+                        Color.RESET,
+                    )
+                except Exception:
+                    exception = True
+                    logger.exception(
+                        f"{Color.RED}Client {client_id} - Exception during conversation ID {conv_id} (turn: {current_turn}){Color.RESET}"  # noqa: E501
                     )
 
-                    # Remove the conversation (should not be used again)
-                    active_convs.pop(conv_id)
-
-            except asyncio.exceptions.TimeoutError:
-                num_failures += 1
-                logger.error(
-                    "%sClient %d - Timeout during conversation ID %s (turn: %d). "
-                    "Base timeout is %ss (set with --request-timeout-sec), but the "
-                    "effective timeout may be longer based on max_tokens. If this "
-                    "is unexpected, consider increasing the timeout or checking "
-                    "model performance.%s",
-                    Color.RED,
-                    client_id,
-                    conv_id,
-                    current_turn,
-                    req_args.timeout_sec,
-                    Color.RESET,
-                )
-                break  # Exit gracefully instead of raising an error
+                # Sleep before retry if not last attempt
+                if not success and attempt_cnt < args.max_retries:
+                    await exponential_backoff_sleep(attempt_cnt, verbose=args.verbose)
 
-            except Exception:
+            if not success:
                 num_failures += 1
-                logger.exception(
-                    f"{Color.RED}Client {client_id} - Exception during conversation ID {conv_id} (turn: {current_turn}){Color.RESET}"  # noqa: E501
-                )
-                break  # Exit gracefully instead of raising an error
+                # Remove the conversation (should not be used again)
+                active_convs.pop(conv_id)
+                if exception:
+                    break  # Exit gracefully instead of raising an error
 
-            if success:
+            else:
                 num_successes += 1
 
                 # Update the turns counter to include the LLM response
@@ -822,6 +845,7 @@ def get_client_config(
         verify_output=args.verify_output,
         conversation_sampling=args.conversation_sampling,
         request_rate=args.request_rate,
+        max_retries=args.max_retries,
     )
 
     if args.limit_min_tokens > 0 or args.limit_max_tokens > 0:
@@ -1357,6 +1381,16 @@ async def main() -> None:
         help="Expected request rate (Poisson process) per client in requests/sec."
         "Set to 0 for no delay between requests.",
     )
+    parser.add_argument(
+        "--max-retries",
+        type=int,
+        default=int(os.environ.get("MULTITURN_BENCH_MAX_RETRIES", "0")),
+        help="Maximum number of retry attempts for timed-out requests. "
+        "Default is 0 (no retries). "
+        "Set to higher values to retry failed requests and maintain "
+        "fair workload distribution. "
+        "Can also be set via MULTITURN_BENCH_MAX_RETRIES environment variable.",
+    )
     parser.add_argument(
         "--conversation-sampling",
         type=ConversationSampling,

From ac0bb2c3075f87b62afde8ea7dab10207bb71df1 Mon Sep 17 00:00:00 2001
From: Lukas Geiger <lukas.geiger94@gmail.com>
Date: Wed, 12 Nov 2025 05:03:01 +0000
Subject: [PATCH 093/183] [Core] Cache `vllm_is_batch_invariant` (#28304)

Signed-off-by: Lukas Geiger <lukas.geiger94@gmail.com>
---
 vllm/model_executor/layers/batch_invariant.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/vllm/model_executor/layers/batch_invariant.py b/vllm/model_executor/layers/batch_invariant.py
index 65babd10a948..746a543ab827 100644
--- a/vllm/model_executor/layers/batch_invariant.py
+++ b/vllm/model_executor/layers/batch_invariant.py
@@ -4,6 +4,7 @@
 import os
 from collections import namedtuple
 from collections.abc import Callable
+from functools import cache
 from typing import Any
 
 import torch
@@ -857,6 +858,7 @@ def get_batch_invariant_attention_block_size() -> AttentionBlockSize:
     return AttentionBlockSize(block_m=16, block_n=16)
 
 
+@cache
 def vllm_is_batch_invariant():
     env_key = "VLLM_BATCH_INVARIANT"
     is_overridden = False

From 91864b79b36e5a7799f90c1c350e663d484bcfee Mon Sep 17 00:00:00 2001
From: Chenguang Zheng <645327136@qq.com>
Date: Wed, 12 Nov 2025 15:09:33 +0800
Subject: [PATCH 094/183] [CI/Build] Fix crash due to removed VLLM_USE_V1
 attribute in EPD (#28521)

Signed-off-by: knlnguyen1802 <knlnguyen1802@gmail.com>
Co-authored-by: knlnguyen1802 <knlnguyen1802@gmail.com>
Co-authored-by: Roger Wang <hey@rogerw.io>
---
 vllm/distributed/ec_transfer/ec_transfer_state.py | 10 +++-------
 1 file changed, 3 insertions(+), 7 deletions(-)

diff --git a/vllm/distributed/ec_transfer/ec_transfer_state.py b/vllm/distributed/ec_transfer/ec_transfer_state.py
index 95f516129e0c..ef3c978b36a3 100644
--- a/vllm/distributed/ec_transfer/ec_transfer_state.py
+++ b/vllm/distributed/ec_transfer/ec_transfer_state.py
@@ -2,7 +2,6 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from typing import TYPE_CHECKING
 
-from vllm import envs
 from vllm.distributed.ec_transfer.ec_connector.base import (
     ECConnectorBase,
     ECConnectorRole,
@@ -38,9 +37,6 @@ def ensure_ec_transfer_initialized(vllm_config: "VllmConfig") -> None:
         vllm_config.ec_transfer_config.is_ec_transfer_instance
         and _EC_CONNECTOR_AGENT is None
     ):
-        if envs.VLLM_USE_V1:
-            _EC_CONNECTOR_AGENT = ECConnectorFactory.create_connector(
-                config=vllm_config, role=ECConnectorRole.WORKER
-            )
-        else:
-            raise ValueError("V0 is no longer supported")
+        _EC_CONNECTOR_AGENT = ECConnectorFactory.create_connector(
+            config=vllm_config, role=ECConnectorRole.WORKER
+        )

From c748355e0d55c98d5458aebbd680ce684c87c9bb Mon Sep 17 00:00:00 2001
From: Huamin Li <3ericli@gmail.com>
Date: Wed, 12 Nov 2025 00:51:19 -0800
Subject: [PATCH 095/183] [CI] Introduce autorun_on_main feature (#27836)

Signed-off-by: Huamin Li <3ericli@gmail.com>
---
 .buildkite/test-pipeline.yaml | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 8d2a7bc5a802..e816a20fe064 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -25,6 +25,7 @@
 #     and $$BUILDKITE_PARALLEL_JOB_COUNT environment variables.
 # working_dir(str): specify the place where the command should execute, default to /vllm-workspace/tests
 # source_file_dependencies(list): the list of prefixes to opt-in the test for, if empty, the test will always run.
+# autorun_on_main (bool): default to false, if true, the test will run automatically when commit is pushed to main branch.
 
 # When adding a test
 # - If the test belongs to an existing group, add it there
@@ -606,6 +607,7 @@ steps:
   source_file_dependencies:
   - csrc/
   - vllm/model_executor/layers/quantization
+  autorun_on_main: true
   commands:
   - pytest -s -v evals/gsm8k/test_gsm8k_correctness.py --config-list-file=configs/models-small.txt --tp-size=1
 
@@ -939,7 +941,7 @@ steps:
     # this runner has 2 GPUs available even though num_gpus=2 is not set
     - pytest -v -s tests/compile/test_fusion_all_reduce.py
     # Limit to Inductor partition, no custom ops, and allreduce & attn fusion to reduce running time
-    # Wrap with quotes to escape yaml 
+    # Wrap with quotes to escape yaml
     - "pytest -v -s tests/compile/test_fusions_e2e.py::test_tp2_attn_quant_allreduce_rmsnorm -k 'True and Llama-3.1 and -quant_fp8 and -rms_norm'"
 
 - label: Blackwell Fusion E2E Tests # 30 min

From 1761dea1a8567fc143b7bfbe61cb1e00cc081c7f Mon Sep 17 00:00:00 2001
From: yyzxw <34639446+yyzxw@users.noreply.github.com>
Date: Wed, 12 Nov 2025 17:03:56 +0800
Subject: [PATCH 096/183] [BugFix]: --enable-lora with model granite-4.0-micro
 crash (#27733)

Signed-off-by: zxw <1020938856@qq.com>
---
 vllm/model_executor/models/granitemoehybrid.py | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/vllm/model_executor/models/granitemoehybrid.py b/vllm/model_executor/models/granitemoehybrid.py
index 3a98abed76fd..ea49a0ffee01 100644
--- a/vllm/model_executor/models/granitemoehybrid.py
+++ b/vllm/model_executor/models/granitemoehybrid.py
@@ -597,6 +597,9 @@ class GraniteMoeHybridForCausalLM(
             "k_proj",
             "v_proj",
         ],
+        "conv1d": ["conv1d"],
+        "in_proj": ["in_proj"],
+        "input_linear": ["input_linear"],
     }
     embedding_modules = {
         "embed_tokens": "input_embeddings",

From d3ade61e429fcae40829587244ced9c553120703 Mon Sep 17 00:00:00 2001
From: wuyaoxuehun <798143193@qq.com>
Date: Wed, 12 Nov 2025 17:14:00 +0700
Subject: [PATCH 097/183] [Model] fix glm4_moe_mtp load weights with GLM-4.6
 checkpoint. (#27597)

Signed-off-by: wuao.scotty <wuao.scotty@bytedance.com>
Co-authored-by: wuao.scotty <wuao.scotty@bytedance.com>
---
 vllm/model_executor/models/glm4_moe_mtp.py | 15 +++++++++++----
 1 file changed, 11 insertions(+), 4 deletions(-)

diff --git a/vllm/model_executor/models/glm4_moe_mtp.py b/vllm/model_executor/models/glm4_moe_mtp.py
index 9a2ae3c476f0..9db2aaa075de 100644
--- a/vllm/model_executor/models/glm4_moe_mtp.py
+++ b/vllm/model_executor/models/glm4_moe_mtp.py
@@ -256,11 +256,18 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
+        spec_layer = self.model.mtp_start_layer_idx
         for name, loaded_weight in weights:
-            spec_layer = get_spec_layer_idx_from_weight_name(self.config, name)
-            if spec_layer is None:
-                continue
-            name = self._rewrite_spec_layer_name(spec_layer, name)
+            if name == "lm_head.weight":
+                name = f"model.layers.{spec_layer}.shard_head.head.weight"
+            elif name == "model.embed_tokens.weight":
+                # This name is same with local model, rewriting is not needed.
+                pass
+            else:
+                spec_layer = get_spec_layer_idx_from_weight_name(self.config, name)
+                if spec_layer is None:
+                    continue
+                name = self._rewrite_spec_layer_name(spec_layer, name)
             for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:

From a4730c1b4fa297848aeb8b81a36c5158b3845e9c Mon Sep 17 00:00:00 2001
From: Chaojun Zhang <chaojun.zhang@intel.com>
Date: Wed, 12 Nov 2025 18:20:55 +0800
Subject: [PATCH 098/183] [XPU]Fix crash due to removed VLLM_USE_V1 attribute
 (#28520)

Signed-off-by: chaojun-zhang <chaojun.zhang@intel.com>
---
 vllm/platforms/xpu.py | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index 684d6d9a6b57..359eafc66445 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -65,7 +65,6 @@ def get_attn_backend_cls(
 
         if use_sparse:
             raise NotImplementedError("Sparse Attention is not supported on XPU.")
-        use_v1 = envs.VLLM_USE_V1
         if not use_v1:
             raise ValueError("XPU backend only supports V1.")
         if selected_backend == AttentionBackendEnum.TRITON_ATTN:
@@ -115,7 +114,9 @@ def get_device_total_memory(cls, device_id: int = 0) -> int:
     @classmethod
     def get_vit_attn_backend(
         cls, head_size: int, dtype: torch.dtype
-    ) -> AttentionBackendEnum:
+    ) -> "AttentionBackendEnum":
+        from vllm.attention.backends.registry import AttentionBackendEnum
+
         return AttentionBackendEnum.FLASH_ATTN
 
     @classmethod

From d143152308ede994406196aa484566a25a68fe3a Mon Sep 17 00:00:00 2001
From: ziruiliu <ziliu@ddn.com>
Date: Wed, 12 Nov 2025 18:44:58 +0800
Subject: [PATCH 099/183] [KVConnector] Enable get_block_ids_with_load_errors()
 in LMCache connector  (#27978)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Signed-off-by: Zirui Liu <ziliu@ddn.com>
Signed-off-by: ziruiliu <ziliu@ddn.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Co-authored-by: Nicolò Lucchesi <nlucches@redhat.com>
---
 .../kv_connector/v1/lmcache_connector.py          | 15 +++++++++++++++
 1 file changed, 15 insertions(+)

diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_connector.py
index 575ab468be56..0c24a53fb754 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_connector.py
@@ -136,6 +136,21 @@ def get_finished(
         """
         return self._lmcache_engine.get_finished(finished_req_ids)
 
+    def get_block_ids_with_load_errors(self) -> set[int]:
+        """
+        Get the set of block IDs that failed to load.
+
+        Returns:
+            Set of block IDs that encountered load errors.
+            Empty set if no load errors occurred.
+        """
+        method = getattr(self._lmcache_engine, "get_block_ids_with_load_errors", None)
+        if callable(method):
+            return method()
+
+        # Fallback for older versions that don't support this method
+        return set()
+
     # ==============================
     # Scheduler-side methods
     # ==============================

From c5f10cc139ec87e217f2bb56a677dd57394729f5 Mon Sep 17 00:00:00 2001
From: ZhengHongming888 <hongming.zheng@intel.com>
Date: Wed, 12 Nov 2025 03:53:08 -0800
Subject: [PATCH 100/183] add cpu option for p/d in nixl_connector (#28356)

Signed-off-by: Hongming Zheng <hongming.zheng@intel.com>
---
 .../kv_connector/v1/nixl_connector.py          | 18 ++++++++++++++++--
 1 file changed, 16 insertions(+), 2 deletions(-)

diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index 375ea79d0e81..42433c717cf2 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -91,6 +91,7 @@
     ),
     "tpu": ("cpu",),
     "xpu": ("cpu",),
+    "cpu": ("cpu",),
 }
 # support for oot platform by providing mapping in current_platform
 _NIXL_SUPPORTED_DEVICE.update(current_platform.get_nixl_supported_devices())
@@ -348,7 +349,13 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
             + vllm_config.parallel_config.data_parallel_rank
         )
         assert vllm_config.kv_transfer_config is not None
-        self.use_host_buffer = vllm_config.kv_transfer_config.kv_buffer_device == "cpu"
+        if current_platform.device_type == "cpu":
+            self.use_host_buffer = False
+        else:
+            self.use_host_buffer = (
+                vllm_config.kv_transfer_config.kv_buffer_device == "cpu"
+            )
+
         logger.info("Initializing NIXL Scheduler %s", engine_id)
 
         # Background thread for handling new handshake requests.
@@ -820,7 +827,11 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         # cpu kv buffer for xfer
         # used when device memory can not be registered under nixl
         self.host_xfer_buffers: dict[str, torch.Tensor] = {}
-        self.use_host_buffer = self.kv_buffer_device == "cpu"
+        if self.device_type == "cpu":
+            self.use_host_buffer = False
+        else:
+            self.use_host_buffer = self.kv_buffer_device == "cpu"
+
         # support for oot platform which can't register nixl memory
         # type based on kv_buffer_device
         nixl_memory_type = current_platform.get_nixl_memory_type()
@@ -1021,6 +1032,9 @@ def set_host_xfer_buffer_ops(self, copy_operation: CopyBlocksOp):
         # Set a no-op if the host buffer is not cpu.
         if self.kv_buffer_device != "cpu":
             return
+        # Set a no-op if self.device_type is 'cpu'.
+        if self.device_type == "cpu":
+            return
         assert self.use_host_buffer
         self.copy_blocks = copy_operation
 

From edb59a9470f5c67ef11d52e7bb25fb8ea17f120f Mon Sep 17 00:00:00 2001
From: TJian <tunjian.tan@embeddedllm.com>
Date: Wed, 12 Nov 2025 05:01:14 -0800
Subject: [PATCH 101/183] [ROCm] [Bugfix] Fix `fused_qknorm_rope_kernel` rocm
 compatibility (#28500)

Signed-off-by: tjtanaa <tunjian.tan@embeddedllm.com>
---
 csrc/fused_qknorm_rope_kernel.cu              | 54 +++++++++----------
 csrc/torch_bindings.cpp                       |  2 -
 csrc/type_convert.cuh                         |  7 +--
 tests/compile/test_qk_norm_rope_fusion.py     |  4 +-
 tests/kernels/core/test_fused_qk_norm_rope.py |  4 +-
 vllm/config/compilation.py                    |  4 +-
 6 files changed, 37 insertions(+), 38 deletions(-)

diff --git a/csrc/fused_qknorm_rope_kernel.cu b/csrc/fused_qknorm_rope_kernel.cu
index cbd23975a773..83017250ebcd 100644
--- a/csrc/fused_qknorm_rope_kernel.cu
+++ b/csrc/fused_qknorm_rope_kernel.cu
@@ -35,10 +35,12 @@
   CHECK_TH_CUDA(x);    \
   CHECK_CONTIGUOUS(x)
 
-#define FINAL_MASK 0xffffffff
+#ifdef USE_ROCM
+  #define FINAL_MASK 0xffffffffffffffffULL
+#else
+  #define FINAL_MASK 0xffffffff
+#endif
 
-// TODO: suport for AMD ROCM platform
-#ifndef USE_ROCM
 namespace tensorrt_llm::common {
 template <typename T, int num>
 struct packed_as;
@@ -60,7 +62,7 @@ struct packed_as<uint, 4> {
 
 template <typename T>
 __inline__ __device__ T warpReduceSum(T val) {
-  #pragma unroll
+#pragma unroll
   for (int mask = 16; mask > 0; mask >>= 1)
     val += __shfl_xor_sync(FINAL_MASK, val, mask, 32);
   return val;
@@ -97,12 +99,12 @@ __global__ void fusedQKNormRopeKernel(
     int64_t const* position_ids,     // Position IDs for RoPE
     int const num_tokens             // Number of tokens
 ) {
-  #if !defined(__CUDA_ARCH__) || __CUDA_ARCH__ < 800
+#if (!defined(__CUDA_ARCH__) || __CUDA_ARCH__ < 800) && !defined(USE_ROCM)
   if constexpr ((std::is_same_v<scalar_t_in, c10::BFloat16>) ||
                 std::is_same_v<scalar_t_cache, c10::BFloat16>) {
     return;
   } else {
-  #endif
+#endif
 
     using Converter = vllm::_typeConvert<scalar_t_in>;
     static_assert(Converter::exists,
@@ -179,7 +181,7 @@ __global__ void fusedQKNormRopeKernel(
     {
       vec_T vec = *reinterpret_cast<vec_T const*>(&qkv[offsetThread]);
       constexpr int num_packed_elems = elemSizeBytes / sizeof(T2_in);
-  #pragma unroll
+#pragma unroll
       for (int i = 0; i < num_packed_elems; i++) {
         // Interpret the generic vector chunk as the specific packed type
         T2_in packed_val = *(reinterpret_cast<T2_in*>(&vec) + i);
@@ -200,7 +202,7 @@ __global__ void fusedQKNormRopeKernel(
     float rms_rcp = rsqrtf(sumOfSquares / static_cast<float>(head_dim) + eps);
 
     // Normalize elements
-  #pragma unroll
+#pragma unroll
     for (int i = 0; i < numElemsPerThread; i++) {
       int dim = laneId * numElemsPerThread + i;
       float weight = isQ ? Converter::convert(q_weight[dim])
@@ -222,7 +224,7 @@ __global__ void fusedQKNormRopeKernel(
 
     if constexpr (interleave) {
       // Perform interleaving. Use pre-computed cos/sin values.
-  #pragma unroll
+#pragma unroll
       for (int i = 0; i < numElemsPerThread / 2; ++i) {
         int const idx0 = 2 * i;
         int const idx1 = 2 * i + 1;
@@ -245,9 +247,9 @@ __global__ void fusedQKNormRopeKernel(
       __syncwarp();
       // Get the data from the other half of the warp. Use pre-computed cos/sin
       // values.
-  #pragma unroll
+#pragma unroll
       for (int i = 0; i < numElemsPerThread; i++) {
-        elements2[i] = __shfl_xor_sync(0xffffffff, elements[i], 16);
+        elements2[i] = __shfl_xor_sync(FINAL_MASK, elements[i], 16);
         if (laneId < 16) {
           elements2[i] = -elements2[i];
         }
@@ -269,7 +271,7 @@ __global__ void fusedQKNormRopeKernel(
     {
       vec_T vec;
       constexpr int num_packed_elems = elemSizeBytes / sizeof(T2_in);
-  #pragma unroll
+#pragma unroll
       for (int i = 0; i < num_packed_elems; i++) {
         // Convert from float2 back to the specific packed type
         T2_in packed_val = Converter::convert(
@@ -280,21 +282,21 @@ __global__ void fusedQKNormRopeKernel(
       *reinterpret_cast<vec_T*>(&qkv[offsetThread]) = vec;
     }
 
-  #if !defined(__CUDA_ARCH__) || __CUDA_ARCH__ < 800
+#if (!defined(__CUDA_ARCH__) || __CUDA_ARCH__ < 800) && !defined(USE_ROCM)
   }
-  #endif
+#endif
 }
 
-  // Borrowed from
-  // https://github.com/flashinfer-ai/flashinfer/blob/8125d079a43e9a0ba463a4ed1b639cefd084cec9/include/flashinfer/pos_enc.cuh#L568
-  #define DISPATCH_INTERLEAVE(interleave, INTERLEAVE, ...) \
-    if (interleave) {                                      \
-      const bool INTERLEAVE = true;                        \
-      __VA_ARGS__                                          \
-    } else {                                               \
-      const bool INTERLEAVE = false;                       \
-      __VA_ARGS__                                          \
-    }
+// Borrowed from
+// https://github.com/flashinfer-ai/flashinfer/blob/8125d079a43e9a0ba463a4ed1b639cefd084cec9/include/flashinfer/pos_enc.cuh#L568
+#define DISPATCH_INTERLEAVE(interleave, INTERLEAVE, ...) \
+  if (interleave) {                                      \
+    const bool INTERLEAVE = true;                        \
+    __VA_ARGS__                                          \
+  } else {                                               \
+    const bool INTERLEAVE = false;                       \
+    __VA_ARGS__                                          \
+  }
 
 template <typename scalar_t_in, typename scalar_t_cache>
 void launchFusedQKNormRope(void* qkv, int const num_tokens,
@@ -413,6 +415,4 @@ void fused_qk_norm_rope(
               stream);
         });
   });
-}
-
-#endif  // not USE_ROCM
\ No newline at end of file
+}
\ No newline at end of file
diff --git a/csrc/torch_bindings.cpp b/csrc/torch_bindings.cpp
index d4a69cbe7971..c3ae06a30e3e 100644
--- a/csrc/torch_bindings.cpp
+++ b/csrc/torch_bindings.cpp
@@ -175,7 +175,6 @@ TORCH_LIBRARY_EXPAND(TORCH_EXTENSION_NAME, ops) {
       "float epsilon) -> ()");
   ops.impl("fused_add_rms_norm", torch::kCUDA, &fused_add_rms_norm);
 
-#ifndef USE_ROCM
   // Function for fused QK Norm and RoPE
   ops.def(
       "fused_qk_norm_rope(Tensor! qkv, int num_heads_q, "
@@ -183,7 +182,6 @@ TORCH_LIBRARY_EXPAND(TORCH_EXTENSION_NAME, ops) {
       "Tensor q_weight, Tensor k_weight, Tensor cos_sin_cache, "
       "bool is_neox, Tensor position_ids) -> ()");
   ops.impl("fused_qk_norm_rope", torch::kCUDA, &fused_qk_norm_rope);
-#endif
 
   // Apply repetition penalties to logits in-place
   ops.def(
diff --git a/csrc/type_convert.cuh b/csrc/type_convert.cuh
index 6da06f1e66cf..2678f69e19b6 100644
--- a/csrc/type_convert.cuh
+++ b/csrc/type_convert.cuh
@@ -67,9 +67,9 @@ struct _typeConvert<c10::Half> {
   }
 };
 
-  #if defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 800
+  #if (defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 800) || defined(USE_ROCM)
 // CUDA_ARCH < 800 does not have BF16 support
-// TODO: Add in ROCm support once public headers handle bf16 maturely
+// ROCm 7.0+ supports bfloat16
 template <>
 struct _typeConvert<c10::BFloat16> {
   static constexpr bool exists = true;
@@ -89,7 +89,8 @@ struct _typeConvert<c10::BFloat16> {
     return __float22bfloat162_rn(x);
   }
 };
-  #endif  // defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 800
+  #endif  // (defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 800) ||
+          // defined(USE_ROCM)
 #endif    // defined(USE_ROCM) || (defined(CUDA_VERSION) && (CUDA_VERSION >=
           // 12000))
 
diff --git a/tests/compile/test_qk_norm_rope_fusion.py b/tests/compile/test_qk_norm_rope_fusion.py
index 973123a3af92..511e50f5fdc2 100644
--- a/tests/compile/test_qk_norm_rope_fusion.py
+++ b/tests/compile/test_qk_norm_rope_fusion.py
@@ -113,8 +113,8 @@ def ops_in_model_after(self) -> list[torch._ops.OpOverload]:
 @pytest.mark.parametrize("enable_rope_custom_op", [True])
 @pytest.mark.parametrize("dtype", [torch.bfloat16, torch.float16])
 @pytest.mark.skipif(
-    not current_platform.is_cuda(),
-    reason="Only test on cuda platform",
+    not current_platform.is_cuda_alike(),
+    reason="Only test on cuda and rocm platform",
 )
 def test_qk_norm_rope_fusion(
     eps, is_neox, enable_rms_norm_custom_op, enable_rope_custom_op, dtype
diff --git a/tests/kernels/core/test_fused_qk_norm_rope.py b/tests/kernels/core/test_fused_qk_norm_rope.py
index 88bb7691ec3b..a23959e353da 100644
--- a/tests/kernels/core/test_fused_qk_norm_rope.py
+++ b/tests/kernels/core/test_fused_qk_norm_rope.py
@@ -44,8 +44,8 @@ def _apply_qk_norm_rope(
 
 
 @pytest.mark.skipif(
-    not current_platform.is_cuda(),
-    reason="fused_qk_norm_rope custom op requires cuda platform",
+    not current_platform.is_cuda_alike(),
+    reason="fused_qk_norm_rope custom op requires cuda and rocm platform",
 )
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @pytest.mark.parametrize("dtype", DTYPES)
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index e1d60ee84d89..68eb9420e70d 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -184,10 +184,10 @@ def __post_init__(self) -> None:
                     "Fusion enabled but reshape elimination disabled. "
                     "Allreduce + rms norm + quant (fp8) fusion might not work"
                 )
-        if self.enable_qk_norm_rope_fusion and not current_platform.is_cuda():
+        if self.enable_qk_norm_rope_fusion and not current_platform.is_cuda_alike():
             logger.warning_once(
                 "QK Norm + RoPE fusion enabled but the current platform is not "
-                "CUDA. The fusion will be disabled."
+                "CUDA or ROCm. The fusion will be disabled."
             )
             self.enable_qk_norm_rope_fusion = False
 

From a9d18b51078d29f732e2811e91e8c002b1d1d0c4 Mon Sep 17 00:00:00 2001
From: Jee Jee Li <pandaleefree@gmail.com>
Date: Wed, 12 Nov 2025 21:02:06 +0800
Subject: [PATCH 102/183] [Bugfix] Fix gpt_oss packed_modules_mapping (#28536)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>
---
 vllm/model_executor/models/gpt_oss.py | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/vllm/model_executor/models/gpt_oss.py b/vllm/model_executor/models/gpt_oss.py
index 291ac833f26a..9cb481fc30c7 100644
--- a/vllm/model_executor/models/gpt_oss.py
+++ b/vllm/model_executor/models/gpt_oss.py
@@ -92,7 +92,7 @@ def __init__(
         self.scaling = self.head_dim**-0.5
         self.rope_theta = config.rope_theta
 
-        self.qkv = QKVParallelLinear(
+        self.qkv_proj = QKVParallelLinear(
             hidden_size=self.hidden_size,
             head_size=self.head_dim,
             total_num_heads=self.num_attention_heads,
@@ -129,7 +129,7 @@ def __init__(
     def forward(
         self, hidden_states: torch.Tensor, positions: torch.Tensor
     ) -> torch.Tensor:
-        qkv, _ = self.qkv(hidden_states)
+        qkv, _ = self.qkv_proj(hidden_states)
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
         q, k = self.rotary_emb(positions, q, k)
         v = v.contiguous()
@@ -606,9 +606,9 @@ def _load_weights_other(
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
-            (".qkv", ".q_proj", "q"),
-            (".qkv", ".k_proj", "k"),
-            (".qkv", ".v_proj", "v"),
+            (".qkv_proj", ".q_proj", "q"),
+            (".qkv_proj", ".k_proj", "k"),
+            (".qkv_proj", ".v_proj", "v"),
         ]
 
         tp_rank = get_tensor_model_parallel_rank()

From 10138c92a5c78678dd7e47cfb9df638d5a6b5719 Mon Sep 17 00:00:00 2001
From: wangxiyuan <wangxiyuan1007@gmail.com>
Date: Wed, 12 Nov 2025 22:03:52 +0800
Subject: [PATCH 103/183] [V0 deprecation] Deprecate use_v1 parameter (#28112)

Signed-off-by: wangxiyuan <wangxiyuan1007@gmail.com>
---
 .../vllm_add_dummy_platform/dummy_platform.py |  1 -
 vllm/attention/selector.py                    | 41 ++++++++++++++-----
 vllm/platforms/cpu.py                         |  3 --
 vllm/platforms/cuda.py                        |  7 ----
 vllm/platforms/interface.py                   |  1 -
 vllm/platforms/rocm.py                        |  7 ----
 vllm/platforms/tpu.py                         |  3 --
 vllm/platforms/xpu.py                         |  3 +-
 8 files changed, 31 insertions(+), 35 deletions(-)

diff --git a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py
index 0389e28746cb..a80617a366ca 100644
--- a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py
+++ b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py
@@ -27,7 +27,6 @@ def get_attn_backend_cls(
         dtype,
         kv_cache_dtype,
         block_size,
-        use_v1,
         use_mla,
         has_sink,
         use_sparse,
diff --git a/vllm/attention/selector.py b/vllm/attention/selector.py
index 6e5fa854d35f..262cdf0e575b 100644
--- a/vllm/attention/selector.py
+++ b/vllm/attention/selector.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+import inspect
 import os
 from collections.abc import Generator
 from contextlib import contextmanager
@@ -141,17 +142,35 @@ def _cached_get_attn_backend(
     # get device-specific attn_backend
     from vllm.platforms import current_platform
 
-    attention_cls = current_platform.get_attn_backend_cls(
-        selected_backend,
-        head_size,
-        dtype,
-        kv_cache_dtype,
-        block_size,
-        True,
-        use_mla,
-        has_sink,
-        use_sparse,
-    )
+    sig = inspect.signature(current_platform.get_attn_backend_cls)
+    if "use_v1" in sig.parameters:
+        logger.warning_once(
+            "use_v1 parameter for get_attn_backend_cls is deprecated and will "
+            "be removed in v0.13.0 or v1.0.0, whichever is soonest. Please "
+            "remove it from your plugin code."
+        )
+        attention_cls = current_platform.get_attn_backend_cls(
+            selected_backend,
+            head_size,
+            dtype,
+            kv_cache_dtype,
+            block_size,
+            True,  # use_v1
+            use_mla,
+            has_sink,
+            use_sparse,
+        )
+    else:
+        attention_cls = current_platform.get_attn_backend_cls(
+            selected_backend,
+            head_size,
+            dtype,
+            kv_cache_dtype,
+            block_size,
+            use_mla,
+            has_sink,
+            use_sparse,
+        )
     if not attention_cls:
         raise ValueError(
             f"Invalid attention backend for {current_platform.device_name}"
diff --git a/vllm/platforms/cpu.py b/vllm/platforms/cpu.py
index 2f3249633710..8b3b8d4cb44f 100644
--- a/vllm/platforms/cpu.py
+++ b/vllm/platforms/cpu.py
@@ -131,7 +131,6 @@ def get_attn_backend_cls(
         dtype: torch.dtype,
         kv_cache_dtype: str | None,
         block_size: int,
-        use_v1: bool,
         use_mla: bool,
         has_sink: bool,
         use_sparse: bool,
@@ -144,8 +143,6 @@ def get_attn_backend_cls(
             raise NotImplementedError("MLA is not supported on CPU.")
         if use_sparse:
             raise NotImplementedError("Sparse Attention is not supported on CPU.")
-        if not use_v1:
-            raise ValueError("CPU backend only supports V1.")
         return AttentionBackendEnum.CPU_ATTN.get_path()
 
     @classmethod
diff --git a/vllm/platforms/cuda.py b/vllm/platforms/cuda.py
index 22c6dde754d0..ebcc290a64cd 100644
--- a/vllm/platforms/cuda.py
+++ b/vllm/platforms/cuda.py
@@ -336,17 +336,10 @@ def get_attn_backend_cls(
         dtype: torch.dtype,
         kv_cache_dtype: "CacheDType | None",
         block_size: int | None,
-        use_v1: bool,
         use_mla: bool,
         has_sink: bool,
         use_sparse: bool,
     ) -> str:
-        if not use_v1:
-            raise RuntimeError(
-                "V0 attention backends have been removed. Set VLLM_USE_V1=1 "
-                "to select a supported backend."
-            )
-
         device_capability = cls.get_device_capability()
         assert device_capability is not None
 
diff --git a/vllm/platforms/interface.py b/vllm/platforms/interface.py
index 4969bcf116a4..d0eb232e14c6 100644
--- a/vllm/platforms/interface.py
+++ b/vllm/platforms/interface.py
@@ -215,7 +215,6 @@ def get_attn_backend_cls(
         dtype: torch.dtype,
         kv_cache_dtype: "CacheDType | None",
         block_size: int,
-        use_v1: bool,
         use_mla: bool,
         has_sink: bool,
         use_sparse: bool,
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index f5f6808258ec..5fa8969b860e 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -213,7 +213,6 @@ def get_attn_backend_cls(
         dtype,
         kv_cache_dtype,
         block_size,
-        use_v1,
         use_mla,
         has_sink,
         use_sparse,
@@ -224,12 +223,6 @@ def get_attn_backend_cls(
         if use_sparse:
             raise NotImplementedError("Sparse Attention is not supported on ROCm.")
 
-        if not use_v1:
-            raise RuntimeError(
-                "V0 attention backends have been removed. Set VLLM_USE_V1=1 "
-                "to select a supported backend."
-            )
-
         if use_mla:
             if selected_backend is None:
                 selected_backend = (
diff --git a/vllm/platforms/tpu.py b/vllm/platforms/tpu.py
index 575a9892c211..4773fef6829d 100644
--- a/vllm/platforms/tpu.py
+++ b/vllm/platforms/tpu.py
@@ -58,7 +58,6 @@ def get_attn_backend_cls(
         dtype: torch.dtype,
         kv_cache_dtype: str | None,
         block_size: int,
-        use_v1: bool,
         use_mla: bool,
         has_sink,
         use_sparse,
@@ -70,8 +69,6 @@ def get_attn_backend_cls(
         if selected_backend != AttentionBackendEnum.PALLAS:
             logger.info("Cannot use %s backend on TPU.", selected_backend)
 
-        if not use_v1:
-            raise ValueError("TPU backend only supports V1.")
         logger.info("Using Pallas V1 backend.")
         return AttentionBackendEnum.PALLAS.get_path()
 
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index 359eafc66445..3a8e174f2b74 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -48,7 +48,6 @@ def get_attn_backend_cls(
         dtype: torch.dtype,
         kv_cache_dtype: str | None,
         block_size: int,
-        use_v1: bool,
         use_mla: bool,
         has_sink: bool,
         use_sparse,
@@ -76,7 +75,7 @@ def get_attn_backend_cls(
         elif selected_backend:
             raise ValueError(
                 f"Invalid attention backend for {cls.device_name}, "
-                f"with use_v1: {use_v1} use_mla: {use_mla}"
+                f"with use_mla: {use_mla}"
             )
 
         logger.info("Using Flash Attention backend.")

From 54aecd9ed55d65d1f7be9d14e4e82751663438c8 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Wed, 12 Nov 2025 14:13:41 +0000
Subject: [PATCH 104/183] Fix pre-commit (and XPU) on `main` (#28556)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
---
 vllm/model_executor/layers/quantization/mxfp4.py | 2 +-
 vllm/platforms/xpu.py                            | 2 --
 2 files changed, 1 insertion(+), 3 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/mxfp4.py b/vllm/model_executor/layers/quantization/mxfp4.py
index 7940b359a150..0f69a18a1f3f 100644
--- a/vllm/model_executor/layers/quantization/mxfp4.py
+++ b/vllm/model_executor/layers/quantization/mxfp4.py
@@ -1145,7 +1145,7 @@ def apply(
     ) -> torch.Tensor:
         assert activation == "swigluoai", (
             "Only swiglu_oai activation is supported for IPEX MXFP4 MoE"
-        )  # noqa:
+        )
         hidden_size_pad = round_up(self.original_hidden_size, 128)
         x_pad = torch.nn.functional.pad(x, (0, hidden_size_pad - x.size(-1)))
         hidden_states = layer.ipex_fusion(
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index 3a8e174f2b74..0309ae0fe962 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -64,8 +64,6 @@ def get_attn_backend_cls(
 
         if use_sparse:
             raise NotImplementedError("Sparse Attention is not supported on XPU.")
-        if not use_v1:
-            raise ValueError("XPU backend only supports V1.")
         if selected_backend == AttentionBackendEnum.TRITON_ATTN:
             logger.info_once("Using Triton backend.")
             return AttentionBackendEnum.TRITON_ATTN.get_path()

From f76e85c29984df2b0312efa5bfb80218689b9e17 Mon Sep 17 00:00:00 2001
From: Alexander Matveev <59768536+alexm-redhat@users.noreply.github.com>
Date: Wed, 12 Nov 2025 10:51:43 -0500
Subject: [PATCH 105/183] [Performance][Hopper] Avoid M dim padding to 4x for
 most cases (due to cuda graphs paddings) (#28492)

Signed-off-by: Alexander Matveev <amatveev@redhat.com>
---
 .../layers/quantization/utils/fp8_utils.py    | 35 +++++++++++--------
 1 file changed, 21 insertions(+), 14 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/utils/fp8_utils.py b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
index 0c54cf4def00..4384857f9270 100644
--- a/vllm/model_executor/layers/quantization/utils/fp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
@@ -115,20 +115,27 @@ def _padded_cutlass(
         dim if dim % pad_multiple == 0 else dim + pad_multiple - (dim % pad_multiple)
     )
 
-    padded_shape = [padded, *qx.shape[1:]]
-    padded_qx = torch.zeros(padded_shape, device=qx.device, dtype=qx.dtype)
-    padded_qx[0 : qx.shape[0], ...].copy_(qx)
-
-    padded_x_scale_shape = [*x_scale.shape[1:], padded]
-    padded_x_scale = torch.ones(
-        padded_x_scale_shape, device=x_scale.device, dtype=x_scale.dtype
-    ).permute(-1, -2)
-    padded_x_scale[0 : x_scale.shape[0], ...].copy_(x_scale)
-
-    output = cutlass_scaled_mm(
-        padded_qx, weight, padded_x_scale, weight_scale, block_size, output_dtype
-    )
-    return output[0 : qx.shape[0], ...]
+    has_pad = padded > dim
+
+    if has_pad:
+        padded_shape = [padded, *qx.shape[1:]]
+        padded_qx = torch.zeros(padded_shape, device=qx.device, dtype=qx.dtype)
+        padded_qx[0 : qx.shape[0], ...].copy_(qx)
+
+        padded_x_scale_shape = [*x_scale.shape[1:], padded]
+        padded_x_scale = torch.ones(
+            padded_x_scale_shape, device=x_scale.device, dtype=x_scale.dtype
+        ).permute(-1, -2)
+        padded_x_scale[0 : x_scale.shape[0], ...].copy_(x_scale)
+
+        output = cutlass_scaled_mm(
+            padded_qx, weight, padded_x_scale, weight_scale, block_size, output_dtype
+        )
+        return output[0 : qx.shape[0], ...]
+    else:
+        return cutlass_scaled_mm(
+            qx, weight, x_scale, weight_scale, block_size, output_dtype
+        )
 
 
 def _padded_cutlass_fake(

From bc5bd45c7d1abbac4a63d97d383212c108e55308 Mon Sep 17 00:00:00 2001
From: Canlin Guo <canlinguosdu@gmail.com>
Date: Wed, 12 Nov 2025 23:56:47 +0800
Subject: [PATCH 106/183] [Refactor] Remove redundant TP gather/split in
 split_qkv in QwenVL (#28271)

Signed-off-by: gcanlin <canlinguosdu@gmail.com>
---
 vllm/model_executor/models/qwen2_5_vl.py | 30 ------------------------
 vllm/model_executor/models/qwen2_vl.py   | 13 +---------
 2 files changed, 1 insertion(+), 42 deletions(-)

diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index 4662176a1cc5..b0557d58d6dd 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -291,25 +291,6 @@ def forward(self, x: torch.Tensor):
         return x_down
 
 
-def all_gather_interleave(local_tensor, hidden_size: int, tp_size: int):
-    """All-gather the input tensor interleavely across model parallel group."""
-    import torch.distributed as dist
-
-    gathered_tensors = [torch.zeros_like(local_tensor) for _ in range(tp_size)]
-    dist.all_gather(
-        gathered_tensors, local_tensor, group=parallel_state.get_tp_group().device_group
-    )
-
-    gathered_tensors_split = [
-        torch.split(tensor, hidden_size // tp_size, -1) for tensor in gathered_tensors
-    ]
-    ordered_tensors = [
-        tensor for pair in zip(*gathered_tensors_split) for tensor in pair
-    ]
-    result_tensor = torch.cat(ordered_tensors, dim=-1)
-    return result_tensor
-
-
 class Qwen2_5_VisionAttention(nn.Module):
     def __init__(
         self,
@@ -383,21 +364,10 @@ def __init__(
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
         # [s, b, 3 * head * head_dim]
         seq_len, bs, _ = qkv.shape
-        if self.tp_size > 1:
-            qkv = all_gather_interleave(qkv, self.qkv.hidden_size, self.tp_size)
 
         # [s, b, 3 * head * head_dim] -> 3 * [s, b, head * head_dim]
         q, k, v = qkv.chunk(3, dim=2)
 
-        # 3 * [s, b, head * head_dim]
-        if self.tp_size > 1:
-            splitter = partial(
-                dist_utils.split_tensor_along_last_dim, num_partitions=self.tp_size
-            )
-            q = splitter(q)[self.tp_rank]
-            k = splitter(k)[self.tp_rank]
-            v = splitter(v)[self.tp_rank]
-
         # 3 * [s, b, head * head_dim] -> 3 * [s, b, head, head_dim]
         new_shape = (
             seq_len,
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index bbebe7c0f928..ff04baee91d1 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -50,7 +50,7 @@
 )
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
-from vllm.distributed import parallel_state, tensor_model_parallel_all_gather
+from vllm.distributed import parallel_state
 from vllm.distributed import utils as dist_utils
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import QuickGELU
@@ -396,21 +396,10 @@ def __init__(
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
         # [s, b, 3 * head * head_dim]
         seq_len, bs, _ = qkv.shape
-        if self.tp_size > 1:
-            qkv = tensor_model_parallel_all_gather(qkv)
 
         # [s, b, 3 * head * head_dim] -> 3 * [s, b, head * head_dim]
         q, k, v = qkv.chunk(3, dim=2)
 
-        # 3 * [s, b, head * head_dim]
-        if self.tp_size > 1:
-            splitter = partial(
-                dist_utils.split_tensor_along_last_dim, num_partitions=self.tp_size
-            )
-            q = splitter(q)[self.tp_rank]
-            k = splitter(k)[self.tp_rank]
-            v = splitter(v)[self.tp_rank]
-
         # 3 * [s, b, head * head_dim] -> 3 * [s, b, head, head_dim]
         new_shape = (
             seq_len,

From 728a9eb70ee30b1ab355a98f7e19fb81a0a7b873 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Nicol=C3=B2=20Lucchesi?= <nlucches@redhat.com>
Date: Wed, 12 Nov 2025 17:05:44 +0100
Subject: [PATCH 107/183] [Misc] Refactor Attention kv transfer methods into
 decorator (#27816)

Signed-off-by: NickLucche <nlucches@redhat.com>
Signed-off-by: Mark McLoughlin <markmc@redhat.com>
Co-authored-by: Mark McLoughlin <markmc@redhat.com>
---
 vllm/attention/layer.py                   | 115 ++++++++--------------
 vllm/attention/utils/kv_transfer_utils.py |  60 +++++++++++
 2 files changed, 99 insertions(+), 76 deletions(-)
 create mode 100644 vllm/attention/utils/kv_transfer_utils.py

diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index ec705126c710..487bba76babf 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -15,14 +15,10 @@
 from vllm.attention.backends.registry import AttentionBackendEnum
 from vllm.attention.selector import get_attn_backend
 from vllm.attention.utils.kv_sharing_utils import validate_kv_sharing_target
+from vllm.attention.utils.kv_transfer_utils import maybe_transfer_kv_layer
 from vllm.config import CacheConfig, get_current_vllm_config
 from vllm.config.multimodal import MultiModalConfig
 from vllm.config.vllm import VllmConfig
-from vllm.distributed.kv_transfer import (
-    get_kv_transfer_group,
-    has_kv_transfer_group,
-    is_v1_kv_transfer_group,
-)
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.logger import init_logger
 from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
@@ -842,41 +838,6 @@ def get_kv_cache_spec(self, vllm_config: VllmConfig) -> KVCacheSpec:
         )
 
 
-def wait_for_kv_layer_from_connector(layer_name: str):
-    if not has_kv_transfer_group() or not is_v1_kv_transfer_group():
-        return
-
-    connector = get_kv_transfer_group()
-    if not connector.has_connector_metadata():
-        return
-
-    forward_context: ForwardContext = get_forward_context()
-    attn_metadata = forward_context.attn_metadata
-    if attn_metadata is None:
-        return
-    assert isinstance(attn_metadata, dict)
-    connector.wait_for_layer_load(layer_name)
-
-
-def maybe_save_kv_layer_to_connector(
-    layer_name: str,
-    kv_cache_layer: list[torch.Tensor],
-):
-    if not has_kv_transfer_group() or not is_v1_kv_transfer_group():
-        return
-
-    connector = get_kv_transfer_group()
-    if not connector.has_connector_metadata():
-        return
-
-    forward_context: ForwardContext = get_forward_context()
-    attn_metadata = forward_context.attn_metadata
-    if attn_metadata is None:
-        return
-    assert isinstance(attn_metadata, dict)
-    connector.save_kv_layer(layer_name, kv_cache_layer, attn_metadata[layer_name])
-
-
 def maybe_calc_kv_scales(
     query: torch.Tensor,
     key: torch.Tensor,
@@ -911,23 +872,46 @@ def maybe_calc_kv_scales_fake(
 )
 
 
-def unified_attention(
-    query: torch.Tensor,
-    key: torch.Tensor,
-    value: torch.Tensor,
+def get_attention_context(
     layer_name: str,
-) -> torch.Tensor:
-    wait_for_kv_layer_from_connector(layer_name)
+) -> tuple[dict | object | None, Attention | MLAAttention, torch.Tensor]:
+    """Extract attention context for a given layer.
+
+    This helper function extracts the attention metadata, attention layer
+    instance, and KV cache tensor for a specific layer.
+
+    Args:
+        layer_name: The name/identifier of the attention layer.
 
+    Returns:
+        A tuple containing:
+        - attn_metadata: Attention metadata for this specific layer, or None if
+            no metadata available
+        - attn_layer: The attention layer instance (Attention or MLAAttention)
+        - kv_cache: The KV cache tensor for current virtual engine
+
+        Note: attn_metadata may be None, but attn_layer and kv_cache are always
+        extracted from the forward context.
+    """
     forward_context: ForwardContext = get_forward_context()
     attn_metadata = forward_context.attn_metadata
     if isinstance(attn_metadata, dict):
         attn_metadata = attn_metadata[layer_name]
-    self = forward_context.no_compile_layers[layer_name]
-    kv_cache = self.kv_cache[forward_context.virtual_engine]
+    attn_layer: Attention | MLAAttention = forward_context.no_compile_layers[layer_name]
+    kv_cache = attn_layer.kv_cache[forward_context.virtual_engine]
+    return attn_metadata, attn_layer, kv_cache
+
+
+@maybe_transfer_kv_layer
+def unified_attention(
+    query: torch.Tensor,
+    key: torch.Tensor,
+    value: torch.Tensor,
+    layer_name: str,
+) -> torch.Tensor:
+    attn_metadata, self, kv_cache = get_attention_context(layer_name)
     output = self.impl.forward(self, query, key, value, kv_cache, attn_metadata)
 
-    maybe_save_kv_layer_to_connector(layer_name, kv_cache)
     return output
 
 
@@ -947,6 +931,7 @@ def unified_attention_fake(
 )
 
 
+@maybe_transfer_kv_layer
 def unified_attention_with_output(
     query: torch.Tensor,
     key: torch.Tensor,
@@ -956,13 +941,7 @@ def unified_attention_with_output(
     output_scale: torch.Tensor | None = None,
     output_block_scale: torch.Tensor | None = None,
 ) -> None:
-    wait_for_kv_layer_from_connector(layer_name)
-    forward_context: ForwardContext = get_forward_context()
-    attn_metadata = forward_context.attn_metadata
-    if isinstance(attn_metadata, dict):
-        attn_metadata = attn_metadata[layer_name]
-    self = forward_context.no_compile_layers[layer_name]
-    kv_cache = self.kv_cache[forward_context.virtual_engine]
+    attn_metadata, self, kv_cache = get_attention_context(layer_name)
     self.impl.forward(
         self,
         query,
@@ -975,8 +954,6 @@ def unified_attention_with_output(
         output_block_scale=output_block_scale,
     )
 
-    maybe_save_kv_layer_to_connector(layer_name, kv_cache)
-
 
 def unified_attention_with_output_fake(
     query: torch.Tensor,
@@ -998,23 +975,16 @@ def unified_attention_with_output_fake(
 )
 
 
+@maybe_transfer_kv_layer
 def unified_mla_attention(
     q: torch.Tensor,
     kv_c_normed: torch.Tensor,
     k_pe: torch.Tensor,
     layer_name: str,
 ) -> torch.Tensor:
-    wait_for_kv_layer_from_connector(layer_name)
-
-    forward_context: ForwardContext = get_forward_context()
-    attn_metadata = forward_context.attn_metadata
-    if isinstance(attn_metadata, dict):
-        attn_metadata = attn_metadata[layer_name]
-    self: MLAAttention = forward_context.no_compile_layers[layer_name]
-    kv_cache = self.kv_cache[forward_context.virtual_engine]
+    attn_metadata, self, kv_cache = get_attention_context(layer_name)
     output = self.impl.forward(self, q, kv_c_normed, k_pe, kv_cache, attn_metadata)
 
-    maybe_save_kv_layer_to_connector(layer_name, kv_cache)
     return output
 
 
@@ -1036,6 +1006,7 @@ def unified_mla_attention_fake(
 )
 
 
+@maybe_transfer_kv_layer
 def unified_mla_attention_with_output(
     q: torch.Tensor,
     kv_c_normed: torch.Tensor,
@@ -1045,13 +1016,7 @@ def unified_mla_attention_with_output(
     output_scale: torch.Tensor | None = None,
     output_block_scale: torch.Tensor | None = None,
 ) -> None:
-    wait_for_kv_layer_from_connector(layer_name)
-    forward_context: ForwardContext = get_forward_context()
-    attn_metadata = forward_context.attn_metadata
-    if isinstance(attn_metadata, dict):
-        attn_metadata = attn_metadata[layer_name]
-    self: MLAAttention = forward_context.no_compile_layers[layer_name]
-    kv_cache = self.kv_cache[forward_context.virtual_engine]
+    attn_metadata, self, kv_cache = get_attention_context(layer_name)
     self.impl.forward(
         self,
         q,
@@ -1064,8 +1029,6 @@ def unified_mla_attention_with_output(
         output_block_scale=output_block_scale,
     )
 
-    maybe_save_kv_layer_to_connector(layer_name, kv_cache)
-
 
 def unified_mla_attention_with_output_fake(
     q: torch.Tensor,
diff --git a/vllm/attention/utils/kv_transfer_utils.py b/vllm/attention/utils/kv_transfer_utils.py
new file mode 100644
index 000000000000..210be55feb2f
--- /dev/null
+++ b/vllm/attention/utils/kv_transfer_utils.py
@@ -0,0 +1,60 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import inspect
+from collections.abc import Callable
+from functools import wraps
+
+from vllm.distributed.kv_transfer import (
+    get_kv_transfer_group,
+    has_kv_transfer_group,
+    is_v1_kv_transfer_group,
+)
+
+
+def maybe_transfer_kv_layer(func: Callable) -> Callable:
+    """Decorator that handles KV layer transfer prior and after execution of
+    an attention layer, if enabled. Otherwise, the wrapper is a no-op.
+
+    On entry: waits for the KV layer from the connector.
+    On exit: saves the KV layer to the connector.
+    """
+    # Import at runtime to avoid circular dependency
+    from vllm.attention.layer import get_attention_context
+
+    # Inspect the signature ONCE when the decorator is applied.
+    sig = inspect.signature(func)
+    param_names = list(sig.parameters.keys())
+
+    # Find the index of 'layer_name' parameter.
+    try:
+        layer_name_index = param_names.index("layer_name")
+    except ValueError as e:
+        raise TypeError(
+            f"Function {func.__name__} must have a 'layer_name' parameter"
+        ) from e
+
+    @wraps(func)
+    def wrapper(*args, **kwargs):
+        if not has_kv_transfer_group() or not is_v1_kv_transfer_group():
+            return func(*args, **kwargs)
+
+        layer_name: str = args[layer_name_index]
+
+        # Extract attention context (layer-specific metadata, layer, and kv_cache)
+        attn_metadata, attn_layer, kv_cache = get_attention_context(layer_name)
+        connector = get_kv_transfer_group()
+        if attn_metadata is None or not connector.has_connector_metadata():
+            return func(*args, **kwargs)
+
+        # Wait for KV layer on entry
+        connector.wait_for_layer_load(layer_name)
+
+        # Execute the function
+        result = func(*args, **kwargs)
+
+        # Save KV cache layer on exit
+        connector.save_kv_layer(layer_name, kv_cache, attn_metadata)
+
+        return result
+
+    return wrapper

From a742134cc5fbdec6c2af1ef383704aac5c445fbd Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Wed, 12 Nov 2025 16:10:28 +0000
Subject: [PATCH 108/183] Remove deprecated fields from `CompilationConfig`
 (#27593)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
---
 .buildkite/test-pipeline.yaml                 |   1 +
 docs/design/cuda_graphs.md                    |  10 --
 .../compile/piecewise/test_multiple_graphs.py |   4 +-
 tests/compile/piecewise/test_simple.py        |   1 -
 tests/compile/piecewise/test_toy_llama.py     |   1 -
 tests/compile/test_config.py                  | 151 +++++++++++-------
 tests/compile/test_decorator.py               |   3 -
 .../multimodal/generation/test_qwen2_5_vl.py  |   2 -
 vllm/config/compilation.py                    |  95 +++--------
 vllm/config/vllm.py                           |  12 +-
 vllm/v1/attention/backends/mamba1_attn.py     |   2 +-
 vllm/v1/attention/backends/mamba2_attn.py     |   2 +-
 vllm/v1/attention/backends/short_conv_attn.py |   2 +-
 13 files changed, 122 insertions(+), 164 deletions(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index e816a20fe064..2af0e46ea15f 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -443,6 +443,7 @@ steps:
     - vllm/
     - tests/compile
   commands:
+    - pytest -v -s compile/test_config.py
     - pytest -v -s compile/test_pass_manager.py
     - pytest -v -s compile/test_fusion.py
     - pytest -v -s compile/test_fusion_attn.py
diff --git a/docs/design/cuda_graphs.md b/docs/design/cuda_graphs.md
index b56cf61e782c..177a581587d0 100644
--- a/docs/design/cuda_graphs.md
+++ b/docs/design/cuda_graphs.md
@@ -218,16 +218,6 @@ outputs = model.generate(
 )
 ```
 
-### Migration from legacy flags
-
-Legacy `use_cudagraph` and `full_cuda_graph` are unified by `cudagraph_mode`:
-
-* `use_cudagraph=False` → `NONE`.
-* `use_cudagraph=True` and `full_cuda_graph=False` → `PIECEWISE`.
-* `full_cuda_graph=True` → directly set `FULL` and rely on the graceful fallback policy.
-
-As they are deprecated and will be removed in the next major or minor release, i.e., v0.11.0 or v1.0.0, we recommend using cudagraph_mode instead.
-
 ### Piecewise compilation and full graph custom passes (attention fusion, sequence parallelism)
 
 Unfortunately, some custom compile passes have to see the whole graph to be effective and hence aren't compatible with piecewise compilation. This includes `AttnFusionPass` and `SequenceParallelismPass`. As a short-term solution, we automatically disable piecewise compilation (by setting `splitting_ops=[]`) when attention fusion is enabled. We use CUDA Graph modes `FULL` or `FULL_DECODE_ONLY` (depending on backend support). However, this leads to another optimization incompatibility and confusing performance tradeoffs.
diff --git a/tests/compile/piecewise/test_multiple_graphs.py b/tests/compile/piecewise/test_multiple_graphs.py
index 700f57ffb068..64d626bae483 100644
--- a/tests/compile/piecewise/test_multiple_graphs.py
+++ b/tests/compile/piecewise/test_multiple_graphs.py
@@ -203,7 +203,7 @@ def test_multi_graph_piecewise_compile(use_inductor_graph_partition: bool):
     vllm_config = VllmConfig(
         compilation_config=CompilationConfig(
             mode=CompilationMode.VLLM_COMPILE,
-            use_cudagraph=True,
+            cudagraph_mode=CUDAGraphMode.PIECEWISE,
             splitting_ops=["silly::attention"],
             cudagraph_capture_sizes=[1, 2],
             use_inductor_graph_partition=use_inductor_graph_partition,
@@ -281,7 +281,7 @@ def test_multi_graph_piecewise_compile(use_inductor_graph_partition: bool):
     vllm_config = VllmConfig(
         compilation_config=CompilationConfig(
             mode=CompilationMode.VLLM_COMPILE,
-            use_cudagraph=False,
+            cudagraph_mode=CUDAGraphMode.NONE,
             splitting_ops=["silly::attention"],
             use_inductor_graph_partition=use_inductor_graph_partition,
         )
diff --git a/tests/compile/piecewise/test_simple.py b/tests/compile/piecewise/test_simple.py
index 228859532ef4..a48af8a8952a 100644
--- a/tests/compile/piecewise/test_simple.py
+++ b/tests/compile/piecewise/test_simple.py
@@ -62,7 +62,6 @@ def _run_simple_model(
     vllm_config = VllmConfig(
         compilation_config=CompilationConfig(
             mode=CompilationMode.VLLM_COMPILE,
-            use_cudagraph=True,
             use_inductor=use_inductor,
             splitting_ops=splitting_ops,
             use_inductor_graph_partition=use_inductor_graph_partition,
diff --git a/tests/compile/piecewise/test_toy_llama.py b/tests/compile/piecewise/test_toy_llama.py
index 6887673eb6a5..92998ede1699 100644
--- a/tests/compile/piecewise/test_toy_llama.py
+++ b/tests/compile/piecewise/test_toy_llama.py
@@ -449,7 +449,6 @@ def benchmark():
         if piecewise:
             compilation_config = CompilationConfig(
                 mode=CompilationMode.VLLM_COMPILE,
-                use_cudagraph=True,
                 splitting_ops=["silly::attention"],
                 cudagraph_capture_sizes=cudagraph_sizes,
             )
diff --git a/tests/compile/test_config.py b/tests/compile/test_config.py
index 7455147f2b95..bb66ef5529b1 100644
--- a/tests/compile/test_config.py
+++ b/tests/compile/test_config.py
@@ -2,8 +2,10 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import copy
 from contextlib import nullcontext
+from unittest.mock import patch
 
 import pytest
+from pydantic import ValidationError
 
 from vllm.compilation.counter import compilation_counter
 from vllm.compilation.fix_functionalization import FixFunctionalizationPass
@@ -11,7 +13,7 @@
 from vllm.config.compilation import CompilationMode
 from vllm.engine.arg_utils import EngineArgs
 from vllm.platforms import current_platform
-from vllm.utils.torch_utils import _is_torch_equal_or_newer, is_torch_equal_or_newer
+from vllm.utils.torch_utils import _is_torch_equal_or_newer
 
 
 def test_version():
@@ -23,14 +25,6 @@ def test_version():
     assert not _is_torch_equal_or_newer("2.7.1", "2.8.0.dev")
 
 
-def test_use_cudagraphs_dynamic():
-    vllm_config = VllmConfig()
-    # Default V1 configuration now starts without cudagraphs enabled; the
-    # engine decides when to capture based on runtime settings instead of a
-    # blanket default.
-    assert vllm_config.compilation_config.use_cudagraph
-
-
 def test_copy_pass():
     vllm_config = VllmConfig()
     inductor_pass = FixFunctionalizationPass(vllm_config)
@@ -65,7 +59,7 @@ def test_VLLM_DISABLE_COMPILE_CACHE(vllm_runner, monkeypatch, val):
     monkeypatch.setenv("VLLM_DISABLE_COMPILE_CACHE", val)
 
     compilation_config = {
-        "use_cudagraph": False,  # speed things up a bit
+        "cudagraph_mode": CUDAGraphMode.NONE,  # speed things up a bit
     }
     with (
         compilation_counter.expect(
@@ -83,20 +77,31 @@ def test_VLLM_DISABLE_COMPILE_CACHE(vllm_runner, monkeypatch, val):
 
 # forked needed to workaround https://github.com/vllm-project/vllm/issues/21073
 @pytest.mark.forked
-@pytest.mark.parametrize("enabled", [True, False])
-def test_use_cudagraphs(vllm_runner, monkeypatch, enabled):
+@pytest.mark.parametrize(
+    "cudagraph_mode,num_cudagraph_captured",
+    [
+        (CUDAGraphMode.NONE, 0),
+        (CUDAGraphMode.FULL_DECODE_ONLY, 1),
+        (CUDAGraphMode.PIECEWISE, 13),
+        (CUDAGraphMode.FULL_AND_PIECEWISE, 14),
+    ],
+)
+def test_use_cudagraphs(
+    vllm_runner, monkeypatch, cudagraph_mode, num_cudagraph_captured
+):
     # Disable multiprocessing so that the counter is in the same process
     monkeypatch.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "0")
 
     compilation_config = {
         "cudagraph_capture_sizes": [100],
-        "use_cudagraph": enabled,
+        "cudagraph_mode": cudagraph_mode,
     }
+    num_gpu_runner_capture_triggers = 1 if cudagraph_mode != CUDAGraphMode.NONE else 0
     with (
         compilation_counter.expect(
             num_graphs_seen=1,
-            num_gpu_runner_capture_triggers=1 if enabled else 0,
-            num_cudagraph_captured=13 if enabled else 0,
+            num_gpu_runner_capture_triggers=num_gpu_runner_capture_triggers,
+            num_cudagraph_captured=num_cudagraph_captured,
         ),
         # loading the model causes compilation (if enabled) to happen
         vllm_runner(
@@ -168,19 +173,18 @@ def test_splitting_ops_dynamic():
     assert not config.compilation_config.splitting_ops_contain_attention()
 
     # When use_inductor_graph_partition=True
-    if is_torch_equal_or_newer("2.9.0.dev"):
-        config = VllmConfig(
-            compilation_config=CompilationConfig(
-                mode=CompilationMode.VLLM_COMPILE,
-                use_inductor_graph_partition=True,
-                splitting_ops=["vllm::unified_attention"],
-            )
+    config = VllmConfig(
+        compilation_config=CompilationConfig(
+            mode=CompilationMode.VLLM_COMPILE,
+            use_inductor_graph_partition=True,
+            splitting_ops=["vllm::unified_attention"],
         )
-        # with inductor partition we use splitting_ops directly for
-        # partition rules
-        assert config.compilation_config.splitting_ops == ["vllm::unified_attention"]
+    )
+    # with inductor partition we use splitting_ops directly for
+    # partition rules
+    assert config.compilation_config.splitting_ops == ["vllm::unified_attention"]
 
-    # When attn_fusion pass enabled, splitting_ops now default to attention ops.
+    # When attn_fusion pass enabled.
     config = VllmConfig(
         compilation_config=CompilationConfig(
             mode=CompilationMode.VLLM_COMPILE,
@@ -189,29 +193,41 @@ def test_splitting_ops_dynamic():
             cudagraph_mode=CUDAGraphMode.PIECEWISE,
         )
     )
-    # With the new simplified logic, attention fusion works with splitting_ops
-    assert config.compilation_config.splitting_ops_contain_attention()
-    # cudagraph mode remains PIECEWISE
-    assert config.compilation_config.cudagraph_mode == CUDAGraphMode.PIECEWISE
+    assert config.compilation_config.splitting_ops == []
+    # cudagraph mode also fall back to FULL
+    assert config.compilation_config.cudagraph_mode == CUDAGraphMode.FULL
 
-    # When both use_inductor_graph_partition and attn_fusion pass enabled.
-    if is_torch_equal_or_newer("2.9.0.dev"):
+    # splitting_ops can not contain attention ops when attn_fusion
+    # pass enabled.
+    with pytest.raises(ValidationError):
         config = VllmConfig(
             compilation_config=CompilationConfig(
                 mode=CompilationMode.VLLM_COMPILE,
-                use_inductor_graph_partition=True,
                 pass_config={"enable_attn_fusion": True, "enable_noop": True},
                 custom_ops=["+quant_fp8"],
                 cudagraph_mode=CUDAGraphMode.PIECEWISE,
+                # work around for accessing all attntion ops
+                splitting_ops=CompilationConfig()._attention_ops,
             )
         )
-        # With inductor graph partition, attn_fusion and splitting_ops
-        # work together. Default splitting_ops include attention ops.
-        assert config.compilation_config.splitting_ops_contain_attention()
-        # enable_attn_fusion is directly supported under
-        # use_inductor_graph_partition=True, and cudagraph_mode
-        # is unchanged.
-        assert config.compilation_config.cudagraph_mode == CUDAGraphMode.PIECEWISE
+
+    # When both use_inductor_graph_partition and attn_fusion pass enabled.
+    config = VllmConfig(
+        compilation_config=CompilationConfig(
+            mode=CompilationMode.VLLM_COMPILE,
+            use_inductor_graph_partition=True,
+            pass_config={"enable_attn_fusion": True, "enable_noop": True},
+            custom_ops=["+quant_fp8"],
+            cudagraph_mode=CUDAGraphMode.PIECEWISE,
+        )
+    )
+    # With inductor graph partition, attn_fusion and splitting_ops
+    # work together. Default splitting_ops include attention ops.
+    assert config.compilation_config.splitting_ops_contain_attention()
+    # enable_attn_fusion is directly supported under
+    # use_inductor_graph_partition=True, and cudagraph_mode
+    # is unchanged.
+    assert config.compilation_config.cudagraph_mode == CUDAGraphMode.PIECEWISE
 
 
 def test_should_split():
@@ -293,25 +309,36 @@ def attention(
         "tp_size",
         "enable_sequence_parallelism",
         "max_num_batched_tokens",
-        "use_cudagraph",
+        "cudagraph_mode",
         "expected_max_size",
     ),
     [
-        (None, None, 1, False, 2048, True, 512),
-        ([1, 2, 4], 4, 1, False, 2048, True, 4),
-        ([1, 2, 4], 8, 1, False, 2048, True, RuntimeError),
-        ([1, 256], None, 1, False, 2048, 256),
-        ([], None, 1, False, 2048, False, 0),
-        (None, 0, 1, False, 2048, False, 0),
+        (None, None, 1, False, 2048, CUDAGraphMode.FULL_AND_PIECEWISE, 256),
+        ([1, 2, 4], 4, 1, False, 2048, CUDAGraphMode.FULL_AND_PIECEWISE, 4),
+        (
+            [1, 2, 4],
+            8,
+            1,
+            False,
+            2048,
+            CUDAGraphMode.FULL_AND_PIECEWISE,
+            ValidationError,
+        ),
+        ([1, 256], None, 1, False, 2048, CUDAGraphMode.FULL_AND_PIECEWISE, 256),
+        ([], None, 1, False, 2048, CUDAGraphMode.NONE, 0),
+        (None, 0, 1, False, 2048, CUDAGraphMode.NONE, 0),
         # truncated to nearest multiple of 8 or 16
-        (None, 257, 1, False, 2048, True, 256),
-        ([1, 2, 4, 15], None, 1, False, 2048, True, 15),  # max from list
-        ([1, 2, 4, 15], None, 2, True, 2048, True, 4),  # filtered out 15 due to SP
-        ([1, 2, 4, 15], None, 1, False, 8, True, 4),  # limited by the max_tokens
+        (None, 257, 1, False, 2048, CUDAGraphMode.FULL_AND_PIECEWISE, 256),
+        # max from list
+        ([1, 2, 4, 15], None, 1, False, 2048, CUDAGraphMode.FULL_AND_PIECEWISE, 15),
+        # filtered out 15 due to SP
+        ([1, 2, 4, 15], None, 2, True, 2048, CUDAGraphMode.FULL_AND_PIECEWISE, 4),
+        # limited by the max_tokens
+        ([1, 2, 4, 15], None, 1, False, 8, CUDAGraphMode.FULL_AND_PIECEWISE, 4),
         # the list should contain at least 1 element when use cudagraph
-        ([], None, 1, False, 2048, True, RuntimeError),
+        ([], None, 1, False, 2048, CUDAGraphMode.FULL_AND_PIECEWISE, ValidationError),
         # the max capturing size should be >= 1 when use cudagraph
-        (None, 0, 1, False, 2048, True, RuntimeError),
+        (None, 0, 1, False, 2048, CUDAGraphMode.FULL_AND_PIECEWISE, ValidationError),
     ],
 )
 def test_cudagraph_sizes_post_init(
@@ -320,15 +347,17 @@ def test_cudagraph_sizes_post_init(
     tp_size,
     enable_sequence_parallelism,
     max_num_batched_tokens,
-    use_cudagraph,
+    cudagraph_mode,
     expected_max_size,
 ):
     ctx = nullcontext()
-    if isinstance(expected_max_size, Exception):
+    if expected_max_size == ValidationError:
         ctx = pytest.raises(expected_max_size)
 
-    cudagraph_mode = CUDAGraphMode.PIECEWISE if use_cudagraph else CUDAGraphMode.NONE
-    with ctx:
+    with (
+        ctx,
+        patch("vllm.config.parallel.cuda_device_count_stateless", return_value=tp_size),
+    ):
         compilation_config = CompilationConfig(
             cudagraph_capture_sizes=cudagraph_capture_sizes,
             max_cudagraph_capture_size=max_cudagraph_capture_size,
@@ -342,11 +371,13 @@ def test_cudagraph_sizes_post_init(
         engine_args = EngineArgs(
             model="facebook/opt-125m",
             tensor_parallel_size=tp_size,
+            max_num_seqs=min(max_num_batched_tokens, 128),
             max_num_batched_tokens=max_num_batched_tokens,
             compilation_config=compilation_config,
         )
         vllm_config = engine_args.create_engine_config()
 
-    assert (
-        vllm_config.compilation_config.max_cudagraph_capture_size == expected_max_size
-    )
+        assert (
+            vllm_config.compilation_config.max_cudagraph_capture_size
+            == expected_max_size
+        )
diff --git a/tests/compile/test_decorator.py b/tests/compile/test_decorator.py
index c9d01f2317d2..1850cc8f1479 100644
--- a/tests/compile/test_decorator.py
+++ b/tests/compile/test_decorator.py
@@ -80,7 +80,6 @@ def test_ignore_torch_compile_decorator(use_inductor_graph_partition, monkeypatc
     vllm_config = VllmConfig(
         compilation_config=CompilationConfig(
             mode=CompilationMode.VLLM_COMPILE,
-            use_cudagraph=True,
             splitting_ops=["silly::attention"],
             cudagraph_capture_sizes=[1, 2],
             use_inductor_graph_partition=use_inductor_graph_partition,
@@ -215,7 +214,6 @@ def test_conditional_compile_enable_if(use_inductor_graph_partition, monkeypatch
         ),
         compilation_config=CompilationConfig(
             mode=CompilationMode.VLLM_COMPILE,
-            use_cudagraph=True,
             splitting_ops=["silly::attention"],
             cudagraph_capture_sizes=[1, 2],
             use_inductor_graph_partition=use_inductor_graph_partition,
@@ -257,7 +255,6 @@ def test_conditional_compile_enable_if(use_inductor_graph_partition, monkeypatch
         ),
         compilation_config=CompilationConfig(
             mode=CompilationMode.VLLM_COMPILE,
-            use_cudagraph=True,
             splitting_ops=["silly::attention"],
             cudagraph_capture_sizes=[1, 2],
             use_inductor_graph_partition=use_inductor_graph_partition,
diff --git a/tests/models/multimodal/generation/test_qwen2_5_vl.py b/tests/models/multimodal/generation/test_qwen2_5_vl.py
index 1a7d854352ae..6b009075abfa 100644
--- a/tests/models/multimodal/generation/test_qwen2_5_vl.py
+++ b/tests/models/multimodal/generation/test_qwen2_5_vl.py
@@ -61,10 +61,8 @@ def test_qwen2_5_vl_evs_functionality(
         model,
         runner="generate",
         max_model_len=4000,
-        max_num_seqs=1,
         dtype=dtype,
         limit_mm_per_prompt={"video": 1},
-        tensor_parallel_size=1,
         video_pruning_rate=video_pruning_rate,
     ) as vllm_model:
         # Generate output - this should not crash
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 68eb9420e70d..b0d1bc2bab30 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -206,7 +206,6 @@ class CompilationConfig:
         - [`splitting_ops`][vllm.config.CompilationConfig.splitting_ops]
         - [`compile_mm_encoder`][vllm.config.CompilationConfig.compile_mm_encoder]
     - CudaGraph capture:
-        - [`use_cudagraph`][vllm.config.CompilationConfig.use_cudagraph]
         - [`cudagraph_mode`][vllm.config.CompilationConfig.cudagraph_mode]
         - [`cudagraph_capture_sizes`]
         [vllm.config.CompilationConfig.cudagraph_capture_sizes]
@@ -216,7 +215,6 @@ class CompilationConfig:
         [vllm.config.CompilationConfig.cudagraph_num_of_warmups]
         - [`cudagraph_copy_inputs`]
         [vllm.config.CompilationConfig.cudagraph_copy_inputs]
-        - [`full_cuda_graph`][vllm.config.CompilationConfig.full_cuda_graph]
     - Inductor compilation:
         - [`use_inductor`][vllm.config.CompilationConfig.use_inductor]
         - [`compile_sizes`][vllm.config.CompilationConfig.compile_sizes]
@@ -396,18 +394,6 @@ class CompilationConfig:
     Warning: This flag is new and subject to change in addition
     more modes may be added.
     """
-    use_cudagraph: bool = True
-    """Whether to use cudagraph inside compilation:
-
-    - False: cudagraph inside compilation is not used.\n
-    - True: cudagraph inside compilation is used. It requires
-        that all input buffers have fixed addresses, and all
-        splitting ops write their outputs to input buffers.
-
-    Warning: This flag is deprecated and will be removed in the next major or
-    minor release, i.e. v0.11.0 or v1.0.0. Please use cudagraph_mode=FULL_AND
-    _PIECEWISE instead.
-    """
     cudagraph_num_of_warmups: int = 0
     """Number of warmup runs for cudagraph.
     It means the first several runs will be treated as warmup runs.
@@ -425,15 +411,6 @@ class CompilationConfig:
     internally managed buffer. Default is False.
     Note that this flag is only effective when cudagraph_mode is PIECEWISE.
     """
-    full_cuda_graph: bool | None = False
-    """whether to use a full cuda graph for the entire forward pass rather than
-    splitting certain operations such as attention into subgraphs. Thus this
-    flag cannot be used together with splitting_ops. This may provide
-    performance benefits for smaller models.
-    Warning: This flag is deprecated and will be removed in the next major or
-    minor release, i.e. v0.11.0 or v1.0.0. Please use cudagraph_mode=
-    FULL_AND_PIECEWISE instead.
-    """
     cudagraph_specialize_lora: bool = True
     """Whether to create separate cuda graphs for cases with and without active
     LoRA adapters. When set to False, the LoRA-enabled cuda graph will be used
@@ -603,13 +580,19 @@ def validate_mode_before(cls, value: Any) -> Any:
     @field_validator("cudagraph_mode", mode="before")
     @classmethod
     def validate_cudagraph_mode_before(cls, value: Any) -> Any:
-        """
-        enable parse the `cudagraph_mode` enum type from string
-        """
+        """Enable parsing of the `cudagraph_mode` enum type from string."""
         if isinstance(value, str):
             return CUDAGraphMode[value.upper()]
         return value
 
+    @field_validator("pass_config", mode="before")
+    @classmethod
+    def validate_pass_config_before(cls, value: Any) -> Any:
+        """Enable parsing of the `pass_config` field from a dictionary."""
+        if isinstance(value, dict):
+            return PassConfig(**value)
+        return value
+
     @field_validator("compile_cache_save_format")
     @classmethod
     def validate_compile_cache_save_format(cls, value: str) -> str:
@@ -666,9 +649,6 @@ def __post_init__(self) -> None:
                 func if isinstance(func, InductorPass) else CallableInductorPass(func)
             )
 
-        if isinstance(self.pass_config, dict):
-            self.pass_config = PassConfig(**self.pass_config)
-
         if self.pass_config.enable_qk_norm_rope_fusion:
             # TODO(zhuhaoran): support rope native forward match and remove this.
             # Linked issue: https://github.com/vllm-project/vllm/issues/28042
@@ -684,36 +664,6 @@ def __post_init__(self) -> None:
             self.inductor_compile_config["combo_kernels"] = True
             self.inductor_compile_config["benchmark_combo_kernel"] = True
 
-        # migrate the deprecated flags
-        if not self.use_cudagraph:
-            logger.warning(
-                "use_cudagraph is deprecated, use cudagraph_mode=NONE instead."
-            )
-            if (
-                self.cudagraph_mode is not None
-                and self.cudagraph_mode != CUDAGraphMode.NONE
-            ):
-                raise ValueError(
-                    "use_cudagraph and cudagraph_mode are mutually"
-                    " exclusive, prefer cudagraph_mode since "
-                    "use_cudagraph is deprecated."
-                )
-            self.cudagraph_mode = CUDAGraphMode.NONE
-        if self.full_cuda_graph:
-            logger.warning(
-                "full_cuda_graph is deprecated, use cudagraph_mode=FULL instead."
-            )
-            if (
-                self.cudagraph_mode is not None
-                and not self.cudagraph_mode.has_full_cudagraphs()
-            ):
-                raise ValueError(
-                    "full_cuda_graph and cudagraph_mode are "
-                    "mutually exclusive, prefer cudagraph_mode "
-                    "since full_cuda_graph is deprecated."
-                )
-            self.cudagraph_mode = CUDAGraphMode.FULL
-
         if self.use_inductor_graph_partition and not is_torch_equal_or_newer(
             "2.9.0.dev"
         ):
@@ -891,20 +841,19 @@ def set_splitting_ops_for_inductor_graph_partition(self):
 
     def set_splitting_ops_for_attn_fusion(self):
         assert self.pass_config.enable_attn_fusion
-        # For dynamo-partition (non-inductor) attention fusion,
-        # set splitting_ops to empty to avoid splitting at attention ops
-        self.splitting_ops = []
-        if self.cudagraph_mode.has_piecewise_cudagraphs():
-            logger.warning_once(
-                "enable_attn_fusion is incompatible with piecewise "
-                "cudagraph when use_inductor_graph_partition is off. "
-                "In this case, splitting_ops will be set to empty "
-                "list, and cudagraph_mode will be set to FULL. "
-                "Please ensure you are using attention backends that "
-                "support cudagraph or set cudagraph_mode to NONE "
-                "explicitly if encountering any problems."
-            )
-            self.cudagraph_mode = CUDAGraphMode.FULL
+        if self.splitting_ops is None:
+            self.splitting_ops = []
+            if self.cudagraph_mode.has_piecewise_cudagraphs():
+                logger.warning_once(
+                    "enable_attn_fusion is incompatible with piecewise "
+                    "cudagraph when use_inductor_graph_partition is off. "
+                    "In this case, splitting_ops will be set to empty "
+                    "list, and cudagraph_mode will be set to FULL. "
+                    "Please ensure you are using attention backends that "
+                    "support cudagraph or set cudagraph_mode to NONE "
+                    "explicitly if encountering any problems."
+                )
+                self.cudagraph_mode = CUDAGraphMode.FULL
 
         assert not self.splitting_ops_contain_attention(), (
             "attention ops should not be in splitting_ops "
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 60458b26944a..f581267f73f7 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -656,14 +656,6 @@ def __post_init__(self):
                     f"cudagraph_mode={self.compilation_config.cudagraph_mode}"
                 )
 
-            # final migrate the deprecated flags
-            self.compilation_config.use_cudagraph = (
-                self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
-            )
-            self.compilation_config.full_cuda_graph = (
-                self.compilation_config.cudagraph_mode.has_full_cudagraphs()
-            )
-
         if self.parallel_config.enable_dbo:
             a2a_backend = self.parallel_config.all2all_backend
             assert a2a_backend in ["deepep_low_latency", "deepep_high_throughput"], (
@@ -853,7 +845,9 @@ def _set_cudagraph_sizes(self):
                 )
                 # de-duplicate the sizes provided by the config
                 dedup_sizes = list(set(self.compilation_config.cudagraph_capture_sizes))
-                cudagraph_capture_sizes = dedup_sizes
+                cudagraph_capture_sizes = [
+                    i for i in dedup_sizes if i <= max_num_tokens
+                ]
                 # sort to make sure the sizes are in ascending order
                 cudagraph_capture_sizes.sort()
             else:
diff --git a/vllm/v1/attention/backends/mamba1_attn.py b/vllm/v1/attention/backends/mamba1_attn.py
index 909af09be255..8e949e53330c 100644
--- a/vllm/v1/attention/backends/mamba1_attn.py
+++ b/vllm/v1/attention/backends/mamba1_attn.py
@@ -123,7 +123,7 @@ def build(
         elif (
             num_decodes > 0
             and num_decodes <= self.decode_cudagraph_max_bs
-            and self.compilation_config.full_cuda_graph
+            and self.compilation_config.cudagraph_mode.has_full_cudagraphs()
         ):
             padded_decodes = self.vllm_config.pad_for_cudagraph(num_decodes)
             self.state_indices_tensor[:num_decodes].copy_(
diff --git a/vllm/v1/attention/backends/mamba2_attn.py b/vllm/v1/attention/backends/mamba2_attn.py
index 4bc1057333a5..888734e5d2b6 100644
--- a/vllm/v1/attention/backends/mamba2_attn.py
+++ b/vllm/v1/attention/backends/mamba2_attn.py
@@ -302,7 +302,7 @@ def build(
 
         elif (
             num_decodes <= self.decode_cudagraph_max_bs
-            and self.compilation_config.full_cuda_graph
+            and self.compilation_config.cudagraph_mode.has_full_cudagraphs()
         ):
             # Pad state tensor for CUDA graph
             num_input_tokens = self.vllm_config.pad_for_cudagraph(num_decodes)
diff --git a/vllm/v1/attention/backends/short_conv_attn.py b/vllm/v1/attention/backends/short_conv_attn.py
index 22ad1054b35e..de0cb73db091 100644
--- a/vllm/v1/attention/backends/short_conv_attn.py
+++ b/vllm/v1/attention/backends/short_conv_attn.py
@@ -81,7 +81,7 @@ def build(
         elif (
             num_decodes > 0
             and num_decodes <= self.decode_cudagraph_max_bs
-            and self.compilation_config.full_cuda_graph
+            and self.compilation_config.cudagraph_mode.has_full_cudagraphs()
         ):
             num_input_tokens = self.vllm_config.pad_for_cudagraph(num_decodes)
             self.state_indices_tensor[:num_decodes].copy_(

From 304419576ae9dc2ecaa28c4506d3870f7c68bd85 Mon Sep 17 00:00:00 2001
From: Benjamin Chislett <bchislett@nvidia.com>
Date: Wed, 12 Nov 2025 11:56:40 -0500
Subject: [PATCH 109/183] [Perf] Refactor cudagraph_support to enable full CUDA
 graphs for spec decoding with FlashInfer (#28479)

Signed-off-by: Benjamin Chislett <bchislett@nvidia.com>
---
 docs/design/cuda_graphs.md                    |  3 +-
 .../layers/chunked_local_attention.py         |  2 +-
 vllm/v1/attention/backends/flash_attn.py      |  2 +-
 vllm/v1/attention/backends/flashinfer.py      | 38 +++++++++++--------
 vllm/v1/attention/backends/gdn_attn.py        |  2 +-
 vllm/v1/attention/backends/mamba_attn.py      |  2 +-
 vllm/v1/attention/backends/mla/cutlass_mla.py |  2 +-
 .../attention/backends/mla/flashattn_mla.py   |  2 +-
 .../attention/backends/mla/flashinfer_mla.py  |  2 +-
 vllm/v1/attention/backends/mla/flashmla.py    |  2 +-
 .../attention/backends/mla/flashmla_sparse.py |  2 +-
 vllm/v1/attention/backends/mla/indexer.py     |  2 +-
 .../attention/backends/mla/rocm_aiter_mla.py  |  2 +-
 vllm/v1/attention/backends/rocm_aiter_fa.py   |  2 +-
 vllm/v1/attention/backends/rocm_attn.py       |  2 +-
 vllm/v1/attention/backends/triton_attn.py     |  2 +-
 vllm/v1/attention/backends/utils.py           | 12 +++++-
 vllm/v1/worker/gpu_model_runner.py            | 31 ++++++++++-----
 18 files changed, 71 insertions(+), 41 deletions(-)

diff --git a/docs/design/cuda_graphs.md b/docs/design/cuda_graphs.md
index 177a581587d0..aac7b76eea26 100644
--- a/docs/design/cuda_graphs.md
+++ b/docs/design/cuda_graphs.md
@@ -177,8 +177,9 @@ The following table lists backends that support full CUDA Graphs at the time of
 | FlashAttention v3 | `ALWAYS` | has unified routine for both batches, so `FULL` mode is good |
 | Triton Attention | `ALWAYS` | prefer `FULL_AND_PIECEWISE` since it has different kernels for prefill/mixed and pure decode batches |
 | AITER FlashAttention | `UNIFORM_BATCH`| |
-| FlashInfer | `UNIFORM_SINGLE_TOKEN_DECODE` | |
+| FlashInfer | `UNIFORM_SINGLE_TOKEN_DECODE` | Will be set to `UNIFORM_BATCH` when using TRTLLM attention on Blackwell |
 | FlashMLA | `UNIFORM_BATCH` | |
+| FlashInferMLA | `UNIFORM_BATCH` | |
 | AITER MLA | `UNIFORM_SINGLE_TOKEN_DECODE` | |
 | CUTLASS MLA | `UNIFORM_SINGLE_TOKEN_DECODE` | |
 | Mamba attention| `UNIFORM_SINGLE_TOKEN_DECODE` | |
diff --git a/vllm/attention/layers/chunked_local_attention.py b/vllm/attention/layers/chunked_local_attention.py
index 5532ce80d7f1..f144e8435b6c 100644
--- a/vllm/attention/layers/chunked_local_attention.py
+++ b/vllm/attention/layers/chunked_local_attention.py
@@ -32,7 +32,7 @@ def create_chunked_local_attention_backend(
     underlying_builder = underlying_attn_backend.get_builder_cls()
 
     class ChunkedLocalAttentionBuilder(underlying_builder):  # type: ignore
-        cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.NEVER
+        _cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.NEVER
 
         def build(
             self,
diff --git a/vllm/v1/attention/backends/flash_attn.py b/vllm/v1/attention/backends/flash_attn.py
index 9cec623814c9..d9bd52d8f980 100755
--- a/vllm/v1/attention/backends/flash_attn.py
+++ b/vllm/v1/attention/backends/flash_attn.py
@@ -207,7 +207,7 @@ class FlashAttentionMetadataBuilder(AttentionMetadataBuilder[FlashAttentionMetad
     # to FULL_AND_PIECEWISE.
     # TODO(luka, lucas): audit FA2 as part of:
     #  https://github.com/vllm-project/vllm/issues/22945
-    cudagraph_support = (
+    _cudagraph_support = (
         AttentionCGSupport.ALWAYS
         if get_flash_attn_version() == 3
         else AttentionCGSupport.UNIFORM_BATCH
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 18bbc3cc3c12..1ce8e6f3d89f 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -15,6 +15,7 @@
 from flashinfer.decode import _get_range_buf, trtllm_batch_decode_with_kv_cache
 from flashinfer.prefill import trtllm_batch_context_with_kv_cache
 from flashinfer.utils import FP4Tensor
+from typing_extensions import override
 
 from vllm import envs
 from vllm.attention.backends.abstract import (
@@ -274,10 +275,6 @@ class FlashInferMetadata:
 
 
 class FlashInferMetadataBuilder(AttentionMetadataBuilder[FlashInferMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = (
-        AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
-    )
-
     reorder_batch_threshold: int = 1
 
     def __init__(
@@ -355,6 +352,9 @@ def __init__(
         else:
             self.q_data_type = self.model_config.dtype
 
+        # Prefer TRTLLM attention for decoding in all cases.
+        # This allows us to use AttentionCGSupport.UNIFORM_BATCH mode.
+        self.use_trtllm_decode_attention = can_use_trtllm
         self._init_reorder_batch_threshold(1, supports_spec_as_decode=can_use_trtllm)
 
         self._cascade_wrapper = None  # Wrapper for cascade attention
@@ -412,6 +412,24 @@ def __init__(
                 "passing --block-size 32 or --block-size 64."
             )
 
+    @classmethod
+    @override
+    def get_cudagraph_support(
+        cls: type["FlashInferMetadataBuilder"],
+        vllm_config: VllmConfig,
+        kv_cache_spec: AttentionSpec,
+    ) -> AttentionCGSupport:
+        has_trtllm_support = can_use_trtllm_attention(
+            num_qo_heads=vllm_config.model_config.get_num_attention_heads(
+                vllm_config.parallel_config
+            ),
+            num_kv_heads=kv_cache_spec.num_kv_heads,
+        )
+        if has_trtllm_support:
+            return AttentionCGSupport.UNIFORM_BATCH
+        else:
+            return AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
+
     def _get_workspace_buffer(self):
         if self._workspace_buffer is None:
             buffer_size = envs.VLLM_FLASHINFER_WORKSPACE_BUFFER_SIZE
@@ -573,17 +591,7 @@ def build(
             has_sinks=self.has_sinks,
             has_spec=uses_spec_reorder,
         )
-        decode_use_trtllm = use_trtllm_attention(
-            self.num_qo_heads,
-            self.num_kv_heads,
-            num_decode_tokens,
-            max_seq_len,
-            self.cache_dtype,
-            self.q_data_type,
-            is_prefill=False,
-            has_sinks=self.has_sinks,
-            has_spec=uses_spec_reorder,
-        )
+        decode_use_trtllm = self.use_trtllm_decode_attention
 
         if not (prefill_use_trtllm and decode_use_trtllm):
             if self.has_sinks:
diff --git a/vllm/v1/attention/backends/gdn_attn.py b/vllm/v1/attention/backends/gdn_attn.py
index 2ca19646911e..69b5a6fb4856 100644
--- a/vllm/v1/attention/backends/gdn_attn.py
+++ b/vllm/v1/attention/backends/gdn_attn.py
@@ -59,7 +59,7 @@ class GDNAttentionMetadata:
 
 
 class GDNAttentionMetadataBuilder(AttentionMetadataBuilder[GDNAttentionMetadata]):
-    cudagraph_support = AttentionCGSupport.UNIFORM_BATCH
+    _cudagraph_support = AttentionCGSupport.UNIFORM_BATCH
 
     reorder_batch_threshold: int = 1
 
diff --git a/vllm/v1/attention/backends/mamba_attn.py b/vllm/v1/attention/backends/mamba_attn.py
index 49d7d6c31b9a..0d875565fc99 100644
--- a/vllm/v1/attention/backends/mamba_attn.py
+++ b/vllm/v1/attention/backends/mamba_attn.py
@@ -20,7 +20,7 @@
 
 class BaseMambaAttentionMetadataBuilder(AttentionMetadataBuilder[M], abc.ABC):
     reorder_batch_threshold: int = 1
-    cudagraph_support: ClassVar[AttentionCGSupport] = (
+    _cudagraph_support: ClassVar[AttentionCGSupport] = (
         AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
     )
 
diff --git a/vllm/v1/attention/backends/mla/cutlass_mla.py b/vllm/v1/attention/backends/mla/cutlass_mla.py
index 0a10ce74cd1d..60cb5022a55e 100644
--- a/vllm/v1/attention/backends/mla/cutlass_mla.py
+++ b/vllm/v1/attention/backends/mla/cutlass_mla.py
@@ -29,7 +29,7 @@
 
 class CutlassMLAMetadataBuilder(MLACommonMetadataBuilder[MLACommonMetadata]):
     # enable full CUDA Graph support for decode-only capture
-    cudagraph_support: ClassVar[AttentionCGSupport] = (
+    _cudagraph_support: ClassVar[AttentionCGSupport] = (
         AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
     )
 
diff --git a/vllm/v1/attention/backends/mla/flashattn_mla.py b/vllm/v1/attention/backends/mla/flashattn_mla.py
index 5662acbe32c2..7794e89cc0a9 100644
--- a/vllm/v1/attention/backends/mla/flashattn_mla.py
+++ b/vllm/v1/attention/backends/mla/flashattn_mla.py
@@ -92,7 +92,7 @@ class FlashAttnMLAMetadata(MLACommonMetadata[FlashAttnMLADecodeMetadata]):
 
 
 class FlashAttnMLAMetadataBuilder(MLACommonMetadataBuilder[FlashAttnMLAMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
+    _cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
     query_len_support: ClassVar[QueryLenSupport] = QueryLenSupport.VARLEN
     reorder_batch_threshold: int = 512  # process small prefills with decode pathway
 
diff --git a/vllm/v1/attention/backends/mla/flashinfer_mla.py b/vllm/v1/attention/backends/mla/flashinfer_mla.py
index b0f514ba4451..52bb19e039e4 100644
--- a/vllm/v1/attention/backends/mla/flashinfer_mla.py
+++ b/vllm/v1/attention/backends/mla/flashinfer_mla.py
@@ -29,7 +29,7 @@
 
 
 class FlashInferMLAMetadataBuilder(MLACommonMetadataBuilder[MLACommonMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
+    _cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
     query_len_support: ClassVar[QueryLenSupport] = QueryLenSupport.UNIFORM
 
 
diff --git a/vllm/v1/attention/backends/mla/flashmla.py b/vllm/v1/attention/backends/mla/flashmla.py
index 8f0364cd58de..3aab1f9bb7fb 100644
--- a/vllm/v1/attention/backends/mla/flashmla.py
+++ b/vllm/v1/attention/backends/mla/flashmla.py
@@ -96,7 +96,7 @@ class FlashMLAMetadata(MLACommonMetadata[FlashMLADecodeMetadata]):
 
 
 class FlashMLAMetadataBuilder(MLACommonMetadataBuilder[FlashMLAMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
+    _cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
     query_len_support: ClassVar[QueryLenSupport] = QueryLenSupport.UNIFORM
     reorder_batch_threshold: int = 128  # process small prefills with decode pathway
     # ^ TODO(matt): tune this
diff --git a/vllm/v1/attention/backends/mla/flashmla_sparse.py b/vllm/v1/attention/backends/mla/flashmla_sparse.py
index 4794312eb96e..5fe9c69d3500 100644
--- a/vllm/v1/attention/backends/mla/flashmla_sparse.py
+++ b/vllm/v1/attention/backends/mla/flashmla_sparse.py
@@ -248,7 +248,7 @@ def triton_convert_req_index_to_global_index(
 
 @dataclass
 class FlashMLASparseMetadataBuilder(AttentionMetadataBuilder[FlashMLASparseMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
+    _cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
 
     def __init__(
         self,
diff --git a/vllm/v1/attention/backends/mla/indexer.py b/vllm/v1/attention/backends/mla/indexer.py
index 4f071145625f..37aa5dad89a0 100644
--- a/vllm/v1/attention/backends/mla/indexer.py
+++ b/vllm/v1/attention/backends/mla/indexer.py
@@ -206,7 +206,7 @@ def split_prefill_chunks(
 
 
 class DeepseekV32IndexerMetadataBuilder(AttentionMetadataBuilder):
-    cudagraph_support: ClassVar[AttentionCGSupport] = (
+    _cudagraph_support: ClassVar[AttentionCGSupport] = (
         AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
     )
 
diff --git a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
index 5757aeadba05..e1864526f02c 100644
--- a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
+++ b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
@@ -55,7 +55,7 @@ class AiterMLAMetadata(MLACommonMetadata[AiterMLADecodeMetadata]):
 class AiterMLAMetadataBuilder(MLACommonMetadataBuilder[AiterMLAMetadata]):
     # TODO(luka, lucas): audit this as part of:
     #  https://github.com/vllm-project/vllm/issues/22945
-    cudagraph_support: ClassVar[AttentionCGSupport] = (
+    _cudagraph_support: ClassVar[AttentionCGSupport] = (
         AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
     )
 
diff --git a/vllm/v1/attention/backends/rocm_aiter_fa.py b/vllm/v1/attention/backends/rocm_aiter_fa.py
index 81991244f5d9..4888ae51d1d3 100644
--- a/vllm/v1/attention/backends/rocm_aiter_fa.py
+++ b/vllm/v1/attention/backends/rocm_aiter_fa.py
@@ -251,7 +251,7 @@ class AiterFlashAttentionMetadata:
 class AiterFlashAttentionMetadataBuilder(
     AttentionMetadataBuilder[AiterFlashAttentionMetadata]
 ):
-    cudagraph_support = AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
+    _cudagraph_support = AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
     reorder_batch_threshold: int = 1
 
     def __init__(
diff --git a/vllm/v1/attention/backends/rocm_attn.py b/vllm/v1/attention/backends/rocm_attn.py
index 1d2c70f65d0f..6dfdfc19ccba 100644
--- a/vllm/v1/attention/backends/rocm_attn.py
+++ b/vllm/v1/attention/backends/rocm_attn.py
@@ -63,7 +63,7 @@ class RocmAttentionMetadata:
 
 
 class RocmAttentionMetadataBuilder(AttentionMetadataBuilder[RocmAttentionMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.ALWAYS
+    _cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.ALWAYS
 
     def __init__(
         self,
diff --git a/vllm/v1/attention/backends/triton_attn.py b/vllm/v1/attention/backends/triton_attn.py
index 37c0ae61e65d..889c79db18ef 100644
--- a/vllm/v1/attention/backends/triton_attn.py
+++ b/vllm/v1/attention/backends/triton_attn.py
@@ -67,7 +67,7 @@ class TritonAttentionMetadata:
 
 
 class TritonAttentionMetadataBuilder(AttentionMetadataBuilder[TritonAttentionMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.ALWAYS
+    _cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.ALWAYS
 
     def __init__(
         self,
diff --git a/vllm/v1/attention/backends/utils.py b/vllm/v1/attention/backends/utils.py
index 751c5c15a4c9..fd37a665cf05 100644
--- a/vllm/v1/attention/backends/utils.py
+++ b/vllm/v1/attention/backends/utils.py
@@ -244,7 +244,8 @@ class AttentionCGSupport(enum.Enum):
 
 class AttentionMetadataBuilder(abc.ABC, Generic[M]):
     # Does this backend/builder support CUDA Graphs for attention (default: no).
-    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.NEVER
+    # Do not access directly. Call get_cudagraph_support() instead.
+    _cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.NEVER
     # Does this backend/builder reorder the batch?
     # If not, set this to None. Otherwise set it to the query
     # length that will be pulled into the front of the batch.
@@ -263,6 +264,15 @@ def __init__(
         self.vllm_config = vllm_config
         self.device = device
 
+    @classmethod
+    def get_cudagraph_support(
+        cls: type["AttentionMetadataBuilder"],
+        vllm_config: VllmConfig,
+        kv_cache_spec: AttentionSpec,
+    ) -> AttentionCGSupport:
+        """Get the cudagraph support level of this builder class."""
+        return cls._cudagraph_support
+
     def _init_reorder_batch_threshold(
         self,
         reorder_batch_threshold: int | None = 1,
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index b14b6b1c3f52..987d451fd6ba 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -4167,14 +4167,16 @@ def create_attn_groups(
             return attn_groups
 
         attention_backend_maps = []
-        attention_backend_set: set[type[AttentionBackend]] = set()
+        attention_backend_list = []
         for kv_cache_group_spec in kv_cache_config.kv_cache_groups:
             attn_backends = get_attn_backends_for_group(kv_cache_group_spec)
             attention_backend_maps.append(attn_backends[0])
-            attention_backend_set.update(attn_backends[1])
+            attention_backend_list.append(attn_backends[1])
 
         # Resolve cudagraph_mode before actually initialize metadata_builders
-        self._check_and_update_cudagraph_mode(attention_backend_set)
+        self._check_and_update_cudagraph_mode(
+            attention_backend_list, kv_cache_config.kv_cache_groups
+        )
 
         for i, attn_backend_map in enumerate(attention_backend_maps):
             self.attn_groups.append(create_attn_groups(attn_backend_map, i))
@@ -4203,22 +4205,31 @@ def initialize_metadata_builders(
         self.calculate_reorder_batch_threshold()
 
     def _check_and_update_cudagraph_mode(
-        self, attention_backends: set[type[AttentionBackend]]
+        self,
+        attention_backends: list[set[type[AttentionBackend]]],
+        kv_cache_groups: list[KVCacheGroupSpec],
     ) -> None:
         """
         Resolve the cudagraph_mode when there are multiple attention
-        backends with potential conflicting CUDA graph support.
+        groups with potential conflicting CUDA graph support.
         Then initialize the cudagraph_dispatcher based on the resolved
         cudagraph_mode.
         """
         min_cg_support = AttentionCGSupport.ALWAYS
         min_cg_backend_name = None
 
-        for attn_backend in attention_backends:
-            builder_cls = attn_backend.get_builder_cls()
-            if builder_cls.cudagraph_support.value < min_cg_support.value:
-                min_cg_support = builder_cls.cudagraph_support
-                min_cg_backend_name = attn_backend.__name__
+        for attn_backend_set, kv_cache_group in zip(
+            attention_backends, kv_cache_groups
+        ):
+            for attn_backend in attn_backend_set:
+                builder_cls = attn_backend.get_builder_cls()
+
+                cg_support = builder_cls.get_cudagraph_support(
+                    self.vllm_config, kv_cache_group.kv_cache_spec
+                )
+                if cg_support.value < min_cg_support.value:
+                    min_cg_support = cg_support
+                    min_cg_backend_name = attn_backend.__name__
         # Flexible resolve the cudagraph mode
         cudagraph_mode = self.compilation_config.cudagraph_mode
         # check cudagraph for mixed batch is supported

From bac904565f170ba198c2398a0f627b38f9cb8e18 Mon Sep 17 00:00:00 2001
From: alberto <aperdomo@redhat.com>
Date: Wed, 12 Nov 2025 17:51:39 +0000
Subject: [PATCH 110/183] Implement ARC KV cache eviction policy for CPU
 offloader (#27039)

Signed-off-by: Alberto Perdomo <aperdomo@redhat.com>
Signed-off-by: alberto <aperdomo@redhat.com>
Co-authored-by: Or Ozeri <or@ozery.com>
---
 tests/v1/kv_offload/test_cpu_manager.py | 308 ++++++++++++++++++++++++
 vllm/v1/kv_offload/arc_manager.py       | 237 ++++++++++++++++++
 vllm/v1/kv_offload/cpu.py               |  25 +-
 3 files changed, 565 insertions(+), 5 deletions(-)
 create mode 100644 vllm/v1/kv_offload/arc_manager.py

diff --git a/tests/v1/kv_offload/test_cpu_manager.py b/tests/v1/kv_offload/test_cpu_manager.py
index 4f90ca022cef..839cd9b6dc55 100644
--- a/tests/v1/kv_offload/test_cpu_manager.py
+++ b/tests/v1/kv_offload/test_cpu_manager.py
@@ -11,6 +11,7 @@
     OffloadingEvent,
     PrepareStoreOutput,
 )
+from vllm.v1.kv_offload.arc_manager import ARCOffloadingManager
 from vllm.v1.kv_offload.backends.cpu import CPUBackend
 from vllm.v1.kv_offload.lru_manager import LRUOffloadingManager
 from vllm.v1.kv_offload.mediums import CPULoadStoreSpec
@@ -187,3 +188,310 @@ def test_cpu_manager():
         expected_stores=({3, 4, 5}, {6, 7, 8}),
         expected_evictions=({2, 3, 4}, {8}),
     )
+
+
+def test_arc_manager_basic():
+    """
+    Tests ARCOffloadingManager basic operations with a CPUBackend.
+    Verifies that ARC handles store, load, and lookup operations correctly.
+    """
+    # initialize a CPU backend with a capacity of 4 blocks
+    block_size = 256
+    cpu_backend = CPUBackend(block_size=block_size, num_blocks=4)
+    arc_manager = ARCOffloadingManager(cpu_backend, enable_events=True)
+
+    # prepare store [1, 2]
+    prepare_store_output = arc_manager.prepare_store(to_hashes([1, 2]))
+    verify_store_output(
+        prepare_store_output,
+        ExpectedPrepareStoreOutput(
+            block_hashes_to_store=[1, 2],
+            store_block_ids=[0, 1],
+            block_hashes_evicted=[],
+        ),
+    )
+
+    # lookup [1, 2] -> not ready
+    assert arc_manager.lookup(to_hashes([1, 2])) == 0
+
+    # no events so far
+    assert list(arc_manager.take_events()) == []
+
+    # complete store [1, 2]
+    arc_manager.complete_store(to_hashes([1, 2]))
+    verify_events(
+        arc_manager.take_events(), block_size=block_size, expected_stores=({1, 2},)
+    )
+
+    # lookup [1, 2]
+    assert arc_manager.lookup(to_hashes([1])) == 1
+    assert arc_manager.lookup(to_hashes([1, 2])) == 2
+    assert arc_manager.lookup(to_hashes([1, 2, 3])) == 2
+
+    # blocks should be in T1 (recent)
+    assert len(arc_manager.t1) == 2
+    assert len(arc_manager.t2) == 0
+
+
+def test_arc_manager_t1_to_t2_promotion():
+    """
+    Tests that accessing a block in T1 promotes it to T2 (frequent).
+    This is a key feature of ARC's adaptive behavior.
+    """
+    block_size = 256
+    cpu_backend = CPUBackend(block_size=block_size, num_blocks=4)
+    arc_manager = ARCOffloadingManager(cpu_backend, enable_events=False)
+
+    # store and complete block 1
+    arc_manager.prepare_store(to_hashes([1]))
+    arc_manager.complete_store(to_hashes([1]))
+
+    # block 1 starts in T1 (recent)
+    assert to_hashes([1])[0] in arc_manager.t1
+    assert to_hashes([1])[0] not in arc_manager.t2
+
+    # touch block 1 (simulate second access)
+    arc_manager.touch(to_hashes([1]))
+
+    # block 1 should now be in T2 (frequent)
+    assert to_hashes([1])[0] not in arc_manager.t1
+    assert to_hashes([1])[0] in arc_manager.t2
+
+
+def test_arc_manager_eviction_with_load():
+    """
+    Tests ARC eviction behavior similar to LRU test.
+    Verifies that blocks being loaded (ref_cnt > 0) cannot be evicted.
+    """
+    block_size = 256
+    cpu_backend = CPUBackend(block_size=block_size, num_blocks=4)
+    arc_manager = ARCOffloadingManager(cpu_backend, enable_events=True)
+
+    # prepare and complete store [1, 2, 3, 4]
+    prepare_store_output = arc_manager.prepare_store(to_hashes([1, 2, 3, 4]))
+    verify_store_output(
+        prepare_store_output,
+        ExpectedPrepareStoreOutput(
+            block_hashes_to_store=[1, 2, 3, 4],
+            store_block_ids=[0, 1, 2, 3],
+            block_hashes_evicted=[],
+        ),
+    )
+    arc_manager.complete_store(to_hashes([1, 2, 3, 4]))
+
+    # prepare load [2, 3] (increases ref_cnt)
+    prepare_load_output = arc_manager.prepare_load(to_hashes([2, 3]))
+    verify_load_output(prepare_load_output, [1, 2])
+
+    # prepare store [5, 6, 7] with [2, 3] being loaded
+    # should fail because [2, 3] have ref_cnt > 0
+    assert arc_manager.prepare_store(to_hashes([5, 6, 7])) is None
+
+    # complete load [2, 3]
+    arc_manager.complete_load(to_hashes([2, 3]))
+
+    # now prepare store [5, 6, 7] should succeed
+    # ARC will evict blocks one at a time from T1 as needed
+    prepare_store_output = arc_manager.prepare_store(to_hashes([5, 6, 7]))
+    assert prepare_store_output is not None
+    # Should successfully evict enough blocks to make room (at least 1)
+    assert len(prepare_store_output.block_hashes_evicted) >= 1
+
+
+def test_arc_manager_adaptive_target():
+    """
+    Tests ARC's adaptive target adjustment via ghost lists.
+    When a block in B1 (ghost list) is accessed, target_t1_size increases.
+    When a block in B2 is accessed, target_t1_size decreases.
+    """
+    block_size = 256
+    cpu_backend = CPUBackend(block_size=block_size, num_blocks=2)
+    arc_manager = ARCOffloadingManager(cpu_backend, enable_events=False)
+
+    # store blocks 1, 2 (fills cache)
+    arc_manager.prepare_store(to_hashes([1, 2]))
+    arc_manager.complete_store(to_hashes([1, 2]))
+
+    initial_target = arc_manager.target_t1_size
+
+    # store block 3, evicting block 1 (moves to B1 ghost list)
+    arc_manager.prepare_store(to_hashes([3]))
+    arc_manager.complete_store(to_hashes([3]))
+
+    # block 1 should be in B1 (ghost list)
+    assert to_hashes([1])[0] in arc_manager.b1
+
+    # touch block 1 (cache miss, but in B1)
+    # this should increase target_t1_size (favor recency)
+    arc_manager.touch(to_hashes([1]))
+
+    # target should have increased
+    assert arc_manager.target_t1_size > initial_target
+
+
+def test_arc_manager_t1_t2_eviction_policy():
+    """
+    Tests that ARC evicts from T1 or T2 based on target_t1_size.
+    If |T1| >= target_t1_size, evict from T1, otherwise from T2.
+    """
+    block_size = 256
+    cpu_backend = CPUBackend(block_size=block_size, num_blocks=4)
+    arc_manager = ARCOffloadingManager(cpu_backend, enable_events=False)
+
+    # store blocks 1, 2, 3, 4
+    arc_manager.prepare_store(to_hashes([1, 2, 3, 4]))
+    arc_manager.complete_store(to_hashes([1, 2, 3, 4]))
+
+    # promote blocks 3, 4 to T2 by touching them
+    arc_manager.touch(to_hashes([3, 4]))
+
+    # now: T1 = {1, 2}, T2 = {3, 4}
+    assert len(arc_manager.t1) == 2
+    assert len(arc_manager.t2) == 2
+
+    # set target_t1_size to prefer evicting from T1
+    # (when |T1| >= target, evict from T1)
+    arc_manager.target_t1_size = 1
+
+    # store block 5, should evict from T1 (block 1, LRU in T1)
+    output = arc_manager.prepare_store(to_hashes([5]))
+    assert output is not None
+    assert to_hashes([1]) == output.block_hashes_evicted
+
+    arc_manager.complete_store(to_hashes([5]))
+
+    # block 1 should be in B1 (ghost list)
+    assert to_hashes([1])[0] in arc_manager.b1
+    # block 5 should be in T1
+    assert to_hashes([5])[0] in arc_manager.t1
+
+
+def test_arc_manager_ghost_list_bounds():
+    """
+    Tests that ghost lists (B1, B2) don't grow unbounded.
+    They should be capped at cache_capacity.
+    """
+    block_size = 256
+    cpu_backend = CPUBackend(block_size=block_size, num_blocks=2)
+    arc_manager = ARCOffloadingManager(cpu_backend, enable_events=False)
+
+    # fill cache with blocks 1, 2
+    arc_manager.prepare_store(to_hashes([1, 2]))
+    arc_manager.complete_store(to_hashes([1, 2]))
+
+    # store many blocks to fill ghost lists
+    for i in range(3, 20):
+        arc_manager.prepare_store(to_hashes([i]))
+        arc_manager.complete_store(to_hashes([i]))
+
+    # ghost lists should not exceed cache_capacity
+    assert len(arc_manager.b1) <= arc_manager.cache_capacity
+    assert len(arc_manager.b2) <= arc_manager.cache_capacity
+
+
+def test_arc_manager_touch_ordering():
+    """
+    Tests that touch() correctly updates access patterns.
+    Similar to LRU test but verifies T1/T2 ordering.
+    """
+    block_size = 256
+    cpu_backend = CPUBackend(block_size=block_size, num_blocks=4)
+    arc_manager = ARCOffloadingManager(cpu_backend, enable_events=True)
+
+    # store blocks 1, 2, 3, 4
+    arc_manager.prepare_store(to_hashes([1, 2, 3, 4]))
+    arc_manager.complete_store(to_hashes([1, 2, 3, 4]))
+
+    # promote 3, 4 to T2
+    arc_manager.touch(to_hashes([3, 4]))
+
+    # T1 = {1, 2}, T2 = {3, 4}
+    # touch [1, 3, 4] - should promote 1 to T2, and move 3,4 to end of T2
+    arc_manager.touch(to_hashes([1, 3, 4]))
+
+    # T1 = {2}, T2 = {1, 3, 4} (in that order, with 4 most recent)
+    assert len(arc_manager.t1) == 1
+    assert len(arc_manager.t2) == 3
+
+    # store block 5, should evict from T1 (block 2, only one in T1)
+    prepare_store_output = arc_manager.prepare_store(to_hashes([5]))
+    verify_store_output(
+        prepare_store_output,
+        ExpectedPrepareStoreOutput(
+            block_hashes_to_store=[5],
+            store_block_ids=[1],  # reuses block 2's storage
+            block_hashes_evicted=[2],
+        ),
+    )
+
+
+def test_arc_manager_failed_store():
+    """
+    Tests that failed store operations clean up correctly.
+    Similar to LRU test but for ARC.
+    """
+    block_size = 256
+    cpu_backend = CPUBackend(block_size=block_size, num_blocks=4)
+    arc_manager = ARCOffloadingManager(cpu_backend, enable_events=True)
+
+    # store blocks 1, 2, 3, 4
+    arc_manager.prepare_store(to_hashes([1, 2, 3, 4]))
+    arc_manager.complete_store(to_hashes([1, 2, 3, 4]))
+
+    # prepare store block 5 (will evict block 1)
+    prepare_store_output = arc_manager.prepare_store(to_hashes([5]))
+    assert prepare_store_output is not None
+    assert len(prepare_store_output.block_hashes_evicted) == 1
+
+    # complete store with failure
+    arc_manager.complete_store(to_hashes([5]), success=False)
+
+    # block 5 should not be in cache
+    assert arc_manager.lookup(to_hashes([5])) == 0
+    # block 5 should not be in T1 or T2
+    assert to_hashes([5])[0] not in arc_manager.t1
+    assert to_hashes([5])[0] not in arc_manager.t2
+
+    # evicted block should still be gone (in B1 ghost list)
+    evicted_hash = prepare_store_output.block_hashes_evicted[0]
+    assert evicted_hash in arc_manager.b1
+
+
+def test_arc_manager_full_scenario():
+    """
+    Comprehensive test covering multiple ARC operations in sequence.
+    Similar to the full LRU test but adapted for ARC behavior.
+    """
+    block_size = 256
+    cpu_backend = CPUBackend(block_size=block_size, num_blocks=4)
+    arc_manager = ARCOffloadingManager(cpu_backend, enable_events=True)
+
+    # store [1, 2]
+    arc_manager.prepare_store(to_hashes([1, 2]))
+    arc_manager.complete_store(to_hashes([1, 2]))
+
+    # store [3, 4, 5] -> evicts [1]
+    prepare_store_output = arc_manager.prepare_store(to_hashes([3, 4, 5]))
+    assert prepare_store_output is not None
+    assert len(prepare_store_output.block_hashes_evicted) == 1
+    arc_manager.complete_store(to_hashes([3, 4, 5]))
+
+    # promote some blocks to T2
+    arc_manager.touch(to_hashes([2, 3]))
+
+    # T1 has {4, 5}, T2 has {2, 3}
+    assert len(arc_manager.t1) == 2
+    assert len(arc_manager.t2) == 2
+
+    # store [6] -> should evict from T1 (4 is oldest in T1)
+    prepare_store_output = arc_manager.prepare_store(to_hashes([6]))
+    assert prepare_store_output is not None
+    arc_manager.complete_store(to_hashes([6]))
+
+    # verify blocks 2, 3 (in T2) are still present
+    assert arc_manager.lookup(to_hashes([2])) == 1
+    assert arc_manager.lookup(to_hashes([3])) == 1
+
+    # verify events
+    events = list(arc_manager.take_events())
+    assert len(events) > 0  # should have store and eviction events
diff --git a/vllm/v1/kv_offload/arc_manager.py b/vllm/v1/kv_offload/arc_manager.py
new file mode 100644
index 000000000000..45b166d6797f
--- /dev/null
+++ b/vllm/v1/kv_offload/arc_manager.py
@@ -0,0 +1,237 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from collections import OrderedDict
+from collections.abc import Iterable
+
+from vllm.v1.core.kv_cache_utils import BlockHash
+from vllm.v1.kv_offload.abstract import (
+    LoadStoreSpec,
+    OffloadingEvent,
+    OffloadingManager,
+    PrepareStoreOutput,
+)
+from vllm.v1.kv_offload.backend import Backend, BlockStatus
+
+
+class ARCOffloadingManager(OffloadingManager):
+    """
+    An OffloadingManager implementing the ARC (Adaptive Replacement Cache)
+    eviction policy with a pluggable backend.
+
+    Data Structures:
+        T1: Recent cache containing blocks accessed once.
+        T2: Frequent cache containing blocks accessed multiple times.
+        B1/B2: Ghost lists tracking recently evicted blocks from T1/T2.
+        target_t1_size: Adaptive target size for the T1 partition.
+
+    Algorithm Flow:
+        1. Cache lookup (lookup):
+           Searches T1 and T2 for block hashes and counts consecutive hits
+           until a miss or non-ready block is encountered.
+
+        2. Cache touch (touch) - Adaptive Learning:
+           For each block_hash (in reverse order):
+           - If in T1: Move to T2 (promotion from recent to frequent).
+           - If in T2: Move to MRU position (end of queue).
+           - If in B1 ghost list: Increase target_t1_size.
+           - If in B2 ghost list: Decrease target_t1_size.
+
+        3. Block eviction (prepare_store) - Adaptive Replacement:
+           Determines eviction source based on adaptive target:
+           - If T1 size > target_t1_size: Evict from T1, add to B1.
+           - Otherwise: Evict from T2, add to B2.
+           Finally, bound each ghost list size.
+
+        4. Block insertion (prepare_store):
+           New blocks are always inserted into T1 and removed from B1/B2 if
+           present. Blocks may later be promoted to T2 during touch operations.
+
+    Adaptive Behavior:
+        The algorithm self-tunes the recency vs. frequency trade-off:
+        - B1 hit: Recent access patterns matter more → increase T1.
+        - B2 hit: Frequent access patterns matter more → decrease T1.
+    """
+
+    def __init__(self, backend: Backend, enable_events: bool = False):
+        self.backend: Backend = backend
+        self.target_t1_size: float = 0.0
+        self.t1: OrderedDict[BlockHash, BlockStatus] = OrderedDict()
+        self.t2: OrderedDict[BlockHash, BlockStatus] = OrderedDict()
+        # block_hash -> None (only care about presence)
+        self.b1: OrderedDict[BlockHash, None] = OrderedDict()
+        self.b2: OrderedDict[BlockHash, None] = OrderedDict()
+        self.events: list[OffloadingEvent] | None = [] if enable_events else None
+        self.cache_capacity: int = self.backend.get_num_free_blocks()
+
+    def lookup(self, block_hashes: Iterable[BlockHash]) -> int:
+        hit_count = 0
+        for block_hash in block_hashes:
+            block = self.t1.get(block_hash) or self.t2.get(block_hash)
+            if block is None or not block.is_ready:
+                break
+            hit_count += 1
+        return hit_count
+
+    def prepare_load(self, block_hashes: Iterable[BlockHash]) -> LoadStoreSpec:
+        blocks = []
+        for block_hash in block_hashes:
+            block = self.t1.get(block_hash) or self.t2.get(block_hash)
+            assert block is not None, f"Block {block_hash!r} not found in cache"
+            assert block.is_ready, f"Block {block_hash!r} is not ready for reading"
+
+            block.ref_cnt += 1
+            blocks.append(block)
+
+        return self.backend.get_load_store_spec(block_hashes, blocks)
+
+    def touch(self, block_hashes: Iterable[BlockHash]):
+        for block_hash in reversed(list(block_hashes)):
+            if block_hash in self.t1:
+                block = self.t1.pop(block_hash)
+                if not block.is_ready:
+                    # block was just prepared to be stored, not really touched twice
+                    self.t1.move_to_end(block_hash)
+                else:
+                    self.t2[block_hash] = block
+
+            elif block_hash in self.t2:
+                self.t2.move_to_end(block_hash)
+
+            elif block_hash in self.b1:
+                delta = max(1, len(self.b2) / len(self.b1))
+                self.target_t1_size = min(
+                    self.target_t1_size + delta, self.cache_capacity
+                )
+                # move to MRU position (end) to keep it fresh in the ghost list
+                self.b1.move_to_end(block_hash)
+
+            elif block_hash in self.b2:
+                delta = max(1, len(self.b1) / len(self.b2))
+                self.target_t1_size = max(self.target_t1_size - delta, 0)
+                # move to MRU position (end) to keep it fresh in the ghost list
+                self.b2.move_to_end(block_hash)
+
+    def complete_load(self, block_hashes: Iterable[BlockHash]):
+        for block_hash in block_hashes:
+            block = self.t1.get(block_hash) or self.t2.get(block_hash)
+            assert block is not None, f"Block {block_hash!r} not found"
+            assert block.ref_cnt > 0, f"Block {block_hash!r} ref_cnt is already 0"
+
+            block.ref_cnt -= 1
+
+    def prepare_store(
+        self, block_hashes: Iterable[BlockHash]
+    ) -> PrepareStoreOutput | None:
+        block_hashes_to_store = []
+        for block_hash in block_hashes:
+            if block_hash not in self.t1 and block_hash not in self.t2:
+                block_hashes_to_store.append(block_hash)
+
+        if not block_hashes_to_store:
+            return PrepareStoreOutput(
+                block_hashes_to_store=[],
+                store_spec=self.backend.get_load_store_spec([], []),
+                block_hashes_evicted=[],
+            )
+
+        num_blocks_to_evict = (
+            len(block_hashes_to_store) - self.backend.get_num_free_blocks()
+        )
+
+        to_evict = []
+        while num_blocks_to_evict > 0:
+            block_to_evict = None
+            if len(self.t1) >= int(self.target_t1_size):
+                # try to evict the least recently used (oldest) block from T1
+                for block_hash, block in self.t1.items():
+                    if block.ref_cnt == 0:
+                        block_to_evict = (block_hash, block)
+                        eviction_t = self.t1
+                        eviction_b = self.b1
+                        break
+            if not block_to_evict:
+                # try to evict the least recently used (oldest) block from T2
+                for block_hash, block in self.t2.items():
+                    if block.ref_cnt == 0:
+                        block_to_evict = (block_hash, block)
+                        eviction_t = self.t2
+                        eviction_b = self.b2
+                        break
+                else:
+                    # cannot evict enough blocks, cache is full of in-use items
+                    return None
+
+            block_hash, block = block_to_evict
+            del eviction_t[block_hash]
+            eviction_b[block_hash] = None
+            to_evict.append(block_hash)
+            self.backend.free(block)
+            num_blocks_to_evict -= 1
+
+        for b in [self.b1, self.b2]:
+            for i in range(len(b) - self.cache_capacity):
+                b.popitem(last=False)
+
+        if to_evict and self.events is not None:
+            self.events.append(
+                OffloadingEvent(
+                    block_hashes=to_evict,
+                    block_size=self.backend.block_size,
+                    medium=self.backend.medium,
+                    removed=True,
+                )
+            )
+
+        blocks = self.backend.allocate_blocks(block_hashes_to_store)
+        assert len(blocks) == len(block_hashes_to_store), (
+            "Backend did not allocate the expected number of blocks"
+        )
+
+        for block_hash, block in zip(block_hashes_to_store, blocks):
+            self.t1[block_hash] = block
+
+            self.b1.pop(block_hash, None)
+            self.b2.pop(block_hash, None)
+
+        store_spec = self.backend.get_load_store_spec(block_hashes_to_store, blocks)
+
+        return PrepareStoreOutput(
+            block_hashes_to_store=block_hashes_to_store,
+            store_spec=store_spec,
+            block_hashes_evicted=to_evict,
+        )
+
+    def complete_store(self, block_hashes: Iterable[BlockHash], success: bool = True):
+        stored_block_hashes: list[BlockHash] = []
+
+        if success:
+            for block_hash in block_hashes:
+                block = self.t1.get(block_hash) or self.t2.get(block_hash)
+
+                if block is not None and not block.is_ready:
+                    block.ref_cnt = 0
+                    stored_block_hashes.append(block_hash)
+        else:
+            for block_hash in block_hashes:
+                block = self.t1.pop(block_hash, None)
+
+                if block is None:
+                    block = self.t2.pop(block_hash, None)
+
+                if block is not None and not block.is_ready:
+                    self.backend.free(block)
+
+        if stored_block_hashes and self.events is not None:
+            self.events.append(
+                OffloadingEvent(
+                    block_hashes=stored_block_hashes,
+                    block_size=self.backend.block_size,
+                    medium=self.backend.medium,
+                    removed=False,
+                )
+            )
+
+    def take_events(self) -> Iterable[OffloadingEvent]:
+        if self.events is not None:
+            yield from self.events
+            self.events.clear()
diff --git a/vllm/v1/kv_offload/cpu.py b/vllm/v1/kv_offload/cpu.py
index f765d19ea017..4b1bbe6f0cc2 100644
--- a/vllm/v1/kv_offload/cpu.py
+++ b/vllm/v1/kv_offload/cpu.py
@@ -8,6 +8,7 @@
 from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
 from vllm.platforms import current_platform
 from vllm.v1.kv_offload.abstract import LoadStoreSpec, OffloadingManager
+from vllm.v1.kv_offload.arc_manager import ARCOffloadingManager
 from vllm.v1.kv_offload.backends.cpu import CPUBackend
 from vllm.v1.kv_offload.lru_manager import LRUOffloadingManager
 from vllm.v1.kv_offload.mediums import CPULoadStoreSpec, GPULoadStoreSpec
@@ -33,18 +34,32 @@ def __init__(self, vllm_config: VllmConfig):
         # worker-side
         self._handler: OffloadingHandler | None = None
 
+        self.eviction_policy: str = self.extra_config.get("eviction_policy", "lru")
+
     def get_manager(self) -> OffloadingManager:
         if not self._manager:
             kv_events_config = self.vllm_config.kv_events_config
             enable_events = (
                 kv_events_config is not None and kv_events_config.enable_kv_cache_events
             )
-            self._manager = LRUOffloadingManager(
-                CPUBackend(
-                    block_size=self.offloaded_block_size, num_blocks=self.num_cpu_blocks
-                ),
-                enable_events=enable_events,
+
+            backend = CPUBackend(
+                block_size=self.offloaded_block_size, num_blocks=self.num_cpu_blocks
             )
+
+            if self.eviction_policy == "lru":
+                self._manager = LRUOffloadingManager(
+                    backend=backend, enable_events=enable_events
+                )
+            elif self.eviction_policy == "arc":
+                self._manager = ARCOffloadingManager(
+                    backend=backend, enable_events=enable_events
+                )
+            else:
+                raise ValueError(
+                    f"Unknown eviction policy: {self.eviction_policy}. "
+                    f"Supported policies: lru, arc"
+                )
         return self._manager
 
     def get_handlers(

From a1e7fa362a514589d4042f2287bde2a0653eb959 Mon Sep 17 00:00:00 2001
From: PerryZhang01 <Perry.Zhang@amd.com>
Date: Thu, 13 Nov 2025 02:16:35 +0800
Subject: [PATCH 111/183] [EPLB][ROCm]: support EPBL for ROCm backend (#27731)

Signed-off-by: Perry Zhang <perzhang@amd.com>
Co-authored-by: Perry Zhang <perzhang@amd.com>
---
 vllm/config/parallel.py                          |  4 ++--
 vllm/model_executor/layers/fused_moe/layer.py    |  6 +++++-
 .../quantization/compressed_tensors/__init__.py  |  3 +++
 .../compressed_tensors/compressed_tensors_moe.py | 16 +++++++++++++---
 4 files changed, 23 insertions(+), 6 deletions(-)

diff --git a/vllm/config/parallel.py b/vllm/config/parallel.py
index b19c8beeae3d..61bcd15e06a8 100644
--- a/vllm/config/parallel.py
+++ b/vllm/config/parallel.py
@@ -278,10 +278,10 @@ def _validate_parallel_config(self) -> Self:
             )
 
         if self.enable_eplb:
-            if not current_platform.is_cuda():
+            if not current_platform.is_cuda_alike():
                 raise ValueError(
                     "Expert parallelism load balancing is only supported on "
-                    "CUDA devices now."
+                    "CUDA devices or ROCm devices now."
                 )
             if not self.enable_expert_parallel:
                 raise ValueError("enable_expert_parallel must be True to use EPLB.")
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index 615da58eeda2..3bd7c54c520c 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -1218,7 +1218,11 @@ def load_weights(
 
     def get_expert_weights(self) -> Iterable[torch.Tensor]:
         weights = list(self.named_parameters())
-        assert all(weight.is_contiguous() for _, weight in weights)
+        assert all(
+            weight.is_contiguous()
+            for name, weight in weights
+            if not name.startswith("_shared_experts.")
+        )
 
         # Filter out the non-expert weights.
         # `e_score_correction_bias` is a bias for each logical expert,
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/__init__.py b/vllm/model_executor/layers/quantization/compressed_tensors/__init__.py
index e69de29bb2d1..6655f8913623 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/__init__.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/__init__.py
@@ -0,0 +1,3 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
index f1050c15f79e..bda94cee9e42 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
@@ -1019,9 +1019,10 @@ def apply(
         logical_replica_count: torch.Tensor | None = None,
     ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
         if enable_eplb:
-            raise NotImplementedError(
-                "EPLB not supported for `CompressedTensorsW8A8Fp8MoEMethod` yet."
-            )
+            assert expert_load_view is not None
+            assert logical_to_physical_map is not None
+            assert logical_replica_count is not None
+            assert isinstance(layer, FusedMoE)
 
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
             hidden_states=x,
@@ -1037,6 +1038,11 @@ def apply(
             e_score_correction_bias=e_score_correction_bias,
             indices_type=self.topk_indices_dtype,
             num_fused_shared_experts=layer.num_fused_shared_experts,
+            enable_eplb=enable_eplb,
+            expert_map=expert_map,
+            expert_load_view=expert_load_view,
+            logical_to_physical_map=logical_to_physical_map,
+            logical_replica_count=logical_replica_count,
         )
 
         per_act_token = self.input_quant.strategy == QuantizationStrategy.TOKEN
@@ -1145,6 +1151,10 @@ def apply(
                 quant_config=self.moe_quant_config,
             )
 
+    @property
+    def supports_eplb(self) -> bool:
+        return True
+
 
 class CompressedTensorsW8A8Int8MoEMethod(CompressedTensorsMoEMethod):
     def __init__(

From 64d57c3be7443137a6a117cf7f3fb9bd625a749f Mon Sep 17 00:00:00 2001
From: Thomas Parnell <tpa@zurich.ibm.com>
Date: Wed, 12 Nov 2025 19:17:55 +0100
Subject: [PATCH 112/183] [Model] [Config] Correctly identify granite-4.0-micro
 as non-hybrid model (#28563)

Signed-off-by: Thomas Parnell <tpa@zurich.ibm.com>
---
 vllm/config/model.py | 7 +++++++
 1 file changed, 7 insertions(+)

diff --git a/vllm/config/model.py b/vllm/config/model.py
index 6ce91ebb87b9..49b66039d4a0 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -1619,6 +1619,13 @@ def is_attention_free(self) -> bool:
 
     @property
     def is_hybrid(self) -> bool:
+        # Handle granite-4.0-micro case which uses hybrid config but does not
+        # actually contain any non-attention layers.
+        layer_types = getattr(self.hf_config, "layer_types", None)
+        if layer_types is not None and all(
+            layer == "attention" for layer in layer_types
+        ):
+            return False
         return self._model_info.is_hybrid
 
     @property

From 319abd5ee9c50b25a7929ba1e3e6588d44fc9d6d Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Wed, 12 Nov 2025 18:25:16 +0000
Subject: [PATCH 113/183] Remove dynamic shape

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 tests/compile/test_compile_ranges.py     |  41 ++++++---
 vllm/compilation/backends.py             | 107 +++++++----------------
 vllm/compilation/collective_fusion.py    |  10 +--
 vllm/compilation/compiler_interface.py   |  36 ++++----
 vllm/compilation/inductor_pass.py        |   8 +-
 vllm/compilation/pass_manager.py         |   7 +-
 vllm/compilation/piecewise_backend.py    |   2 +-
 vllm/compilation/sequence_parallelism.py |   8 +-
 vllm/config/compilation.py               |  10 +--
 vllm/config/utils.py                     |   6 +-
 vllm/config/vllm.py                      |   3 +-
 11 files changed, 105 insertions(+), 133 deletions(-)

diff --git a/tests/compile/test_compile_ranges.py b/tests/compile/test_compile_ranges.py
index bacaa48ae477..b15f90395c6a 100644
--- a/tests/compile/test_compile_ranges.py
+++ b/tests/compile/test_compile_ranges.py
@@ -42,9 +42,9 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 @torch.inference_mode
 def run_model(vllm_config: VllmConfig, model: nn.Module, batch_sizes: list[int]):
     with set_forward_context({}, vllm_config=vllm_config):
-        model(torch.randn(BATCH_SIZE, MLP_SIZE).cuda())
+        model(torch.randn(BATCH_SIZE, MLP_SIZE))
         for batch_size in batch_sizes:
-            model(torch.randn(batch_size, MLP_SIZE).cuda())
+            model(torch.randn(batch_size, MLP_SIZE))
 
 
 class PostGradPassManagerCheckRanges(InductorPass):
@@ -70,11 +70,14 @@ def uuid(self) -> str:
 def test_compile_ranges():
     post_grad_pass_manager = PostGradPassManagerCheckRanges(
         [
-            Range(start=1, end=8),
-            Range(start=8, end=32),
-            Range(start=32, end=8193),
+            Range(start=1, end=9),
+            Range(start=16, end=16),
+            Range(start=9, end=33),
+            Range(start=64, end=64),
+            Range(start=33, end=8193),
         ]
     )
+    torch.set_default_device("cuda")
     vllm_config = VllmConfig(
         scheduler_config=SchedulerConfig(
             max_num_batched_tokens=8192,
@@ -82,6 +85,7 @@ def test_compile_ranges():
         compilation_config=CompilationConfig(
             mode=CompilationMode.VLLM_COMPILE,
             compile_ranges_split_points=[8, 32],
+            compile_sizes=[16, 64, 128],
             inductor_compile_config={
                 "post_grad_custom_post_pass": post_grad_pass_manager,
                 # Disable inductor cache to get the number of passes correctly
@@ -91,14 +95,31 @@ def test_compile_ranges():
     )
 
     with set_current_vllm_config(vllm_config):
-        model = TestModel(vllm_config=vllm_config, prefix="").eval().cuda()
-        batch_sizes = [1, 4, 16, 24, 48, 64]
+        model = TestModel(vllm_config=vllm_config, prefix="").eval()
+        # Number of compilations: 3 for each compile range + 2 compile sizes
+        batch_sizes = [1, 4, 16, 24, 48, 64, 8192]
         # A has support_torch_compile
         with compilation_counter.expect(
             num_graphs_seen=1,
             num_piecewise_graphs_seen=1,
-            num_backend_compilations=3,
-            # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+            num_backend_compilations=5,
         ):
             run_model(vllm_config, model, batch_sizes)
-        assert post_grad_pass_manager.num_calls == 3
+        assert post_grad_pass_manager.num_calls == 5
+
+
+def test_compile_config_get_compile_ranges():
+    compilation_config = CompilationConfig(
+        compile_ranges_split_points=[8, 32],
+    )
+    VllmConfig(
+        scheduler_config=SchedulerConfig(
+            max_num_batched_tokens=8192,
+        ),
+        compilation_config=compilation_config,
+    )
+    assert compilation_config.get_compile_ranges() == [
+        Range(start=1, end=9),
+        Range(start=9, end=33),
+        Range(start=33, end=8193),
+    ]
diff --git a/vllm/compilation/backends.py b/vllm/compilation/backends.py
index efd68a71c7e4..b1fe58d08265 100644
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -84,7 +84,7 @@ class CompilerManager:
     """
 
     def __init__(self, compilation_config: CompilationConfig):
-        self.cache: dict[tuple[Range | None, int, str], Any] = dict()
+        self.cache: dict[tuple[Range, int, str], Any] = dict()
         self.is_cache_updated = False
         self.compilation_config = compilation_config
         self.compiler = make_compiler(compilation_config)
@@ -93,7 +93,7 @@ def compute_hash(self, vllm_config: VllmConfig) -> str:
         return self.compiler.compute_hash(vllm_config)
 
     @contextmanager
-    def compile_context(self, compile_range: Range | None = None):
+    def compile_context(self, compile_range: Range):
         """Provide compilation context for the duration of compilation to set
         any torch global properties we want to scope to a single Inductor
         compilation (e.g. partition rules, pass context)."""
@@ -153,7 +153,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: Range | None = None,
+        compile_range: Range,
     ) -> Callable | None:
         if (compile_range, graph_index, self.compiler.name) not in self.cache:
             return None
@@ -161,23 +161,13 @@ def load(
         compiled_graph = self.compiler.load(
             handle, graph, example_inputs, graph_index, compile_range
         )
-        if compile_range is None:
-            logger.debug(
-                "Directly load the %s-th graph for dynamic compile range"
-                "from %s via handle %s",
-                graph_index,
-                self.compiler.name,
-                handle,
-            )
-        else:
-            logger.debug(
-                "Directly load the %s-th graph for compile range %s"
-                "from %s via handle %s",
-                graph_index,
-                str(compile_range),
-                self.compiler.name,
-                handle,
-            )
+        logger.debug(
+            "Directly load the %s-th graph for compile range %sfrom %s via handle %s",
+            graph_index,
+            str(compile_range),
+            self.compiler.name,
+            handle,
+        )
         return compiled_graph
 
     def compile(
@@ -186,9 +176,9 @@ def compile(
         example_inputs,
         additional_inductor_config,
         compilation_config: CompilationConfig,
+        compile_range: Range,
         graph_index: int = 0,
         num_graphs: int = 1,
-        compile_range: Range | None = None,
     ) -> Any:
         if graph_index == 0:
             # before compiling the first graph, record the start time
@@ -208,19 +198,12 @@ def compile(
                 now = time.time()
                 elapsed = now - compilation_start_time
                 compilation_config.compilation_time += elapsed
-                if compile_range is None:
-                    logger.info(
-                        "Directly load the compiled graph(s) for dynamic shape "
-                        "from the cache, took %.3f s",
-                        elapsed,
-                    )
-                else:
-                    logger.info(
-                        "Directly load the compiled graph(s) for compile range %s "
-                        "from the cache, took %.3f s",
-                        str(compile_range),
-                        elapsed,
-                    )
+                logger.info(
+                    "Directly load the compiled graph(s) for compile range %s "
+                    "from the cache, took %.3f s",
+                    str(compile_range),
+                    elapsed,
+                )
             return compiled_graph
 
         # no compiler cached the graph, or the cache is disabled,
@@ -230,10 +213,7 @@ def compile(
             maybe_key = None
         else:
             maybe_key = "artifact_compile_range_"
-            if compile_range is None:
-                maybe_key += "dynamic_shape"
-            else:
-                maybe_key += f"{compile_range.start}_{compile_range.end}"
+            maybe_key += f"{compile_range.start}_{compile_range.end}"
             maybe_key += f"_subgraph_{graph_index}"
         with self.compile_context(compile_range):
             compiled_graph, handle = self.compiler.compile(
@@ -253,50 +233,29 @@ def compile(
             self.is_cache_updated = True
             if graph_index == 0:
                 # adds some info logging for the first graph
-                if compile_range is None:
-                    logger.info_once(
-                        "Cache the graph for dynamic shape for later use", scope="local"
-                    )
-                else:
-                    logger.info_once(
-                        "Cache the graph of compile range %s for later use",
-                        str(compile_range),
-                    )
-            if compile_range is None:
-                logger.debug(
-                    "Store the %s-th graph for dynamic compile range"
-                    "from %s via handle %s",
-                    graph_index,
-                    self.compiler.name,
-                    handle,
-                )
-            else:
-                logger.debug(
-                    "Store the %s-th graph for compile range%s from %s via handle %s",
-                    graph_index,
+                logger.info_once(
+                    "Cache the graph of compile range %s for later use",
                     str(compile_range),
-                    self.compiler.name,
-                    handle,
                 )
+            logger.debug(
+                "Store the %s-th graph for compile range%s from %s via handle %s",
+                graph_index,
+                str(compile_range),
+                self.compiler.name,
+                handle,
+            )
 
         # after compiling the last graph, record the end time
         if graph_index == num_graphs - 1:
             now = time.time()
             elapsed = now - compilation_start_time
             compilation_config.compilation_time += elapsed
-            if compile_range is None:
-                logger.info_once(
-                    "Compiling a graph for dynamic compile range takes %.2f s",
-                    elapsed,
-                    scope="local",
-                )
-            else:
-                logger.info_once(
-                    "Compiling a graph for compile range %s takes %.2f s",
-                    str(compile_range),
-                    elapsed,
-                    scope="local",
-                )
+            logger.info_once(
+                "Compiling a graph for compile range %s takes %.2f s",
+                str(compile_range),
+                elapsed,
+                scope="local",
+            )
 
         return compiled_graph
 
diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index 32d1f1531f4c..bef8925661cd 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -432,7 +432,7 @@ def __init__(self, config: VllmConfig):
 
         self.dump_patterns(config, self.patterns)
 
-    def is_applicable_for_range(self, compile_range: Range | None) -> bool:
+    def is_applicable_for_range(self, compile_range: Range) -> bool:
         # This pass is applied on top of the sequence parallelism pass.
         # It inherits the same applicability condition as `SequenceParallelismPass`.
         # See `SequenceParallelismPass.is_applicable` for more details.
@@ -442,9 +442,7 @@ def is_applicable_for_range(self, compile_range: Range | None) -> bool:
         ):
             return True
         tp_size = get_tensor_model_parallel_world_size()
-        return compile_range is not None and (
-            compile_range.is_single_size() and compile_range.end % tp_size == 0
-        )
+        return compile_range.is_single_size() and compile_range.end % tp_size == 0
 
     @VllmInductorPass.time_and_log
     def __call__(self, graph: fx.Graph):
@@ -1189,9 +1187,7 @@ def register_patterns(self):
 
         self.disabled = False
 
-    def is_applicable_for_range(self, compile_range: Range | None) -> bool:
-        if compile_range is None:
-            return False
+    def is_applicable_for_range(self, compile_range: Range) -> bool:
         return compile_range.end - 1 <= self.max_token_num
 
     @VllmInductorPass.time_and_log
diff --git a/vllm/compilation/compiler_interface.py b/vllm/compilation/compiler_interface.py
index b95067aba191..3bafba2e1642 100644
--- a/vllm/compilation/compiler_interface.py
+++ b/vllm/compilation/compiler_interface.py
@@ -64,16 +64,15 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: Range | None = None,
+        compile_range: Range,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         """
         Compile the graph with the given example inputs and compiler config,
-        with a range. If the `compile_range` is None, it means
-        the `example_inputs` have a dynamic shape. Otherwise, the
-        `compile_range` specifies the range of the inputs,
-        it could be concrete size, e.g. (4, 4).
-        Right now we only support one variable range of shapes for all inputs,
+        with a range. The `compile_range` specifies the range of the inputs,
+        it could be concrete size (if compile_sizes is provided), e.g. [4, 4)
+        or a range [4, 5).
+        Right now we only support one variable in ranges for all inputs,
          which is the batchsize (number of tokens) during inference.
 
         Dynamo will make sure `graph(*example_inputs)` is valid.
@@ -100,7 +99,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: Range | None = None,
+        compile_range: Range,
     ) -> Callable:
         """
         Load the compiled function from the handle.
@@ -214,7 +213,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: Range | None = None,
+        compile_range: Range,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_inductor_compiles += 1
@@ -224,13 +223,10 @@ def compile(
         set_inductor_config(current_config, compile_range)
         set_functorch_config()
 
-        if compile_range is not None:
-            if compile_range.is_single_size():
-                dynamic_shapes = "from_example_inputs"
-            else:
-                dynamic_shapes = "from_graph"
+        if compile_range.is_single_size():
+            dynamic_shapes = "from_example_inputs"
         else:
-            dynamic_shapes = "from_tracing_context"
+            dynamic_shapes = "from_graph"
 
         from torch._inductor import standalone_compile
 
@@ -255,7 +251,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: Range | None = None,
+        compile_range: Range,
     ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
@@ -319,7 +315,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: Range | None = None,
+        compile_range: Range,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_inductor_compiles += 1
@@ -516,7 +512,7 @@ def load(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         graph_index: int,
-        compile_range: Range | None = None,
+        compile_range: Range,
     ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
@@ -612,8 +608,8 @@ def metrics_context(self) -> contextlib.AbstractContextManager:
             return contextlib.nullcontext()
 
 
-def set_inductor_config(config, compile_range):
-    if compile_range is not None and compile_range.is_single_size():
+def set_inductor_config(config, compile_range: Range):
+    if compile_range.is_single_size():
         # for a specific batch size, tuning triton kernel parameters
         # can be beneficial
         config["max_autotune"] = envs.VLLM_ENABLE_INDUCTOR_MAX_AUTOTUNE
@@ -634,7 +630,7 @@ def compile(
         graph: fx.GraphModule,
         example_inputs: list[Any],
         compiler_config: dict[str, Any],
-        compile_range: Range | None = None,
+        compile_range: Range,
         key: str | None = None,
     ) -> tuple[Callable | None, Any | None]:
         compilation_counter.num_eager_compiles += 1
diff --git a/vllm/compilation/inductor_pass.py b/vllm/compilation/inductor_pass.py
index 008eba4629a3..8159b817f637 100644
--- a/vllm/compilation/inductor_pass.py
+++ b/vllm/compilation/inductor_pass.py
@@ -29,8 +29,8 @@
 
 
 class PassContext:
-    def __init__(self, compile_range: Range | None):
-        self.compile_range: Range | None = compile_range
+    def __init__(self, compile_range: Range):
+        self.compile_range: Range = compile_range
 
 
 def get_pass_context() -> PassContext:
@@ -40,7 +40,7 @@ def get_pass_context() -> PassContext:
 
 
 @contextmanager
-def pass_context(compile_range: Range | None):
+def pass_context(compile_range: Range):
     """A context manager that stores the current pass context,
     usually it is a list of sizes to specialize.
     """
@@ -97,7 +97,7 @@ def hash_dict(dict_: dict[Any, Any]):
         encoded = json.dumps(dict_, sort_keys=True).encode("utf-8")
         return hashlib.sha256(encoded).hexdigest()
 
-    def is_applicable_for_range(self, compile_range: Range | None):
+    def is_applicable_for_range(self, compile_range: Range):
         return True
 
 
diff --git a/vllm/compilation/pass_manager.py b/vllm/compilation/pass_manager.py
index 820fa9b007e3..399c998d87f8 100644
--- a/vllm/compilation/pass_manager.py
+++ b/vllm/compilation/pass_manager.py
@@ -128,9 +128,8 @@ def uuid(self):
             state["passes"].append(pass_.uuid())
         state["passes"].append(self.fix_functionalization.uuid())
         compile_range = get_pass_context().compile_range
-        if compile_range is not None:
-            # Include the compile range in the uuid to ensure that inductor
-            # recompiles the graph for the new dynamic compile range.
-            state["compile_range"] = str(compile_range)
+        # Include the compile range in the uuid to ensure that inductor
+        # recompiles the graph for the new dynamic compile range.
+        state["compile_range"] = str(compile_range)
 
         return InductorPass.hash_dict(state)
diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index 8f34aa818a80..b59cc50f70bc 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -133,9 +133,9 @@ def _maybe_compile_for_range_entry(self, range_entry: RangeEntry, args) -> Any:
                 args,
                 self.compilation_config.inductor_compile_config,
                 self.compilation_config,
+                compile_range=range_entry.compile_range,
                 graph_index=self.piecewise_compile_index,
                 num_graphs=self.total_piecewise_compiles,
-                compile_range=range_entry.compile_range,
             )
 
             # finished compilations for all required shapes
diff --git a/vllm/compilation/sequence_parallelism.py b/vllm/compilation/sequence_parallelism.py
index 6a5ee5a0efb7..84484756e7ef 100644
--- a/vllm/compilation/sequence_parallelism.py
+++ b/vllm/compilation/sequence_parallelism.py
@@ -483,7 +483,7 @@ def __init__(self, config: VllmConfig):
             ).register(self.patterns)
         self.dump_patterns(config, self.patterns)
 
-    def is_applicable_for_range(self, compile_range: Range | None) -> bool:
+    def is_applicable_for_range(self, compile_range: Range) -> bool:
         # When sequence parallelism is enabled, the residual tensor from RMSNorm
         # needs to be split along the sequence dimension. However, this dimension
         # is symbolic during piecewise compilation, and splitting symbolic shapes
@@ -503,11 +503,7 @@ def is_applicable_for_range(self, compile_range: Range | None) -> bool:
         ):
             return True
         tp_size = get_tensor_model_parallel_world_size()
-        return (
-            compile_range is not None
-            and (compile_range.is_single_size())
-            and (compile_range.end % tp_size == 0)
-        )
+        return (compile_range.is_single_size()) and (compile_range.end % tp_size == 0)
 
     @VllmInductorPass.time_and_log
     def __call__(self, graph: fx.Graph):
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 36bbd2b9abff..85118544117d 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -349,11 +349,11 @@ class CompilationConfig:
     compile_ranges_split_points: list[int] | None = None
     """Split points that represent compile ranges for inductor.
     The compile ranges are 
-    [1, split_points[0]), 
-    [split_points[0], split_points[1]), ..., 
-    [split_points[-1], max_num_batched_tokens + 1).
-    Compile sizes are also used single element ranges:
-    [compile_sizes[i], compile_sizes[i] + 1).
+    [1, split_points[0] + 1), 
+    [split_points[0] + 1, split_points[1] + 1), ..., 
+    [split_points[-1] + 1, max_num_batched_tokens + 1).
+    Compile sizes are also used single element ranges,
+    the range is represented as [compile_sizes[i], compile_sizes[i] + 1).
     """
 
     inductor_compile_config: dict = field(default_factory=dict)
diff --git a/vllm/config/utils.py b/vllm/config/utils.py
index ea97ddf125f7..20304696ffcc 100644
--- a/vllm/config/utils.py
+++ b/vllm/config/utils.py
@@ -206,7 +206,11 @@ def __hash__(self) -> int:
         return hash((self.start, self.end))
 
     def __str__(self) -> str:
-        return f"(start={self.start}, end={self.end})"
+        return (
+            f"[{self.start}, {self.end + 1})"
+            if self.is_single_size()
+            else f"[{self.start}, {self.end})"
+        )
 
     def __repr__(self) -> str:
         return self.__str__()
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 4557e59a5cf8..2d71bec7c517 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -965,12 +965,13 @@ def _set_compile_ranges(self):
             for x in compilation_config.compile_ranges_split_points:
                 assert isinstance(x, int)
                 assert x > 0, f"Invalid compile range split point: {x}"
+                # Split points need to be inclusive of the end so we add 1.
                 if (
                     max_num_batched_tokens is not None
                     and x < max_num_batched_tokens
                     and x > 1
                 ):
-                    computed_compile_ranges_split_points.append(x)
+                    computed_compile_ranges_split_points.append(x + 1)
         compilation_config.compile_ranges_split_points = sorted(
             computed_compile_ranges_split_points
         )  # type: ignore

From a39dd7bb06c3bea055057d5c272ca952e0e000bf Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Wed, 12 Nov 2025 19:38:13 +0000
Subject: [PATCH 114/183] [CI] Skip "Multi-Modal Models Test (Extended) 3" test
 that's broken in current Transformers (#28559)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
---
 tests/models/multimodal/generation/test_common.py | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/tests/models/multimodal/generation/test_common.py b/tests/models/multimodal/generation/test_common.py
index de74acf3b8a5..5504c417fda4 100644
--- a/tests/models/multimodal/generation/test_common.py
+++ b/tests/models/multimodal/generation/test_common.py
@@ -9,11 +9,13 @@
 from pathlib import PosixPath
 
 import pytest
+from packaging.version import Version
 from transformers import (
     AutoModel,
     AutoModelForImageTextToText,
     AutoModelForTextToWaveform,
 )
+from transformers import __version__ as TRANSFORMERS_VERSION
 
 from vllm.platforms import current_platform
 from vllm.utils.func_utils import identity
@@ -851,6 +853,12 @@
                 limit_mm_per_prompt={"image": 4},
             )
         ],
+        marks=[
+            pytest.mark.skipif(
+                Version(TRANSFORMERS_VERSION) == Version("4.57.1"),
+                reason="This model is broken in Transformers v4.57.1",
+            )
+        ],
     ),
     # regression test for https://github.com/vllm-project/vllm/issues/15122
     "qwen2_5_vl-windows-attention": VLMTestInfo(

From 94a9ebcf317b804a6a70d74de9f91804d314ff6a Mon Sep 17 00:00:00 2001
From: Yihua Cheng <yihua98@uchicago.edu>
Date: Wed, 12 Nov 2025 12:25:43 -0800
Subject: [PATCH 115/183] [KV connector][WIP] KV cache proxy based on LMCache
 multi-process mode (#27902)

Signed-off-by: ApostaC <yihua98@uchicago.edu>
---
 .../kv_transfer/kv_connector/factory.py       |   6 +
 .../v1/lmcache_integration/__init__.py        |  15 +-
 .../multi_process_adapter.py                  | 379 ++++++++
 .../kv_connector/v1/lmcache_mp_connector.py   | 867 ++++++++++++++++++
 4 files changed, 1265 insertions(+), 2 deletions(-)
 create mode 100644 vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/multi_process_adapter.py
 create mode 100644 vllm/distributed/kv_transfer/kv_connector/v1/lmcache_mp_connector.py

diff --git a/vllm/distributed/kv_transfer/kv_connector/factory.py b/vllm/distributed/kv_transfer/kv_connector/factory.py
index 494a4d3c33aa..df871dd7cbe4 100644
--- a/vllm/distributed/kv_transfer/kv_connector/factory.py
+++ b/vllm/distributed/kv_transfer/kv_connector/factory.py
@@ -161,6 +161,12 @@ def get_connector_class(
     "LMCacheConnectorV1",
 )
 
+KVConnectorFactory.register_connector(
+    "LMCacheMPConnector",
+    "vllm.distributed.kv_transfer.kv_connector.v1.lmcache_mp_connector",
+    "LMCacheMPConnector",
+)
+
 KVConnectorFactory.register_connector(
     "NixlConnector",
     "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector",
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/__init__.py b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/__init__.py
index 3c73a1c09e58..07e05cc8f893 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/__init__.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/__init__.py
@@ -2,6 +2,17 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 
-from . import vllm_v1_adapter
+from . import multi_process_adapter, vllm_v1_adapter
+from .multi_process_adapter import (
+    LMCacheMPSchedulerAdapter,
+    LMCacheMPWorkerAdapter,
+    LoadStoreOp,
+)
 
-__all__ = ["vllm_v1_adapter"]
+__all__ = [
+    "vllm_v1_adapter",
+    "multi_process_adapter",
+    "LMCacheMPSchedulerAdapter",
+    "LMCacheMPWorkerAdapter",
+    "LoadStoreOp",
+]
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/multi_process_adapter.py b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/multi_process_adapter.py
new file mode 100644
index 000000000000..ab2eeed9f6b8
--- /dev/null
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/multi_process_adapter.py
@@ -0,0 +1,379 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import os
+from collections.abc import Iterable
+from dataclasses import dataclass
+from itertools import islice
+from typing import Any
+
+import torch
+import zmq
+from lmcache.utils import _lmcache_nvtx_annotate, init_logger
+from lmcache.v1.multiprocess.custom_types import (
+    CudaIPCWrapper,
+    IPCCacheEngineKey,
+    KVCache,
+)
+from lmcache.v1.multiprocess.mq import MessageQueueClient, MessagingFuture
+from lmcache.v1.multiprocess.protocol import RequestType, get_response_class
+
+logger = init_logger(__name__)
+
+
+def wrap_kv_caches(kv_caches: dict[str, KVCache]) -> KVCache:
+    logger.info("KV caches keys are %s", list(kv_caches.keys()))
+    return [CudaIPCWrapper(tensor) for tensor in kv_caches.values()]
+
+
+def send_lmcache_request(
+    mq_client: MessageQueueClient,
+    request_type: RequestType,
+    payloads: list[Any],
+) -> MessagingFuture[Any]:
+    future = mq_client.submit_request(
+        request_type, payloads, get_response_class(request_type)
+    )
+    return future
+
+
+def get_lmcache_chunk_size(
+    mq_client: MessageQueueClient,
+) -> int:
+    future = send_lmcache_request(mq_client, RequestType.GET_CHUNK_SIZE, [])
+    chunk_size = future.result()
+    return chunk_size
+
+
+def striding_block_hashes(
+    block_hashes: list[bytes],
+    blocks_in_chunk,
+) -> Iterable[bytes]:
+    """Striding the block hashes to get the block hashes for each chunk.
+    For example, if blocks_in_chunk is 16, then we will get the block hashes
+    for the 16th, 32nd, 48th, ... blocks.
+    """
+    return islice(block_hashes, blocks_in_chunk - 1, None, blocks_in_chunk)
+
+
+@dataclass
+class LoadStoreOp:
+    block_hashes: list[bytes]
+    block_ids: list[int]
+
+    def __len__(self) -> int:
+        return len(self.block_hashes)
+
+    def __post_init__(self):
+        assert len(self.block_hashes) == len(self.block_ids), (
+            "The number of block hashes should be equal to the number of block ids "
+            f"But got {len(self.block_hashes)} and {len(self.block_ids)}"
+        )
+
+
+StoreResult = bool
+RetrieveResult = list[bool]
+LookupResult = list[bool]
+
+
+class LMCacheMPSchedulerAdapter:
+    def __init__(
+        self,
+        server_url: str,
+        context: zmq.Context,
+        model_name: str,
+        world_size: int,
+        kv_rank: int,
+        vllm_block_size: int,
+    ):
+        """
+        Args:
+            server_url: The server URL for the LMCache message queue
+            context: The ZMQ context
+
+            model_name: The model name used for LMCache keys
+            world_size: The world size used for LMCache keys
+            kv_rank: The kv rank used for LMCache keys
+            vllm_block_size: The block size used in vLLM
+        """
+        self.mq_client = MessageQueueClient(server_url, context)
+
+        # Request futures
+        self.lookup_futures: dict[str, MessagingFuture[LookupResult]] = {}
+
+        self.model_name = model_name
+        self.world_size = world_size
+        self.worker_id = kv_rank
+
+        # Read chunk size from lmcache
+        self.chunk_size = get_lmcache_chunk_size(self.mq_client)
+        assert self.chunk_size % vllm_block_size == 0, (
+            "LMCache chunk size should be a multiple of vLLM block size"
+        )
+        self.blocks_in_chunk = self.chunk_size // vllm_block_size
+
+    @_lmcache_nvtx_annotate
+    def maybe_submit_lookup_request(self, request_id: str, block_hashes: list[bytes]):
+        if request_id in self.lookup_futures:
+            # Skip if there is already a lookup request
+            return
+
+        s = striding_block_hashes(block_hashes, self.blocks_in_chunk)
+        keys = [self._create_key(block_hash) for block_hash in s]
+        future = send_lmcache_request(
+            self.mq_client,
+            RequestType.LOOKUP,
+            [keys, True],
+        )
+        self.lookup_futures[request_id] = future
+
+    @_lmcache_nvtx_annotate
+    def check_lookup_result(self, request_id: str) -> int | None:
+        assert request_id in self.lookup_futures, (
+            f"Lookup request for request_id={request_id} has not been submitted"
+        )
+
+        future = self.lookup_futures[request_id]
+        if not future.query():
+            return None
+
+        result = future.result()
+        num_chunks = sum(result)
+        return num_chunks * self.chunk_size
+
+    def num_blocks_per_chunk(self) -> int:
+        """
+        Returns:
+            The number of vllm blocks in a LMCache data chunk
+        """
+        return self.blocks_in_chunk
+
+    # Helper functions
+    def _create_key(self, block_hash: bytes) -> IPCCacheEngineKey:
+        """Convert a block hash to an IPC cache engine key"""
+        return IPCCacheEngineKey(
+            model_name=self.model_name,
+            world_size=self.world_size,
+            worker_id=self.worker_id,
+            chunk_hash=block_hash,
+        )
+
+
+class LMCacheMPWorkerAdapter:
+    def __init__(
+        self,
+        server_url: str,
+        context: zmq.Context,
+        model_name: str,
+        world_size: int,
+        kv_rank: int,
+        vllm_block_size: int,
+    ):
+        self.mq_client = MessageQueueClient(server_url, context)
+
+        # Instance id for GPU worker
+        self.instance_id = os.getpid()
+
+        # Registered kv caches from vLLM
+        self.kv_caches: dict[str, torch.Tensor] = {}
+
+        # Request futures
+        # request_id -> (future, other merged requests)
+        self.store_futures: dict[
+            str, tuple[MessagingFuture[StoreResult], list[str]]
+        ] = {}
+        self.retrieve_futures: dict[
+            str, tuple[MessagingFuture[RetrieveResult], list[str]]
+        ] = {}
+
+        self.finished_stores: set[str] = set()
+        self.previously_finished: set[str] = set()
+
+        self.model_name = model_name
+        self.world_size = world_size
+        self.worker_id = kv_rank
+
+        # Read chunk size from lmcache
+        chunk_size = get_lmcache_chunk_size(self.mq_client)
+        assert chunk_size % vllm_block_size == 0, (
+            "LMCache chunk size should be a multiple of vLLM block size"
+        )
+        self.blocks_in_chunk = chunk_size // vllm_block_size
+
+    def register_kv_caches(self, kv_caches: dict[str, KVCache]):
+        # Register kv cache and send the request
+        self.kv_caches = kv_caches
+        logger.info("Registering kv caches")
+        future = send_lmcache_request(
+            self.mq_client,
+            RequestType.REGISTER_KV_CACHE,
+            [self.instance_id, wrap_kv_caches(kv_caches)],
+        )
+        future.result()
+
+    @_lmcache_nvtx_annotate
+    def submit_store_request(
+        self, request_id: str, op: LoadStoreOp, event: torch.cuda.Event
+    ):
+        keys = self._block_hashes_to_keys(op.block_hashes)
+        future = send_lmcache_request(
+            self.mq_client,
+            RequestType.STORE,
+            [keys, self.instance_id, op.block_ids, event.ipc_handle()],
+        ).to_cuda_future()
+        self.store_futures[request_id] = (future, [])
+
+    @_lmcache_nvtx_annotate
+    def submit_retrieve_request(
+        self, request_id: str, op: LoadStoreOp, event: torch.cuda.Event
+    ):
+        keys = self._block_hashes_to_keys(op.block_hashes)
+        future = send_lmcache_request(
+            self.mq_client,
+            RequestType.RETRIEVE,
+            [keys, self.instance_id, op.block_ids, event.ipc_handle()],
+        ).to_cuda_future()
+        self.retrieve_futures[request_id] = (future, [])
+
+    @_lmcache_nvtx_annotate
+    def batched_submit_store_requests(
+        self,
+        request_ids: list[str],
+        ops: list[LoadStoreOp],
+        event: torch.cuda.Event,
+    ):
+        keys = []
+        block_ids = []
+        for op in ops:
+            keys.extend(self._block_hashes_to_keys(op.block_hashes))
+            block_ids.extend(op.block_ids)
+        future = send_lmcache_request(
+            self.mq_client,
+            RequestType.STORE,
+            [keys, self.instance_id, block_ids, event.ipc_handle()],
+        ).to_cuda_future()
+        self.store_futures[request_ids[0]] = (future, request_ids[1:])
+
+    @_lmcache_nvtx_annotate
+    def batched_submit_retrieve_requests(
+        self,
+        request_ids: list[str],
+        ops: list[LoadStoreOp],
+        event: torch.cuda.Event,
+    ):
+        keys = []
+        block_ids = []
+        for op in ops:
+            keys.extend(self._block_hashes_to_keys(op.block_hashes))
+            block_ids.extend(op.block_ids)
+        future = send_lmcache_request(
+            self.mq_client,
+            RequestType.RETRIEVE,
+            [keys, self.instance_id, block_ids, event.ipc_handle()],
+        ).to_cuda_future()
+        self.retrieve_futures[request_ids[0]] = (future, request_ids[1:])
+
+    @_lmcache_nvtx_annotate
+    def get_finished(
+        self, finished_req_ids: set[str]
+    ) -> tuple[set[str] | None, set[str] | None]:
+        finished_stores = set()
+        finished_retrieves = set()
+        for request_id, (future, other_reqs) in self.store_futures.items():
+            if not future.query():
+                continue
+
+            result = future.result()
+            finished_stores.add(request_id)
+            finished_stores.update(other_reqs)
+
+            if not result:
+                # TODO: add error handling here
+                logger.error(
+                    "Something went wrong when processing the "
+                    "store request for request_id=%s",
+                    request_id,
+                )
+
+        for request_id, (future, other_reqs) in self.retrieve_futures.items():
+            if not future.query():
+                continue
+
+            result = future.result()
+            finished_retrieves.add(request_id)
+            finished_retrieves.update(other_reqs)
+
+            if not all(result):
+                # TODO: add error handing here
+                logger.error(
+                    "Something went wrong when processing the "
+                    "retrieve request for request_id=%s, result=%s",
+                    request_id,
+                    result,
+                )
+            logger.info("Retrieve request for request_id=%s finished", request_id)
+
+        # Remove the finished requests from the tracking dicts
+        for request_id in finished_stores:
+            self.store_futures.pop(request_id, None)
+        for request_id in finished_retrieves:
+            self.retrieve_futures.pop(request_id, None)
+
+        # Update the internal states
+        self.finished_stores.update(finished_stores)
+
+        ret_stores = set()
+        for req_id in finished_req_ids:
+            if req_id in self.finished_stores or req_id in self.store_futures:
+                self.previously_finished.add(req_id)
+            else:
+                ret_stores.add(req_id)
+
+        # Calculate the final finished stores
+        ret_stores.update(self._update_and_get_finished_store())
+
+        return ret_stores, finished_retrieves
+
+    def num_blocks_per_chunk(self) -> int:
+        """
+        Returns:
+            The number of vllm blocks in a LMCache data chunk
+        """
+        return self.blocks_in_chunk
+
+    def shutdown(self):
+        # Unregister kv cache
+        logger.info("Unregistering kv caches")
+        send_lmcache_request(
+            self.mq_client, RequestType.UNREGISTER_KV_CACHE, [self.instance_id]
+        ).result()
+
+        self.mq_client.close()
+
+    # Helper functions
+    def _update_and_get_finished_store(
+        self,
+    ) -> set[str]:
+        """Converge the internal states about finished stores
+        and returns the 'safe finished store request ids' back
+        """
+        safe_finished_s = self.finished_stores.intersection(self.previously_finished)
+        self.finished_stores.difference_update(self.previously_finished)
+        self.previously_finished.difference_update(safe_finished_s)
+
+        return safe_finished_s
+
+    def _create_key(self, block_hash: bytes) -> IPCCacheEngineKey:
+        """Convert a block hash to an IPC cache engine key"""
+        return IPCCacheEngineKey(
+            model_name=self.model_name,
+            world_size=self.world_size,
+            worker_id=self.worker_id,
+            chunk_hash=block_hash,
+        )
+
+    def _block_hashes_to_keys(
+        self, block_hashes: list[bytes]
+    ) -> list[IPCCacheEngineKey]:
+        """Convert block hashes to IPC cache engine keys"""
+        s = striding_block_hashes(block_hashes, self.blocks_in_chunk)
+        return [self._create_key(block_hash) for block_hash in s]
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_mp_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_mp_connector.py
new file mode 100644
index 000000000000..55831dc56c80
--- /dev/null
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_mp_connector.py
@@ -0,0 +1,867 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import enum
+from collections.abc import Iterable
+from dataclasses import dataclass, field
+from typing import TYPE_CHECKING, Any, Literal, Optional, cast
+
+import torch
+import zmq
+from lmcache.utils import init_logger as lmcache_init_logger
+
+from vllm.config import VllmConfig
+from vllm.distributed.kv_transfer.kv_connector.v1.base import (
+    KVConnectorBase_V1,
+    KVConnectorMetadata,
+    KVConnectorRole,
+)
+from vllm.distributed.kv_transfer.kv_connector.v1.lmcache_integration import (
+    LMCacheMPSchedulerAdapter,
+    LMCacheMPWorkerAdapter,
+    LoadStoreOp,
+)
+from vllm.v1.core.sched.output import SchedulerOutput
+from vllm.v1.outputs import KVConnectorOutput
+from vllm.v1.utils import ConstantList
+
+if TYPE_CHECKING:
+    from vllm.attention.backends.abstract import AttentionMetadata
+    from vllm.config import VllmConfig
+    from vllm.distributed.kv_events import KVCacheEvent
+    from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
+        KVConnectorPromMetrics,
+        KVConnectorStats,
+        PromMetric,
+        PromMetricT,
+    )
+    from vllm.forward_context import ForwardContext
+    from vllm.v1.core.kv_cache_manager import KVCacheBlocks
+    from vllm.v1.core.kv_cache_utils import BlockHash
+    from vllm.v1.kv_cache_interface import KVCacheConfig
+    from vllm.v1.request import Request
+
+logger = lmcache_init_logger(__name__)
+
+
+# Helper functions
+def reformat_block_ids(block_ids: tuple[list[int], ...] | None) -> list[int]:
+    if block_ids is None:
+        return []
+    assert isinstance(block_ids, tuple), (
+        f"Expected block_ids to be a tuple of lists, but got {type(block_ids)}"
+    )
+
+    if len(block_ids) > 1:
+        raise RuntimeError(
+            "LMCacheMPConnector only works without hybrid kv cache manager. "
+            "Please pass --disable-hybrid-kv-cache-manager when starting vllm"
+        )
+
+    return block_ids[0]
+
+
+def create_scheduler_adapter(
+    server_url: str, zmq_context: zmq.Context, vllm_config: VllmConfig
+) -> LMCacheMPSchedulerAdapter:
+    # TODO: have a helper function to calculate the correct rank and
+    # world size for the MLA and other models
+    return LMCacheMPSchedulerAdapter(
+        server_url,
+        zmq_context,
+        vllm_config.model_config.model,
+        vllm_config.parallel_config.world_size,
+        vllm_config.parallel_config.rank,
+        vllm_config.cache_config.block_size,
+    )
+
+
+def create_worker_adapter(
+    server_url: str, zmq_context: zmq.Context, vllm_config: VllmConfig
+) -> LMCacheMPWorkerAdapter:
+    # TODO: have a helper function to calculate the correct rank and
+    # world size for the MLA and other models
+    return LMCacheMPWorkerAdapter(
+        server_url,
+        zmq_context,
+        vllm_config.model_config.model,
+        vllm_config.parallel_config.world_size,
+        vllm_config.parallel_config.rank,
+        vllm_config.cache_config.block_size,
+    )
+
+
+def convert_block_hashes_to_bytes(
+    block_hashes: list["BlockHash"],
+) -> list[bytes]:
+    return cast(list[bytes], block_hashes)
+
+
+class LMCacheMPRequestState(enum.Enum):
+    """
+    State machine:
+    PREFETCHING -- update_state_after_alloc --> WAITING_FOR_LOAD
+    WAITING_FOR_LOAD -- process_loading_requests --> READY
+    """
+
+    PREFETCHING = enum.auto()
+    WAITING_FOR_LOAD = enum.auto()
+    READY = enum.auto()
+
+
+@dataclass
+class LMCacheMPRequestTracker:
+    # NOTE: this class used vLLM data structures, should be part of
+    # vLLM integration code
+
+    request_id: str
+
+    # Read-only lists to track the token ids and block hashes
+    all_token_ids: ConstantList[int]
+    block_hashes: ConstantList["BlockHash"]
+
+    # Block ids and hashes will be updated at update_states_after_alloc and
+    # during the generation
+    allocated_block_ids: list[int] = field(default_factory=list)
+
+    # Number of scheduled tokens in this request. We keep tracking this to
+    # avoid saving half-full blocks.
+    num_scheduled_tokens: int = 0
+
+    # Number of blocks stored will be initialized when lookup the external
+    # hit tokens and will be updated when processing new requests and cached
+    # requests.
+    num_stored_blocks: int = 0
+
+    # Staging load operation -- save vllm and lmcache hit tokens during lookup
+    num_vllm_hit_blocks: int = 0
+    num_lmcache_hit_blocks: int = 0
+
+    # Main state
+    state: LMCacheMPRequestState = LMCacheMPRequestState.PREFETCHING
+
+    def __init__(self, request: "Request"):
+        self.request_id = request.request_id
+        self.all_token_ids = request.all_token_ids
+        self.block_hashes = ConstantList(request.block_hashes)
+        self.allocated_block_ids = []
+        self.num_stored_blocks = 0
+        self.num_vllm_hit_blocks = 0
+        self.num_lmcache_hit_blocks = 0
+        self.state = LMCacheMPRequestState.PREFETCHING
+
+    ####
+    # Check the state of the request
+    ####
+    def needs_retrieve(self) -> bool:
+        """Check whether the current request needs retrieve, will be used
+        update_stage_after_alloc"""
+        return (
+            self.num_lmcache_hit_blocks > self.num_vllm_hit_blocks
+            and self.state != LMCacheMPRequestState.READY
+        )
+
+    def is_ready_for_retrieving(self) -> bool:
+        """Check whether the current request is ready for retrieving,
+        will be used in process_loading_requests"""
+        return (
+            self.state == LMCacheMPRequestState.WAITING_FOR_LOAD
+            and self.needs_retrieve()
+        )
+
+    ####
+    # Update internal states
+    ####
+    def increase_num_scheduled_tokens(self, num_new_tokens: int):
+        self.num_scheduled_tokens += num_new_tokens
+
+    def increase_num_stored_blocks(self, num_new_blocks: int):
+        """Increase the number of stored blocks for the current request
+        This function will be called when processing the cached requests.
+        """
+        self.num_stored_blocks += num_new_blocks
+
+    def update_block_ids(
+        self,
+        new_block_ids: list[int],
+    ):
+        """Update the block ids for the current request
+        This function will be called when processing the cached requests.
+        """
+        self.allocated_block_ids.extend(new_block_ids)
+
+    ####
+    # For debugging
+    ####
+    def __repr__(self) -> str:
+        return (
+            f"LMCacheMPRequestTracker(request_id={self.request_id}, "
+            f"num_tokens={len(self.all_token_ids)}, "
+            f"num_block_hashes={len(self.block_hashes)}, "
+            f"num_allocated_blocks={len(self.allocated_block_ids)}, "
+            f"num_stored_blocks={self.num_stored_blocks}, "
+            f"vllm_hit_blocks={self.num_vllm_hit_blocks}, "
+            f"lmcache_hit_blocks={self.num_lmcache_hit_blocks}, "
+            f"state={self.state})"
+        )
+
+    def __str__(self) -> str:
+        return self.__repr__()
+
+
+@dataclass
+class LMCacheMPRequestMetadata:
+    request_id: str
+    direction: Literal["STORE", "RETRIEVE"]
+    op: LoadStoreOp
+
+    @staticmethod
+    def GetStoreMetadata(
+        tracker: LMCacheMPRequestTracker,
+        blocks_in_chunk: int,
+        vllm_block_size: int,
+    ) -> "LMCacheMPRequestMetadata | None":
+        """
+        Generate the store metadata for the current request tracker.
+
+        Args:
+            tracker: The request tracker to generate the metadata from.
+            blocks_in_chunk: the number of blocks in a LMCache data chunk
+        """
+        # Store the blocks that has block hashes
+        # NOTE: the invariant here is that `num_stored_blocks` should
+        # always be a multiple of `blocks_in_chunk`
+        # TODO: This should be checked everytime we update the num_stored_blocks
+        min_available_blocks = min(
+            len(tracker.block_hashes),
+            len(tracker.allocated_block_ids),
+            tracker.num_scheduled_tokens // vllm_block_size,
+        )
+        num_staging_blocks = min_available_blocks - tracker.num_stored_blocks
+        num_chunks = num_staging_blocks // blocks_in_chunk
+
+        if num_chunks >= 1:
+            start = tracker.num_stored_blocks
+            end = start + num_chunks * blocks_in_chunk
+            block_hashes = convert_block_hashes_to_bytes(
+                tracker.block_hashes[start:end]
+            )
+            block_ids = tracker.allocated_block_ids[start:end]
+
+            ret = LMCacheMPRequestMetadata(
+                request_id=tracker.request_id,
+                direction="STORE",
+                op=LoadStoreOp(block_hashes=block_hashes, block_ids=block_ids),
+            )
+
+            # Update the request tracker
+            tracker.increase_num_stored_blocks(end - start)
+            return ret
+
+        return None
+
+    @staticmethod
+    def GetRetrieveMetadata(
+        tracker: LMCacheMPRequestTracker,
+        blocks_in_chunk: int,
+    ) -> "LMCacheMPRequestMetadata | None":
+        """
+        Generate the retrieve metadata for the current request tracker.
+
+        Args:
+            tracker: The request tracker to generate the metadata from.
+            blocks_in_chunk: the number of blocks in a LMCache data chunk
+        """
+        if not tracker.is_ready_for_retrieving():
+            return None
+
+        # |---------------------|-----------------|----------------|
+        # | num_vllm_hit_blocks |
+        # | lmcache chunk 1   | lmcache chunk 2   |
+        #                     |  need to retrieve |
+
+        start = tracker.num_vllm_hit_blocks // blocks_in_chunk * blocks_in_chunk
+        end = tracker.num_lmcache_hit_blocks
+        assert end % blocks_in_chunk == 0, (
+            "The number of LMCache hit blocks should be a multiple of the "
+            "number of blocks in a lmcache chunk. "
+        )
+        assert len(tracker.block_hashes) >= end, (
+            "The number of block hashes should be greater than or equal to the "
+            "number of LMCache hit blocks. "
+        )
+        if end > start:
+            block_hashes = convert_block_hashes_to_bytes(
+                tracker.block_hashes[start:end]
+            )
+            block_ids = tracker.allocated_block_ids[start:end]
+
+            ret = LMCacheMPRequestMetadata(
+                request_id=tracker.request_id,
+                direction="RETRIEVE",
+                op=LoadStoreOp(block_hashes=block_hashes, block_ids=block_ids),
+            )
+            return ret
+
+        return None
+
+
+class LMCacheMPConnectorMetadata(KVConnectorMetadata):
+    def __init__(self):
+        super().__init__()
+        self.requests: list[LMCacheMPRequestMetadata] = []
+
+    def add_request_metadata(self, request_metadata: LMCacheMPRequestMetadata):
+        self.requests.append(request_metadata)
+
+    def __len__(self):
+        return len(self.requests)
+
+    # For debugging
+    def __str__(self):
+        request_strs = []
+        for req_meta in self.requests:
+            request_strs.append(
+                f"RequestMetadata(request_id={req_meta.request_id}, "
+                f"direction={req_meta.direction}, "
+                f"num_blocks={len(req_meta.op)}, "
+                f"block_ids={req_meta.op.block_ids})"
+            )
+        return "[" + "\n".join(request_strs) + "]"
+
+    def __repr__(self):
+        return self.__str__()
+
+
+class LMCacheMPConnector(KVConnectorBase_V1):
+    """
+    The connector for LMCache multi-process mode.
+
+    Extra configs (kv_transfer_config.extra_config):
+    - lmcache.mp.host: the host of the LMCache server.
+    - lmcache.mp.port: the port of the LMCache server.
+    """
+
+    def __init__(
+        self,
+        vllm_config: "VllmConfig",
+        role: KVConnectorRole,
+        kv_cache_config: Optional["KVCacheConfig"] = None,
+    ):
+        super().__init__(vllm_config, role, kv_cache_config)
+
+        assert vllm_config.kv_transfer_config is not None
+        server_host = vllm_config.kv_transfer_config.get_from_extra_config(
+            "lmcache.mp.host", "tcp://localhost"
+        )
+        server_port = vllm_config.kv_transfer_config.get_from_extra_config(
+            "lmcache.mp.port", 5555
+        )
+
+        server_url = f"{server_host}:{server_port}"
+        zmq_context = zmq.Context.instance()
+        if self.role == KVConnectorRole.SCHEDULER:
+            self.scheduler_adapter = create_scheduler_adapter(
+                server_url, zmq_context, vllm_config
+            )
+            self.request_trackers: dict[str, LMCacheMPRequestTracker] = {}
+        elif self.role == KVConnectorRole.WORKER:
+            self.worker_adapter = create_worker_adapter(
+                server_url, zmq_context, vllm_config
+            )
+        else:
+            raise ValueError(f"Unknown KVConnectorRole: {self.role}")
+
+        self.vllm_block_size = vllm_config.cache_config.block_size
+
+    @property
+    def role(self) -> KVConnectorRole:
+        return self._role
+
+    # ==============================
+    # Worker-side methods
+    # ==============================
+
+    def _get_connector_metadata(self) -> KVConnectorMetadata:
+        """Get the connector metadata.
+
+        This function should only be called inside the connector.
+
+        Returns:
+            ConnectorMetadata: the connector metadata.
+        """
+
+        # Should only be called while set to valid metadata.
+        assert self._connector_metadata is not None
+        return self._connector_metadata
+
+    def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
+        """
+        Initialize with the KV caches. Useful for pre-registering the
+        KV Caches in the KVConnector (e.g. for NIXL).
+
+        Args:
+            kv_caches: dictionary of layer names, kv cache
+        """
+        logger.info("Registering kv caches!")
+        self.worker_adapter.register_kv_caches(kv_caches)
+        return
+
+    def start_load_kv(self, forward_context: "ForwardContext", **kwargs: Any) -> None:
+        """
+        Start loading the KV cache from the connector to vLLM's paged
+        KV buffer. This is called from the forward context before the
+        forward pass to enable async loading during model execution.
+
+        Args:
+            forward_context (ForwardContext): the forward context.
+            **kwargs: additional arguments for the load operation
+
+        Note:
+            The number of elements in kv_caches and layer_names should be
+            the same.
+
+        """
+        metadata = self._get_connector_metadata()
+        assert isinstance(metadata, LMCacheMPConnectorMetadata)
+
+        with torch.cuda.stream(torch.cuda.current_stream()):
+            event = torch.cuda.Event(interprocess=True)
+            event.record()
+
+        request_ids = []
+        ops = []
+
+        for meta in metadata.requests:
+            if meta.direction != "RETRIEVE":
+                continue
+            request_ids.append(meta.request_id)
+            ops.append(meta.op)
+
+        if len(request_ids) > 0:
+            logger.info(
+                "HERE! SUBMITTING THE BATCHED RETRIEVE REQUESTS %s", request_ids
+            )
+            self.worker_adapter.batched_submit_retrieve_requests(
+                request_ids, ops, event
+            )
+
+    def wait_for_layer_load(self, layer_name: str) -> None:
+        """
+        Block until the KV for a specific layer is loaded into vLLM's
+        paged buffer. This is called from within attention layer to ensure
+        async copying from start_load_kv is complete.
+
+        This interface will be useful for layer-by-layer pipelining.
+
+        Args:
+            layer_name: the name of that layer
+        """
+        return
+
+    def save_kv_layer(
+        self,
+        layer_name: str,
+        kv_layer: torch.Tensor,
+        attn_metadata: "AttentionMetadata",
+        **kwargs: Any,
+    ) -> None:
+        """
+        Start saving a layer of KV cache from vLLM's paged buffer
+        to the connector. This is called from within attention layer to
+        enable async copying during execution.
+
+        Args:
+            layer_name (str): the name of the layer.
+            kv_layer (torch.Tensor): the paged KV buffer of the current
+                layer in vLLM.
+            attn_metadata (AttentionMetadata): the attention metadata.
+            **kwargs: additional arguments for the save operation.
+        """
+        return
+
+    def wait_for_save(self):
+        """
+        Block until all the save operations is done. This is called
+        as the forward context exits to ensure that the async saving
+        from save_kv_layer is complete before finishing the forward.
+
+        This prevents overwrites of paged KV buffer before saving done.
+        """
+        metadata = self._get_connector_metadata()
+        assert isinstance(metadata, LMCacheMPConnectorMetadata)
+
+        with torch.cuda.stream(torch.cuda.current_stream()):
+            event = torch.cuda.Event(interprocess=True)
+            event.record()
+
+        request_ids = []
+        ops = []
+        for meta in metadata.requests:
+            if meta.direction != "STORE":
+                continue
+            request_ids.append(meta.request_id)
+            ops.append(meta.op)
+
+        if len(request_ids) > 0:
+            self.worker_adapter.batched_submit_store_requests(request_ids, ops, event)
+
+    def get_finished(
+        self, finished_req_ids: set[str]
+    ) -> tuple[set[str] | None, set[str] | None]:
+        """
+        Notifies worker-side connector ids of requests that have
+        finished generating tokens on the worker.
+        The scheduler process (via the Executors) will use this output
+        to track which workers are done.
+
+        Returns:
+            ids of requests that have finished asynchronous transfer
+            (requests that previously returned True from request_finished()),
+            tuple of (sending/saving ids, recving/loading ids).
+            The finished saves/sends req ids must belong to a set provided in a
+            call to this method (this call or a prior one).
+        """
+        val = self.worker_adapter.get_finished(finished_req_ids)
+        # logger.error("Finished req ids: %s, %s", val[0], val[1])
+        return val
+
+    def get_block_ids_with_load_errors(self) -> set[int]:
+        """
+        Get the set of block IDs that failed to load.
+
+        Returns:
+            Set of block IDs that encountered load errors.
+            Empty set if no load errors occurred.
+
+        Notes:
+            - Applies to both sync- and async-loading requests.
+            - Async loading: failed blocks may be reported in any forward pass
+              up to and including the pass where the request ID is returned by
+              `get_finished()`. Even if failures occur, the request must still
+              be reported via `get_finished()`, and the failed block IDs must
+              appear here no later than that same pass.
+            - Sync loading: failed blocks should be reported in the forward
+              pass in which they are detected.
+        """
+        # TODO: add error tracking
+        return set()
+
+    def shutdown(self):
+        """
+        Shutdown the connector. This is called when the worker process
+        is shutting down to ensure that all the async operations are
+        completed and the connector is cleaned up properly.
+        """
+        if hasattr(self, "worker_adapter"):
+            self.worker_adapter.shutdown()
+        return None
+
+    def get_kv_connector_stats(self) -> Optional["KVConnectorStats"]:
+        """
+        Get the KV connector stats collected during the last interval.
+        """
+        return None
+
+    # ==============================
+    # Scheduler-side methods
+    # ==============================
+
+    def get_num_new_matched_tokens(
+        self,
+        request: "Request",
+        num_computed_tokens: int,
+    ) -> tuple[int | None, bool]:
+        """
+        Get number of new tokens that can be loaded from the
+        external KV cache beyond the num_computed_tokens.
+
+        Args:
+            request (Request): the request object.
+            num_computed_tokens (int): the number of locally
+                computed tokens for this request
+
+        Returns:
+            A tuple with the following elements:
+                - An optional number of tokens that can be loaded from the
+                  external KV cache beyond what is already computed.
+                  If None, it means that the connector needs more time to
+                  determine the number of matched tokens, and the scheduler
+                  should query for this request again later.
+                - `True` if external KV cache tokens will be loaded
+                  asynchronously (between scheduler steps). Must be
+                  'False' if the first element is 0.
+
+        Notes:
+            The connector should only consider the largest prefix of prompt-
+            tokens for which KV cache is actually available at the time of the
+            call. If the cache cannot be loaded for some tokens (e.g., due to
+            connectivity issues or eviction), those tokens must not be taken
+            into account.
+        """
+        tracker = self._get_or_create_request_tracker(request)
+
+        self.scheduler_adapter.maybe_submit_lookup_request(
+            request.request_id, convert_block_hashes_to_bytes(request.block_hashes)
+        )
+
+        ret = self.scheduler_adapter.check_lookup_result(request.request_id)
+        if ret is None:
+            return None, True
+
+        if ret == 0:
+            return 0, False
+
+        assert (
+            ret % (self.scheduler_adapter.num_blocks_per_chunk() * self.vllm_block_size)
+            == 0
+        )
+
+        # Update num stored blocks for the tracker
+        num_vllm_blocks = num_computed_tokens // self.vllm_block_size
+        num_lmcache_blocks = ret // self.vllm_block_size
+        tracker.increase_num_stored_blocks(num_lmcache_blocks)
+
+        # Save the vllm and lmcache hit tokens
+        tracker.num_vllm_hit_blocks = num_vllm_blocks
+        tracker.num_lmcache_hit_blocks = num_lmcache_blocks
+
+        need_to_load = max(0, ret - num_computed_tokens)
+        logger.debug(
+            "vLLM hit is: %d, Need to load is %d", num_computed_tokens, need_to_load
+        )
+        return need_to_load, need_to_load > 0
+
+    def update_state_after_alloc(
+        self, request: "Request", blocks: "KVCacheBlocks", num_external_tokens: int
+    ):
+        """
+        Update KVConnector state after block allocation.
+
+        If get_num_new_matched_tokens previously returned True for a
+        request, this function may be called twice for that same request -
+        first when blocks are allocated for the connector tokens to be
+        asynchronously loaded into, and second when any additional blocks
+        are allocated, after the load/transfer is complete.
+
+        Args:
+            request (Request): the request object.
+            blocks (KVCacheBlocks): the blocks allocated for the request.
+            num_external_tokens (int): the number of tokens that will be
+                loaded from the external KV cache.
+        """
+        # NOTE: the `blocks` are NEW BLOCKS allocated for this request.
+        tracker = self._get_request_tracker(request.request_id)
+        block_ids = reformat_block_ids(blocks.get_block_ids())
+
+        # No matter we need to retrieve or not, we need to update
+        # the block ids into the tracker
+        tracker.update_block_ids(block_ids)
+
+        # Update the state of the tracker
+        condition = tracker.needs_retrieve()
+        if tracker.state == LMCacheMPRequestState.PREFETCHING:
+            # If need to retrieve, change to WAITING_FOR_LOAD
+            # Otherwise, change to READY
+            tracker.state = (
+                LMCacheMPRequestState.WAITING_FOR_LOAD
+                if condition
+                else LMCacheMPRequestState.READY
+            )
+
+    def build_connector_meta(
+        self, scheduler_output: SchedulerOutput
+    ) -> KVConnectorMetadata:
+        """
+        Build the connector metadata for this step.
+
+        This function should NOT modify fields in the scheduler_output.
+        Also, calling this function will reset the state of the connector.
+
+        Args:
+            scheduler_output (SchedulerOutput): the scheduler output object.
+        """
+        metadata = LMCacheMPConnectorMetadata()
+
+        self._process_retrieve_requests(metadata)
+        self._process_new_requests(scheduler_output, metadata)
+        self._process_cached_requests(scheduler_output, metadata)
+
+        if len(metadata) > 0:
+            logger.debug("Final connector metadata: %s", metadata)
+
+        return metadata
+
+    def update_connector_output(self, connector_output: KVConnectorOutput):
+        """
+        Update KVConnector state from worker-side connectors output.
+
+        Args:
+            connector_output (KVConnectorOutput): the worker-side
+                connectors output.
+        """
+        return
+
+    def request_finished(
+        self,
+        request: "Request",
+        block_ids: list[int],
+    ) -> tuple[bool, dict[str, Any] | None]:
+        """
+        Called exactly once when a request has finished, before its blocks are
+        freed.
+
+        The connector may assumes responsibility for freeing the blocks
+        asynchronously by returning True.
+
+        Returns:
+            True if the request is being saved/sent asynchronously and blocks
+            should not be freed until the request_id is returned from
+            get_finished().
+            Optional KVTransferParams to be included in the request outputs
+            returned by the engine.
+        """
+        return True, None
+
+    def take_events(self) -> Iterable["KVCacheEvent"]:
+        """
+        Take the KV cache events from the connector.
+
+        Yields:
+            New KV cache events since the last call.
+        """
+        return ()
+
+    @classmethod
+    def get_required_kvcache_layout(cls, vllm_config: "VllmConfig") -> str | None:
+        """
+        Get the required KV cache layout for this connector.
+        Args:
+            vllm_config (VllmConfig): the vllm config.
+
+        Returns:
+            str: the required KV cache layout. e.g. HND, or NHD.
+            None if the connector does not require a specific layout.
+        """
+
+        if cls is KVConnectorBase_V1:
+            raise TypeError(
+                "get_required_kvcache_layout should not be called "
+                "on the abstract base class"
+            )
+        return None
+
+    def get_finished_count(self) -> int | None:
+        """
+        Get the count of requests expected to complete send/receive operations
+        via this connector. This method is used to initialize the
+        KVOutputAggregator, overwriting the default world_size.
+
+        Returns:
+            int: expected sending or receiving completion count.
+        """
+        return None
+
+    @classmethod
+    def build_kv_connector_stats(
+        cls, data: dict[str, Any] | None = None
+    ) -> Optional["KVConnectorStats"]:
+        """
+        KVConnectorStats resolution method. This method allows dynamically
+        registered connectors to return their own KVConnectorStats object,
+        which can implement custom aggregation logic on the data dict.
+        """
+        return None
+
+    @classmethod
+    def build_prom_metrics(
+        cls,
+        vllm_config: "VllmConfig",
+        metric_types: dict[type["PromMetric"], type["PromMetricT"]],
+        labelnames: list[str],
+        per_engine_labelvalues: dict[int, list[str]],
+    ) -> Optional["KVConnectorPromMetrics"]:
+        """
+        Create a KVConnectorPromMetrics subclass which should register
+        per-connector Prometheus metrics and implement observe() to
+        expose connector transfer stats via Prometheus.
+        """
+        return None
+
+    ##############################
+    # Helper functions
+    ##############################
+    def _process_retrieve_requests(
+        self,
+        metadata: LMCacheMPConnectorMetadata,
+    ) -> None:
+        blocks_per_chunk = self.scheduler_adapter.num_blocks_per_chunk()
+
+        for request_tracker in self.request_trackers.values():
+            if request_tracker.state != LMCacheMPRequestState.WAITING_FOR_LOAD:
+                continue
+            r_metadata = LMCacheMPRequestMetadata.GetRetrieveMetadata(
+                request_tracker, blocks_per_chunk
+            )
+            if r_metadata is not None:
+                metadata.add_request_metadata(r_metadata)
+            request_tracker.state = LMCacheMPRequestState.READY
+
+    def _process_new_requests(
+        self,
+        scheduler_output: SchedulerOutput,
+        metadata: LMCacheMPConnectorMetadata,
+    ) -> None:
+        blocks_per_chunk = self.scheduler_adapter.num_blocks_per_chunk()
+
+        for new_request in scheduler_output.scheduled_new_reqs:
+            request_tracker = self._get_request_tracker(new_request.req_id)
+
+            num_new_tokens = scheduler_output.num_scheduled_tokens[new_request.req_id]
+            request_tracker.increase_num_scheduled_tokens(num_new_tokens)
+
+            r_meta = LMCacheMPRequestMetadata.GetStoreMetadata(
+                request_tracker, blocks_per_chunk, self.vllm_block_size
+            )
+            if r_meta is not None:
+                metadata.add_request_metadata(r_meta)
+
+    def _process_cached_requests(
+        self,
+        scheduler_output: SchedulerOutput,
+        metadata: LMCacheMPConnectorMetadata,
+    ) -> None:
+        blocks_per_chunk = self.scheduler_adapter.num_blocks_per_chunk()
+
+        cached_reqs = scheduler_output.scheduled_cached_reqs
+        for idx, request_id in enumerate(cached_reqs.req_ids):
+            request_tracker = self._get_request_tracker(request_id)
+
+            # Update block ids
+            new_block_ids = reformat_block_ids(cached_reqs.new_block_ids[idx])
+            request_tracker.update_block_ids(new_block_ids)
+
+            # Update new scheduled tokens
+            num_new_tokens = cached_reqs.num_computed_tokens[idx]
+            request_tracker.increase_num_scheduled_tokens(num_new_tokens)
+
+            r_meta = LMCacheMPRequestMetadata.GetStoreMetadata(
+                request_tracker, blocks_per_chunk, self.vllm_block_size
+            )
+
+            if r_meta is not None:
+                metadata.add_request_metadata(r_meta)
+
+    def _get_request_tracker(self, request_id: str) -> LMCacheMPRequestTracker:
+        assert request_id in self.request_trackers, (
+            f"Request tracker for request_id {request_id} not found. "
+        )
+        return self.request_trackers[request_id]
+
+    def _get_or_create_request_tracker(
+        self, request: "Request"
+    ) -> LMCacheMPRequestTracker:
+        request_id = request.request_id
+        if request_id not in self.request_trackers:
+            new_tracker = LMCacheMPRequestTracker(request)
+            self.request_trackers[request_id] = new_tracker
+        return self.request_trackers[request_id]

From 58ce8d12b741b5bafe6bd0fb878727baea6171fe Mon Sep 17 00:00:00 2001
From: Andy Lo <andy@mistral.ai>
Date: Wed, 12 Nov 2025 20:29:21 +0000
Subject: [PATCH 116/183] [BugFix] Priority scheduling and spec tokens
 preemption (#28558)

Signed-off-by: Andy Lo <andy@mistral.ai>
---
 .../v1/core/test_priority_scheduler_random.py | 252 ++++++++++++++++++
 vllm/v1/core/sched/scheduler.py               |  14 +
 2 files changed, 266 insertions(+)
 create mode 100644 tests/v1/core/test_priority_scheduler_random.py

diff --git a/tests/v1/core/test_priority_scheduler_random.py b/tests/v1/core/test_priority_scheduler_random.py
new file mode 100644
index 000000000000..b4805be80272
--- /dev/null
+++ b/tests/v1/core/test_priority_scheduler_random.py
@@ -0,0 +1,252 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import random
+import uuid
+
+import pytest
+
+from vllm.config import VllmConfig
+from vllm.multimodal.inputs import (
+    MultiModalFeatureSpec,
+    MultiModalKwargsItem,
+    PlaceholderRange,
+)
+from vllm.sampling_params import SamplingParams
+from vllm.utils.hashing import get_hash_fn_by_name
+from vllm.v1.core.kv_cache_utils import get_request_block_hasher, init_none_hash
+from vllm.v1.core.sched.output import SchedulerOutput
+from vllm.v1.outputs import DraftTokenIds, ModelRunnerOutput
+from vllm.v1.request import Request
+
+from .test_scheduler import create_scheduler_with_priority
+from .utils import EOS_TOKEN_ID
+
+pytestmark = pytest.mark.cpu_test
+
+
+def _create_random_request(
+    max_tokens_range: tuple[int, int],
+    num_tokens_range: tuple[int, int],
+    arrival_time_range: tuple[float, float],
+    priority_range: tuple[int, int],
+    num_mm_item_range: tuple[int, int],
+    vllm_config: VllmConfig,
+):
+    max_tokens = random.randint(*max_tokens_range)
+    num_tokens = random.randint(*num_tokens_range)
+    priority = random.randint(*priority_range)
+    arrival_time = random.uniform(*arrival_time_range)
+    num_mm_item = random.randint(*num_mm_item_range)
+
+    mm_positions: list[PlaceholderRange] = []
+    for mm_start in sorted(
+        random.sample(range(num_tokens), min(num_mm_item, num_tokens))
+    ):
+        if mm_start + 10 > num_tokens:
+            continue
+        mm_positions.append(PlaceholderRange(offset=mm_start, length=10))
+
+    request_id = uuid.uuid4().hex
+
+    sampling_params = SamplingParams(
+        ignore_eos=False,
+        max_tokens=max_tokens,
+    )
+    mm_features = []
+    for j, position in enumerate(mm_positions):
+        identifier = f"{request_id}_hash_{j}"
+        mm_feature = MultiModalFeatureSpec(
+            data=MultiModalKwargsItem.dummy("dummy_m"),
+            mm_position=position,
+            identifier=identifier,
+            modality="image",
+        )
+        mm_features.append(mm_feature)
+
+    prompt_token_ids = random.choices(range(100), k=num_tokens)
+
+    caching_hash_fn = get_hash_fn_by_name(
+        vllm_config.cache_config.prefix_caching_hash_algo
+    )
+    init_none_hash(caching_hash_fn)
+    block_hasher = get_request_block_hasher(
+        vllm_config.cache_config.block_size, caching_hash_fn
+    )
+
+    request = Request(
+        request_id=request_id,
+        prompt_token_ids=prompt_token_ids,
+        sampling_params=sampling_params,
+        pooling_params=None,
+        mm_features=mm_features if mm_features else None,
+        eos_token_id=EOS_TOKEN_ID,
+        arrival_time=arrival_time,
+        priority=priority,
+        block_hasher=block_hasher,
+    )
+    return request
+
+
+def _mock_execute_model(
+    scheduler_output: SchedulerOutput, num_output_tokens_range: tuple[int, int]
+) -> ModelRunnerOutput:
+    request_ids: list[str] = []
+    request_ids.extend(req.req_id for req in scheduler_output.scheduled_new_reqs)
+    request_ids.extend(scheduler_output.scheduled_cached_reqs.req_ids)
+    random.shuffle(request_ids)
+
+    num_output_tokens = [
+        random.randint(*num_output_tokens_range) for _ in range(len(request_ids))
+    ]
+    sampled_token_ids = [
+        [random.randint(0, 100) for _ in range(num_tokens)]
+        for num_tokens in num_output_tokens
+    ]
+
+    return ModelRunnerOutput(
+        req_ids=request_ids,
+        req_id_to_index={req_id: i for i, req_id in enumerate(request_ids)},
+        sampled_token_ids=sampled_token_ids,
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=[],
+    )
+
+
+def _mock_draft_token_ids(
+    scheduler_output: SchedulerOutput,
+    num_output_tokens_range: tuple[int, int],
+    seen_request_prompt_length: dict[str, int],
+) -> DraftTokenIds:
+    request_ids: list[str] = []
+    sampled_token_ids: list[list[int]] = []
+    for request in scheduler_output.scheduled_new_reqs:
+        assert request.req_id not in seen_request_prompt_length
+        seen_request_prompt_length[request.req_id] = len(request.prompt_token_ids or [])
+        if request.num_computed_tokens >= seen_request_prompt_length[request.req_id]:
+            num_tokens = random.randint(*num_output_tokens_range)
+            request_ids.append(request.req_id)
+            sampled_token_ids.append(
+                [random.randint(0, 100) for _ in range(num_tokens)]
+            )
+    for req_id, num_computed_tokens in zip(
+        scheduler_output.scheduled_cached_reqs.req_ids,
+        scheduler_output.scheduled_cached_reqs.num_computed_tokens,
+    ):
+        if num_computed_tokens >= seen_request_prompt_length[req_id]:
+            num_tokens = random.randint(*num_output_tokens_range)
+            request_ids.append(req_id)
+            sampled_token_ids.append(
+                [random.randint(0, 100) for _ in range(num_tokens)]
+            )
+    return DraftTokenIds(req_ids=request_ids, draft_token_ids=sampled_token_ids)
+
+
+def _chech_valid_scheduler_output(
+    scheduler_output: SchedulerOutput,
+    seen_request_ids: set[str],
+    seen_mm_hashes: set[str],
+):
+    for req in scheduler_output.scheduled_new_reqs:
+        assert req.req_id not in seen_request_ids
+        seen_request_ids.add(req.req_id)
+    for req_id in scheduler_output.scheduled_cached_reqs.req_ids:
+        assert req_id in seen_request_ids
+
+    req_ids = set[str]()
+    req_ids.update(req.req_id for req in scheduler_output.scheduled_new_reqs)
+    req_ids.update(scheduler_output.scheduled_cached_reqs.req_ids)
+
+    assert set(scheduler_output.num_scheduled_tokens.keys()) == req_ids
+    assert (
+        sum(scheduler_output.num_scheduled_tokens.values())
+        == scheduler_output.total_num_scheduled_tokens
+    )
+
+    assert set(scheduler_output.scheduled_spec_decode_tokens.keys()) <= req_ids
+    assert set(scheduler_output.scheduled_encoder_inputs.keys()) <= req_ids
+
+    for req in scheduler_output.scheduled_new_reqs:
+        for mm_feature in req.mm_features:
+            seen_mm_hashes.add(mm_feature.identifier)
+    for mm_hash in scheduler_output.free_encoder_mm_hashes:
+        assert mm_hash in seen_mm_hashes
+
+    assert scheduler_output.finished_req_ids <= seen_request_ids
+
+
+@pytest.mark.parametrize("enable_prefix_caching", [True, False])
+@pytest.mark.parametrize("num_speculative_tokens", [None, 1, 5])
+@pytest.mark.parametrize(
+    ("max_input_tokens", "max_output_tokens", "max_num_seqs", "num_blocks"),
+    [
+        # Standard profile
+        (5000, 500, 256, 10000),
+        # Generation heavy + high max_num_seqs + low num_blocks -> Many preemptions
+        (500, 5000, 1024, 1000),
+    ],
+    ids=["standard", "preemption"],
+)
+def test_priority_scheduling_blast(
+    enable_prefix_caching: bool,
+    num_speculative_tokens: int | None,
+    max_input_tokens: int,
+    max_output_tokens: int,
+    max_num_seqs: int,
+    num_blocks: int,
+):
+    random.seed(42)
+    seen_request_prompt_length = dict[str, int]()
+    seen_request_ids = set[str]()
+    seen_mm_hashes = set[str]()
+
+    scheduler = create_scheduler_with_priority(
+        model="Qwen/Qwen2.5-VL-3B-Instruct",
+        max_num_seqs=max_num_seqs,
+        enable_prefix_caching=enable_prefix_caching,
+        num_blocks=num_blocks,
+        num_speculative_tokens=num_speculative_tokens,
+    )
+
+    num_initial_requests = 10
+    for _ in range(num_initial_requests):
+        req = _create_random_request(
+            max_tokens_range=(1, max_output_tokens),
+            num_tokens_range=(1, max_input_tokens),
+            arrival_time_range=(0, 1),
+            priority_range=(-3, 3),
+            num_mm_item_range=(0, 2),
+            vllm_config=scheduler.vllm_config,
+        )
+        scheduler.add_request(req)
+
+    for _ in range(20000):
+        if len(scheduler.waiting) == 0:
+            num_new_requests = random.randint(0, 2)
+            for _ in range(num_new_requests):
+                req = _create_random_request(
+                    max_tokens_range=(1, max_output_tokens),
+                    num_tokens_range=(1, max_input_tokens),
+                    arrival_time_range=(0, 1),
+                    priority_range=(-3, 3),
+                    num_mm_item_range=(0, 2),
+                    vllm_config=scheduler.vllm_config,
+                )
+                scheduler.add_request(req)
+        scheduler_output = scheduler.schedule()
+        _chech_valid_scheduler_output(
+            scheduler_output, seen_request_ids, seen_mm_hashes
+        )
+        model_output = _mock_execute_model(
+            scheduler_output,
+            num_output_tokens_range=(1, 1 + (num_speculative_tokens or 0)),
+        )
+        scheduler.update_from_output(scheduler_output, model_output)
+        if num_speculative_tokens is not None:
+            scheduler.update_draft_token_ids(
+                _mock_draft_token_ids(
+                    scheduler_output,
+                    (0, num_speculative_tokens),
+                    seen_request_prompt_length,
+                )
+            )
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index 8455746cd56d..4fcc7955df19 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -300,6 +300,20 @@ def schedule(self) -> SchedulerOutput:
                             ]
                             req_to_new_blocks.pop(preempted_req.request_id)
                             num_scheduled_tokens.pop(preempted_req.request_id)
+                            scheduled_spec_decode_tokens.pop(
+                                preempted_req.request_id, None
+                            )
+                            preempted_encoder_inputs = scheduled_encoder_inputs.pop(
+                                preempted_req.request_id, None
+                            )
+                            if preempted_encoder_inputs:
+                                # Restore encoder compute budget if the preempted
+                                # request had encoder inputs scheduled in this step.
+                                num_tokens_to_restore = sum(
+                                    preempted_req.get_num_encoder_tokens(i)
+                                    for i in preempted_encoder_inputs
+                                )
+                                encoder_compute_budget += num_tokens_to_restore
                             req_index -= 1
                     else:
                         preempted_req = self.running.pop()

From 478ee511de0776159163877924f7e77ce1f472d0 Mon Sep 17 00:00:00 2001
From: Wei Wei <wwei6@meta.com>
Date: Wed, 12 Nov 2025 12:59:43 -0800
Subject: [PATCH 117/183] [Misc]Fix typo in llm_engine.py (#28584)

Signed-off-by: Wei Wei <wwei6@meta.com>
---
 vllm/v1/engine/llm_engine.py | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/vllm/v1/engine/llm_engine.py b/vllm/v1/engine/llm_engine.py
index d27d13840989..6224af5700b7 100644
--- a/vllm/v1/engine/llm_engine.py
+++ b/vllm/v1/engine/llm_engine.py
@@ -281,11 +281,11 @@ def step(self) -> list[RequestOutput | PoolingRequestOutput]:
             return []
 
         # 1) Get EngineCoreOutput from the EngineCore.
-        with record_function_or_nullcontext("llm_genine step: get_output"):
+        with record_function_or_nullcontext("llm_engine step: get_output"):
             outputs = self.engine_core.get_output()
 
         # 2) Process EngineCoreOutputs.
-        with record_function_or_nullcontext("llm_genine step: process_outputs"):
+        with record_function_or_nullcontext("llm_engine step: process_outputs"):
             iteration_stats = IterationStats() if self.log_stats else None
             processed_outputs = self.output_processor.process_outputs(
                 outputs.outputs,
@@ -295,11 +295,11 @@ def step(self) -> list[RequestOutput | PoolingRequestOutput]:
             self.output_processor.update_scheduler_stats(outputs.scheduler_stats)
 
         # 3) Abort any reqs that finished due to stop strings.
-        with record_function_or_nullcontext("llm_genine step: abort_requests"):
+        with record_function_or_nullcontext("llm_engine step: abort_requests"):
             self.engine_core.abort_requests(processed_outputs.reqs_to_abort)
 
         # 4) Record stats
-        with record_function_or_nullcontext("llm_genine step: record_stats"):
+        with record_function_or_nullcontext("llm_engine step: record_stats"):
             if self.logger_manager is not None and outputs.scheduler_stats is not None:
                 self.logger_manager.record(
                     scheduler_stats=outputs.scheduler_stats,

From 74a9a9faad062e6fe90f7d238b5fad7e2f3da237 Mon Sep 17 00:00:00 2001
From: Varun Sundar Rabindranath <varunsundar08@gmail.com>
Date: Wed, 12 Nov 2025 16:13:03 -0500
Subject: [PATCH 118/183] [Performance][B200] Fix deepgemm prologue (#27897)

Signed-off-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
Co-authored-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
---
 .../layers/fused_moe/batched_deep_gemm_moe.py |  7 ++
 .../fused_moe/deepep_ll_prepare_finalize.py   | 29 ++++++++
 .../layers/fused_moe/modular_kernel.py        | 25 +++++++
 .../model_executor/layers/quantization/fp8.py | 74 +++++++++----------
 .../layers/quantization/utils/fp8_utils.py    | 57 +++++++++++++-
 vllm/utils/deep_gemm.py                       | 19 ++++-
 6 files changed, 163 insertions(+), 48 deletions(-)

diff --git a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
index b8a97e92ab79..869082f8231d 100644
--- a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
@@ -232,6 +232,7 @@ def __init__(
         """
         super().__init__(quant_config)
         assert self.block_shape == get_mk_alignment_for_contiguous_layout()
+        assert self.quant_config.use_fp8_w8a8
         self.max_num_tokens = max_num_tokens
         self.num_dispatchers = num_dispatchers
 
@@ -250,6 +251,12 @@ def supports_chunking(self) -> bool:
     def supports_expert_map(self) -> bool:
         return False
 
+    def supports_packed_ue8m0_act_scales(self) -> bool:
+        """
+        DeepGemm supports packed ue8m0 activation scales format in devices == sm100
+        """
+        return current_platform.is_device_capability(100)
+
     def finalize_weight_and_reduce_impl(self) -> mk.TopKWeightAndReduce:
         # Let PrepareAndFinalize::finalize() decide the impl.
         return TopKWeightAndReduceDelegate()
diff --git a/vllm/model_executor/layers/fused_moe/deepep_ll_prepare_finalize.py b/vllm/model_executor/layers/fused_moe/deepep_ll_prepare_finalize.py
index 500bcefcfaa9..06c9df317f7c 100644
--- a/vllm/model_executor/layers/fused_moe/deepep_ll_prepare_finalize.py
+++ b/vllm/model_executor/layers/fused_moe/deepep_ll_prepare_finalize.py
@@ -6,6 +6,7 @@
 import torch
 
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
+from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
     TopKWeightAndReduceDelegate,
@@ -20,6 +21,8 @@
     dbo_maybe_run_recv_hook,
 )
 
+logger = init_logger(__name__)
+
 # DeepEP kernels quantize dispatch inputs in 128 element chunks.
 DEEPEP_QUANT_BLOCK_SIZE = 128
 DEEPEP_QUANT_BLOCK_SHAPE = [DEEPEP_QUANT_BLOCK_SIZE, DEEPEP_QUANT_BLOCK_SIZE]
@@ -94,6 +97,29 @@ def __init__(
         self.handles: list[tuple | None] = [None, None]
         self.num_dispatchers_ = num_dispatchers
 
+        # We don't have enough information to determine if we should dispatch
+        # activation scales in a packed ue8m0 format during object construction
+        # time. This setting is handled by post_init_setup.
+        self.use_ue8m0_dispatch = False
+
+    def post_init_setup(self, fused_experts: mk.FusedMoEPermuteExpertsUnpermute):
+        if not fused_experts.supports_packed_ue8m0_act_scales():
+            # Early exit.
+            return
+
+        if self.use_fp8_dispatch:
+            logger.debug_once(
+                "Update DeepEPLLPrepareFinalize to do packed ue8m0 scales dispatch."
+            )
+            self.use_ue8m0_dispatch = True
+        else:
+            logger.warning_once(
+                "DeepEPLLPrepareAndFinalize is setup to dispatch raw/unquantized "
+                f"activations despite ({fused_experts.__class__.__name__}) being able "
+                "to support quantized activations.",
+                scope="local",
+            )
+
     def num_dispatchers(self) -> int:
         return self.num_dispatchers_
 
@@ -206,6 +232,9 @@ def prepare_async(
             self.max_tokens_per_rank,
             num_experts,
             use_fp8=self.use_fp8_dispatch,
+            # round_scale needs to be set to dispatch in ue8m0
+            round_scale=self.use_ue8m0_dispatch,
+            use_ue8m0=self.use_ue8m0_dispatch,
             async_finish=False,
             return_recv_hook=True,
         )
diff --git a/vllm/model_executor/layers/fused_moe/modular_kernel.py b/vllm/model_executor/layers/fused_moe/modular_kernel.py
index b5fa2c71bec5..a3142f37053f 100644
--- a/vllm/model_executor/layers/fused_moe/modular_kernel.py
+++ b/vllm/model_executor/layers/fused_moe/modular_kernel.py
@@ -149,6 +149,15 @@ class FusedMoEPrepareAndFinalize(ABC):
     described above.
     """
 
+    def post_init_setup(self, fused_experts: "FusedMoEPermuteExpertsUnpermute"):
+        """
+        Initialize FusedMoEPrepareAndFinalize settings that depend on
+        FusedMoEPermuteExpertsUnpermute experts object.
+        The FusedMoEPrepareAndFinalize implementations that have such
+        dependencies may choose to override this function.
+        """
+        return
+
     @abstractmethod
     def prepare(
         self,
@@ -503,6 +512,13 @@ def supports_expert_map(self) -> bool:
         """
         raise NotImplementedError
 
+    def supports_packed_ue8m0_act_scales(self) -> bool:
+        """
+        A flag indicating whether or not this class can process packed ue8m0
+        activation scales.
+        """
+        return False
+
     def workspace_dtype(self, act_dtype: torch.dtype) -> torch.dtype:
         """
         Workspace type: The dtype to use for the workspace tensors.
@@ -698,6 +714,8 @@ def __init__(
         self.prepare_finalize = prepare_finalize
         self.fused_experts = fused_experts
         self.shared_experts = shared_experts
+
+        self._post_init_setup()
         assert (
             prepare_finalize.activation_format == fused_experts.activation_formats[0]
         ), (
@@ -707,6 +725,13 @@ def __init__(
             f"{fused_experts.activation_formats[0]}"
         )
 
+    def _post_init_setup(self):
+        """
+        Resolve any leftover setup dependencies between self.prepare_finalize
+        and self.fused_experts here.
+        """
+        self.prepare_finalize.post_init_setup(self.fused_experts)
+
     def supports_expert_map(self) -> bool:
         """
         A flag indicating whether or not this class supports expert maps.
diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index cb065eb68b66..bbd0a4df1048 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -60,11 +60,10 @@
     create_fp8_input_scale,
     create_fp8_scale_parameter,
     create_fp8_weight_parameter,
-    expert_weight_is_col_major,
+    deepgemm_post_process_fp8_weight_block,
     maybe_post_process_fp8_weight_block,
     process_fp8_weight_block_strategy,
     process_fp8_weight_tensor_strategy,
-    requant_weight_ue8m0_inplace,
     validate_fp8_block_shape,
 )
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp8 import (
@@ -94,7 +93,6 @@
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 from vllm.utils.deep_gemm import (
-    get_col_major_tma_aligned_tensor,
     is_deep_gemm_e8m0_used,
     is_deep_gemm_supported,
 )
@@ -846,15 +844,31 @@ def process_weights_after_loading(self, layer: Module) -> None:
 
             # DeepGemm scales need to be transposed and aligned. We try to do
             # it ahead of time for performance reasons.
-            if self.allow_deep_gemm and not is_deep_gemm_e8m0_used():
-                if expert_weight_is_col_major(layer.w13_weight_scale_inv):
-                    layer.w13_weight_scale_inv = get_col_major_tma_aligned_tensor(
-                        layer.w13_weight_scale_inv
+            if self.allow_deep_gemm:
+                dg_w13_weight, dg_w13_weight_scale_inv = (
+                    deepgemm_post_process_fp8_weight_block(
+                        wq=layer.w13_weight.data,
+                        ws=layer.w13_weight_scale_inv.data,
+                        quant_block_shape=tuple(layer.weight_block_size),
+                        use_e8m0=is_deep_gemm_e8m0_used(),
                     )
-                if expert_weight_is_col_major(layer.w2_weight_scale_inv):
-                    layer.w2_weight_scale_inv = get_col_major_tma_aligned_tensor(
-                        layer.w2_weight_scale_inv
+                )
+                dg_w2_weight, dg_w2_weight_scale_inv = (
+                    deepgemm_post_process_fp8_weight_block(
+                        wq=layer.w2_weight.data,
+                        ws=layer.w2_weight_scale_inv.data,
+                        quant_block_shape=tuple(layer.weight_block_size),
+                        use_e8m0=is_deep_gemm_e8m0_used(),
                     )
+                )
+                layer.w13_weight = Parameter(dg_w13_weight, requires_grad=False)
+                layer.w13_weight_scale_inv = Parameter(
+                    dg_w13_weight_scale_inv, requires_grad=False
+                )
+                layer.w2_weight = Parameter(dg_w2_weight, requires_grad=False)
+                layer.w2_weight_scale_inv = Parameter(
+                    dg_w2_weight_scale_inv, requires_grad=False
+                )
 
         # If checkpoint is fp16, quantize in place.
         elif not self.quant_config.is_checkpoint_fp8_serialized:
@@ -990,31 +1004,6 @@ def process_weights_after_loading(self, layer: Module) -> None:
             del layer.w13_input_scale
             del layer.w2_input_scale
 
-        if is_deep_gemm_e8m0_used() and self.block_quant:
-            assert layer.weight_block_size is not None
-            # Re-quantise the expert weights so their scales are UE8M0.
-            block_sz = tuple(layer.weight_block_size)
-            requant_weight_ue8m0_inplace(
-                layer.w13_weight.data,
-                layer.w13_weight_scale_inv.data,
-                block_sz,
-            )
-            requant_weight_ue8m0_inplace(
-                layer.w2_weight.data,
-                layer.w2_weight_scale_inv.data,
-                block_sz,
-            )
-
-            # Ensure column-major TMA alignment expected by DeepGEMM.
-            if expert_weight_is_col_major(layer.w13_weight_scale_inv):
-                layer.w13_weight_scale_inv = get_col_major_tma_aligned_tensor(
-                    layer.w13_weight_scale_inv
-                )
-            if expert_weight_is_col_major(layer.w2_weight_scale_inv):
-                layer.w2_weight_scale_inv = get_col_major_tma_aligned_tensor(
-                    layer.w2_weight_scale_inv
-                )
-
     def maybe_make_prepare_finalize(self) -> mk.FusedMoEPrepareAndFinalize | None:
         if (
             self.rocm_aiter_moe_enabled
@@ -1037,7 +1026,8 @@ def select_gemm_impl(
         layer: torch.nn.Module,
     ) -> FusedMoEPermuteExpertsUnpermute:
         from vllm.model_executor.layers.fused_moe import (
-            BatchedTritonOrDeepGemmExperts,
+            BatchedDeepGemmExperts,
+            BatchedTritonExperts,
             TritonOrDeepGemmExperts,
         )
 
@@ -1053,20 +1043,24 @@ def select_gemm_impl(
         ):
             max_num_tokens_per_rank = prepare_finalize.max_num_tokens_per_rank()
             assert max_num_tokens_per_rank is not None
+
+            experts_impl = (
+                BatchedDeepGemmExperts if self.allow_deep_gemm else BatchedTritonExperts
+            )
             logger.debug(
-                "BatchedTritonOrDeepGemmExperts(%s): "
-                "max_tokens_per_rank=%s, block_size=%s, per_act_token=%s",
+                "%s(%s): max_tokens_per_rank=%s, block_size=%s, per_act_token=%s",
+                experts_impl.__name__,
                 self.__class__.__name__,
                 max_num_tokens_per_rank,
                 self.weight_block_size,
                 False,
             )
-            return BatchedTritonOrDeepGemmExperts(
+            return experts_impl(
                 max_num_tokens=max_num_tokens_per_rank,
                 num_dispatchers=prepare_finalize.num_dispatchers(),
                 quant_config=self.moe_quant_config,
-                allow_deep_gemm=self.allow_deep_gemm,
             )
+
         elif self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS:
             experts = select_cutlass_fp8_gemm_impl(
                 self.moe,
diff --git a/vllm/model_executor/layers/quantization/utils/fp8_utils.py b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
index 4384857f9270..03d086bda8e3 100644
--- a/vllm/model_executor/layers/quantization/utils/fp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
@@ -34,6 +34,7 @@
     is_deep_gemm_e8m0_used,
     is_deep_gemm_supported,
     should_use_deepgemm_for_fp8_linear,
+    transform_sf_into_required_layout,
 )
 from vllm.utils.torch_utils import direct_register_custom_op
 
@@ -929,6 +930,50 @@ def requant_weight_ue8m0_inplace(
         s_old.copy_(s_requant)
 
 
+def deepgemm_post_process_fp8_weight_block(
+    wq: torch.Tensor, ws: torch.Tensor, quant_block_shape: tuple[int], use_e8m0: bool
+) -> tuple[torch.Tensor, torch.Tensor]:
+    assert wq.dtype == torch.float8_e4m3fn, (
+        "Expected quantized tensor dtype "
+        f"to be torch.float8_e4m3fn, got {wq.dtype} instead."
+    )
+    assert ws.dtype == torch.float32, (
+        f"Expected tensor scales dtype to be torch.float32, got {ws.dtype} instead"
+    )
+
+    if use_e8m0:
+        requant_weight_ue8m0_inplace(wq, ws, block_size=quant_block_shape)
+
+    original_ndim = wq.ndim
+    if wq.ndim == 2:
+        assert ws.ndim == 2
+        wq = wq.unsqueeze(0)
+        ws = ws.unsqueeze(0)
+
+    # From https://github.com/deepseek-ai/DeepGEMM/blob/c9f8b34dcdacc20aa746b786f983492c51072870/csrc/utils/layout.hpp#L46
+    recipe = (1, 128, 128)
+
+    # Ref : https://github.com/deepseek-ai/DeepGEMM/blob/c9f8b34dcdacc20aa746b786f983492c51072870/csrc/apis/gemm.hpp
+    # DeepGemm uses the `transform_sf_into_required_layout` function to
+    # represent scales in the correct format.
+    dg_ws = transform_sf_into_required_layout(
+        sf=ws,
+        mn=wq.size(1),
+        k=wq.size(2),
+        recipe=recipe,
+        num_groups=wq.size(0),
+        # is the scale factors for A in (Refers to the argument A in A @ B).
+        # Weights are B.
+        is_sfa=False,
+    )
+
+    if original_ndim == 2:
+        wq = wq.squeeze(0)
+        dg_ws = dg_ws.squeeze(0)
+
+    return wq, dg_ws
+
+
 def _maybe_pad_fp8_weight(weight: torch.Tensor) -> torch.Tensor:
     """Pad the weight tensor. This is an optimization on ROCm platform, which
     can benefit from tensors located far enough from one another in memory"""
@@ -1141,11 +1186,15 @@ def maybe_post_process_fp8_weight_block(layer: torch.nn.Module):
     should_use_deepgemm = should_use_deepgemm_for_fp8_linear(
         layer.orig_dtype, layer.weight
     )
-    if is_deep_gemm_e8m0_used() and should_use_deepgemm:
-        block_sz = tuple(layer.weight_block_size)
-        requant_weight_ue8m0_inplace(
-            layer.weight.data, layer.weight_scale.data, block_sz
+    if should_use_deepgemm:
+        dg_weight, dg_weight_scale = deepgemm_post_process_fp8_weight_block(
+            wq=layer.weight.data,
+            ws=layer.weight_scale.data,
+            quant_block_shape=tuple(layer.weight_block_size),
+            use_e8m0=is_deep_gemm_e8m0_used(),
         )
+        layer.weight = torch.nn.Parameter(dg_weight, requires_grad=False)
+        layer.weight_scale = torch.nn.Parameter(dg_weight_scale, requires_grad=False)
 
 
 def expert_weight_is_col_major(x: torch.Tensor) -> bool:
diff --git a/vllm/utils/deep_gemm.py b/vllm/utils/deep_gemm.py
index a928cce09011..4c15baf7a8f9 100644
--- a/vllm/utils/deep_gemm.py
+++ b/vllm/utils/deep_gemm.py
@@ -49,10 +49,6 @@ def is_deep_gemm_e8m0_used() -> bool:
         logger.info_once("DeepGEMM E8M0 disabled: _fp8_gemm_nt_impl not found")
         return False
 
-    if envs.VLLM_USE_FLASHINFER_MOE_FP8:
-        logger.info_once("DeepGEMM E8M0 disabled: FlashInfer MOE is enabled.")
-        return False
-
     if envs.VLLM_USE_DEEP_GEMM_E8M0:
         logger.info_once("DeepGEMM E8M0 enabled on current platform.")
         return True
@@ -77,6 +73,7 @@ def _missing(*_: Any, **__: Any) -> NoReturn:
 _get_paged_mqa_logits_metadata_impl: Callable[..., Any] | None = None
 _get_mn_major_tma_aligned_tensor_impl: Callable[..., Any] | None = None
 _get_mk_alignment_for_contiguous_layout_impl: Callable[..., Any] | None = None
+_transform_sf_into_required_layout_impl: Callable[..., Any] | None = None
 
 
 def _lazy_init() -> None:
@@ -86,6 +83,7 @@ def _lazy_init() -> None:
     global _get_paged_mqa_logits_metadata_impl
     global _get_mn_major_tma_aligned_tensor_impl
     global _get_mk_alignment_for_contiguous_layout_impl
+    global _transform_sf_into_required_layout_impl
     # fast path
     if (
         _fp8_gemm_nt_impl is not None
@@ -95,6 +93,7 @@ def _lazy_init() -> None:
         or _fp8_paged_mqa_logits_impl is not None
         or _get_paged_mqa_logits_metadata_impl is not None
         or _get_mk_alignment_for_contiguous_layout_impl is not None
+        or _transform_sf_into_required_layout_impl is not None
     ):
         return
 
@@ -124,6 +123,9 @@ def _lazy_init() -> None:
     _get_mk_alignment_for_contiguous_layout_impl = getattr(
         _dg, "get_mk_alignment_for_contiguous_layout", None
     )
+    _transform_sf_into_required_layout_impl = getattr(
+        _dg, "transform_sf_into_required_layout", None
+    )
 
 
 def get_num_sms() -> int:
@@ -179,6 +181,15 @@ def fp8_m_grouped_gemm_nt_masked(*args, **kwargs):
     )
 
 
+def transform_sf_into_required_layout(*args, **kwargs):
+    _lazy_init()
+    if _transform_sf_into_required_layout_impl is None:
+        return _missing(*args, **kwargs)
+    return _transform_sf_into_required_layout_impl(
+        *args, disable_ue8m0_cast=not is_deep_gemm_e8m0_used(), **kwargs
+    )
+
+
 def fp8_mqa_logits(
     q: torch.Tensor,
     kv: tuple[torch.Tensor, torch.Tensor],

From d8140b98337a253f73dedd58c7d1e9b8832a9e3f Mon Sep 17 00:00:00 2001
From: vllmellm <vllm.ellm@embeddedllm.com>
Date: Thu, 13 Nov 2025 05:46:57 +0800
Subject: [PATCH 119/183] [ROCM] Fix ROCm warnings, environment flag access,
 and GEMM kernel naming for consistency in `_aiter_ops.py` (#28464)

Signed-off-by: vllmellm <vllm.ellm@embeddedllm.com>
---
 vllm/_aiter_ops.py                            | 49 ++++++++++---------
 .../quantization/kernels/scaled_mm/aiter.py   |  2 +-
 .../layers/quantization/utils/fp8_utils.py    |  2 +-
 vllm/model_executor/layers/utils.py           |  4 +-
 vllm/platforms/rocm.py                        |  5 +-
 5 files changed, 33 insertions(+), 29 deletions(-)

diff --git a/vllm/_aiter_ops.py b/vllm/_aiter_ops.py
index 8d35aa65738b..5508e59bcd2f 100644
--- a/vllm/_aiter_ops.py
+++ b/vllm/_aiter_ops.py
@@ -32,13 +32,13 @@ def if_aiter_supported(func: Callable) -> Callable:
     def wrapper(*args, **kwargs):
         # checks the platform, device arch and aiter library existance.
 
-        from vllm.platforms.rocm import on_gfx9
+        if current_platform.is_rocm() and IS_AITER_FOUND:
+            from vllm.platforms.rocm import on_gfx9
 
-        if current_platform.is_rocm() and on_gfx9() and IS_AITER_FOUND:
-            return func(*args, **kwargs)
-        else:
-            # Return None or do nothing if not supported
-            return None
+            if on_gfx9():
+                return func(*args, **kwargs)
+
+        return None
 
     return wrapper
 
@@ -296,7 +296,7 @@ def _rocm_aiter_mla_decode_fwd_fake(
     pass
 
 
-def _rocm_aiter_gemm_w8a8_impl(
+def _rocm_aiter_gemm_a8w8_impl(
     A: torch.Tensor,
     B: torch.Tensor,
     As: torch.Tensor,
@@ -313,7 +313,7 @@ def _rocm_aiter_gemm_w8a8_impl(
     return gemm_a8w8_CK(A, B, As, Bs, bias, output_dtype)
 
 
-def _rocm_aiter_gemm_w8a8_fake(
+def _rocm_aiter_gemm_a8w8_fake(
     A: torch.Tensor,
     B: torch.Tensor,
     As: torch.Tensor,
@@ -327,7 +327,7 @@ def _rocm_aiter_gemm_w8a8_fake(
     return Y
 
 
-def _rocm_aiter_gemm_w8a8_blockscale_impl(
+def _rocm_aiter_gemm_a8w8_blockscale_impl(
     A: torch.Tensor,
     B: torch.Tensor,
     As: torch.Tensor,
@@ -339,7 +339,7 @@ def _rocm_aiter_gemm_w8a8_blockscale_impl(
     return gemm_a8w8_blockscale(A, B, As, Bs, dtype=output_dtype)
 
 
-def _rocm_aiter_gemm_w8a8_blockscale_fake(
+def _rocm_aiter_gemm_a8w8_blockscale_fake(
     A: torch.Tensor,
     B: torch.Tensor,
     As: torch.Tensor,
@@ -419,6 +419,7 @@ class rocm_aiter_ops:
     _FP4_GEMM_DYNAMIC_QUANT_ASM = envs.VLLM_ROCM_USE_AITER_FP4_ASM_GEMM
     _TRITON_ROTARY_EMBED = envs.VLLM_ROCM_USE_AITER_TRITON_ROPE
     _MOE_SHARED_EXPERTS_ENABLED = envs.VLLM_ROCM_USE_AITER_FUSION_SHARED_EXPERTS
+    _TRITON_UNQUANT_GEMM = envs.VLLM_ROCM_USE_AITER_TRITON_GEMM
 
     @classmethod
     @if_aiter_supported
@@ -494,6 +495,11 @@ def is_asm_fp4_gemm_dynamic_quant_enabled(cls) -> bool:
     def is_triton_rotary_embed_enabled(cls) -> bool:
         return cls._AITER_ENABLED and cls._TRITON_ROTARY_EMBED
 
+    @classmethod
+    @if_aiter_supported
+    def is_triton_gemm_enabled(cls) -> bool:
+        return cls._AITER_ENABLED and cls._TRITON_UNQUANT_GEMM
+
     @staticmethod
     @if_aiter_supported
     def register_ops_once() -> None:
@@ -555,18 +561,18 @@ def register_ops_once() -> None:
             )
 
             direct_register_custom_op(
-                op_name="rocm_aiter_gemm_w8a8",
-                op_func=_rocm_aiter_gemm_w8a8_impl,
+                op_name="rocm_aiter_gemm_a8w8",
+                op_func=_rocm_aiter_gemm_a8w8_impl,
                 mutates_args=[],
-                fake_impl=_rocm_aiter_gemm_w8a8_fake,
+                fake_impl=_rocm_aiter_gemm_a8w8_fake,
                 dispatch_key=current_platform.dispatch_key,
             )
 
             direct_register_custom_op(
-                op_name="rocm_aiter_gemm_w8a8_blockscale",
-                op_func=_rocm_aiter_gemm_w8a8_blockscale_impl,
+                op_name="rocm_aiter_gemm_a8w8_blockscale",
+                op_func=_rocm_aiter_gemm_a8w8_blockscale_impl,
                 mutates_args=[],
-                fake_impl=_rocm_aiter_gemm_w8a8_blockscale_fake,
+                fake_impl=_rocm_aiter_gemm_a8w8_blockscale_fake,
                 dispatch_key=current_platform.dispatch_key,
             )
 
@@ -606,7 +612,7 @@ def rms_norm(
         return torch.ops.vllm.rocm_aiter_rms_norm(x, weight, variance_epsilon)
 
     @staticmethod
-    def gemm_w8a8(
+    def gemm_a8w8(
         A: torch.Tensor,
         B: torch.Tensor,
         As: torch.Tensor,
@@ -614,10 +620,10 @@ def gemm_w8a8(
         bias: torch.Tensor | None = None,
         output_dtype: torch.dtype = torch.float16,
     ) -> torch.Tensor:
-        return torch.ops.vllm.rocm_aiter_gemm_w8a8(A, B, As, Bs, bias, output_dtype)
+        return torch.ops.vllm.rocm_aiter_gemm_a8w8(A, B, As, Bs, bias, output_dtype)
 
     @staticmethod
-    def gemm_w8a8_blockscale(
+    def gemm_a8w8_blockscale(
         A: torch.Tensor,
         B: torch.Tensor,
         As: torch.Tensor,
@@ -625,7 +631,7 @@ def gemm_w8a8_blockscale(
         block_size: list[int],
         output_dtype: torch.dtype = torch.float16,
     ) -> torch.Tensor:
-        return torch.ops.vllm.rocm_aiter_gemm_w8a8_blockscale(
+        return torch.ops.vllm.rocm_aiter_gemm_a8w8_blockscale(
             A, B, As, Bs, output_dtype
         )
 
@@ -938,5 +944,4 @@ def shuffle_weights(
         return tuple(shuffle_weight(tensor, layout=layout) for tensor in tensors)
 
 
-if IS_AITER_FOUND:
-    rocm_aiter_ops.register_ops_once()
+rocm_aiter_ops.register_ops_once()
diff --git a/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py b/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py
index f5cd91469b78..038a92c516ce 100644
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py
@@ -117,4 +117,4 @@ def apply_weights(
         # a to be [M, K]
         # b to be [N, K]
         # CutlassScaledMMLinearKernel prepare weight `w_q` in [K, N] format
-        return rocm_aiter_ops.gemm_w8a8(x_q, w_q.t(), x_s, w_s, bias, out_dtype)
+        return rocm_aiter_ops.gemm_a8w8(x_q, w_q.t(), x_s, w_s, bias, out_dtype)
diff --git a/vllm/model_executor/layers/quantization/utils/fp8_utils.py b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
index 03d086bda8e3..541c6c631053 100644
--- a/vllm/model_executor/layers/quantization/utils/fp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
@@ -328,7 +328,7 @@ def _run_aiter(
         if use_triton:
             gemm_a8w8_blockscale_op = rocm_aiter_ops.triton_gemm_a8w8_blockscale
         else:
-            gemm_a8w8_blockscale_op = rocm_aiter_ops.gemm_w8a8_blockscale
+            gemm_a8w8_blockscale_op = rocm_aiter_ops.gemm_a8w8_blockscale
 
         if input_scale is not None:
             q_input = input_2d
diff --git a/vllm/model_executor/layers/utils.py b/vllm/model_executor/layers/utils.py
index b17bdd0b7207..68262a2703f9 100644
--- a/vllm/model_executor/layers/utils.py
+++ b/vllm/model_executor/layers/utils.py
@@ -8,6 +8,7 @@
 
 from vllm import _custom_ops as ops
 from vllm import envs
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.logger import init_logger
 from vllm.platforms import CpuArchEnum, current_platform
 from vllm.utils.torch_utils import direct_register_custom_op
@@ -105,8 +106,7 @@ def default_unquantized_gemm(
 
 def use_aiter_triton_gemm(n, m, k, dtype):
     if (
-        envs.VLLM_ROCM_USE_AITER == 0
-        or envs.VLLM_ROCM_USE_AITER_TRITON_GEMM == 0
+        not rocm_aiter_ops.is_triton_gemm_enabled()
         # MI300's - fp8nuz=True
         or current_platform.is_fp8_fnuz()
         or dtype not in [torch.float16, torch.bfloat16]
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index 5fa8969b860e..d977d999de67 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -325,6 +325,7 @@ def get_device_total_memory(cls, device_id: int = 0) -> int:
 
     @classmethod
     def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
+        from vllm._aiter_ops import rocm_aiter_ops
         from vllm.config.compilation import CUDAGraphMode
 
         cache_config = vllm_config.cache_config
@@ -332,9 +333,7 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         parallel_config = vllm_config.parallel_config
         is_eager_execution = compilation_config == CUDAGraphMode.NONE
 
-        use_aiter_rms_norm = (
-            envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_RMSNORM
-        )
+        use_aiter_rms_norm = rocm_aiter_ops.is_rmsnorm_enabled()
 
         if cache_config and cache_config.block_size is None:
             cache_config.block_size = 16

From 3eb0c2673e128714073f7e3fd105cf962a4c8c16 Mon Sep 17 00:00:00 2001
From: QiliangCui <derrhein@gmail.com>
Date: Wed, 12 Nov 2025 14:31:14 -0800
Subject: [PATCH 120/183] [TPU] Support GCS path in VLLM_TORCH_PROFILER_DIR
 (#28487)

Signed-off-by: Qiliang Cui <derrhein@gmail.com>
---
 vllm/envs.py | 8 +++++---
 1 file changed, 5 insertions(+), 3 deletions(-)

diff --git a/vllm/envs.py b/vllm/envs.py
index b99e2524318f..8e2f872c069c 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -824,9 +824,11 @@ def get_vllm_port() -> int | None:
     # Note that it must be an absolute path.
     "VLLM_TORCH_PROFILER_DIR": lambda: (
         None
-        if os.getenv("VLLM_TORCH_PROFILER_DIR", None) is None
-        else os.path.abspath(
-            os.path.expanduser(os.getenv("VLLM_TORCH_PROFILER_DIR", "."))
+        if (val := os.getenv("VLLM_TORCH_PROFILER_DIR")) is None
+        else (
+            val
+            if val.startswith("gs://") and val[5:] and val[5] != "/"
+            else os.path.abspath(os.path.expanduser(val))
         )
     ),
     # Enable torch profiler to record shapes if set

From 10f01d5a3a5c1570e36e15cd57eb3cc1534483d6 Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Wed, 12 Nov 2025 18:14:13 -0500
Subject: [PATCH 121/183] [Bugfix] Adjust Marlin CUDA arch selection to
 8.0+PTX;9.0+PTX (#28294)

---
 CMakeLists.txt | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 5cddf81a4b4a..ad63649d4b16 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -331,7 +331,7 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
   # Keep building Marlin for 9.0 as there are some group sizes and shapes that
   # are not supported by Machete yet.
   # 9.0 for latest bf16 atomicAdd PTX
-  cuda_archs_loose_intersection(MARLIN_ARCHS "8.0;8.7;9.0+PTX" "${CUDA_ARCHS}")
+  cuda_archs_loose_intersection(MARLIN_ARCHS "8.0+PTX;9.0+PTX" "${CUDA_ARCHS}")
   if (MARLIN_ARCHS)
 
     #
@@ -915,7 +915,7 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
 
   list(APPEND VLLM_MOE_EXT_SRC "${VLLM_MOE_WNA16_SRC}")
   # 9.0 for latest bf16 atomicAdd PTX
-  cuda_archs_loose_intersection(MARLIN_MOE_ARCHS "8.0;8.7;9.0+PTX" "${CUDA_ARCHS}")
+  cuda_archs_loose_intersection(MARLIN_MOE_ARCHS "8.0+PTX;9.0+PTX" "${CUDA_ARCHS}")
   if (MARLIN_MOE_ARCHS)
 
     #

From 4ca5cd5740c0cd7788cdfa8b7ec6a27335607a48 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E2=84=8D=F0=9D=95=A0=F0=9D=95=9D=F0=9D=95=9D=F0=9D=95=A0?=
 =?UTF-8?q?=F0=9D=95=A8=20=F0=9D=95=84=F0=9D=95=92=F0=9D=95=9F?=
 <hollowman@opensuse.org>
Date: Thu, 13 Nov 2025 01:24:12 +0200
Subject: [PATCH 122/183] [Core][AMD] Migrate fully transparent sleep mode to
 ROCm platform (#12695)

Signed-off-by: Hollow Man <hollowman@opensuse.org>
Signed-off-by: tjtanaa <tunjian.tan@embeddedllm.com>
Co-authored-by: tjtanaa <tunjian.tan@embeddedllm.com>
Co-authored-by: kliuae <kuanfu.liu@embeddedllm.com>
---
 CMakeLists.txt                                |  30 +-
 csrc/cumem_allocator.cpp                      | 409 +++++++++++++++++-
 csrc/cumem_allocator_compat.h                 | 109 +++++
 docs/features/sleep_mode.md                   |   6 +-
 setup.py                                      |   4 +-
 tests/basic_correctness/test_cumem.py         |   9 +-
 vllm/config/model.py                          |   3 +-
 vllm/device_allocator/cumem.py                |   2 +-
 .../device_communicators/cuda_wrapper.py      |  30 +-
 vllm/envs.py                                  |   5 +
 vllm/platforms/interface.py                   |   6 +-
 11 files changed, 582 insertions(+), 31 deletions(-)
 create mode 100644 csrc/cumem_allocator_compat.h

diff --git a/CMakeLists.txt b/CMakeLists.txt
index ad63649d4b16..dcc44be87e55 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -39,6 +39,13 @@ set(PYTHON_SUPPORTED_VERSIONS "3.10" "3.11" "3.12" "3.13")
 # Supported AMD GPU architectures.
 set(HIP_SUPPORTED_ARCHS "gfx906;gfx908;gfx90a;gfx942;gfx950;gfx1030;gfx1100;gfx1101;gfx1200;gfx1201;gfx1150;gfx1151")
 
+# ROCm installation prefix. Default to /opt/rocm but allow override via
+# -DROCM_PATH=/your/rocm/path when invoking cmake.
+if(NOT DEFINED ROCM_PATH)
+  set(ROCM_PATH "/opt/rocm" CACHE PATH "ROCm installation prefix")
+else()
+  set(ROCM_PATH ${ROCM_PATH} CACHE PATH "ROCm installation prefix" FORCE)
+endif()
 #
 # Supported/expected torch versions for CUDA/ROCm.
 #
@@ -237,10 +244,27 @@ set_gencode_flags_for_srcs(
   SRCS "${VLLM_CUMEM_EXT_SRC}"
   CUDA_ARCHS "${CUDA_ARCHS}")
 
-if(VLLM_GPU_LANG STREQUAL "CUDA")
+if(VLLM_GPU_LANG STREQUAL "CUDA" OR VLLM_GPU_LANG STREQUAL "HIP")
   message(STATUS "Enabling cumem allocator extension.")
-  # link against cuda driver library
-  list(APPEND CUMEM_LIBS CUDA::cuda_driver)
+  if(VLLM_GPU_LANG STREQUAL "CUDA")
+    # link against cuda driver library
+    list(APPEND CUMEM_LIBS CUDA::cuda_driver)
+  else()
+    # link against rocm driver library. Prefer an absolute path to
+    # libamdhip64.so inside ${ROCM_PATH}/lib if available, otherwise fall
+    # back to linking by name "amdhip64".
+    find_library(AMDHIP64_LIB
+      NAMES amdhip64 libamdhip64.so
+      PATHS ${ROCM_PATH}/lib
+      NO_DEFAULT_PATH)
+    if(AMDHIP64_LIB)
+      message(STATUS "Found libamdhip64 at ${AMDHIP64_LIB}")
+      list(APPEND CUMEM_LIBS ${AMDHIP64_LIB})
+    else()
+      message(WARNING "libamdhip64 not found in ${ROCM_PATH}/lib; falling back to linking 'amdhip64' by name")
+      list(APPEND CUMEM_LIBS amdhip64)
+    endif()
+  endif()
   define_extension_target(
     cumem_allocator
     DESTINATION vllm
diff --git a/csrc/cumem_allocator.cpp b/csrc/cumem_allocator.cpp
index fab6ca36d422..78dc840a98b6 100644
--- a/csrc/cumem_allocator.cpp
+++ b/csrc/cumem_allocator.cpp
@@ -3,14 +3,58 @@
 // need to be unsigned long long
 #include <iostream>
 
+#include "cumem_allocator_compat.h"
+
+#ifndef USE_ROCM
+static const char* PYARGS_PARSE = "KKKK";
+#else
+  #include <cstdlib>
+  #include <cerrno>
+  #include <climits>
+
+// Default chunk size 256MB for ROCm. Can be overridden at runtime by the
+// environment variable VLLM_ROCM_SLEEP_MEM_CHUNK_SIZE, specified in megabytes
+// (MB). The env value is parsed with strtoull as an integer number of MB
+// (decimal or 0x hex). The parsed MB value is converted to bytes. If
+// parsing fails, the value is 0, or the multiplication would overflow,
+// the default (256MB) is used.
+static const unsigned long long DEFAULT_MEMCREATE_CHUNK_SIZE =
+    (256ULL * 1024ULL * 1024ULL);
+
+static unsigned long long get_memcreate_chunk_size() {
+  const char* env = getenv("VLLM_ROCM_SLEEP_MEM_CHUNK_SIZE");
+  if (!env) return DEFAULT_MEMCREATE_CHUNK_SIZE;
+  char* endptr = nullptr;
+  errno = 0;
+  unsigned long long val_mb = strtoull(env, &endptr, 0);
+  if (endptr == env || errno != 0) {
+    // parsing failed, fallback to default
+    return DEFAULT_MEMCREATE_CHUNK_SIZE;
+  }
+  if (val_mb == 0) return DEFAULT_MEMCREATE_CHUNK_SIZE;
+
+  const unsigned long long MB = 1024ULL * 1024ULL;
+  // guard against overflow when converting MB -> bytes
+  if (val_mb > (ULLONG_MAX / MB)) {
+    return DEFAULT_MEMCREATE_CHUNK_SIZE;
+  }
+  return val_mb * MB;
+}
+
+static inline unsigned long long my_min(unsigned long long a,
+                                        unsigned long long b) {
+  return a < b ? a : b;
+}
+
+static const char* PYARGS_PARSE = "KKKO";
+#endif
+
 extern "C" {
 
 #define PY_SSIZE_T_CLEAN
 #include <Python.h>
 
 #include <sys/types.h>
-#include <cuda_runtime_api.h>
-#include <cuda.h>
 
 char error_msg[10240];  // 10KB buffer to store error messages
 CUresult no_error = CUresult(0);
@@ -49,7 +93,12 @@ void ensure_context(unsigned long long device) {
 }
 
 void create_and_map(unsigned long long device, ssize_t size, CUdeviceptr d_mem,
+#ifndef USE_ROCM
                     CUmemGenericAllocationHandle* p_memHandle) {
+#else
+                    CUmemGenericAllocationHandle** p_memHandle,
+                    unsigned long long* chunk_sizes, size_t num_chunks) {
+#endif
   ensure_context(device);
   // Define memory allocation properties
   CUmemAllocationProp prop = {};
@@ -58,6 +107,7 @@ void create_and_map(unsigned long long device, ssize_t size, CUdeviceptr d_mem,
   prop.location.id = device;
   prop.allocFlags.compressionType = CU_MEM_ALLOCATION_COMP_NONE;
 
+#ifndef USE_ROCM
   // Allocate memory using cuMemCreate
   CUDA_CHECK(cuMemCreate(p_memHandle, size, &prop, 0));
   if (error_code != 0) {
@@ -67,6 +117,39 @@ void create_and_map(unsigned long long device, ssize_t size, CUdeviceptr d_mem,
   if (error_code != 0) {
     return;
   }
+#else
+  for (auto i = 0; i < num_chunks; ++i) {
+    CUDA_CHECK(cuMemCreate(p_memHandle[i], chunk_sizes[i], &prop, 0));
+    if (error_code != 0) {
+      // Clean up previously created handles
+      for (auto j = 0; j < i; ++j) {
+        cuMemRelease(*(p_memHandle[j]));
+      }
+      return;
+    }
+  }
+  unsigned long long allocated_size = 0;
+  for (auto i = 0; i < num_chunks; ++i) {
+    void* map_addr = (void*)((uintptr_t)d_mem + allocated_size);
+    CUDA_CHECK(cuMemMap(map_addr, chunk_sizes[i], 0, *(p_memHandle[i]), 0));
+    if (error_code != 0) {
+      // unmap previously mapped chunks
+      unsigned long long unmapped_size = 0;
+      for (auto j = 0; j < i; ++j) {
+        void* unmap_addr = (void*)((uintptr_t)d_mem + unmapped_size);
+        cuMemUnmap(unmap_addr, chunk_sizes[j]);
+        unmapped_size += chunk_sizes[j];
+      }
+      // release all created handles
+      for (auto j = 0; j < num_chunks; ++j) {
+        cuMemRelease(*(p_memHandle[j]));
+      }
+      return;
+    }
+    allocated_size += chunk_sizes[i];
+  }
+#endif
+
   CUmemAccessDesc accessDesc = {};
   accessDesc.location.type = CU_MEM_LOCATION_TYPE_DEVICE;
   accessDesc.location.id = device;
@@ -82,10 +165,16 @@ void create_and_map(unsigned long long device, ssize_t size, CUdeviceptr d_mem,
 
 void unmap_and_release(unsigned long long device, ssize_t size,
                        CUdeviceptr d_mem,
+#ifndef USE_ROCM
                        CUmemGenericAllocationHandle* p_memHandle) {
+#else
+                       CUmemGenericAllocationHandle** p_memHandle,
+                       unsigned long long* chunk_sizes, size_t num_chunks) {
+#endif
   // std::cout << "unmap_and_release: device=" << device << ", size=" << size <<
   // ", d_mem=" << d_mem << ", p_memHandle=" << p_memHandle << std::endl;
   ensure_context(device);
+#ifndef USE_ROCM
   CUDA_CHECK(cuMemUnmap(d_mem, size));
   if (error_code != 0) {
     return;
@@ -94,6 +183,30 @@ void unmap_and_release(unsigned long long device, ssize_t size,
   if (error_code != 0) {
     return;
   }
+#else
+  unsigned long long allocated_size = 0;
+  CUresult first_error = no_error;
+
+  for (auto i = 0; i < num_chunks; ++i) {
+    void* map_addr = (void*)((uintptr_t)d_mem + allocated_size);
+    CUresult status = cuMemUnmap(map_addr, chunk_sizes[i]);
+    if (status != no_error && first_error == no_error) {
+      first_error = status;
+    }
+    allocated_size += chunk_sizes[i];
+  }
+
+  for (auto i = 0; i < num_chunks; ++i) {
+    CUresult status = cuMemRelease(*(p_memHandle[i]));
+    if (status != no_error && first_error == no_error) {
+      first_error = status;
+    }
+  }
+
+  if (first_error != no_error) {
+    CUDA_CHECK(first_error);
+  }
+#endif
 }
 
 PyObject* create_tuple_from_c_integers(unsigned long long a,
@@ -120,6 +233,36 @@ PyObject* create_tuple_from_c_integers(unsigned long long a,
   return tuple;  // Return the created tuple
 }
 
+PyObject* create_tuple_from_c_mixed(unsigned long long a, unsigned long long b,
+                                    unsigned long long c,
+                                    CUmemGenericAllocationHandle** vec,
+                                    unsigned long long* chunk_sizes,
+                                    size_t num_chunks) {
+  PyObject* tuple = PyTuple_New(4);
+  if (!tuple) {
+    return NULL;
+  }
+
+  // PyObject* list = PyList_New(vec.size());
+  PyObject* list = PyList_New(num_chunks);
+  for (auto i = 0; i < num_chunks; ++i) {
+    PyObject* addr_size_pair = PyTuple_New(2);
+    PyObject* addr = PyLong_FromUnsignedLongLong((unsigned long long)(vec[i]));
+    PyObject* size =
+        PyLong_FromUnsignedLongLong((unsigned long long)(chunk_sizes[i]));
+    PyTuple_SetItem(addr_size_pair, 0, addr);
+    PyTuple_SetItem(addr_size_pair, 1, size);
+    PyList_SetItem(list, i, addr_size_pair);
+  }
+
+  PyTuple_SetItem(tuple, 0, PyLong_FromUnsignedLongLong(a));
+  PyTuple_SetItem(tuple, 1, PyLong_FromUnsignedLongLong(b));
+  PyTuple_SetItem(tuple, 2, PyLong_FromUnsignedLongLong(c));
+  PyTuple_SetItem(tuple, 3, list);
+
+  return tuple;
+}
+
 // ---------------------------------------------------------------------------
 // Our exported C functions that call Python:
 
@@ -147,14 +290,55 @@ void* my_malloc(ssize_t size, int device, CUstream stream) {
   size_t alignedSize = ((size + granularity - 1) / granularity) * granularity;
 
   CUdeviceptr d_mem;
+#ifndef USE_ROCM
   CUDA_CHECK(cuMemAddressReserve(&d_mem, alignedSize, 0, 0, 0));
   if (error_code != 0) {
     return nullptr;
   }
+#else
+  CUDA_CHECK(cuMemAddressReserve(&d_mem, alignedSize, granularity, 0, 0));
+  if (error_code != 0) {
+    return nullptr;
+  }
+#endif
+
+#ifndef USE_ROCM
   // allocate the CUmemGenericAllocationHandle
   CUmemGenericAllocationHandle* p_memHandle =
       (CUmemGenericAllocationHandle*)malloc(
           sizeof(CUmemGenericAllocationHandle));
+#else
+  // Make sure chunk size is aligned with hardware granularity. The base
+  // chunk size can be configured via environment variable
+  // ``VLLM_ROCM_SLEEP_MEM_CHUNK_SIZE``; otherwise
+  // DEFAULT_MEMCREATE_CHUNK_SIZE is used.
+  size_t base_chunk = (size_t)get_memcreate_chunk_size();
+  size_t aligned_chunk_size =
+      ((base_chunk + granularity - 1) / granularity) * granularity;
+  size_t num_chunks =
+      (alignedSize + aligned_chunk_size - 1) / aligned_chunk_size;
+  CUmemGenericAllocationHandle** p_memHandle =
+      (CUmemGenericAllocationHandle**)malloc(
+          num_chunks * sizeof(CUmemGenericAllocationHandle*));
+  unsigned long long* chunk_sizes =
+      (unsigned long long*)malloc(num_chunks * sizeof(unsigned long long));
+  for (auto i = 0; i < num_chunks; ++i) {
+    p_memHandle[i] = (CUmemGenericAllocationHandle*)malloc(
+        sizeof(CUmemGenericAllocationHandle));
+    if (p_memHandle[i] == nullptr) {
+      std::cerr << "ERROR: malloc failed for p_memHandle[" << i << "].\n";
+      for (auto j = 0; j < i; ++j) {
+        free(p_memHandle[j]);
+      }
+      free(p_memHandle);
+      free(chunk_sizes);
+      return nullptr;
+    }
+    chunk_sizes[i] = (unsigned long long)my_min(
+        (unsigned long long)(alignedSize - i * aligned_chunk_size),
+        (unsigned long long)aligned_chunk_size);
+  }
+#endif
 
   if (!g_python_malloc_callback) {
     std::cerr << "ERROR: g_python_malloc_callback not set.\n";
@@ -164,9 +348,15 @@ void* my_malloc(ssize_t size, int device, CUstream stream) {
   // Acquire GIL (not in stable ABI officially, but often works)
   PyGILState_STATE gstate = PyGILState_Ensure();
 
+#ifndef USE_ROCM
   PyObject* arg_tuple = create_tuple_from_c_integers(
       (unsigned long long)device, (unsigned long long)alignedSize,
       (unsigned long long)d_mem, (unsigned long long)p_memHandle);
+#else
+  PyObject* arg_tuple = create_tuple_from_c_mixed(
+      (unsigned long long)device, (unsigned long long)alignedSize,
+      (unsigned long long)d_mem, p_memHandle, chunk_sizes, num_chunks);
+#endif
 
   // Call g_python_malloc_callback
   PyObject* py_result =
@@ -182,7 +372,27 @@ void* my_malloc(ssize_t size, int device, CUstream stream) {
   PyGILState_Release(gstate);
 
   // do the final mapping
+#ifndef USE_ROCM
   create_and_map(device, alignedSize, d_mem, p_memHandle);
+#else
+  create_and_map(device, alignedSize, d_mem, p_memHandle, chunk_sizes,
+                 num_chunks);
+  free(chunk_sizes);
+#endif
+
+  if (error_code != 0) {
+    // free address and the handle
+    CUDA_CHECK(cuMemAddressFree(d_mem, alignedSize));
+#ifndef USE_ROCM
+    free(p_memHandle);
+#else
+    for (size_t i = 0; i < num_chunks; ++i) {
+      free(p_memHandle[i]);
+    }
+    free(p_memHandle);
+#endif
+    return nullptr;
+  }
 
   return (void*)d_mem;
 }
@@ -206,36 +416,96 @@ void my_free(void* ptr, ssize_t size, int device, CUstream stream) {
 
   if (!py_result || !PyTuple_Check(py_result) || PyTuple_Size(py_result) != 4) {
     PyErr_SetString(PyExc_TypeError, "Expected a tuple of size 4");
+    Py_XDECREF(py_result);
+    Py_XDECREF(py_ptr);
     return;
   }
 
   unsigned long long recv_device, recv_size;
-  unsigned long long recv_d_mem, recv_p_memHandle;
+  unsigned long long recv_d_mem;
+#ifndef USE_ROCM
+  unsigned long long recv_p_memHandle;
+#else
+  PyObject* recv_p_memHandle;
+#endif
   // Unpack the tuple into four C integers
-  if (!PyArg_ParseTuple(py_result, "KKKK", &recv_device, &recv_size,
+  if (!PyArg_ParseTuple(py_result, PYARGS_PARSE, &recv_device, &recv_size,
                         &recv_d_mem, &recv_p_memHandle)) {
     // PyArg_ParseTuple sets an error if it fails
+    Py_XDECREF(py_result);
+    Py_XDECREF(py_ptr);
     return;
   }
 
-  PyGILState_Release(gstate);
+  // For ROCm, copy the Python list of (addr,size) pairs into C arrays while
+  // holding the GIL. Then release the GIL and call the unmap/release helper
+  // using the copied arrays. This avoids calling PyList_* APIs without the
+  // GIL (which is undefined behavior and can crash when called from other
+  // threads).
+  CUdeviceptr d_mem = (CUdeviceptr)recv_d_mem;
+#ifdef USE_ROCM
+  Py_ssize_t num_chunks = PyList_Size(recv_p_memHandle);
+  CUmemGenericAllocationHandle** p_memHandle =
+      (CUmemGenericAllocationHandle**)malloc(
+          num_chunks * sizeof(CUmemGenericAllocationHandle*));
+  if (p_memHandle == nullptr) {
+    Py_DECREF(py_ptr);
+    Py_DECREF(py_result);
+    PyGILState_Release(gstate);
+    std::cerr << "ERROR: malloc failed for p_memHandle in my_free."
+              << std::endl;
+    return;
+  }
+  unsigned long long* chunk_sizes =
+      (unsigned long long*)malloc(num_chunks * sizeof(unsigned long long));
+  if (chunk_sizes == nullptr) {
+    free(p_memHandle);
+    Py_DECREF(py_ptr);
+    Py_DECREF(py_result);
+    PyGILState_Release(gstate);
+    std::cerr << "ERROR: malloc failed for chunk_sizes in my_free."
+              << std::endl;
+    return;
+  }
+  for (Py_ssize_t i = 0; i < num_chunks; ++i) {
+    PyObject* item = PyList_GetItem(recv_p_memHandle, i);
+    PyObject* addr_py = PyTuple_GetItem(item, 0);
+    PyObject* size_py = PyTuple_GetItem(item, 1);
+    p_memHandle[i] =
+        (CUmemGenericAllocationHandle*)PyLong_AsUnsignedLongLong(addr_py);
+    chunk_sizes[i] = (unsigned long long)PyLong_AsUnsignedLongLong(size_py);
+  }
 
-  // recv_size == size
-  // recv_device == device
+  // Drop temporary Python refs, then release the GIL before calling into
+  // non-Python APIs.
+  Py_DECREF(py_ptr);
+  Py_DECREF(py_result);
+  PyGILState_Release(gstate);
 
-  // Free memory
+  unmap_and_release(device, size, d_mem, p_memHandle, chunk_sizes, num_chunks);
+#else
+  // Non-ROCm path: simple integer handle already extracted; drop temporary
+  // Python refs while still holding the GIL, then release it.
+  Py_DECREF(py_ptr);
+  Py_DECREF(py_result);
+  PyGILState_Release(gstate);
 
-  CUdeviceptr d_mem = (CUdeviceptr)recv_d_mem;
   CUmemGenericAllocationHandle* p_memHandle =
       (CUmemGenericAllocationHandle*)recv_p_memHandle;
   unmap_and_release(device, size, d_mem, p_memHandle);
+#endif
 
   // free address and the handle
   CUDA_CHECK(cuMemAddressFree(d_mem, size));
-  if (error_code != 0) {
-    return;
+#ifndef USE_ROCM
+  free(p_memHandle);
+#else
+  for (auto i = 0; i < num_chunks; ++i) {
+    free(p_memHandle[i]);
   }
   free(p_memHandle);
+  free(chunk_sizes);
+#endif
 }
 
 // ---------------------------------------------------------------------------
@@ -271,19 +541,87 @@ static PyObject* python_unmap_and_release(PyObject* self, PyObject* args) {
   }
 
   unsigned long long recv_device, recv_size;
-  unsigned long long recv_d_mem, recv_p_memHandle;
+  unsigned long long recv_d_mem;
+#ifndef USE_ROCM
+  unsigned long long recv_p_memHandle;
+#else
+  PyObject* recv_p_memHandle;
+#endif
   // Unpack the tuple into four C integers
-  if (!PyArg_ParseTuple(args, "KKKK", &recv_device, &recv_size, &recv_d_mem,
-                        &recv_p_memHandle)) {
+  if (!PyArg_ParseTuple(args, PYARGS_PARSE, &recv_device, &recv_size,
+                        &recv_d_mem, &recv_p_memHandle)) {
     // PyArg_ParseTuple sets an error if it fails
     return nullptr;
   }
 
   CUdeviceptr d_mem_ptr = (CUdeviceptr)recv_d_mem;
+#ifndef USE_ROCM
   CUmemGenericAllocationHandle* p_memHandle =
       (CUmemGenericAllocationHandle*)recv_p_memHandle;
 
   unmap_and_release(recv_device, recv_size, d_mem_ptr, p_memHandle);
+#else
+  if (!PyList_Check(recv_p_memHandle)) {
+    PyErr_SetString(PyExc_TypeError,
+                    "Expected a list for the 4th argument on ROCm");
+    return nullptr;
+  }
+  Py_ssize_t num_chunks = PyList_Size(recv_p_memHandle);
+  if (num_chunks < 0) {
+    return nullptr;  // PyList_Size sets an exception on error.
+  }
+  CUmemGenericAllocationHandle** p_memHandle =
+      (CUmemGenericAllocationHandle**)malloc(
+          num_chunks * sizeof(CUmemGenericAllocationHandle*));
+  if (p_memHandle == nullptr) {
+    PyErr_SetString(PyExc_MemoryError, "malloc failed for p_memHandle");
+    return nullptr;
+  }
+  unsigned long long* chunk_sizes =
+      (unsigned long long*)malloc(num_chunks * sizeof(unsigned long long));
+  if (chunk_sizes == nullptr) {
+    free(p_memHandle);
+    PyErr_SetString(PyExc_MemoryError, "malloc failed for chunk_sizes");
+    return nullptr;
+  }
+  for (Py_ssize_t i = 0; i < num_chunks; ++i) {
+    PyObject* item = PyList_GetItem(recv_p_memHandle, i);
+    if (item == nullptr || !PyTuple_Check(item) || PyTuple_Size(item) != 2) {
+      free(p_memHandle);
+      free(chunk_sizes);
+      PyErr_SetString(
+          PyExc_TypeError,
+          "List items must be tuples of size 2 (handle_addr, size)");
+      return nullptr;
+    }
+    PyObject* addr_py = PyTuple_GetItem(item, 0);
+    PyObject* size_py = PyTuple_GetItem(item, 1);
+    if (addr_py == nullptr || size_py == nullptr) {
+      free(p_memHandle);
+      free(chunk_sizes);
+      return nullptr;  // PyTuple_GetItem sets an exception
+    }
+    p_memHandle[i] =
+        (CUmemGenericAllocationHandle*)PyLong_AsUnsignedLongLong(addr_py);
+    if (PyErr_Occurred()) {
+      free(p_memHandle);
+      free(chunk_sizes);
+      return nullptr;
+    }
+    chunk_sizes[i] = (unsigned long long)PyLong_AsUnsignedLongLong(size_py);
+    if (PyErr_Occurred()) {
+      free(p_memHandle);
+      free(chunk_sizes);
+      return nullptr;
+    }
+  }
+
+  unmap_and_release(recv_device, recv_size, d_mem_ptr, p_memHandle, chunk_sizes,
+                    num_chunks);
+
+  free(p_memHandle);
+  free(chunk_sizes);
+#endif
 
   if (error_code != 0) {
     error_code = no_error;
@@ -301,19 +639,56 @@ static PyObject* python_create_and_map(PyObject* self, PyObject* args) {
   }
 
   unsigned long long recv_device, recv_size;
-  unsigned long long recv_d_mem, recv_p_memHandle;
+  unsigned long long recv_d_mem;
+#ifndef USE_ROCM
+  unsigned long long recv_p_memHandle;
+#else
+  PyObject* recv_p_memHandle;
+#endif
   // Unpack the tuple into four C integers
-  if (!PyArg_ParseTuple(args, "KKKK", &recv_device, &recv_size, &recv_d_mem,
-                        &recv_p_memHandle)) {
+  if (!PyArg_ParseTuple(args, PYARGS_PARSE, &recv_device, &recv_size,
+                        &recv_d_mem, &recv_p_memHandle)) {
     // PyArg_ParseTuple sets an error if it fails
     return nullptr;
   }
 
   CUdeviceptr d_mem_ptr = (CUdeviceptr)recv_d_mem;
+#ifndef USE_ROCM
   CUmemGenericAllocationHandle* p_memHandle =
       (CUmemGenericAllocationHandle*)recv_p_memHandle;
 
   create_and_map(recv_device, recv_size, d_mem_ptr, p_memHandle);
+#else
+  Py_ssize_t num_chunks = PyList_Size(recv_p_memHandle);
+  CUmemGenericAllocationHandle** p_memHandle =
+      (CUmemGenericAllocationHandle**)malloc(
+          num_chunks * sizeof(CUmemGenericAllocationHandle*));
+  if (p_memHandle == nullptr) {
+    PyErr_SetString(PyExc_MemoryError, "malloc failed for p_memHandle");
+    return nullptr;
+  }
+  unsigned long long* chunk_sizes =
+      (unsigned long long*)malloc(num_chunks * sizeof(unsigned long long));
+  if (chunk_sizes == nullptr) {
+    free(p_memHandle);
+    PyErr_SetString(PyExc_MemoryError, "malloc failed for chunk_sizes");
+    return nullptr;
+  }
+  for (auto i = 0; i < num_chunks; ++i) {
+    PyObject* item = PyList_GetItem(recv_p_memHandle, i);
+    PyObject* addr_py = PyTuple_GetItem(item, 0);
+    PyObject* size_py = PyTuple_GetItem(item, 1);
+    p_memHandle[i] =
+        (CUmemGenericAllocationHandle*)PyLong_AsUnsignedLongLong(addr_py);
+    chunk_sizes[i] = PyLong_AsUnsignedLongLong(size_py);
+  }
+
+  create_and_map(recv_device, recv_size, d_mem_ptr, p_memHandle, chunk_sizes,
+                 num_chunks);
+
+  free(p_memHandle);
+  free(chunk_sizes);
+#endif
 
   if (error_code != 0) {
     error_code = no_error;
diff --git a/csrc/cumem_allocator_compat.h b/csrc/cumem_allocator_compat.h
new file mode 100644
index 000000000000..74f4bc9eeadf
--- /dev/null
+++ b/csrc/cumem_allocator_compat.h
@@ -0,0 +1,109 @@
+#pragma once
+
+#ifdef USE_ROCM
+////////////////////////////////////////
+// For compatibility with CUDA and ROCm
+////////////////////////////////////////
+  #include <hip/hip_runtime_api.h>
+
+extern "C" {
+  #ifndef CUDA_SUCCESS
+    #define CUDA_SUCCESS hipSuccess
+  #endif  // CUDA_SUCCESS
+
+// https://rocm.docs.amd.com/projects/HIPIFY/en/latest/tables/CUDA_Driver_API_functions_supported_by_HIP.html
+typedef unsigned long long CUdevice;
+typedef hipDeviceptr_t CUdeviceptr;
+typedef hipError_t CUresult;
+typedef hipCtx_t CUcontext;
+typedef hipStream_t CUstream;
+typedef hipMemGenericAllocationHandle_t CUmemGenericAllocationHandle;
+typedef hipMemAllocationGranularity_flags CUmemAllocationGranularity_flags;
+typedef hipMemAllocationProp CUmemAllocationProp;
+typedef hipMemAccessDesc CUmemAccessDesc;
+
+  #define CU_MEM_ALLOCATION_TYPE_PINNED hipMemAllocationTypePinned
+  #define CU_MEM_LOCATION_TYPE_DEVICE hipMemLocationTypeDevice
+  #define CU_MEM_ACCESS_FLAGS_PROT_READWRITE hipMemAccessFlagsProtReadWrite
+  #define CU_MEM_ALLOC_GRANULARITY_MINIMUM hipMemAllocationGranularityMinimum
+
+  // https://docs.nvidia.com/cuda/cuda-driver-api/group__CUDA__TYPES.html
+  #define CU_MEM_ALLOCATION_COMP_NONE 0x0
+
+// Error Handling
+// https://docs.nvidia.com/cuda/archive/11.4.4/cuda-driver-api/group__CUDA__ERROR.html
+CUresult cuGetErrorString(CUresult hipError, const char** pStr) {
+  *pStr = hipGetErrorString(hipError);
+  return CUDA_SUCCESS;
+}
+
+// Context Management
+// https://docs.nvidia.com/cuda/cuda-driver-api/group__CUDA__CTX.html
+CUresult cuCtxGetCurrent(CUcontext* ctx) {
+  // This API is deprecated on the AMD platform, only for equivalent cuCtx
+  // driver API on the NVIDIA platform.
+  return hipCtxGetCurrent(ctx);
+}
+
+CUresult cuCtxSetCurrent(CUcontext ctx) {
+  // This API is deprecated on the AMD platform, only for equivalent cuCtx
+  // driver API on the NVIDIA platform.
+  return hipCtxSetCurrent(ctx);
+}
+
+// Primary Context Management
+// https://docs.nvidia.com/cuda/cuda-driver-api/group__CUDA__PRIMARY__CTX.html
+CUresult cuDevicePrimaryCtxRetain(CUcontext* ctx, CUdevice dev) {
+  return hipDevicePrimaryCtxRetain(ctx, dev);
+}
+
+// Virtual Memory Management
+// https://docs.nvidia.com/cuda/cuda-driver-api/group__CUDA__VA.html
+CUresult cuMemAddressFree(CUdeviceptr ptr, size_t size) {
+  return hipMemAddressFree(ptr, size);
+}
+
+CUresult cuMemAddressReserve(CUdeviceptr* ptr, size_t size, size_t alignment,
+                             CUdeviceptr addr, unsigned long long flags) {
+  return hipMemAddressReserve(ptr, size, alignment, addr, flags);
+}
+
+CUresult cuMemCreate(CUmemGenericAllocationHandle* handle, size_t size,
+                     const CUmemAllocationProp* prop,
+                     unsigned long long flags) {
+  return hipMemCreate(handle, size, prop, flags);
+}
+
+CUresult cuMemGetAllocationGranularity(
+    size_t* granularity, const CUmemAllocationProp* prop,
+    CUmemAllocationGranularity_flags option) {
+  return hipMemGetAllocationGranularity(granularity, prop, option);
+}
+
+CUresult cuMemMap(CUdeviceptr dptr, size_t size, size_t offset,
+                  CUmemGenericAllocationHandle handle,
+                  unsigned long long flags) {
+  return hipMemMap(dptr, size, offset, handle, flags);
+}
+
+CUresult cuMemRelease(CUmemGenericAllocationHandle handle) {
+  return hipMemRelease(handle);
+}
+
+CUresult cuMemSetAccess(CUdeviceptr ptr, size_t size,
+                        const CUmemAccessDesc* desc, size_t count) {
+  return hipMemSetAccess(ptr, size, desc, count);
+}
+
+CUresult cuMemUnmap(CUdeviceptr ptr, size_t size) {
+  return hipMemUnmap(ptr, size);
+}
+}  // extern "C"
+
+#else
+////////////////////////////////////////
+// Import CUDA headers for NVIDIA GPUs
+////////////////////////////////////////
+  #include <cuda_runtime_api.h>
+  #include <cuda.h>
+#endif
diff --git a/docs/features/sleep_mode.md b/docs/features/sleep_mode.md
index edcbaa716447..9ab167ab9a23 100644
--- a/docs/features/sleep_mode.md
+++ b/docs/features/sleep_mode.md
@@ -11,7 +11,7 @@ Key benefits:
 - **Fine-grained control**: Optionally wake up only model weights or KV cache to avoid OOM during weight updates.
 
 !!! note
-    This feature is only supported on CUDA platform.
+    This feature is now supported on CUDA and ROCm platform.
 
 !!! note
     For more information, see this [Blog Post](https://blog.vllm.ai/2025/10/26/sleep-mode.html).
@@ -116,3 +116,7 @@ curl -X POST 'http://localhost:8000/wake_up?tags=kv_cache'
 
 !!! note
     These endpoints are only available when passing `VLLM_SERVER_DEV_MODE=1`.
+
+## Limitation
+
+On ROCm, the virtual memory allocation on ROCm is done through chunked memory allocation. You can control the chunk size through `VLLM_ROCM_SLEEP_MEM_CHUNK_SIZE` (in MB). The default value is set at 256MB. The larger the chunk size the faster the performance. However, setting it too large will cause OOM. So if you encounter OOM when using sleep mode. Try reducing the chunk size. It is recommended to define the chunk size as a power of 2.
diff --git a/setup.py b/setup.py
index 8139d0d62b8a..0934a8608eb1 100644
--- a/setup.py
+++ b/setup.py
@@ -208,6 +208,8 @@ def configure(self, ext: CMakeExtension) -> None:
         # Make sure we use the nvcc from CUDA_HOME
         if _is_cuda():
             cmake_args += [f"-DCMAKE_CUDA_COMPILER={CUDA_HOME}/bin/nvcc"]
+        elif _is_hip():
+            cmake_args += [f"-DROCM_PATH={ROCM_HOME}"]
 
         other_cmake_args = os.environ.get("CMAKE_ARGS")
         if other_cmake_args:
@@ -628,6 +630,7 @@ def _read_requirements(filename: str) -> list[str]:
 
 if _is_cuda() or _is_hip():
     ext_modules.append(CMakeExtension(name="vllm._moe_C"))
+    ext_modules.append(CMakeExtension(name="vllm.cumem_allocator"))
 
 if _is_hip():
     ext_modules.append(CMakeExtension(name="vllm._rocm_C"))
@@ -643,7 +646,6 @@ def _read_requirements(filename: str) -> list[str]:
         ext_modules.append(
             CMakeExtension(name="vllm._flashmla_extension_C", optional=True)
         )
-    ext_modules.append(CMakeExtension(name="vllm.cumem_allocator"))
 
 if _build_custom_ops():
     ext_modules.append(CMakeExtension(name="vllm._C"))
diff --git a/tests/basic_correctness/test_cumem.py b/tests/basic_correctness/test_cumem.py
index 0c037622f5e8..754ef20dbeb2 100644
--- a/tests/basic_correctness/test_cumem.py
+++ b/tests/basic_correctness/test_cumem.py
@@ -8,12 +8,13 @@
 
 from vllm import LLM, AsyncEngineArgs, AsyncLLMEngine, SamplingParams
 from vllm.device_allocator.cumem import CuMemAllocator
+from vllm.platforms import current_platform
 from vllm.utils.mem_constants import GiB_bytes
 
 from ..utils import create_new_process_for_each_test
 
 
-@create_new_process_for_each_test()
+@create_new_process_for_each_test("fork" if not current_platform.is_rocm() else "spawn")
 def test_python_error():
     """
     Test if Python error occurs when there's low-level
@@ -39,7 +40,7 @@ def test_python_error():
         allocator.wake_up()
 
 
-@create_new_process_for_each_test()
+@create_new_process_for_each_test("fork" if not current_platform.is_rocm() else "spawn")
 def test_basic_cumem():
     # some tensors from default memory pool
     shape = (1024, 1024)
@@ -72,7 +73,7 @@ def test_basic_cumem():
     assert torch.allclose(output, torch.ones_like(output) * 3)
 
 
-@create_new_process_for_each_test()
+@create_new_process_for_each_test("fork" if not current_platform.is_rocm() else "spawn")
 def test_cumem_with_cudagraph():
     allocator = CuMemAllocator.get_instance()
     with allocator.use_memory_pool():
@@ -117,7 +118,7 @@ def model(x):
     assert torch.allclose(y, x + 1)
 
 
-@create_new_process_for_each_test()
+@create_new_process_for_each_test("fork" if not current_platform.is_rocm() else "spawn")
 @pytest.mark.parametrize(
     "model",
     [
diff --git a/vllm/config/model.py b/vllm/config/model.py
index 49b66039d4a0..c47b619118ff 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -264,7 +264,8 @@ class ModelConfig:
     merged with the default config from the model. If used with
     `--generation-config vllm`, only the override parameters are used."""
     enable_sleep_mode: bool = False
-    """Enable sleep mode for the engine (only cuda platform is supported)."""
+    """Enable sleep mode for the engine (only cuda and
+    hip platforms are supported)."""
     model_impl: str | ModelImpl = "auto"
     """Which implementation of the model to use:\n
     - "auto" will try to use the vLLM implementation, if it exists, and fall
diff --git a/vllm/device_allocator/cumem.py b/vllm/device_allocator/cumem.py
index 5e3dbde393be..e9695698bb49 100644
--- a/vllm/device_allocator/cumem.py
+++ b/vllm/device_allocator/cumem.py
@@ -63,7 +63,7 @@ def find_loaded_library(lib_name) -> str | None:
     libcudart = CudaRTLibrary()
     cumem_available = True
 except ModuleNotFoundError:
-    # rocm platform does not support cumem allocator
+    # only cuda and rocm platforms support cumem allocator
     init_module = None
     python_create_and_map = None
     python_unmap_and_release = None
diff --git a/vllm/distributed/device_communicators/cuda_wrapper.py b/vllm/distributed/device_communicators/cuda_wrapper.py
index 07ab2f712409..6aadab33e313 100644
--- a/vllm/distributed/device_communicators/cuda_wrapper.py
+++ b/vllm/distributed/device_communicators/cuda_wrapper.py
@@ -14,6 +14,7 @@
 
 import vllm.envs as envs
 from vllm.logger import init_logger
+from vllm.platforms import current_platform
 
 logger = init_logger(__name__)
 
@@ -105,6 +106,20 @@ class CudaRTLibrary:
         ),
     ]
 
+    # https://rocm.docs.amd.com/projects/HIPIFY/en/latest/tables/CUDA_Runtime_API_functions_supported_by_HIP.html # noqa
+    cuda_to_hip_mapping = {
+        "cudaSetDevice": "hipSetDevice",
+        "cudaDeviceSynchronize": "hipDeviceSynchronize",
+        "cudaDeviceReset": "hipDeviceReset",
+        "cudaGetErrorString": "hipGetErrorString",
+        "cudaMalloc": "hipMalloc",
+        "cudaFree": "hipFree",
+        "cudaMemset": "hipMemset",
+        "cudaMemcpy": "hipMemcpy",
+        "cudaIpcGetMemHandle": "hipIpcGetMemHandle",
+        "cudaIpcOpenMemHandle": "hipIpcOpenMemHandle",
+    }
+
     # class attribute to store the mapping from the path to the library
     # to avoid loading the same library multiple times
     path_to_library_cache: dict[str, Any] = {}
@@ -117,7 +132,13 @@ def __init__(self, so_file: str | None = None):
         if so_file is None:
             so_file = find_loaded_library("libcudart")
             if so_file is None:
-                so_file = envs.VLLM_CUDART_SO_PATH  # fallback to env var
+                # libcudart is not loaded in the current process, try hip
+                so_file = find_loaded_library("libamdhip64")
+                # should be safe to assume now that we are using ROCm
+                # as the following assertion should error out if the
+                # libhiprtc library is also not loaded
+                if so_file is None:
+                    so_file = envs.VLLM_CUDART_SO_PATH  # fallback to env var
             assert so_file is not None, (
                 "libcudart is not loaded in the current process, "
                 "try setting VLLM_CUDART_SO_PATH"
@@ -130,7 +151,12 @@ def __init__(self, so_file: str | None = None):
         if so_file not in CudaRTLibrary.path_to_dict_mapping:
             _funcs = {}
             for func in CudaRTLibrary.exported_functions:
-                f = getattr(self.lib, func.name)
+                f = getattr(
+                    self.lib,
+                    CudaRTLibrary.cuda_to_hip_mapping[func.name]
+                    if current_platform.is_rocm()
+                    else func.name,
+                )
                 f.restype = func.restype
                 f.argtypes = func.argtypes
                 _funcs[func.name] = f
diff --git a/vllm/envs.py b/vllm/envs.py
index 8e2f872c069c..1c3247a315c1 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -18,6 +18,7 @@
     VLLM_RINGBUFFER_WARNING_INTERVAL: int = 60
     VLLM_NCCL_SO_PATH: str | None = None
     LD_LIBRARY_PATH: str | None = None
+    VLLM_ROCM_SLEEP_MEM_CHUNK_SIZE: int = 256
     VLLM_V1_USE_PREFILL_DECODE_ATTENTION: bool = False
     VLLM_FLASH_ATTN_VERSION: int | None = None
     LOCAL_RANK: int = 0
@@ -520,6 +521,10 @@ def get_vllm_port() -> int | None:
     # when `VLLM_NCCL_SO_PATH` is not set, vllm will try to find the nccl
     # library file in the locations specified by `LD_LIBRARY_PATH`
     "LD_LIBRARY_PATH": lambda: os.environ.get("LD_LIBRARY_PATH", None),
+    # flag to control the chunk size (in MB) for sleeping memory allocations under ROCm
+    "VLLM_ROCM_SLEEP_MEM_CHUNK_SIZE": lambda: int(
+        os.environ.get("VLLM_ROCM_SLEEP_MEM_CHUNK_SIZE", "256")
+    ),
     # Use separate prefill and decode kernels for V1 attention instead of
     # the unified triton kernel.
     "VLLM_V1_USE_PREFILL_DECODE_ATTENTION": lambda: (
diff --git a/vllm/platforms/interface.py b/vllm/platforms/interface.py
index d0eb232e14c6..bde825f7709a 100644
--- a/vllm/platforms/interface.py
+++ b/vllm/platforms/interface.py
@@ -171,7 +171,11 @@ def is_cuda_alike(self) -> bool:
         return self._enum in (PlatformEnum.CUDA, PlatformEnum.ROCM)
 
     def is_sleep_mode_available(self) -> bool:
-        return self._enum == PlatformEnum.CUDA
+        # TODO: Actually only mi3xx has the sleep mode support now
+        # for ROCm, but currently we don't have a way to detect the
+        # exact GPU model statelessly here. So we return True for
+        # all ROCm platforms for now.
+        return self._enum in (PlatformEnum.CUDA, PlatformEnum.ROCM)
 
     @classmethod
     def device_id_to_physical_device_id(cls, device_id: int):

From 69d0e903137109dd9a1e0f88bc0af20db7ca70fb Mon Sep 17 00:00:00 2001
From: Alexander Matveev <59768536+alexm-redhat@users.noreply.github.com>
Date: Wed, 12 Nov 2025 18:37:24 -0500
Subject: [PATCH 123/183] [MoE][Kernel][Perf] Improve Shared Expert Stream
 Overlap (#28406)

Signed-off-by: Alexander Matveev <amatveev@redhat.com>
---
 vllm/envs.py                                  |  8 ++
 vllm/model_executor/layers/fused_moe/layer.py | 85 +++++++++++--------
 vllm/utils/torch_utils.py                     | 24 ++++++
 3 files changed, 81 insertions(+), 36 deletions(-)

diff --git a/vllm/envs.py b/vllm/envs.py
index 1c3247a315c1..0530938c32f9 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -222,6 +222,7 @@
     VLLM_USE_FBGEMM: bool = False
     VLLM_GC_DEBUG: str = ""
     VLLM_DISABLE_SHARED_EXPERTS_STREAM: bool = False
+    VLLM_SHARED_EXPERTS_STREAM_TOKEN_THRESHOLD: int = 256
     VLLM_COMPILE_CACHE_SAVE_FORMAT: Literal["binary", "unpacked"] = "binary"
     VLLM_FLAT_LOGPROBS: bool = False
 
@@ -1476,6 +1477,13 @@ def get_vllm_port() -> int | None:
     "VLLM_DISABLE_SHARED_EXPERTS_STREAM": lambda: bool(
         int(os.getenv("VLLM_DISABLE_SHARED_EXPERTS_STREAM", "0"))
     ),
+    # Limits when we run shared_experts in a separate stream.
+    # We found out that for large batch sizes, the separate stream
+    # execution is not beneficial (most likely because of the input clone)
+    # TODO(alexm-redhat): Tune to be more dynamic based on GPU type
+    "VLLM_SHARED_EXPERTS_STREAM_TOKEN_THRESHOLD": lambda: int(
+        int(os.getenv("VLLM_SHARED_EXPERTS_STREAM_TOKEN_THRESHOLD", 256))
+    ),
     # Format for saving torch.compile cache artifacts
     # - "binary": saves as binary file
     #     Safe for multiple vllm serve processes accessing the same torch compile cache.
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index 3bd7c54c520c..aed8245cbd83 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -48,7 +48,11 @@
 )
 from vllm.platforms import current_platform
 from vllm.utils.math_utils import cdiv, round_up
-from vllm.utils.torch_utils import current_stream, direct_register_custom_op
+from vllm.utils.torch_utils import (
+    aux_stream,
+    current_stream,
+    direct_register_custom_op,
+)
 from vllm.v1.worker.ubatching import dbo_current_ubatch_id
 
 if current_platform.is_cuda_alike():
@@ -331,7 +335,11 @@ def __init__(
             logger.info_once("Disabling MoE shared_experts cuda stream")
             self.shared_experts_stream = None
         else:
-            self.shared_experts_stream = torch.cuda.Stream()
+            # TODO(rob): enable shared expert overlap with non-cuda.
+            # aux_stream() returns None on non-cuda platforms.
+            self.shared_experts_stream = aux_stream()
+            if self.shared_experts_stream is not None:
+                logger.info_once("Enabled separate cuda stream for MoE shared_experts")
 
         if params_dtype is None:
             params_dtype = torch.get_default_dtype()
@@ -1606,7 +1614,9 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
             if has_separate_shared_experts:
                 assert not isinstance(final_hidden_states, tuple)
                 assert self.shared_experts is not None
+
                 shared_output = self.shared_experts(staged_hidden_states)
+
                 final_hidden_states = (
                     shared_output,
                     final_hidden_states,
@@ -1684,13 +1694,34 @@ def forward_impl(
 
         use_chunked_impl = self.use_dp_chunking
 
-        if (
+        use_shared_experts_stream = (
             has_separate_shared_experts
             and not use_chunked_impl
             and self.shared_experts_stream is not None
-        ):
-            # Start the separate shared experts stream here since we want
-            # to run in parallel with the router/gate (next op below)
+            and (
+                hidden_states.shape[0]
+                <= envs.VLLM_SHARED_EXPERTS_STREAM_TOKEN_THRESHOLD
+            )
+        )
+
+        if use_shared_experts_stream:
+            assert self.shared_experts_stream is not None
+
+            # Clone BEFORE switching streams to avoid race condition
+            # where routed_expert kernel may mutate hidden_states.
+            hidden_states_clone = hidden_states.clone()
+
+            # Record that the clone will be used by shared_experts_stream
+            # to avoid gc issue from deallocation of hidden_states_clone
+            # For more details: https://docs.pytorch.org/docs/stable/generated/torch.Tensor.record_stream.html # noqa: E501
+            # NOTE: We dont need shared_output.record_stream(current_stream())
+            # because we synch the streams before using shared_output.
+            hidden_states_clone.record_stream(self.shared_experts_stream)
+
+            # Mark sync start point for the separate shared experts
+            # stream here since we want to run in parallel with the
+            # router/gate (next op below)
+            assert self.shared_experts_stream is not None
             self.shared_experts_stream.wait_stream(current_stream())
 
         # If router/gate provided, then apply it here.
@@ -1709,33 +1740,6 @@ def forward_impl(
             self.quant_method, FusedMoEModularMethod
         )
 
-        # If there are shared experts but we are not using a modular kernel, the
-        # shared experts must be called here
-        if has_separate_shared_experts:
-            assert self.shared_experts is not None
-
-            if self.shared_experts_stream is not None:
-                # Clone BEFORE switching streams to avoid race condition
-                # where routed_expert kernel may mutate hidden_states.
-                hidden_states_clone = hidden_states.clone()
-                self.shared_experts_stream.wait_stream(current_stream())
-
-                # Run shared experts in parallel on a separate stream
-                with torch.cuda.stream(self.shared_experts_stream):
-                    shared_output = self.shared_experts(hidden_states_clone)
-
-                # Record that the clone will be used by shared_experts_stream
-                # to avoid gc issue from deallocation of hidden_states_clone
-                # For more details: https://docs.pytorch.org/docs/stable/generated/torch.Tensor.record_stream.html # noqa: E501
-                # NOTE: we dont need shared_output.record_stream(current_stream())
-                # because we synch the streams before using shared_output.
-                hidden_states_clone.record_stream(self.shared_experts_stream)
-
-            else:
-                shared_output = self.shared_experts(hidden_states)
-        else:
-            shared_output = None
-
         ctx = get_forward_context()
         sp_ctx = (
             ctx.dp_metadata.sp_local_sizes(self.sp_size)
@@ -1776,12 +1780,21 @@ def forward_impl(
             )
 
             if has_separate_shared_experts:
-                assert not isinstance(final_hidden_states, tuple)
                 assert self.shared_experts is not None
 
-                # Wait for the parallel shared experts stream to finish here
-                if self.shared_experts_stream is not None:
+                if use_shared_experts_stream:
+                    # Run shared experts in parallel on a separate stream
+                    # NOTE: We start the separate stream here and mark the
+                    # sync end point immediately after it is done. This is
+                    # important to avoid excessive stream allocations by the cuda
+                    # graph replay later.
+                    with torch.cuda.stream(self.shared_experts_stream):
+                        # Note that hidden_states clone() is necessary here to avoid
+                        # conflict with the main stream
+                        shared_output = self.shared_experts(hidden_states_clone)
                     current_stream().wait_stream(self.shared_experts_stream)
+                else:
+                    shared_output = self.shared_experts(hidden_states)
 
                 final_hidden_states = (
                     shared_output,
diff --git a/vllm/utils/torch_utils.py b/vllm/utils/torch_utils.py
index fd5c1b73f191..7c094e14cff7 100644
--- a/vllm/utils/torch_utils.py
+++ b/vllm/utils/torch_utils.py
@@ -409,6 +409,30 @@ def current_stream() -> torch.cuda.Stream:
     return _current_stream_tls.value
 
 
+# Global auxilary stream for running operations in background streams.
+# We have single global auxilary stream to avoid an explosion of streams
+# for every layer (and make profiling look sane).
+#
+# aux_stream() is currently used for:
+#   - MoE shared_expert overlap with router
+_aux_stream: torch.cuda.Stream | None = None
+
+
+def aux_stream() -> torch.cuda.Stream | None:
+    """
+    Ensures aux_stream is initialized only once
+    """
+    global _aux_stream
+
+    from vllm.platforms import current_platform
+
+    # TODO: validate this works properly on ROCm platform.
+    if _aux_stream is None and current_platform.is_cuda():
+        _aux_stream = torch.cuda.Stream()
+
+    return _aux_stream
+
+
 @lru_cache(maxsize=8)
 def _cuda_device_count_stateless(cuda_visible_devices: str | None = None) -> int:
     # Note: cuda_visible_devices is not used, but we keep it as an argument for

From 51c599f0ec9c754ddf9f6094f27c1fa2be76b318 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Wed, 12 Nov 2025 23:43:57 +0000
Subject: [PATCH 124/183] Skip models that cannot currently init on
 Transformers v5 (#28471)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
---
 .buildkite/test-pipeline.yaml                    |  8 ++++----
 vllm/model_executor/model_loader/weight_utils.py |  3 ++-
 vllm/model_executor/models/whisper.py            | 11 -----------
 3 files changed, 6 insertions(+), 16 deletions(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 2af0e46ea15f..36a867f1addb 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -872,12 +872,12 @@ steps:
   optional: true
   commands:
     - pip install --upgrade git+https://github.com/huggingface/transformers
-    - pytest -v -s tests/models/test_initialization.py
+    - pytest -v -s tests/models/test_initialization.py -k 'not (Gemma3 or ModernBert or Qwen2_5_VL or Qwen2_5vl or Qwen2VL or TransformersMultiModalEmbeddingModel or TransformersMultiModalForSequenceClassification or Ultravox or Phi4Multimodal or LlavaNextVideo or MiniCPMO or Lfm2Moe or PaliGemma or RobertaForSequenceClassification or Ovis2_5 or Fuyu or DeepseekOCR or KimiVL)'
     - pytest -v -s tests/models/test_transformers.py
-    - pytest -v -s tests/models/multimodal/processing/
-    - pytest -v -s tests/models/multimodal/test_mapping.py
+    # - pytest -v -s tests/models/multimodal/processing/
+    - pytest -v -s tests/models/multimodal/test_mapping.py -k 'not (Gemma3 or Qwen2VL or Qwen2_5_VL)'
     - python3 examples/offline_inference/basic/chat.py
-    - python3 examples/offline_inference/vision_language.py --model-type qwen2_5_vl
+    # - python3 examples/offline_inference/vision_language.py --model-type qwen2_5_vl
     # Whisper needs spawn method to avoid deadlock
     - VLLM_WORKER_MULTIPROC_METHOD=spawn python3 examples/offline_inference/audio_language.py --model-type whisper
 
diff --git a/vllm/model_executor/model_loader/weight_utils.py b/vllm/model_executor/model_loader/weight_utils.py
index 3dbe803f9986..93986e5f2fc0 100644
--- a/vllm/model_executor/model_loader/weight_utils.py
+++ b/vllm/model_executor/model_loader/weight_utils.py
@@ -82,7 +82,8 @@ def enable_hf_transfer():
 
 class DisabledTqdm(tqdm):
     def __init__(self, *args, **kwargs):
-        super().__init__(*args, **kwargs, disable=True)
+        kwargs["disable"] = True
+        super().__init__(*args, **kwargs)
 
 
 def get_lock(model_name_or_path: str | Path, cache_dir: str | None = None):
diff --git a/vllm/model_executor/models/whisper.py b/vllm/model_executor/models/whisper.py
index 502783b1fd93..23436a27d489 100644
--- a/vllm/model_executor/models/whisper.py
+++ b/vllm/model_executor/models/whisper.py
@@ -13,7 +13,6 @@
     BatchFeature,
     WhisperConfig,
     WhisperFeatureExtractor,
-    WhisperProcessor,
 )
 from transformers.models.whisper.modeling_whisper import sinusoids
 
@@ -660,16 +659,6 @@ class WhisperProcessingInfo(BaseProcessingInfo):
     def get_hf_config(self) -> WhisperConfig:
         return self.ctx.get_hf_config(WhisperConfig)
 
-    def get_hf_processor(self, **kwargs: object) -> WhisperProcessor:
-        # HACK: Transformers 4.53.2 has issue with whisper tokenizer to
-        # initialize processor. We use a monkeypatch to fix it here.
-        # See: https://github.com/vllm-project/vllm/issues/20224
-        processor_class = WhisperProcessor
-        tokenizer_class = ("WhisperTokenizer", "WhisperTokenizerFast")
-        if processor_class.tokenizer_class != tokenizer_class:
-            processor_class.tokenizer_class = tokenizer_class
-        return self.ctx.get_hf_processor(processor_class, **kwargs)
-
     def get_supported_mm_limits(self) -> Mapping[str, int | None]:
         return {"audio": 1}
 

From 52eadcec9ea6f59433bfcba2f0d065b3ce5548b4 Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Wed, 12 Nov 2025 19:00:23 -0500
Subject: [PATCH 125/183] [Docs] Update meetups.md description (#28583)

Signed-off-by: mgoin <mgoin64@gmail.com>
---
 docs/community/meetups.md | 20 ++++++++++++++++++--
 1 file changed, 18 insertions(+), 2 deletions(-)

diff --git a/docs/community/meetups.md b/docs/community/meetups.md
index 3fca4659e284..0735f452df96 100644
--- a/docs/community/meetups.md
+++ b/docs/community/meetups.md
@@ -1,6 +1,14 @@
 # Meetups
 
-We host regular meetups in San Francisco Bay Area every 2 months. We will share the project updates from the vLLM team and have guest speakers from the industry to share their experience and insights. Please find the materials of our previous meetups below:
+We host regular meetups around the world. We will share the project updates from the vLLM team and have guest speakers from the industry to share their experience and insights.
+
+## Upcoming Meetups
+
+Stay tuned for upcoming meetups! Follow us on [Twitter/X](https://x.com/vllm_project), join our [Slack](https://slack.vllm.ai), and follow vLLM on [Luma](https://luma.com/vLLM-Meetups) to get notified about new events.
+
+## Past Meetups
+
+Below you'll find slides and recordings from our previous meetups:
 
 - [vLLM Zurich Meetup](https://luma.com/0gls27kb), November 6th 2025. [[Slides]](https://docs.google.com/presentation/d/1UC9PTLCHYXQpOmJDSFg6Sljra3iVXzc09DeEI7dnxMc/edit?usp=sharing) [[Recording]](https://www.youtube.com/watch?v=6m6ZE6yVEDI)
 - [vLLM Beijing Meetup](https://mp.weixin.qq.com/s/xSrYXjNgr1HbCP4ExYNG1w), November 1st 2025. [[Slides]](https://drive.google.com/drive/folders/1nQJ8ZkLSjKxvu36sSHaceVXtttbLvvu-?usp=drive_link)
@@ -26,4 +34,12 @@ We host regular meetups in San Francisco Bay Area every 2 months. We will share
 - [The second vLLM meetup](https://lu.ma/ygxbpzhl), with IBM Research, January 31st 2024. [[Slides]](https://docs.google.com/presentation/d/12mI2sKABnUw5RBWXDYY-HtHth4iMSNcEoQ10jDQbxgA/edit?usp=sharing) [[Video (vLLM Update)]](https://youtu.be/Y0C-DUvEnZQ) [[Video (IBM Research & torch.compile)]](https://youtu.be/m0dMtFLI-dg)
 - [The first vLLM meetup](https://lu.ma/first-vllm-meetup), with a16z, October 5th 2023. [[Slides]](https://docs.google.com/presentation/d/1QL-XPFXiFpDBh86DbEegFXBXFXjix4v032GhShbKf3s/edit?usp=sharing)
 
-We are always looking for speakers and sponsors at San Francisco Bay Area and potentially other locations. If you are interested in speaking or sponsoring, please contact us at [vllm-questions@lists.berkeley.edu](mailto:vllm-questions@lists.berkeley.edu).
+## Get Involved
+
+**Want to host or speak at a vLLM meetup?** We're always looking for speakers and sponsors for our meetups. Whether you want to:
+
+- Share your vLLM feature, use case, project extension, or deployment experience
+- Host a meetup in your city
+- Sponsor an event
+
+Please contact us at [vllm-questions@lists.berkeley.edu](mailto:vllm-questions@lists.berkeley.edu).

From d75ad048184f2864dad6b5da2e6e11322aec13aa Mon Sep 17 00:00:00 2001
From: Gregory Shtrasberg <156009573+gshtras@users.noreply.github.com>
Date: Wed, 12 Nov 2025 19:46:58 -0500
Subject: [PATCH 126/183] [ROCm][Bugfix] Revert removing setuptools version
 restriction (#28592)

Signed-off-by: Gregory Shtrasberg <Gregory.Shtrasberg@amd.com>
---
 requirements/rocm-build.txt | 2 +-
 requirements/rocm.txt       | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/requirements/rocm-build.txt b/requirements/rocm-build.txt
index 56ec90c563c0..51f58e57a785 100644
--- a/requirements/rocm-build.txt
+++ b/requirements/rocm-build.txt
@@ -9,7 +9,7 @@ torchaudio==2.9.0
 triton==3.5.0
 cmake>=3.26.1,<4
 packaging>=24.2
-setuptools>=77.0.3,<81.0.0
+setuptools>=77.0.3,<80.0.0
 setuptools-scm>=8
 wheel
 jinja2>=3.1.6
diff --git a/requirements/rocm.txt b/requirements/rocm.txt
index f06e4248a724..6f1cca90e5e2 100644
--- a/requirements/rocm.txt
+++ b/requirements/rocm.txt
@@ -10,7 +10,7 @@ peft
 pytest-asyncio
 tensorizer==2.10.1
 packaging>=24.2
-setuptools>=77.0.3,<81.0.0
+setuptools>=77.0.3,<80.0.0
 setuptools-scm>=8
 runai-model-streamer[s3,gcs]==0.15.0
 conch-triton-kernels==1.2.1

From 2dacd5739409847e91299e7747a142e200fdff6c Mon Sep 17 00:00:00 2001
From: wangxiyuan <wangxiyuan1007@gmail.com>
Date: Thu, 13 Nov 2025 08:48:47 +0800
Subject: [PATCH 127/183] [platform] Move get_cu_count to utils (#27005)

Signed-off-by: wangxiyuan <wangxiyuan1007@gmail.com>
---
 .../quantization/test_rocm_skinny_gemms.py    | 24 +++++++++++++++----
 .../layers/quantization/utils/w8a8_utils.py   |  3 ++-
 vllm/model_executor/layers/utils.py           |  3 ++-
 vllm/platforms/interface.py                   |  7 ------
 vllm/platforms/rocm.py                        |  4 ----
 vllm/utils/platform_utils.py                  |  5 ++++
 6 files changed, 28 insertions(+), 18 deletions(-)

diff --git a/tests/kernels/quantization/test_rocm_skinny_gemms.py b/tests/kernels/quantization/test_rocm_skinny_gemms.py
index dc6557b93f05..15ff6d536413 100644
--- a/tests/kernels/quantization/test_rocm_skinny_gemms.py
+++ b/tests/kernels/quantization/test_rocm_skinny_gemms.py
@@ -8,6 +8,7 @@
 import vllm._custom_ops as ops
 from tests.kernels.quant_utils import ref_dynamic_per_tensor_fp8_quant
 from vllm.platforms import current_platform
+from vllm.utils.platform_utils import get_cu_count
 
 DTYPES = [torch.bfloat16, torch.float16]
 # Specific (N, K, M) combinations for targeted testing
@@ -85,7 +86,7 @@ def test_rocm_llmm1_kernel(n, k, m, dtype, rows_per_block, seed):
 @pytest.mark.skipif(not current_platform.is_rocm(), reason="only test for rocm")
 def test_rocm_wvsplitk_kernel(n, k, m, dtype, seed):
     torch.manual_seed(seed)
-    cu_count = current_platform.get_cu_count()
+    cu_count = get_cu_count()
 
     A = torch.rand(n, k, dtype=dtype, device="cuda") - 0.5
     B = torch.rand(m, k, dtype=dtype, device="cuda") - 0.5
@@ -102,7 +103,7 @@ def test_rocm_wvsplitk_kernel(n, k, m, dtype, seed):
 @pytest.mark.skipif(not current_platform.is_rocm(), reason="only test for rocm")
 def test_rocm_wvsplitk_bias1D_kernel(n, k, m, dtype, seed):
     torch.manual_seed(seed)
-    cu_count = current_platform.get_cu_count()
+    cu_count = get_cu_count()
 
     xavier = math.sqrt(2 / k)  # normalize to avoid large output-bias deltas
     A = (torch.rand(n, k, dtype=dtype, device="cuda") - 0.5) * xavier
@@ -121,7 +122,7 @@ def test_rocm_wvsplitk_bias1D_kernel(n, k, m, dtype, seed):
 @pytest.mark.skipif(not current_platform.is_rocm(), reason="only test for rocm")
 def test_rocm_wvsplitk_bias2D_kernel(n, k, m, dtype, seed):
     torch.manual_seed(seed)
-    cu_count = current_platform.get_cu_count()
+    cu_count = get_cu_count()
 
     xavier = math.sqrt(2 / k)  # normalize to avoid large output-bias deltas
     A = (torch.rand(n, k, dtype=dtype, device="cuda") - 0.5) * xavier
@@ -153,7 +154,14 @@ def test_rocm_wvsplitk_fp8_kernel(n, k, m, dtype, seed):
     ref_out = torch._scaled_mm(
         A, B.t(), out_dtype=dtype, scale_a=scale_a, scale_b=scale_b
     )
-    out = ops.wvSplitKQ(B, A, dtype, scale_a, scale_b, current_platform.get_cu_count())
+    out = ops.wvSplitKQ(
+        B,
+        A,
+        dtype,
+        scale_a,
+        scale_b,
+        get_cu_count(),
+    )
 
     assert torch.allclose(out, ref_out, rtol=0.01)
 
@@ -180,7 +188,13 @@ def test_rocm_wvsplitk_fp8_bias1D_kernel(n, k, m, dtype, seed):
         A, B.t(), out_dtype=dtype, scale_a=scale_a, scale_b=scale_b, bias=BIAS
     )
     out = ops.wvSplitKQ(
-        B, A, dtype, scale_a, scale_b, current_platform.get_cu_count(), BIAS
+        B,
+        A,
+        dtype,
+        scale_a,
+        scale_b,
+        get_cu_count(),
+        BIAS,
     )
 
     assert torch.allclose(out, ref_out, rtol=0.01)
diff --git a/vllm/model_executor/layers/quantization/utils/w8a8_utils.py b/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
index 7fe902807a74..fceed3e55c2d 100644
--- a/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
@@ -13,6 +13,7 @@
 from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.platforms import current_platform
 from vllm.utils.flashinfer import flashinfer_scaled_fp8_mm, has_flashinfer
+from vllm.utils.platform_utils import get_cu_count
 from vllm.utils.torch_utils import direct_register_custom_op
 
 # Input scaling factors are no longer optional in _scaled_mm starting
@@ -200,7 +201,7 @@ def rocm_per_tensor_w8a8_scaled_mm_impl(
             out_dtype,
             scale_a,
             scale_b,
-            current_platform.get_cu_count(),
+            get_cu_count(),
             bias,
         )
     else:
diff --git a/vllm/model_executor/layers/utils.py b/vllm/model_executor/layers/utils.py
index 68262a2703f9..4b7ba2eed94c 100644
--- a/vllm/model_executor/layers/utils.py
+++ b/vllm/model_executor/layers/utils.py
@@ -11,6 +11,7 @@
 from vllm._aiter_ops import rocm_aiter_ops
 from vllm.logger import init_logger
 from vllm.platforms import CpuArchEnum, current_platform
+from vllm.utils.platform_utils import get_cu_count
 from vllm.utils.torch_utils import direct_register_custom_op
 
 logger = init_logger(__name__)
@@ -151,7 +152,7 @@ def rocm_unquantized_gemm_impl(
 
     x_view = x.reshape(-1, x.size(-1))
     if m > 8 and 0 < n <= 4:
-        cu_count = current_platform.get_cu_count()
+        cu_count = get_cu_count()
         out = ops.wvSplitK(weight, x_view, cu_count, bias)
         return out.reshape(*x.shape[:-1], weight.shape[0])
     elif m % 4 == 0 and n == 1 and k <= 8192 and bias is None:
diff --git a/vllm/platforms/interface.py b/vllm/platforms/interface.py
index bde825f7709a..12c377384270 100644
--- a/vllm/platforms/interface.py
+++ b/vllm/platforms/interface.py
@@ -545,13 +545,6 @@ def get_global_graph_pool(self) -> Any:
             cls._global_graph_pool = self.graph_pool_handle()
         return cls._global_graph_pool
 
-    @classmethod
-    def get_cu_count(cls, device_id: int = 0) -> int:
-        """
-        Returns the total number of compute units (CU) on single GPU.
-        """
-        raise NotImplementedError
-
     @classmethod
     def get_static_graph_wrapper_cls(cls) -> str:
         """
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index d977d999de67..d20dc9e6b067 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -423,10 +423,6 @@ def use_custom_allreduce(cls) -> bool:
     def opaque_attention_op(cls) -> bool:
         return True
 
-    @classmethod
-    def get_cu_count(cls, device_id: int = 0) -> int:
-        return torch.cuda.get_device_properties(device_id).multi_processor_count
-
     @classmethod
     def is_navi(cls) -> bool:
         return "gfx1" in torch.cuda.get_device_properties(0).gcnArchName
diff --git a/vllm/utils/platform_utils.py b/vllm/utils/platform_utils.py
index 34ac820c6e9d..3327fce6707b 100644
--- a/vllm/utils/platform_utils.py
+++ b/vllm/utils/platform_utils.py
@@ -24,6 +24,11 @@ def xpu_is_initialized() -> bool:
     return torch.xpu.is_initialized()
 
 
+def get_cu_count(cls, device_id: int = 0) -> int:
+    """Returns the total number of compute units (CU) on single GPU."""
+    return torch.cuda.get_device_properties(device_id).multi_processor_count
+
+
 def cuda_get_device_properties(
     device, names: Sequence[str], init_cuda=False
 ) -> tuple[Any, ...]:

From a543e678b45a08c6bd98a4e5ebcc244679003659 Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Wed, 12 Nov 2025 21:40:59 -0500
Subject: [PATCH 128/183] [Bugfix] Fix SM100 gpt-oss regression due to faulty
 attn sink support (#28561)

Signed-off-by: mgoin <mgoin64@gmail.com>
---
 vllm/utils/flashinfer.py                 | 31 ++++++++++++++++--------
 vllm/v1/attention/backends/flashinfer.py | 15 ++++++++++++
 2 files changed, 36 insertions(+), 10 deletions(-)

diff --git a/vllm/utils/flashinfer.py b/vllm/utils/flashinfer.py
index 5101020fda12..62af39513d65 100644
--- a/vllm/utils/flashinfer.py
+++ b/vllm/utils/flashinfer.py
@@ -35,9 +35,20 @@
 )
 
 
+@functools.cache
+def has_flashinfer_cubin() -> bool:
+    """Return `True` if flashinfer-cubin package is available."""
+    if envs.VLLM_HAS_FLASHINFER_CUBIN:
+        return True
+    if importlib.util.find_spec("flashinfer_cubin") is not None:
+        return True
+    logger.debug_once("flashinfer-cubin package was not found")
+    return False
+
+
 @functools.cache
 def has_flashinfer() -> bool:
-    """Return `True` if FlashInfer is available."""
+    """Return `True` if flashinfer-python package is available."""
     # Use find_spec to check if the module exists without importing it
     # This avoids potential CUDA initialization side effects
     if importlib.util.find_spec("flashinfer") is None:
@@ -45,7 +56,7 @@ def has_flashinfer() -> bool:
         return False
     # When not using flashinfer cubin,
     # Also check if nvcc is available since it's required to JIT compile flashinfer
-    if not envs.VLLM_HAS_FLASHINFER_CUBIN and shutil.which("nvcc") is None:
+    if not has_flashinfer_cubin() and shutil.which("nvcc") is None:
         logger.debug_once(
             "FlashInfer unavailable since nvcc was not found "
             "and not using pre-downloaded cubins"
@@ -183,9 +194,8 @@ def has_nvidia_artifactory() -> bool:
     This checks connectivity to the kernel inference library artifactory
     which is required for downloading certain cubin kernels like TRTLLM FHMA.
     """
-    # Since FLASHINFER_CUBIN_DIR defines the pre-downloaded cubins path, when
-    # it's true, we could assume the cubins are available.
-    if envs.VLLM_HAS_FLASHINFER_CUBIN:
+    # If we have pre-downloaded cubins, we can assume the cubins are available.
+    if has_flashinfer_cubin():
         return True
 
     try:
@@ -208,9 +218,13 @@ def has_nvidia_artifactory() -> bool:
 @functools.cache
 def supports_trtllm_attention() -> bool:
     """
-    TRTLLM attention is supported if the platform is SM100 and
-    NVIDIA artifactory is accessible
+    TRTLLM attention is supported if the platform is SM100,
+    NVIDIA artifactory is accessible, and batch-invariant mode is not enabled.
     """
+    # Batch-invariant mode disables TRTLLM attention
+    if vllm_is_batch_invariant():
+        return False
+
     # Requires SM100 and NVIDIA artifactory to be accessible to download cubins
     return current_platform.is_device_capability(100) and has_nvidia_artifactory()
 
@@ -229,9 +243,6 @@ def force_use_trtllm_attention() -> bool | None:
     return `True` if TRTLLM attention is forced to be used,
     return `False` if TRTLLM attention is forced to be not used.
     """
-    if vllm_is_batch_invariant():
-        logger.info_once("VLLM_USE_TRTLLM_ATTENTION is disabled for batch-invariant")
-        return False
     return _force_use_trtllm_attention(envs.VLLM_USE_TRTLLM_ATTENTION)
 
 
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 1ce8e6f3d89f..0b650e2e0d33 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -229,6 +229,21 @@ def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
             12, 1
         )
 
+    @classmethod
+    def supports_sink(cls) -> bool:
+        """FlashInfer supports sinks when TRTLLM attention is available (SM100)."""
+        from vllm.utils.flashinfer import (
+            force_use_trtllm_attention,
+            supports_trtllm_attention,
+        )
+
+        # Respect explicit disable flag (e.g., VLLM_USE_TRTLLM_ATTENTION=0)
+        if force_use_trtllm_attention() is False:
+            return False
+
+        # Check if TRTLLM is supported on this platform
+        return supports_trtllm_attention()
+
     @classmethod
     def get_required_kv_cache_layout(cls) -> KVCacheLayoutType | None:
         from vllm.platforms import current_platform

From 8832fff972b2f2c4a653f6cc10d3c77013b8326a Mon Sep 17 00:00:00 2001
From: Nick Hill <nhill@redhat.com>
Date: Wed, 12 Nov 2025 19:06:03 -0800
Subject: [PATCH 129/183] [BugFix] Fix `mm_encoder_attn_backend` arg type
 checking (#28599)

Signed-off-by: Nick Hill <nhill@redhat.com>
---
 .buildkite/test-pipeline.yaml | 4 +++-
 vllm/config/multimodal.py     | 3 +++
 2 files changed, 6 insertions(+), 1 deletion(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 36a867f1addb..be1b79ddc432 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -57,7 +57,7 @@ steps:
   - pytest -v -s -m 'not cpu_test' multimodal
   - pytest -v -s utils_
 
-- label: Async Engine, Inputs, Utils, Worker Test (CPU) # 4 mins
+- label: Async Engine, Inputs, Utils, Worker, Config Test (CPU) # 4 mins
   timeout_in_minutes: 10
   source_file_dependencies:
   - vllm/
@@ -66,6 +66,7 @@ steps:
   - tests/multimodal
   - tests/standalone_tests/lazy_imports.py
   - tests/transformers_utils
+  - tests/config
   no_gpu: true
   commands:
   - python3 standalone_tests/lazy_imports.py
@@ -73,6 +74,7 @@ steps:
   - pytest -v -s test_outputs.py
   - pytest -v -s -m 'cpu_test' multimodal
   - pytest -v -s transformers_utils
+  - pytest -v -s config
 
 - label: Python-only Installation Test # 10min
   timeout_in_minutes: 20
diff --git a/vllm/config/multimodal.py b/vllm/config/multimodal.py
index 9348c1b2af8c..9f62b35ed515 100644
--- a/vllm/config/multimodal.py
+++ b/vllm/config/multimodal.py
@@ -170,6 +170,9 @@ def _validate_limit_per_prompt(
     def _validate_mm_encoder_attn_backend(
         cls, value: str | AttentionBackendEnum | None
     ) -> AttentionBackendEnum | None:
+        # We need to import the real type here (deferred to avoid circular import).
+        from vllm.attention.backends.registry import AttentionBackendEnum
+
         if value is None or isinstance(value, AttentionBackendEnum):
             return value
 

From 32262834610d56f533c53acb953777ac8f3d7942 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Thu, 13 Nov 2025 03:12:14 +0000
Subject: [PATCH 130/183] [Docs] Add some details about what the MoE block
 needs for the Transformers backend (#28588)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
---
 docs/models/supported_models.md | 24 +++++++++++++++++++++++-
 1 file changed, 23 insertions(+), 1 deletion(-)

diff --git a/docs/models/supported_models.md b/docs/models/supported_models.md
index eed1b3fb4bc8..c1eb207efcd1 100644
--- a/docs/models/supported_models.md
+++ b/docs/models/supported_models.md
@@ -75,7 +75,12 @@ This section details the necessary modifications to make to a Transformers compa
 To make your model compatible with the Transformers backend, it needs:
 
 1. `kwargs` passed down through all modules from `MyModel` to `MyAttention`.
-    1. If your model is encoder-only, you must also add `is_causal = False` to `MyAttention`.
+    - If your model is encoder-only:
+        1. Add `is_causal = False` to `MyAttention`.
+    - If your model is mixture-of-experts (MoE):
+        1. Your sparse MoE block must have an attribute called `experts`.
+        2. The class of `experts` (`MyExperts`) must inherit from `nn.ModuleList`.
+        3. `MyExperts.forward` must accept `hidden_states`, `top_k_index`, `top_k_weights`.
 2. `MyAttention` must use `ALL_ATTENTION_FUNCTIONS` to call attention.
 3. `MyModel` must contain `_supports_attention_backend = True`.
 
@@ -102,6 +107,23 @@ class MyAttention(nn.Module):
         )
         ...
 
+# Only do this for mixture-of-experts models
+class MyExperts(nn.ModuleList):
+    def forward(self, hidden_states, top_k_index, top_k_weights):
+        ...
+
+# Only do this for mixture-of-experts models
+class MySparseMoEBlock(nn.Module):
+    def __init__(self, config):
+        ...
+        self.experts = MyExperts(config)
+        ...
+
+    def forward(self, hidden_states: torch.Tensor):
+        ...
+        hidden_states = self.experts(hidden_states, top_k_index, top_k_weights)
+        ...
+
 class MyModel(PreTrainedModel):
     _supports_attention_backend = True
 ```

From 97d1c99302df6f7eadc0d0b32ec174db69cb4421 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Thu, 13 Nov 2025 03:14:33 +0000
Subject: [PATCH 131/183] Rename clashing method names for vLLM model protocol
 (#27583)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
---
 docs/contributing/model/basic.md              |  4 +-
 docs/contributing/model/multimodal.md         |  6 +--
 vllm/model_executor/models/apertus.py         |  8 ++--
 vllm/model_executor/models/arcee.py           |  8 ++--
 vllm/model_executor/models/arctic.py          |  8 ++--
 vllm/model_executor/models/aria.py            |  6 +--
 vllm/model_executor/models/aya_vision.py      |  2 +-
 vllm/model_executor/models/baichuan.py        |  8 ++--
 vllm/model_executor/models/bailing_moe.py     |  8 ++--
 vllm/model_executor/models/bamba.py           |  8 ++--
 vllm/model_executor/models/bert.py            | 14 +++---
 vllm/model_executor/models/bert_with_rope.py  |  6 +--
 vllm/model_executor/models/blip2.py           |  2 +-
 vllm/model_executor/models/bloom.py           |  8 ++--
 vllm/model_executor/models/chameleon.py       |  8 ++--
 vllm/model_executor/models/chatglm.py         |  8 ++--
 vllm/model_executor/models/clip.py            | 12 +++---
 vllm/model_executor/models/cohere2_vision.py  |  2 +-
 vllm/model_executor/models/commandr.py        |  8 ++--
 vllm/model_executor/models/dbrx.py            |  8 ++--
 vllm/model_executor/models/deepseek_eagle.py  |  6 +--
 vllm/model_executor/models/deepseek_mtp.py    |  6 +--
 vllm/model_executor/models/deepseek_ocr.py    |  4 +-
 vllm/model_executor/models/deepseek_v2.py     |  8 ++--
 vllm/model_executor/models/deepseek_vl2.py    |  2 +-
 vllm/model_executor/models/dots1.py           |  8 ++--
 vllm/model_executor/models/dots_ocr.py        |  6 +--
 vllm/model_executor/models/ernie45_moe.py     |  8 ++--
 vllm/model_executor/models/ernie45_vl.py      | 10 ++---
 vllm/model_executor/models/ernie45_vl_moe.py  |  8 ++--
 vllm/model_executor/models/ernie_mtp.py       |  6 +--
 vllm/model_executor/models/exaone.py          |  8 ++--
 vllm/model_executor/models/exaone4.py         |  8 ++--
 vllm/model_executor/models/falcon.py          |  8 ++--
 vllm/model_executor/models/falcon_h1.py       |  8 ++--
 vllm/model_executor/models/fuyu.py            |  2 +-
 vllm/model_executor/models/gemma.py           |  8 ++--
 vllm/model_executor/models/gemma2.py          |  8 ++--
 vllm/model_executor/models/gemma3.py          |  8 ++--
 vllm/model_executor/models/gemma3_mm.py       |  2 +-
 vllm/model_executor/models/gemma3n.py         | 12 +++---
 vllm/model_executor/models/gemma3n_mm.py      | 12 +++---
 vllm/model_executor/models/glm4.py            |  4 +-
 vllm/model_executor/models/glm4_1v.py         |  4 +-
 vllm/model_executor/models/glm4_moe.py        |  8 ++--
 vllm/model_executor/models/glm4_moe_mtp.py    |  6 +--
 vllm/model_executor/models/glm4v.py           |  4 +-
 vllm/model_executor/models/gpt2.py            | 12 +++---
 vllm/model_executor/models/gpt_bigcode.py     |  8 ++--
 vllm/model_executor/models/gpt_j.py           |  8 ++--
 vllm/model_executor/models/gpt_neox.py        |  8 ++--
 vllm/model_executor/models/gpt_oss.py         |  8 ++--
 vllm/model_executor/models/granite.py         |  8 ++--
 vllm/model_executor/models/granite_speech.py  |  8 ++--
 vllm/model_executor/models/granitemoe.py      |  8 ++--
 .../model_executor/models/granitemoehybrid.py |  8 ++--
 .../model_executor/models/granitemoeshared.py |  8 ++--
 vllm/model_executor/models/grok1.py           |  8 ++--
 vllm/model_executor/models/hunyuan_v1.py      |  8 ++--
 .../models/hyperclovax_vision.py              |  2 +-
 vllm/model_executor/models/idefics3.py        |  6 +--
 vllm/model_executor/models/interfaces.py      | 32 ++++++++------
 vllm/model_executor/models/interfaces_base.py | 43 ++++++++++---------
 vllm/model_executor/models/internlm2.py       |  8 ++--
 vllm/model_executor/models/interns1.py        |  8 ++--
 vllm/model_executor/models/internvl.py        |  8 ++--
 vllm/model_executor/models/jais.py            |  8 ++--
 vllm/model_executor/models/jamba.py           |  8 ++--
 vllm/model_executor/models/keye.py            |  4 +-
 vllm/model_executor/models/kimi_linear.py     |  8 ++--
 vllm/model_executor/models/kimi_vl.py         |  2 +-
 vllm/model_executor/models/lfm2.py            |  8 ++--
 vllm/model_executor/models/lfm2_moe.py        |  8 ++--
 vllm/model_executor/models/llama.py           |  8 ++--
 vllm/model_executor/models/llama4_eagle.py    |  6 +--
 vllm/model_executor/models/llama_eagle.py     |  6 +--
 vllm/model_executor/models/llama_eagle3.py    |  8 ++--
 vllm/model_executor/models/llava.py           |  2 +-
 vllm/model_executor/models/llava_next.py      |  8 ++--
 .../model_executor/models/llava_next_video.py |  2 +-
 vllm/model_executor/models/llava_onevision.py |  2 +-
 vllm/model_executor/models/longcat_flash.py   |  8 ++--
 vllm/model_executor/models/mamba.py           |  8 ++--
 vllm/model_executor/models/mamba2.py          |  8 ++--
 vllm/model_executor/models/midashenglm.py     |  2 +-
 vllm/model_executor/models/mimo.py            |  2 +-
 vllm/model_executor/models/mimo_mtp.py        |  6 +--
 vllm/model_executor/models/minicpm.py         |  8 ++--
 vllm/model_executor/models/minicpm_eagle.py   |  8 ++--
 vllm/model_executor/models/minicpmv.py        |  2 +-
 vllm/model_executor/models/minimax_m2.py      |  8 ++--
 vllm/model_executor/models/minimax_text_01.py |  6 +--
 vllm/model_executor/models/minimax_vl_01.py   |  6 +--
 vllm/model_executor/models/mistral3.py        |  2 +-
 vllm/model_executor/models/mixtral.py         |  8 ++--
 vllm/model_executor/models/mllama4.py         |  2 +-
 vllm/model_executor/models/modernbert.py      | 14 +++---
 vllm/model_executor/models/molmo.py           |  4 +-
 vllm/model_executor/models/mpt.py             |  8 ++--
 .../model_executor/models/nano_nemotron_vl.py |  6 +--
 vllm/model_executor/models/nemotron.py        |  8 ++--
 vllm/model_executor/models/nemotron_h.py      |  8 ++--
 vllm/model_executor/models/nemotron_nas.py    |  8 ++--
 vllm/model_executor/models/nemotron_vl.py     |  8 ++--
 vllm/model_executor/models/olmo.py            |  8 ++--
 vllm/model_executor/models/olmo2.py           |  6 +--
 vllm/model_executor/models/olmoe.py           |  8 ++--
 vllm/model_executor/models/openpangu.py       |  8 ++--
 vllm/model_executor/models/openpangu_mtp.py   |  4 +-
 vllm/model_executor/models/opt.py             | 12 +++---
 vllm/model_executor/models/orion.py           |  8 ++--
 vllm/model_executor/models/ouro.py            |  8 ++--
 vllm/model_executor/models/ovis.py            |  2 +-
 vllm/model_executor/models/ovis2_5.py         |  2 +-
 vllm/model_executor/models/paddleocr_vl.py    |  6 +--
 vllm/model_executor/models/paligemma.py       |  2 +-
 vllm/model_executor/models/persimmon.py       |  8 ++--
 vllm/model_executor/models/phi.py             |  8 ++--
 vllm/model_executor/models/phi3v.py           |  8 ++--
 vllm/model_executor/models/phi4_multimodal.py |  2 +-
 vllm/model_executor/models/phi4mm.py          |  2 +-
 vllm/model_executor/models/phimoe.py          |  8 ++--
 vllm/model_executor/models/pixtral.py         |  2 +-
 vllm/model_executor/models/plamo2.py          |  8 ++--
 vllm/model_executor/models/qwen.py            |  4 +-
 vllm/model_executor/models/qwen2.py           |  8 ++--
 .../models/qwen2_5_omni_thinker.py            | 10 ++---
 vllm/model_executor/models/qwen2_5_vl.py      |  2 +-
 vllm/model_executor/models/qwen2_audio.py     |  2 +-
 vllm/model_executor/models/qwen2_moe.py       |  8 ++--
 vllm/model_executor/models/qwen2_rm.py        |  4 +-
 vllm/model_executor/models/qwen2_vl.py        |  2 +-
 vllm/model_executor/models/qwen3.py           |  4 +-
 vllm/model_executor/models/qwen3_moe.py       |  8 ++--
 vllm/model_executor/models/qwen3_next.py      |  8 ++--
 vllm/model_executor/models/qwen3_next_mtp.py  |  8 ++--
 .../models/qwen3_omni_moe_thinker.py          | 12 +++---
 vllm/model_executor/models/qwen3_vl.py        | 14 +++---
 vllm/model_executor/models/qwen3_vl_moe.py    |  2 +-
 vllm/model_executor/models/qwen_vl.py         |  2 +-
 vllm/model_executor/models/roberta.py         |  4 +-
 vllm/model_executor/models/seed_oss.py        |  8 ++--
 vllm/model_executor/models/siglip.py          | 10 ++---
 vllm/model_executor/models/skyworkr1v.py      |  8 ++--
 vllm/model_executor/models/solar.py           |  8 ++--
 vllm/model_executor/models/stablelm.py        |  8 ++--
 vllm/model_executor/models/starcoder2.py      |  8 ++--
 vllm/model_executor/models/step3_text.py      |  8 ++--
 vllm/model_executor/models/step3_vl.py        | 12 +++---
 vllm/model_executor/models/tarsier.py         |  6 +--
 vllm/model_executor/models/teleflm.py         |  2 +-
 vllm/model_executor/models/terratorch.py      |  2 +-
 .../models/transformers/base.py               |  4 +-
 .../models/transformers/multimodal.py         |  2 +-
 vllm/model_executor/models/ultravox.py        |  8 ++--
 vllm/model_executor/models/utils.py           |  2 +-
 vllm/model_executor/models/voxtral.py         |  2 +-
 vllm/model_executor/models/whisper.py         | 10 ++---
 vllm/model_executor/models/zamba2.py          |  8 ++--
 vllm/multimodal/processing.py                 |  2 +-
 vllm/v1/spec_decode/eagle.py                  | 10 ++---
 vllm/v1/worker/gpu_model_runner.py            | 10 ++---
 vllm/v1/worker/tpu_model_runner.py            | 22 +++++-----
 vllm/v1/worker/utils.py                       |  8 ++--
 164 files changed, 574 insertions(+), 583 deletions(-)

diff --git a/docs/contributing/model/basic.md b/docs/contributing/model/basic.md
index 795bd5507a61..a7b54f015c2d 100644
--- a/docs/contributing/model/basic.md
+++ b/docs/contributing/model/basic.md
@@ -56,13 +56,13 @@ The initialization code should look like this:
 
 ### Computation Code
 
-- Add a `get_input_embeddings` method inside `MyModel` module that returns the text embeddings given `input_ids`. This is equivalent to directly calling the text embedding layer, but provides a unified interface in case `MyModel` is used within a composite multimodal model.
+- Add a `embed_input_ids` method inside `MyModel` module that returns the text embeddings given `input_ids`. This is equivalent to directly calling the text embedding layer, but provides a unified interface in case `MyModel` is used within a composite multimodal model.
 
 ```python
 class MyModel(nn.Module):
         ...
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         ... 
 ```
 
diff --git a/docs/contributing/model/multimodal.md b/docs/contributing/model/multimodal.md
index 4e74afc688cf..c2ca199220a1 100644
--- a/docs/contributing/model/multimodal.md
+++ b/docs/contributing/model/multimodal.md
@@ -36,7 +36,7 @@ Further update the model as follows:
   
   More conveniently, you can simply pass `**kwargs` to the [forward][torch.nn.Module.forward] method and retrieve the keyword parameters for multimodal inputs from it.
 
-- Implement [get_multimodal_embeddings][vllm.model_executor.models.interfaces.SupportsMultiModal.get_multimodal_embeddings] that returns the embeddings from running the multimodal inputs through the multimodal tokenizer of the model. Below we provide a boilerplate of a typical implementation pattern, but feel free to adjust it to your own needs.
+- Implement [embed_multimodal][vllm.model_executor.models.interfaces.SupportsMultiModal.embed_multimodal] that returns the embeddings from running the multimodal inputs through the multimodal tokenizer of the model. Below we provide a boilerplate of a typical implementation pattern, but feel free to adjust it to your own needs.
 
     ??? code
 
@@ -49,7 +49,7 @@ Further update the model as follows:
                 image_features = self.vision_encoder(image_input)
                 return self.multi_modal_projector(image_features)
 
-            def get_multimodal_embeddings(
+            def embed_multimodal(
                 self,
                 **kwargs: object,
             ) -> MultiModalEmbeddings | None:
@@ -69,7 +69,7 @@ Further update the model as follows:
 !!! note
     By default, vLLM merges the multimodal embeddings into text embeddings depending on the information of their locations defined in
     [PlaceholderRange][vllm.multimodal.inputs.PlaceholderRange] from input processing.
-    This logic can be found at [get_input_embeddings][vllm.model_executor.models.interfaces.SupportsMultiModal.get_input_embeddings].
+    This logic can be found at [embed_input_ids][vllm.model_executor.models.interfaces.SupportsMultiModal.embed_input_ids].
 
     You may override this method if additional logic is required for your model when merging embeddings. 
 
diff --git a/vllm/model_executor/models/apertus.py b/vllm/model_executor/models/apertus.py
index 233b8c79f299..0a8f21abb0a3 100644
--- a/vllm/model_executor/models/apertus.py
+++ b/vllm/model_executor/models/apertus.py
@@ -382,7 +382,7 @@ def __init__(
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -396,7 +396,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -557,8 +557,8 @@ def _init_model(
             vllm_config=vllm_config, prefix=prefix, layer_type=layer_type
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/arcee.py b/vllm/model_executor/models/arcee.py
index f33970aff279..20c3ff075450 100644
--- a/vllm/model_executor/models/arcee.py
+++ b/vllm/model_executor/models/arcee.py
@@ -239,7 +239,7 @@ def __init__(
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -254,7 +254,7 @@ def forward(
             hidden_states = (
                 inputs_embeds
                 if inputs_embeds is not None
-                else self.get_input_embeddings(input_ids)
+                else self.embed_input_ids(input_ids)
             )
             residual = None
         else:
@@ -423,8 +423,8 @@ def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor | None:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         """Load weights into the model (delegates to inner model and handles
diff --git a/vllm/model_executor/models/arctic.py b/vllm/model_executor/models/arctic.py
index ae3b96c83509..b5cc07a56535 100644
--- a/vllm/model_executor/models/arctic.py
+++ b/vllm/model_executor/models/arctic.py
@@ -442,7 +442,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -456,7 +456,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -496,8 +496,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/aria.py b/vllm/model_executor/models/aria.py
index fe37487d6ed8..3d07e6b612ca 100644
--- a/vllm/model_executor/models/aria.py
+++ b/vllm/model_executor/models/aria.py
@@ -613,7 +613,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -629,8 +629,8 @@ def forward(
         **kwargs: object,
     ) -> torch.Tensor | IntermediateTensors:
         if inputs_embeds is None:
-            multimodal_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
+            multimodal_embeddings = self.embed_multimodal(**kwargs)
+            inputs_embeds = self.embed_input_ids(
                 input_ids,
                 multimodal_embeddings,
                 is_multimodal=input_ids == self.config.image_token_index,
diff --git a/vllm/model_executor/models/aya_vision.py b/vllm/model_executor/models/aya_vision.py
index 839ab5947e09..0ada2ed5028b 100644
--- a/vllm/model_executor/models/aya_vision.py
+++ b/vllm/model_executor/models/aya_vision.py
@@ -417,7 +417,7 @@ def _parse_and_validate_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/baichuan.py b/vllm/model_executor/models/baichuan.py
index dac012eb9f82..8991ef4c606b 100644
--- a/vllm/model_executor/models/baichuan.py
+++ b/vllm/model_executor/models/baichuan.py
@@ -309,7 +309,7 @@ def __init__(
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -323,7 +323,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -426,8 +426,8 @@ def __init__(
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/bailing_moe.py b/vllm/model_executor/models/bailing_moe.py
index 641bdb69c366..a87813402256 100644
--- a/vllm/model_executor/models/bailing_moe.py
+++ b/vllm/model_executor/models/bailing_moe.py
@@ -438,7 +438,7 @@ def __init__(
         else:
             self.norm = PPMissingLayer()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.word_embeddings(input_ids)
 
     def forward(
@@ -452,7 +452,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -608,8 +608,8 @@ def __init__(
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/bamba.py b/vllm/model_executor/models/bamba.py
index 4a2b3da1c194..e0a2defd5127 100644
--- a/vllm/model_executor/models/bamba.py
+++ b/vllm/model_executor/models/bamba.py
@@ -314,7 +314,7 @@ def get_layer(prefix: str):
 
         self.final_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -328,7 +328,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -493,8 +493,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/bert.py b/vllm/model_executor/models/bert.py
index 1c2334a78543..2679448bce77 100644
--- a/vllm/model_executor/models/bert.py
+++ b/vllm/model_executor/models/bert.py
@@ -375,7 +375,7 @@ def __init__(
         self.embeddings = embedding_class(self.config)
         self.encoder = BertEncoder(vllm_config=vllm_config, prefix=f"{prefix}.encoder")
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings.word_embeddings(input_ids)
 
     def forward(
@@ -486,8 +486,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.pooler = self._build_pooler(pooler_config)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
@@ -835,8 +835,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             }
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.bert.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.bert.embed_input_ids(input_ids)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(self)
@@ -893,8 +893,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             }
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.bert.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.bert.embed_input_ids(input_ids)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(self)
diff --git a/vllm/model_executor/models/bert_with_rope.py b/vllm/model_executor/models/bert_with_rope.py
index 31fdc4d21245..131cb68914cf 100644
--- a/vllm/model_executor/models/bert_with_rope.py
+++ b/vllm/model_executor/models/bert_with_rope.py
@@ -463,7 +463,7 @@ def __init__(
         )
         self.pooler = BertPooler(self.config) if add_pooling_layer else None
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings(input_ids)
 
     def forward(
@@ -714,8 +714,8 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loaded_params = loader.load_weights(weights)
         return loaded_params
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.new.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.new.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/blip2.py b/vllm/model_executor/models/blip2.py
index 2986a72f2e48..f71b9c01d359 100644
--- a/vllm/model_executor/models/blip2.py
+++ b/vllm/model_executor/models/blip2.py
@@ -630,7 +630,7 @@ def _process_image_input(self, image_input: Blip2ImageInputs) -> torch.Tensor:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/bloom.py b/vllm/model_executor/models/bloom.py
index 18b09ee43b7b..00fba93423d8 100644
--- a/vllm/model_executor/models/bloom.py
+++ b/vllm/model_executor/models/bloom.py
@@ -271,7 +271,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.word_embeddings(input_ids)
 
     def forward(
@@ -285,7 +285,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             hidden_states = self.word_embeddings_layernorm(hidden_states)
         else:
             assert intermediate_tensors is not None
@@ -353,8 +353,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/chameleon.py b/vllm/model_executor/models/chameleon.py
index 64f73e938bf6..fb7476c45fcd 100644
--- a/vllm/model_executor/models/chameleon.py
+++ b/vllm/model_executor/models/chameleon.py
@@ -886,7 +886,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def get_image_tokens(self, pixel_values: torch.Tensor) -> torch.Tensor:
@@ -912,7 +912,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -998,7 +998,7 @@ def _parse_and_validate_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -1006,7 +1006,7 @@ def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_tokens = self.model.get_image_tokens(
             image_input["data"].to(self.config.dtype)
         )
-        vision_embeddings = self.model.get_input_embeddings(image_tokens)
+        vision_embeddings = self.model.embed_input_ids(image_tokens)
         return vision_embeddings
 
     def forward(
diff --git a/vllm/model_executor/models/chatglm.py b/vllm/model_executor/models/chatglm.py
index ccf7c9300166..5d6f5e9125a2 100644
--- a/vllm/model_executor/models/chatglm.py
+++ b/vllm/model_executor/models/chatglm.py
@@ -353,7 +353,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.encoder.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embedding(input_ids)
 
     def forward(
@@ -368,7 +368,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -451,8 +451,8 @@ def __init__(
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def compute_logits(
         self,
diff --git a/vllm/model_executor/models/clip.py b/vllm/model_executor/models/clip.py
index 27953c27188d..50f476dfd185 100644
--- a/vllm/model_executor/models/clip.py
+++ b/vllm/model_executor/models/clip.py
@@ -561,7 +561,7 @@ def __init__(
             eps=config.layer_norm_eps,
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings.token_embedding(input_ids)
 
     def forward(
@@ -842,7 +842,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             }
         )
 
-        # Assumes that self.forward is called after self.get_input_embeddings
+        # Assumes that self.forward is called after self.embed_input_ids
         self._is_text_input = True
 
     def get_text_features(
@@ -903,7 +903,7 @@ def _process_image_inputs(self, inputs: CLIPImagePixelInputs) -> torch.Tensor:
     def get_language_model(self) -> torch.nn.Module:
         return self.text_model
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -917,16 +917,16 @@ def get_input_embeddings(
 
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
             handle_oov_mm_token=handle_oov_mm_token,
         )
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/cohere2_vision.py b/vllm/model_executor/models/cohere2_vision.py
index 19cc31c9bd18..139ccba9df6d 100644
--- a/vllm/model_executor/models/cohere2_vision.py
+++ b/vllm/model_executor/models/cohere2_vision.py
@@ -439,7 +439,7 @@ def _patch_quant_config(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/commandr.py b/vllm/model_executor/models/commandr.py
index 6ae1dc356082..77bb17851981 100644
--- a/vllm/model_executor/models/commandr.py
+++ b/vllm/model_executor/models/commandr.py
@@ -311,7 +311,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -325,7 +325,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -436,8 +436,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     @torch.no_grad()
     def forward(
diff --git a/vllm/model_executor/models/dbrx.py b/vllm/model_executor/models/dbrx.py
index 70999501f4c6..528ef4f76742 100644
--- a/vllm/model_executor/models/dbrx.py
+++ b/vllm/model_executor/models/dbrx.py
@@ -354,7 +354,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.d_model
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
 
     def forward(
@@ -368,7 +368,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors
             hidden_states = intermediate_tensors["hidden_states"]
@@ -455,8 +455,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/deepseek_eagle.py b/vllm/model_executor/models/deepseek_eagle.py
index fd2f20ea501d..9e834a73f8e5 100644
--- a/vllm/model_executor/models/deepseek_eagle.py
+++ b/vllm/model_executor/models/deepseek_eagle.py
@@ -73,7 +73,7 @@ def __init__(
         self.hnorm = RMSNorm(self.config.hidden_size, eps=self.config.rms_norm_eps)
         self.norm = RMSNorm(self.config.hidden_size, eps=self.config.rms_norm_eps)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -222,8 +222,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.num_moe_layers = self.config.num_hidden_layers
         self.set_moe_parameters()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/deepseek_mtp.py b/vllm/model_executor/models/deepseek_mtp.py
index 26b9c25e6bdb..e028dc497aa6 100644
--- a/vllm/model_executor/models/deepseek_mtp.py
+++ b/vllm/model_executor/models/deepseek_mtp.py
@@ -142,7 +142,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -206,8 +206,8 @@ def set_moe_parameters(self):
                 self.moe_layers.append(layer.mlp.experts)
         self.extract_moe_parameters(example_moe)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/deepseek_ocr.py b/vllm/model_executor/models/deepseek_ocr.py
index 043256752184..c89caab93a1e 100644
--- a/vllm/model_executor/models/deepseek_ocr.py
+++ b/vllm/model_executor/models/deepseek_ocr.py
@@ -557,9 +557,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(
-        self, **kwargs: object
-    ) -> MultiModalEmbeddings | None:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings | None:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return None
diff --git a/vllm/model_executor/models/deepseek_v2.py b/vllm/model_executor/models/deepseek_v2.py
index 38189e17f7d8..115818d903a6 100644
--- a/vllm/model_executor/models/deepseek_v2.py
+++ b/vllm/model_executor/models/deepseek_v2.py
@@ -1236,7 +1236,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -1250,7 +1250,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -1389,8 +1389,8 @@ def set_moe_parameters(self):
 
         self.extract_moe_parameters(example_moe)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/deepseek_vl2.py b/vllm/model_executor/models/deepseek_vl2.py
index 306eef3dca99..e7b48e0f4e55 100644
--- a/vllm/model_executor/models/deepseek_vl2.py
+++ b/vllm/model_executor/models/deepseek_vl2.py
@@ -619,7 +619,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/dots1.py b/vllm/model_executor/models/dots1.py
index 15caa3184581..d24da0c42a25 100644
--- a/vllm/model_executor/models/dots1.py
+++ b/vllm/model_executor/models/dots1.py
@@ -398,7 +398,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -412,7 +412,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -541,8 +541,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/dots_ocr.py b/vllm/model_executor/models/dots_ocr.py
index 1b2bb60a17c1..25e5588961a6 100644
--- a/vllm/model_executor/models/dots_ocr.py
+++ b/vllm/model_executor/models/dots_ocr.py
@@ -840,7 +840,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -858,8 +858,8 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
         elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
+            vision_embeddings = self.embed_multimodal(**kwargs)
+            inputs_embeds = self.embed_input_ids(
                 input_ids,
                 vision_embeddings,
                 is_multimodal=input_ids == self.config.image_token_id,
diff --git a/vllm/model_executor/models/ernie45_moe.py b/vllm/model_executor/models/ernie45_moe.py
index b35666175ea7..f2999968669f 100644
--- a/vllm/model_executor/models/ernie45_moe.py
+++ b/vllm/model_executor/models/ernie45_moe.py
@@ -465,7 +465,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -479,7 +479,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -726,8 +726,8 @@ def update_physical_experts_metadata(
                 moe.n_redundant_experts = self.num_redundant_experts
                 moe.experts.update_expert_map()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/ernie45_vl.py b/vllm/model_executor/models/ernie45_vl.py
index c040b19bba20..daa5bf03ea4a 100644
--- a/vllm/model_executor/models/ernie45_vl.py
+++ b/vllm/model_executor/models/ernie45_vl.py
@@ -1656,9 +1656,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
 
         return modalities
 
-    def get_multimodal_embeddings(
-        self, **kwargs: object
-    ) -> MultiModalEmbeddings | None:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings | None:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return None
@@ -1681,7 +1679,7 @@ def get_multimodal_embeddings(
 
         return multimodal_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -1694,9 +1692,9 @@ def get_input_embeddings(
 
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
diff --git a/vllm/model_executor/models/ernie45_vl_moe.py b/vllm/model_executor/models/ernie45_vl_moe.py
index d002d1838c8e..e8ef86f9b7f0 100644
--- a/vllm/model_executor/models/ernie45_vl_moe.py
+++ b/vllm/model_executor/models/ernie45_vl_moe.py
@@ -561,7 +561,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -577,7 +577,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -642,8 +642,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/ernie_mtp.py b/vllm/model_executor/models/ernie_mtp.py
index e7036840388c..1b9abc3572a3 100644
--- a/vllm/model_executor/models/ernie_mtp.py
+++ b/vllm/model_executor/models/ernie_mtp.py
@@ -112,7 +112,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -160,8 +160,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/exaone.py b/vllm/model_executor/models/exaone.py
index b9c7a520caff..6c56bfc433c7 100644
--- a/vllm/model_executor/models/exaone.py
+++ b/vllm/model_executor/models/exaone.py
@@ -357,7 +357,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
 
     def forward(
@@ -371,7 +371,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -512,8 +512,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/exaone4.py b/vllm/model_executor/models/exaone4.py
index 6a5c888c095a..b89e168ada20 100644
--- a/vllm/model_executor/models/exaone4.py
+++ b/vllm/model_executor/models/exaone4.py
@@ -344,7 +344,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -358,7 +358,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -498,8 +498,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/falcon.py b/vllm/model_executor/models/falcon.py
index 1b9c7da33490..85acdff3d96b 100644
--- a/vllm/model_executor/models/falcon.py
+++ b/vllm/model_executor/models/falcon.py
@@ -399,7 +399,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.word_embeddings(input_ids)
 
     def forward(
@@ -413,7 +413,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             hidden_states = intermediate_tensors["hidden_states"]
         for layer in islice(self.h, self.start_layer, self.end_layer):
@@ -515,8 +515,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/falcon_h1.py b/vllm/model_executor/models/falcon_h1.py
index 38838be29093..3653425b8e1c 100644
--- a/vllm/model_executor/models/falcon_h1.py
+++ b/vllm/model_executor/models/falcon_h1.py
@@ -461,7 +461,7 @@ def get_layer(prefix: str):
         else:
             self.final_layernorm = PPMissingLayer()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -476,7 +476,7 @@ def forward(
                 hidden_states = inputs_embeds * self.embedding_multiplier
             else:
                 hidden_states = (
-                    self.get_input_embeddings(input_ids) * self.embedding_multiplier
+                    self.embed_input_ids(input_ids) * self.embedding_multiplier
                 )
         else:
             assert intermediate_tensors is not None
@@ -601,8 +601,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/fuyu.py b/vllm/model_executor/models/fuyu.py
index 005fac4b1f05..269c36ab5b9c 100644
--- a/vllm/model_executor/models/fuyu.py
+++ b/vllm/model_executor/models/fuyu.py
@@ -333,7 +333,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/gemma.py b/vllm/model_executor/models/gemma.py
index caeee7c2e1ec..7aaae7c503b5 100644
--- a/vllm/model_executor/models/gemma.py
+++ b/vllm/model_executor/models/gemma.py
@@ -293,7 +293,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -307,7 +307,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             hidden_states *= self.normalizer
             residual = None
         else:
@@ -396,8 +396,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/gemma2.py b/vllm/model_executor/models/gemma2.py
index efd01535fc3e..4d5d6cbb37c6 100644
--- a/vllm/model_executor/models/gemma2.py
+++ b/vllm/model_executor/models/gemma2.py
@@ -290,7 +290,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -304,7 +304,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             hidden_states *= self.normalizer
             residual = None
         else:
@@ -409,8 +409,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/gemma3.py b/vllm/model_executor/models/gemma3.py
index 213f9f562f8a..357e61a4e78b 100644
--- a/vllm/model_executor/models/gemma3.py
+++ b/vllm/model_executor/models/gemma3.py
@@ -393,7 +393,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         # NOTE(woosuk): Only apply the normalizer to the output of
         # vocab embedding. Don't apply it to the vision embedding.
         return self.embed_tokens(input_ids) * self.normalizer
@@ -410,7 +410,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -540,8 +540,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/gemma3_mm.py b/vllm/model_executor/models/gemma3_mm.py
index 8e1dbd9e2cea..02fb7ef31dc9 100644
--- a/vllm/model_executor/models/gemma3_mm.py
+++ b/vllm/model_executor/models/gemma3_mm.py
@@ -596,7 +596,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/gemma3n.py b/vllm/model_executor/models/gemma3n.py
index 22d51ab76269..64443190f53e 100644
--- a/vllm/model_executor/models/gemma3n.py
+++ b/vllm/model_executor/models/gemma3n.py
@@ -685,7 +685,7 @@ def get_per_layer_inputs(
             per_layer_inputs = per_layer_projection
         return per_layer_inputs
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids) * self.embed_scale
 
     def altup_embed(self, hidden_states_0: torch.Tensor) -> torch.Tensor:
@@ -712,7 +712,7 @@ def forward(
         if inputs_embeds is not None:
             hidden_states_0 = inputs_embeds
         else:
-            hidden_states_0 = self.get_input_embeddings(input_ids)
+            hidden_states_0 = self.embed_input_ids(input_ids)
 
         adjusted_per_layer_inputs = self.get_per_layer_inputs(
             hidden_states_0, per_layer_inputs
@@ -881,8 +881,8 @@ def embed_tokens(self):
     def get_per_layer_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.self_decoder.get_per_layer_input_embeddings(input_ids)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.self_decoder.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.self_decoder.embed_input_ids(input_ids)
 
     def fast_prefill_forward(
         self,
@@ -1125,8 +1125,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config.vocab_size, soft_cap=config.final_logit_softcapping
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/gemma3n_mm.py b/vllm/model_executor/models/gemma3n_mm.py
index 2b727a538bf2..6ae76976eb46 100644
--- a/vllm/model_executor/models/gemma3n_mm.py
+++ b/vllm/model_executor/models/gemma3n_mm.py
@@ -645,7 +645,7 @@ def _process_audio_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if mm_input_by_modality is None:
             return []
@@ -664,7 +664,7 @@ def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
                 multimodal_embeddings.extend(audio_embeddings)
         return multimodal_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: Optional[MultiModalEmbeddings] = None,
@@ -689,9 +689,9 @@ def get_input_embeddings(
 
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
@@ -709,10 +709,10 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE (NickLucche) During profiling, `get_input_embeddings` is not
+        # NOTE (NickLucche) During profiling, `embed_input_ids` is not
         # called, hence we don't have input_ids to compute PLEs. We simply
         # select a chunk of pre-allocated PLEs. During normal execution,
-        # `get_input_embeddings` is called before forward, hence this slice
+        # `embed_input_ids` is called before forward, hence this slice
         # will contain PLEs computed from the actual input_ids.
         per_layer_inputs = self.per_layer_embeddings[: inputs_embeds.shape[0]]
 
diff --git a/vllm/model_executor/models/glm4.py b/vllm/model_executor/models/glm4.py
index 4172f16737c1..faa0674a2e43 100644
--- a/vllm/model_executor/models/glm4.py
+++ b/vllm/model_executor/models/glm4.py
@@ -275,8 +275,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index 60cad2e2907f..b2d4fe0c0139 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -1594,9 +1594,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(
-        self, **kwargs: object
-    ) -> MultiModalEmbeddings | None:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings | None:
         mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return None
diff --git a/vllm/model_executor/models/glm4_moe.py b/vllm/model_executor/models/glm4_moe.py
index b30bd66161da..1422dbe9b3cd 100644
--- a/vllm/model_executor/models/glm4_moe.py
+++ b/vllm/model_executor/models/glm4_moe.py
@@ -455,7 +455,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -469,7 +469,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -704,8 +704,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.extract_moe_parameters(example_moe)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/glm4_moe_mtp.py b/vllm/model_executor/models/glm4_moe_mtp.py
index 9db2aaa075de..110ed0a64633 100644
--- a/vllm/model_executor/models/glm4_moe_mtp.py
+++ b/vllm/model_executor/models/glm4_moe_mtp.py
@@ -149,7 +149,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -211,8 +211,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 self.moe_layers.append(layer.mlp.experts)
         self.extract_moe_parameters(example_moe)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/glm4v.py b/vllm/model_executor/models/glm4v.py
index 899797a51053..1c18ea0745f2 100644
--- a/vllm/model_executor/models/glm4v.py
+++ b/vllm/model_executor/models/glm4v.py
@@ -756,9 +756,9 @@ def get_mrope_input_positions(
     def get_language_model(self) -> torch.nn.Module:
         return self.transformer
 
-    get_input_embeddings = SupportsMultiModal.get_input_embeddings
+    embed_input_ids = SupportsMultiModal.embed_input_ids
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/gpt2.py b/vllm/model_executor/models/gpt2.py
index 6d99d02a32be..a5e8131c7fba 100644
--- a/vllm/model_executor/models/gpt2.py
+++ b/vllm/model_executor/models/gpt2.py
@@ -213,7 +213,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.n_embd
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
 
     def forward(
@@ -225,7 +225,7 @@ def forward(
     ) -> torch.Tensor | IntermediateTensors:
         if get_pp_group().is_first_rank:
             if inputs_embeds is None:
-                inputs_embeds = self.get_input_embeddings(input_ids)
+                inputs_embeds = self.embed_input_ids(input_ids)
             position_embeds = self.wpe(position_ids)
             hidden_states = inputs_embeds + position_embeds
         else:
@@ -293,8 +293,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def forward(
         self,
@@ -365,8 +365,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             }
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(self)
diff --git a/vllm/model_executor/models/gpt_bigcode.py b/vllm/model_executor/models/gpt_bigcode.py
index 99cdaabb98df..cdf038ba25c9 100644
--- a/vllm/model_executor/models/gpt_bigcode.py
+++ b/vllm/model_executor/models/gpt_bigcode.py
@@ -230,7 +230,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.n_embd
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
 
     def forward(
@@ -242,7 +242,7 @@ def forward(
     ) -> torch.Tensor | IntermediateTensors:
         if get_pp_group().is_first_rank:
             if inputs_embeds is None:
-                inputs_embeds = self.get_input_embeddings(input_ids)
+                inputs_embeds = self.embed_input_ids(input_ids)
             hidden_states = inputs_embeds + self.wpe(position_ids)
         else:
             hidden_states = intermediate_tensors["hidden_states"]
@@ -306,8 +306,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/gpt_j.py b/vllm/model_executor/models/gpt_j.py
index e04b2465e54a..e416ecde0c1e 100644
--- a/vllm/model_executor/models/gpt_j.py
+++ b/vllm/model_executor/models/gpt_j.py
@@ -215,7 +215,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.n_embd
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
 
     def forward(
@@ -229,7 +229,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             hidden_states = intermediate_tensors["hidden_states"]
         for layer in islice(self.h, self.start_layer, self.end_layer):
@@ -319,8 +319,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/gpt_neox.py b/vllm/model_executor/models/gpt_neox.py
index e6c145602d29..af0c9209231c 100644
--- a/vllm/model_executor/models/gpt_neox.py
+++ b/vllm/model_executor/models/gpt_neox.py
@@ -229,7 +229,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_in(input_ids)
 
     def forward(
@@ -243,7 +243,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             hidden_states = intermediate_tensors["hidden_states"]
         for layer in islice(self.layers, self.start_layer, self.end_layer):
@@ -317,8 +317,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.gpt_neox.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.gpt_neox.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.gpt_neox.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/gpt_oss.py b/vllm/model_executor/models/gpt_oss.py
index 9cb481fc30c7..692ef605fe17 100644
--- a/vllm/model_executor/models/gpt_oss.py
+++ b/vllm/model_executor/models/gpt_oss.py
@@ -269,7 +269,7 @@ def __init__(
         )
         self.aux_hidden_state_layers = tuple[int, ...]()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embedding(input_ids)
 
     def forward(
@@ -283,7 +283,7 @@ def forward(
             if inputs_embeds is not None:
                 x = inputs_embeds
             else:
-                x = self.get_input_embeddings(input_ids)
+                x = self.embed_input_ids(input_ids)
 
             residual = None
         else:
@@ -703,8 +703,8 @@ def get_eagle3_aux_hidden_state_layers(self) -> tuple[int, ...]:
         num_layers = len(self.model.layers)
         return (2, num_layers // 2, num_layers - 3)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/granite.py b/vllm/model_executor/models/granite.py
index 5fc8718ca75e..c44b4021471e 100644
--- a/vllm/model_executor/models/granite.py
+++ b/vllm/model_executor/models/granite.py
@@ -318,7 +318,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         else:
             self.norm = PPMissingLayer()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -332,7 +332,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
 
             hidden_states *= self.config.embedding_multiplier
         else:
@@ -473,8 +473,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         else:
             self.lm_head = PPMissingLayer()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/granite_speech.py b/vllm/model_executor/models/granite_speech.py
index 3ddf02bbba2e..1797adab8d14 100644
--- a/vllm/model_executor/models/granite_speech.py
+++ b/vllm/model_executor/models/granite_speech.py
@@ -767,7 +767,7 @@ def _process_audio_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(
+    def embed_multimodal(
         self,
         **kwargs: object,
     ) -> MultiModalEmbeddings:
@@ -779,7 +779,7 @@ def get_multimodal_embeddings(
         audio_features = self._process_audio_input(audio_input)
         return audio_features
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -790,9 +790,9 @@ def get_input_embeddings(
     ) -> torch.Tensor:
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
diff --git a/vllm/model_executor/models/granitemoe.py b/vllm/model_executor/models/granitemoe.py
index c5b36c362ee3..5c6759ded066 100644
--- a/vllm/model_executor/models/granitemoe.py
+++ b/vllm/model_executor/models/granitemoe.py
@@ -315,7 +315,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -329,7 +329,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             hidden_states *= self.embedding_multiplier
         else:
             assert intermediate_tensors is not None
@@ -531,8 +531,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             scale=1 / self.config.logits_scaling,
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/granitemoehybrid.py b/vllm/model_executor/models/granitemoehybrid.py
index ea49a0ffee01..05177f1d1ac2 100644
--- a/vllm/model_executor/models/granitemoehybrid.py
+++ b/vllm/model_executor/models/granitemoehybrid.py
@@ -366,7 +366,7 @@ def get_layer(prefix: str):
 
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -380,7 +380,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
                 hidden_states = hidden_states * self.embedding_multiplier
             residual = None
         else:
@@ -680,8 +680,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/granitemoeshared.py b/vllm/model_executor/models/granitemoeshared.py
index e08e9f73ec87..926c539af33b 100644
--- a/vllm/model_executor/models/granitemoeshared.py
+++ b/vllm/model_executor/models/granitemoeshared.py
@@ -182,7 +182,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -196,7 +196,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             hidden_states *= self.embedding_multiplier
         else:
             assert intermediate_tensors is not None
@@ -295,8 +295,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             scale=1 / self.config.logits_scaling,
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/grok1.py b/vllm/model_executor/models/grok1.py
index 0770e03b5356..9dc231863f74 100644
--- a/vllm/model_executor/models/grok1.py
+++ b/vllm/model_executor/models/grok1.py
@@ -334,7 +334,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         hidden_states = self.embed_tokens(input_ids)
         hidden_states = hidden_states * self.embedding_multiplier_scale
         return hidden_states
@@ -350,7 +350,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -522,8 +522,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/hunyuan_v1.py b/vllm/model_executor/models/hunyuan_v1.py
index a05a00932c13..1eadcbe67ade 100644
--- a/vllm/model_executor/models/hunyuan_v1.py
+++ b/vllm/model_executor/models/hunyuan_v1.py
@@ -643,7 +643,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         else:
             self.norm = PPMissingLayer()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -657,7 +657,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -987,8 +987,8 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         )
         return loader.load_weights(weights)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
 
 class HunYuanMoEV1Base(HunyuanV1ModelBase, MixtureOfExperts):
diff --git a/vllm/model_executor/models/hyperclovax_vision.py b/vllm/model_executor/models/hyperclovax_vision.py
index 3d28ba951b94..db46353efde5 100644
--- a/vllm/model_executor/models/hyperclovax_vision.py
+++ b/vllm/model_executor/models/hyperclovax_vision.py
@@ -732,7 +732,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(
+    def embed_multimodal(
         self,
         **kwargs: object,
     ) -> MultiModalEmbeddings:
diff --git a/vllm/model_executor/models/idefics3.py b/vllm/model_executor/models/idefics3.py
index 06ca8c488634..9c5f9389e54b 100644
--- a/vllm/model_executor/models/idefics3.py
+++ b/vllm/model_executor/models/idefics3.py
@@ -550,8 +550,8 @@ def image_pixels_to_features(
 
         return image_hidden_states
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.text_model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.text_model.embed_input_ids(input_ids)
 
     def forward(
         self,
@@ -674,7 +674,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/interfaces.py b/vllm/model_executor/models/interfaces.py
index 88b45bf07c0d..929bfaaee5cb 100644
--- a/vllm/model_executor/models/interfaces.py
+++ b/vllm/model_executor/models/interfaces.py
@@ -94,7 +94,7 @@ def get_placeholder_str(cls, modality: str, i: int) -> str | None:
         """
         ...
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         """
         Returns multimodal embeddings generated from multimodal kwargs
         to be merged with text embeddings.
@@ -104,7 +104,13 @@ def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
             the appearances of their corresponding multimodal data item in the
             input prompt.
         """
-        ...
+        if hasattr(self, "get_multimodal_embeddings"):
+            logger.warning_once(
+                "`get_multimodal_embeddings` for vLLM models is deprecated and will be "
+                "removed in v0.13.0 or v1.0.0, whichever is earlier. Please rename "
+                "this method to `embed_multimodal`."
+            )
+            return self.get_multimodal_embeddings(**kwargs)
 
     def get_language_model(self) -> VllmModel:
         """
@@ -119,10 +125,10 @@ def get_language_model(self) -> VllmModel:
         ...
 
     @overload
-    def get_input_embeddings(self, input_ids: Tensor) -> Tensor: ...
+    def embed_input_ids(self, input_ids: Tensor) -> Tensor: ...
 
     @overload
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: Tensor,
         multimodal_embeddings: MultiModalEmbeddings,
@@ -131,17 +137,17 @@ def get_input_embeddings(
         handle_oov_mm_token: bool = False,
     ) -> Tensor: ...
 
-    def _get_text_embeddings(
+    def _embed_text_input_ids(
         self,
         input_ids: Tensor,
-        get_input_embeddings: Callable[[Tensor], Tensor],
+        embed_input_ids: Callable[[Tensor], Tensor],
         *,
         is_multimodal: Tensor | None,
         handle_oov_mm_token: bool,
     ) -> Tensor:
         if handle_oov_mm_token and is_multimodal is not None:
             is_text = ~is_multimodal
-            text_embeds = get_input_embeddings(input_ids[is_text])
+            text_embeds = embed_input_ids(input_ids[is_text])
 
             return torch.empty(
                 (input_ids.shape[0], text_embeds.shape[1]),
@@ -149,9 +155,9 @@ def _get_text_embeddings(
                 device=text_embeds.device,
             ).masked_scatter_(is_text.unsqueeze_(-1), text_embeds)
 
-        return get_input_embeddings(input_ids)
+        return embed_input_ids(input_ids)
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -167,15 +173,15 @@ def get_input_embeddings(
 
         In case the multi-modal token IDs exceed the vocabulary size of
         the language model, you can set `handle_oov_mm_token=False`
-        to avoid calling the language model's `get_input_embeddings` method
+        to avoid calling the language model's `embed_input_ids` method
         on those tokens. Note however that doing so increases memory usage
         as an additional buffer is needed to hold the input embeddings.
         """
         from .utils import _merge_multimodal_embeddings
 
-        inputs_embeds = self._get_text_embeddings(
+        inputs_embeds = self._embed_text_input_ids(
             input_ids,
-            self.get_language_model().get_input_embeddings,
+            self.get_language_model().embed_input_ids,
             is_multimodal=is_multimodal,
             handle_oov_mm_token=handle_oov_mm_token,
         )
@@ -185,7 +191,7 @@ def get_input_embeddings(
 
         if is_multimodal is None:
             raise ValueError(
-                "`get_input_embeddings` now requires `is_multimodal` arg, "
+                "`embed_input_ids` now requires `is_multimodal` arg, "
                 "please update your model runner according to "
                 "https://github.com/vllm-project/vllm/pull/16229."
             )
diff --git a/vllm/model_executor/models/interfaces_base.py b/vllm/model_executor/models/interfaces_base.py
index d87a65a47083..4267b6c6598e 100644
--- a/vllm/model_executor/models/interfaces_base.py
+++ b/vllm/model_executor/models/interfaces_base.py
@@ -41,24 +41,19 @@
 class VllmModel(Protocol[T_co]):
     """The interface required for all models in vLLM."""
 
-    def __init__(
-        self,
-        vllm_config: VllmConfig,
-        prefix: str = "",
-    ) -> None: ...
+    def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None: ...
 
-    def get_input_embeddings(
-        self,
-        input_ids: torch.Tensor,
-    ) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         """Apply token embeddings to `input_ids`."""
-        ...
+        if hasattr(self, "get_input_embeddings"):
+            logger.warning_once(
+                "`get_input_embeddings` for vLLM models is deprecated and will be "
+                "removed in v0.13.0 or v1.0.0, whichever is earlier. Please rename "
+                "this method to `embed_input_ids`."
+            )
+            return self.get_input_embeddings(input_ids)
 
-    def forward(
-        self,
-        input_ids: torch.Tensor,
-        positions: torch.Tensor,
-    ) -> T_co: ...
+    def forward(self, input_ids: torch.Tensor, positions: torch.Tensor) -> T_co: ...
 
 
 def _check_vllm_model_init(model: type[object] | object) -> bool:
@@ -66,11 +61,19 @@ def _check_vllm_model_init(model: type[object] | object) -> bool:
     return supports_kw(model_init, "vllm_config")
 
 
-def _check_vllm_model_get_input_embeddings(model: type[object] | object) -> bool:
-    model_get_input_embeddings = getattr(model, "get_input_embeddings", None)
-    if not callable(model_get_input_embeddings):
+def _check_vllm_model_embed_input_ids(model: type[object] | object) -> bool:
+    model_embed_input_ids = getattr(model, "embed_input_ids", None)
+    if not callable(model_embed_input_ids):
+        model_get_input_embeddings = getattr(model, "get_input_embeddings", None)
+        if callable(model_get_input_embeddings):
+            logger.warning(
+                "`get_input_embeddings` for vLLM models is deprecated and will be "
+                "removed in v0.13.0 or v1.0.0, whichever is earlier. Please rename "
+                "this method to `embed_input_ids`."
+            )
+            model.embed_input_ids = model_get_input_embeddings
         logger.warning(
-            "The model (%s) is missing the `get_input_embeddings` method.",
+            "The model (%s) is missing the `embed_input_ids` method.",
             model,
         )
         return False
@@ -110,7 +113,7 @@ def is_vllm_model(
 ) -> TypeIs[type[VllmModel]] | TypeIs[VllmModel]:
     return (
         _check_vllm_model_init(model)
-        and _check_vllm_model_get_input_embeddings(model)
+        and _check_vllm_model_embed_input_ids(model)
         and _check_vllm_model_forward(model)
     )
 
diff --git a/vllm/model_executor/models/internlm2.py b/vllm/model_executor/models/internlm2.py
index d856f5c79e33..60fbeb842dd4 100644
--- a/vllm/model_executor/models/internlm2.py
+++ b/vllm/model_executor/models/internlm2.py
@@ -284,7 +284,7 @@ def __init__(
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.tok_embeddings(input_ids)
 
     def forward(
@@ -298,7 +298,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -350,8 +350,8 @@ def __init__(
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/interns1.py b/vllm/model_executor/models/interns1.py
index 1f251935a70a..c2195fd0cb88 100644
--- a/vllm/model_executor/models/interns1.py
+++ b/vllm/model_executor/models/interns1.py
@@ -742,7 +742,7 @@ def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -765,7 +765,7 @@ def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
 
         return multimodal_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -778,9 +778,9 @@ def get_input_embeddings(
 
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
diff --git a/vllm/model_executor/models/internvl.py b/vllm/model_executor/models/internvl.py
index e2d2647f0177..ccbde115009d 100644
--- a/vllm/model_executor/models/internvl.py
+++ b/vllm/model_executor/models/internvl.py
@@ -1344,7 +1344,7 @@ def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -1367,7 +1367,7 @@ def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
 
         return multimodal_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -1380,9 +1380,9 @@ def get_input_embeddings(
 
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
diff --git a/vllm/model_executor/models/jais.py b/vllm/model_executor/models/jais.py
index 782ab6f1e2da..5549a1fc1cd3 100644
--- a/vllm/model_executor/models/jais.py
+++ b/vllm/model_executor/models/jais.py
@@ -275,7 +275,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.n_embd
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
 
     def forward(
@@ -287,7 +287,7 @@ def forward(
     ) -> IntermediateTensors | torch.Tensor:
         if get_pp_group().is_first_rank:
             if inputs_embeds is None:
-                inputs_embeds = self.get_input_embeddings(input_ids)
+                inputs_embeds = self.embed_input_ids(input_ids)
             if self.wpe is not None:
                 position_embeds = self.wpe(position_ids)
                 hidden_states = inputs_embeds + position_embeds
@@ -339,8 +339,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/jamba.py b/vllm/model_executor/models/jamba.py
index 70f52e3106f8..3a2c98c73dab 100644
--- a/vllm/model_executor/models/jamba.py
+++ b/vllm/model_executor/models/jamba.py
@@ -340,7 +340,7 @@ def get_layer(prefix: str):
 
         self.final_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -354,7 +354,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -508,8 +508,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index 2998c87918a9..1eb0eccc0411 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -1484,9 +1484,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(
-        self, **kwargs: object
-    ) -> MultiModalEmbeddings | None:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings | None:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return None
diff --git a/vllm/model_executor/models/kimi_linear.py b/vllm/model_executor/models/kimi_linear.py
index cce22842d333..f3675075a48f 100644
--- a/vllm/model_executor/models/kimi_linear.py
+++ b/vllm/model_executor/models/kimi_linear.py
@@ -439,7 +439,7 @@ def get_layer(prefix: str):
             "num_attention_heads must be divisible by world_size"
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -454,7 +454,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -504,8 +504,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.config.vocab_size, scale=logit_scale
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/kimi_vl.py b/vllm/model_executor/models/kimi_vl.py
index fa04f60b9c14..8167b82f3233 100644
--- a/vllm/model_executor/models/kimi_vl.py
+++ b/vllm/model_executor/models/kimi_vl.py
@@ -404,7 +404,7 @@ def _process_image_input(self, image_input: KimiVLImageInputs) -> torch.Tensor:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> NestedTensors | None:
+    def embed_multimodal(self, **kwargs: object) -> NestedTensors | None:
         # Validate the multimodal input keyword arguments
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
diff --git a/vllm/model_executor/models/lfm2.py b/vllm/model_executor/models/lfm2.py
index 21d71887178e..aeb25602f11a 100644
--- a/vllm/model_executor/models/lfm2.py
+++ b/vllm/model_executor/models/lfm2.py
@@ -351,7 +351,7 @@ def get_layer(prefix: str):
         else:
             self.embedding_norm = PPMissingLayer()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -365,7 +365,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -504,8 +504,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/lfm2_moe.py b/vllm/model_executor/models/lfm2_moe.py
index b19116467105..6b7b5564ee98 100644
--- a/vllm/model_executor/models/lfm2_moe.py
+++ b/vllm/model_executor/models/lfm2_moe.py
@@ -466,7 +466,7 @@ def get_layer(prefix: str):
         else:
             self.embedding_norm = PPMissingLayer()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -480,7 +480,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -714,8 +714,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.num_routed_experts = example_layer.n_routed_experts
         self.num_redundant_experts = example_layer.n_redundant_experts
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def update_physical_experts_metadata(
         self,
diff --git a/vllm/model_executor/models/llama.py b/vllm/model_executor/models/llama.py
index 0a08bd376bad..c49a1ea817f9 100644
--- a/vllm/model_executor/models/llama.py
+++ b/vllm/model_executor/models/llama.py
@@ -424,7 +424,7 @@ def __init__(
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -438,7 +438,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -640,8 +640,8 @@ def _init_model(
     ):
         return LlamaModel(vllm_config=vllm_config, prefix=prefix, layer_type=layer_type)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/llama4_eagle.py b/vllm/model_executor/models/llama4_eagle.py
index b59176191e7a..e8716d652415 100644
--- a/vllm/model_executor/models/llama4_eagle.py
+++ b/vllm/model_executor/models/llama4_eagle.py
@@ -82,7 +82,7 @@ def __init__(
         )
         self.norm = RMSNorm(self.config.hidden_size, eps=self.config.rms_norm_eps)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -93,7 +93,7 @@ def forward(
         inputs_embeds: torch.Tensor | None = None,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         if inputs_embeds is None:
-            inputs_embeds = self.get_input_embeddings(input_ids)
+            inputs_embeds = self.embed_input_ids(input_ids)
         hidden_states = self.fc(torch.cat((inputs_embeds, hidden_states), dim=-1))
         residual = None
         for layer in self.layers:
@@ -195,7 +195,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
     def get_language_model(self) -> torch.nn.Module:
         return self.model
 
-    get_input_embeddings = SupportsMultiModal.get_input_embeddings  # type: ignore
+    embed_input_ids = SupportsMultiModal.embed_input_ids  # type: ignore
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/llama_eagle.py b/vllm/model_executor/models/llama_eagle.py
index 3617294bd621..ab2a9f6f06db 100644
--- a/vllm/model_executor/models/llama_eagle.py
+++ b/vllm/model_executor/models/llama_eagle.py
@@ -84,7 +84,7 @@ def __init__(
             self.config.hidden_size * 2, self.config.hidden_size, bias=False
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -158,8 +158,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.config.vocab_size, scale=logit_scale
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/llama_eagle3.py b/vllm/model_executor/models/llama_eagle3.py
index b8b9cc76d08d..6edc9519dfbb 100644
--- a/vllm/model_executor/models/llama_eagle3.py
+++ b/vllm/model_executor/models/llama_eagle3.py
@@ -172,7 +172,7 @@ def __init__(
             eps=self.config.rms_norm_eps,
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -183,7 +183,7 @@ def forward(
         input_embeds: torch.Tensor | None = None,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         if input_embeds is None:
-            input_embeds = self.get_input_embeddings(input_ids)
+            input_embeds = self.embed_input_ids(input_ids)
         assert hidden_states.shape[-1] == input_embeds.shape[-1]
 
         residual = None
@@ -261,13 +261,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             requires_grad=False,
         )
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: NestedTensors | None = None,
         is_multimodal: torch.Tensor | None = None,
     ) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/llava.py b/vllm/model_executor/models/llava.py
index a3dea0ce86f8..c1fb2d4f4af7 100644
--- a/vllm/model_executor/models/llava.py
+++ b/vllm/model_executor/models/llava.py
@@ -661,7 +661,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/llava_next.py b/vllm/model_executor/models/llava_next.py
index 3cf546644d04..98b1b46045c3 100644
--- a/vllm/model_executor/models/llava_next.py
+++ b/vllm/model_executor/models/llava_next.py
@@ -483,14 +483,14 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
         vision_embeddings = self._process_image_input(image_input)
         return vision_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -501,9 +501,9 @@ def get_input_embeddings(
     ) -> torch.Tensor:
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
diff --git a/vllm/model_executor/models/llava_next_video.py b/vllm/model_executor/models/llava_next_video.py
index 77c331b0182b..902c598c226f 100644
--- a/vllm/model_executor/models/llava_next_video.py
+++ b/vllm/model_executor/models/llava_next_video.py
@@ -422,7 +422,7 @@ def _process_video_pixels(self, inputs: LlavaNextVideoPixelInputs):
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         video_input = self._parse_and_validate_video_input(**kwargs)
         if video_input is None:
             return []
diff --git a/vllm/model_executor/models/llava_onevision.py b/vllm/model_executor/models/llava_onevision.py
index c4cae240ea46..322bde94ff66 100644
--- a/vllm/model_executor/models/llava_onevision.py
+++ b/vllm/model_executor/models/llava_onevision.py
@@ -866,7 +866,7 @@ def apply_pooling(self, image_features: torch.Tensor, stride: int = 2):
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return []
diff --git a/vllm/model_executor/models/longcat_flash.py b/vllm/model_executor/models/longcat_flash.py
index b848ae6e822f..5de10e708683 100644
--- a/vllm/model_executor/models/longcat_flash.py
+++ b/vllm/model_executor/models/longcat_flash.py
@@ -498,7 +498,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -512,7 +512,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -583,8 +583,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/mamba.py b/vllm/model_executor/models/mamba.py
index 02abe693e071..aa16640a9427 100644
--- a/vllm/model_executor/models/mamba.py
+++ b/vllm/model_executor/models/mamba.py
@@ -135,7 +135,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings(input_ids)
 
     def forward(
@@ -149,7 +149,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -218,8 +218,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.backbone.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.backbone.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.backbone.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/mamba2.py b/vllm/model_executor/models/mamba2.py
index d19480b064e0..fc17f98be198 100644
--- a/vllm/model_executor/models/mamba2.py
+++ b/vllm/model_executor/models/mamba2.py
@@ -131,7 +131,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings(input_ids)
 
     def forward(
@@ -145,7 +145,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -257,8 +257,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.backbone.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.backbone.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.backbone.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/midashenglm.py b/vllm/model_executor/models/midashenglm.py
index 322cce79d4cb..a84c99059cd9 100644
--- a/vllm/model_executor/models/midashenglm.py
+++ b/vllm/model_executor/models/midashenglm.py
@@ -791,7 +791,7 @@ def _process_audio_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.decoder
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         audio_input = self._parse_and_validate_audio_input(**kwargs)
 
         if audio_input is None:
diff --git a/vllm/model_executor/models/mimo.py b/vllm/model_executor/models/mimo.py
index 666ac90c4429..cd0a6190e950 100644
--- a/vllm/model_executor/models/mimo.py
+++ b/vllm/model_executor/models/mimo.py
@@ -70,7 +70,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
diff --git a/vllm/model_executor/models/mimo_mtp.py b/vllm/model_executor/models/mimo_mtp.py
index 3d7695a2a304..9905f65b74ca 100644
--- a/vllm/model_executor/models/mimo_mtp.py
+++ b/vllm/model_executor/models/mimo_mtp.py
@@ -120,7 +120,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -164,8 +164,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=maybe_prefix(prefix, "lm_head"),
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/minicpm.py b/vllm/model_executor/models/minicpm.py
index d9f0b477180e..914b097fe199 100644
--- a/vllm/model_executor/models/minicpm.py
+++ b/vllm/model_executor/models/minicpm.py
@@ -440,7 +440,7 @@ def _init_layers(
             prefix=f"{prefix}.layers",
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         embedding = self.embed_tokens(input_ids)
         return embedding * self.config.scale_emb
 
@@ -455,7 +455,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             hidden_states = intermediate_tensors["hidden_states"]
@@ -615,8 +615,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
     def _init_model(self, *, vllm_config: VllmConfig, prefix: str = ""):
         return MiniCPMModel(vllm_config=vllm_config, prefix=prefix)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def set_aux_hidden_state_layers(self, layers: tuple[int, ...]) -> None:
         self.model.aux_hidden_state_layers = layers
diff --git a/vllm/model_executor/models/minicpm_eagle.py b/vllm/model_executor/models/minicpm_eagle.py
index 6efc61e25ea1..0ca31913485d 100644
--- a/vllm/model_executor/models/minicpm_eagle.py
+++ b/vllm/model_executor/models/minicpm_eagle.py
@@ -193,7 +193,7 @@ def _init_layers(
             ]
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         embedding = self.embed_tokens(input_ids)
         return embedding * self.config.scale_emb
 
@@ -203,7 +203,7 @@ def forward(
         positions: torch.Tensor,
         hidden_states: torch.Tensor,
     ) -> torch.Tensor | IntermediateTensors:
-        input_embeds = self.get_input_embeddings(input_ids)
+        input_embeds = self.embed_input_ids(input_ids)
         input_embeds = self.input_norm1(input_embeds)
         hidden_states = self.input_norm2(hidden_states)
 
@@ -354,8 +354,8 @@ def _init_model(
             vllm_config=vllm_config, prefix=prefix, start_layer=start_layer
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/minicpmv.py b/vllm/model_executor/models/minicpmv.py
index 09937706f8c5..2ac97764dd34 100644
--- a/vllm/model_executor/models/minicpmv.py
+++ b/vllm/model_executor/models/minicpmv.py
@@ -1139,7 +1139,7 @@ def _process_multimodal_inputs(self, modalities: dict):
     def get_language_model(self) -> torch.nn.Module:
         return self.llm
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
diff --git a/vllm/model_executor/models/minimax_m2.py b/vllm/model_executor/models/minimax_m2.py
index 21ed428a05d0..49d2f2d26196 100644
--- a/vllm/model_executor/models/minimax_m2.py
+++ b/vllm/model_executor/models/minimax_m2.py
@@ -360,7 +360,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -374,7 +374,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -510,8 +510,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/minimax_text_01.py b/vllm/model_executor/models/minimax_text_01.py
index 1409a309f3ae..bf1ecc822756 100644
--- a/vllm/model_executor/models/minimax_text_01.py
+++ b/vllm/model_executor/models/minimax_text_01.py
@@ -620,7 +620,7 @@ def _clear_prefill_cache(
             )
             minimax_cache_tensors[:, slots_tensor, ...] = 0
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -709,8 +709,8 @@ def copy_inputs_before_cuda_graphs(self, input_buffers, **kwargs):
     def get_seqlen_agnostic_capture_inputs(self, batch_size: int):
         return self.model.minimax_cache.get_seqlen_agnostic_capture_inputs(batch_size)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/minimax_vl_01.py b/vllm/model_executor/models/minimax_vl_01.py
index fb7c6d42a065..0939a72ba53e 100644
--- a/vllm/model_executor/models/minimax_vl_01.py
+++ b/vllm/model_executor/models/minimax_vl_01.py
@@ -353,7 +353,7 @@ def _parse_and_validate_image_input(
 
         raise AssertionError("This line should be unreachable.")
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -371,8 +371,8 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
         elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
+            vision_embeddings = self.embed_multimodal(**kwargs)
+            inputs_embeds = self.embed_input_ids(
                 input_ids,
                 vision_embeddings,
                 is_multimodal=input_ids == self.config.image_token_index,
diff --git a/vllm/model_executor/models/mistral3.py b/vllm/model_executor/models/mistral3.py
index 26d4deca2e12..1ddb470a0f93 100644
--- a/vllm/model_executor/models/mistral3.py
+++ b/vllm/model_executor/models/mistral3.py
@@ -549,7 +549,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/mixtral.py b/vllm/model_executor/models/mixtral.py
index c1f411b6cd2a..d7a1cb82fb4f 100644
--- a/vllm/model_executor/models/mixtral.py
+++ b/vllm/model_executor/models/mixtral.py
@@ -345,7 +345,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -359,7 +359,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -591,8 +591,8 @@ def update_physical_experts_metadata(
                 moe.n_redundant_experts = self.num_redundant_experts
                 moe.experts.update_expert_map()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/mllama4.py b/vllm/model_executor/models/mllama4.py
index 4548abde77d5..14e741f32258 100644
--- a/vllm/model_executor/models/mllama4.py
+++ b/vllm/model_executor/models/mllama4.py
@@ -865,7 +865,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/modernbert.py b/vllm/model_executor/models/modernbert.py
index 5a0769f3bdaa..3a8a6c74d9d1 100644
--- a/vllm/model_executor/models/modernbert.py
+++ b/vllm/model_executor/models/modernbert.py
@@ -46,7 +46,7 @@ def __init__(self, config: ModernBertConfig):
         )
         self.norm = nn.LayerNorm(config.hidden_size, eps=eps, bias=config.norm_bias)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.tok_embeddings(input_ids)
 
     def forward(
@@ -225,8 +225,8 @@ def __init__(
             config.hidden_size, eps=config.norm_eps, bias=config.norm_bias
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.embeddings.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.embeddings.embed_input_ids(input_ids)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         weights = self.hf_to_vllm_mapper.apply(weights)
@@ -337,8 +337,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             }
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         self_weights = []
@@ -424,8 +424,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             }
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(self, skip_prefixes=["drop"])
diff --git a/vllm/model_executor/models/molmo.py b/vllm/model_executor/models/molmo.py
index 7a9e3d81b73a..ab83a271e30a 100644
--- a/vllm/model_executor/models/molmo.py
+++ b/vllm/model_executor/models/molmo.py
@@ -832,7 +832,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -1491,7 +1491,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/mpt.py b/vllm/model_executor/models/mpt.py
index 29e887c4d9c9..106ad971a321 100644
--- a/vllm/model_executor/models/mpt.py
+++ b/vllm/model_executor/models/mpt.py
@@ -248,7 +248,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.d_model
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
 
     def forward(
@@ -262,7 +262,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -308,8 +308,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.transformer.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.transformer.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.transformer.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 86fc1d6046ce..cb39c2ae482d 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -655,7 +655,7 @@ def get_video_repl(
         The replacement returned is not actually used to replace the placeholder
         tokens - it's just used to make sure we allocate the correct number
         of tokens.
-        Actual replacement is done in get_multimodal_embeddings of
+        Actual replacement is done in embed_multimodal of
         NemotronH_Nano_VL_V2
         (specifically in _process_video_input -> _create_final_video_embeddings).
         There, we create the final embeddings with text embeddings for indicator tokens
@@ -1401,7 +1401,7 @@ def _create_final_video_embeddings(
 
         # Create final video embeddings, merging text embeddings for indicator
         # tokens with video embeddings
-        text_embeddings = self.get_language_model().get_input_embeddings(repl_token_ids)
+        text_embeddings = self.get_language_model().embed_input_ids(repl_token_ids)
         final_video_embeddings = _merge_multimodal_embeddings(
             inputs_embeds=text_embeddings,
             multimodal_embeddings=video_embeddings,
@@ -1465,7 +1465,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
 
         return modalities
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         # Validate the multimodal input keyword arguments
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if modalities is None:
diff --git a/vllm/model_executor/models/nemotron.py b/vllm/model_executor/models/nemotron.py
index 17e8e7f28258..92dcf5ea5700 100644
--- a/vllm/model_executor/models/nemotron.py
+++ b/vllm/model_executor/models/nemotron.py
@@ -351,7 +351,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -365,7 +365,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -491,8 +491,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/nemotron_h.py b/vllm/model_executor/models/nemotron_h.py
index 8ef3eee173eb..f7e0caf410e1 100644
--- a/vllm/model_executor/models/nemotron_h.py
+++ b/vllm/model_executor/models/nemotron_h.py
@@ -548,7 +548,7 @@ def get_layer(prefix: str):
 
         self.norm_f = RMSNorm(config.hidden_size, eps=config.layer_norm_epsilon)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -562,7 +562,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -823,8 +823,8 @@ def update_physical_experts_metadata(
                 moe.n_redundant_experts = self.num_redundant_experts
                 moe.experts.update_expert_map()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/nemotron_nas.py b/vllm/model_executor/models/nemotron_nas.py
index acd0d0c98234..b839206a3094 100644
--- a/vllm/model_executor/models/nemotron_nas.py
+++ b/vllm/model_executor/models/nemotron_nas.py
@@ -291,7 +291,7 @@ def get_layer(prefix: str):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -305,7 +305,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -461,8 +461,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
     def _init_model(self, vllm_config: VllmConfig, prefix: str = ""):
         return DeciModel(vllm_config=vllm_config, prefix=prefix)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/nemotron_vl.py b/vllm/model_executor/models/nemotron_vl.py
index 2f78e2f60c93..5a1dda8aac2c 100644
--- a/vllm/model_executor/models/nemotron_vl.py
+++ b/vllm/model_executor/models/nemotron_vl.py
@@ -561,7 +561,7 @@ def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -580,7 +580,7 @@ def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
 
         return multimodal_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -593,9 +593,9 @@ def get_input_embeddings(
 
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
diff --git a/vllm/model_executor/models/olmo.py b/vllm/model_executor/models/olmo.py
index cb47f76a27ff..487e3f671a45 100644
--- a/vllm/model_executor/models/olmo.py
+++ b/vllm/model_executor/models/olmo.py
@@ -268,7 +268,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -285,7 +285,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -379,8 +379,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/olmo2.py b/vllm/model_executor/models/olmo2.py
index 2aa01adebc9f..045582c889ee 100644
--- a/vllm/model_executor/models/olmo2.py
+++ b/vllm/model_executor/models/olmo2.py
@@ -304,7 +304,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], self.config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -419,8 +419,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/olmoe.py b/vllm/model_executor/models/olmoe.py
index 35a09334a129..499eb05de76e 100644
--- a/vllm/model_executor/models/olmoe.py
+++ b/vllm/model_executor/models/olmoe.py
@@ -296,7 +296,7 @@ def __init__(
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -310,7 +310,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -471,8 +471,8 @@ def __init__(
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/openpangu.py b/vllm/model_executor/models/openpangu.py
index bf1b7570a882..d13a745beffe 100644
--- a/vllm/model_executor/models/openpangu.py
+++ b/vllm/model_executor/models/openpangu.py
@@ -753,7 +753,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -767,7 +767,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -969,8 +969,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/openpangu_mtp.py b/vllm/model_executor/models/openpangu_mtp.py
index f4049f2d3970..436b7f981b1f 100644
--- a/vllm/model_executor/models/openpangu_mtp.py
+++ b/vllm/model_executor/models/openpangu_mtp.py
@@ -100,8 +100,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/opt.py b/vllm/model_executor/models/opt.py
index d124b7671b9c..5df700d1a2e1 100644
--- a/vllm/model_executor/models/opt.py
+++ b/vllm/model_executor/models/opt.py
@@ -262,7 +262,7 @@ def __init__(
             prefix=f"{prefix}.layers",
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -274,7 +274,7 @@ def forward(
     ) -> torch.Tensor | IntermediateTensors:
         if get_pp_group().is_first_rank:
             if inputs_embeds is None:
-                inputs_embeds = self.get_input_embeddings(input_ids)
+                inputs_embeds = self.embed_input_ids(input_ids)
             pos_embeds = self.embed_positions(positions)
             if self.project_in is not None:
                 inputs_embeds, _ = self.project_in(inputs_embeds)
@@ -311,8 +311,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.decoder.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.decoder.embed_input_ids(input_ids)
 
     def forward(
         self,
@@ -394,8 +394,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/orion.py b/vllm/model_executor/models/orion.py
index cbfce18b4388..859cd2cecf89 100644
--- a/vllm/model_executor/models/orion.py
+++ b/vllm/model_executor/models/orion.py
@@ -255,7 +255,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config.hidden_size,
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -269,7 +269,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -345,8 +345,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/ouro.py b/vllm/model_executor/models/ouro.py
index cc7947df50ae..9db6c317c26a 100644
--- a/vllm/model_executor/models/ouro.py
+++ b/vllm/model_executor/models/ouro.py
@@ -361,7 +361,7 @@ def __init__(
 
         self.total_ut_steps = getattr(self.config, "total_ut_steps", 4)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -374,7 +374,7 @@ def forward(
         if inputs_embeds is not None:
             hidden_states = inputs_embeds
         else:
-            hidden_states = self.get_input_embeddings(input_ids)
+            hidden_states = self.embed_input_ids(input_ids)
 
         for current_ut in range(self.total_ut_steps):
             residual = None
@@ -486,8 +486,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/ovis.py b/vllm/model_executor/models/ovis.py
index cc6c9b4e72d7..a0fab820720f 100644
--- a/vllm/model_executor/models/ovis.py
+++ b/vllm/model_executor/models/ovis.py
@@ -514,7 +514,7 @@ def _process_image_input(
 
         return tuple(vision_embeddings)
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/ovis2_5.py b/vllm/model_executor/models/ovis2_5.py
index 9a4d69dea096..85f37cfea10b 100644
--- a/vllm/model_executor/models/ovis2_5.py
+++ b/vllm/model_executor/models/ovis2_5.py
@@ -617,7 +617,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
 
         return modalities
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
diff --git a/vllm/model_executor/models/paddleocr_vl.py b/vllm/model_executor/models/paddleocr_vl.py
index 62994abe8e31..183f458658aa 100644
--- a/vllm/model_executor/models/paddleocr_vl.py
+++ b/vllm/model_executor/models/paddleocr_vl.py
@@ -1328,10 +1328,10 @@ def forward(
             inputs_embeds = None
 
         elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
+            vision_embeddings = self.embed_multimodal(**kwargs)
             is_multimodal = kwargs.pop("is_multimodal", None)
             handle_oov_mm_token = kwargs.pop("handle_oov_mm_token", False)
-            inputs_embeds = self.get_input_embeddings(
+            inputs_embeds = self.embed_input_ids(
                 input_ids,
                 vision_embeddings,
                 is_multimodal=is_multimodal,
@@ -1391,7 +1391,7 @@ def _process_image_input(
         image_embeds = self.mlp_AR(vision_outputs, image_grid_thw)
         return image_embeds
 
-    def get_multimodal_embeddings(self, **kwargs) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return ()
diff --git a/vllm/model_executor/models/paligemma.py b/vllm/model_executor/models/paligemma.py
index fb0b4b290467..ec5d0fa6226d 100644
--- a/vllm/model_executor/models/paligemma.py
+++ b/vllm/model_executor/models/paligemma.py
@@ -375,7 +375,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/persimmon.py b/vllm/model_executor/models/persimmon.py
index 37a7108d5c01..3bf6a1d9763d 100644
--- a/vllm/model_executor/models/persimmon.py
+++ b/vllm/model_executor/models/persimmon.py
@@ -270,7 +270,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -284,7 +284,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -347,8 +347,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/phi.py b/vllm/model_executor/models/phi.py
index e76fb1904727..8fee53c23fb4 100644
--- a/vllm/model_executor/models/phi.py
+++ b/vllm/model_executor/models/phi.py
@@ -240,7 +240,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -254,7 +254,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -346,8 +346,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/phi3v.py b/vllm/model_executor/models/phi3v.py
index a7b28bd18cc7..384572217bc1 100644
--- a/vllm/model_executor/models/phi3v.py
+++ b/vllm/model_executor/models/phi3v.py
@@ -664,14 +664,14 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
         vision_embeddings = self._process_image_input(image_input)
         return vision_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -679,7 +679,7 @@ def get_input_embeddings(
         is_multimodal: torch.Tensor | None = None,
         handle_oov_mm_token: bool = False,
     ) -> torch.Tensor:
-        inputs_embeds = self._get_text_embeddings(
+        inputs_embeds = self._embed_text_input_ids(
             input_ids,
             self.embed_tokens,
             is_multimodal=is_multimodal,
@@ -691,7 +691,7 @@ def get_input_embeddings(
 
         if is_multimodal is None:
             raise ValueError(
-                "`get_input_embeddings` now requires `is_multimodal` arg, "
+                "`embed_input_ids` now requires `is_multimodal` arg, "
                 "please update your model runner according to "
                 "https://github.com/vllm-project/vllm/pull/16229."
             )
diff --git a/vllm/model_executor/models/phi4_multimodal.py b/vllm/model_executor/models/phi4_multimodal.py
index 4799b7aba7f7..0f1230a55bae 100644
--- a/vllm/model_executor/models/phi4_multimodal.py
+++ b/vllm/model_executor/models/phi4_multimodal.py
@@ -1371,7 +1371,7 @@ def _process_image_input(
             )
         return image_embeds
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
diff --git a/vllm/model_executor/models/phi4mm.py b/vllm/model_executor/models/phi4mm.py
index c2a3be16b610..8425549a7bd2 100644
--- a/vllm/model_executor/models/phi4mm.py
+++ b/vllm/model_executor/models/phi4mm.py
@@ -1180,7 +1180,7 @@ def _process_image_input(
         )
         return image_embeds
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
diff --git a/vllm/model_executor/models/phimoe.py b/vllm/model_executor/models/phimoe.py
index 97e553787790..92fd858b608b 100644
--- a/vllm/model_executor/models/phimoe.py
+++ b/vllm/model_executor/models/phimoe.py
@@ -482,7 +482,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -496,7 +496,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -648,8 +648,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/pixtral.py b/vllm/model_executor/models/pixtral.py
index dfe5f0c52a50..8cb7d6a889da 100644
--- a/vllm/model_executor/models/pixtral.py
+++ b/vllm/model_executor/models/pixtral.py
@@ -461,7 +461,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/plamo2.py b/vllm/model_executor/models/plamo2.py
index ece1c5ec23cf..0c87f5000ff4 100644
--- a/vllm/model_executor/models/plamo2.py
+++ b/vllm/model_executor/models/plamo2.py
@@ -762,7 +762,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.layers = Plamo2Decoder(vllm_config=vllm_config, prefix=f"{prefix}.layers")
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -776,7 +776,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -839,8 +839,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/qwen.py b/vllm/model_executor/models/qwen.py
index c99f628004fb..50a125c3f597 100644
--- a/vllm/model_executor/models/qwen.py
+++ b/vllm/model_executor/models/qwen.py
@@ -221,7 +221,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
 
     def forward(
@@ -235,7 +235,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
diff --git a/vllm/model_executor/models/qwen2.py b/vllm/model_executor/models/qwen2.py
index cdf32c6c5137..1bbb969ce5aa 100644
--- a/vllm/model_executor/models/qwen2.py
+++ b/vllm/model_executor/models/qwen2.py
@@ -355,7 +355,7 @@ def __init__(
 
         self.aux_hidden_state_layers = tuple[int, ...]()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -369,7 +369,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -504,8 +504,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def set_aux_hidden_state_layers(self, layers: tuple[int, ...]) -> None:
         self.model.aux_hidden_state_layers = layers
diff --git a/vllm/model_executor/models/qwen2_5_omni_thinker.py b/vllm/model_executor/models/qwen2_5_omni_thinker.py
index 8f74cab0534d..262ea771d9cd 100644
--- a/vllm/model_executor/models/qwen2_5_omni_thinker.py
+++ b/vllm/model_executor/models/qwen2_5_omni_thinker.py
@@ -1132,7 +1132,7 @@ def get_mrope_input_positions(
 
         return llm_positions, mrope_position_delta
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return []
@@ -1158,7 +1158,7 @@ def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
 
     # TODO (ywang96): support overlapping modality embeddings so that
     # `use_audio_in_video` will work on V1.
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -1168,16 +1168,16 @@ def get_input_embeddings(
     ) -> torch.Tensor:
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
             handle_oov_mm_token=handle_oov_mm_token,
         )
 
-    def get_multimodal_embeddings_v0(self, **kwargs: object) -> NestedTensors | None:
+    def embed_multimodal_v0(self, **kwargs: object) -> NestedTensors | None:
         audio_input = self._parse_and_validate_audio_input(**kwargs)
         image_input = self._parse_and_validate_image_input(**kwargs)
         video_input = self._parse_and_validate_video_input(**kwargs)
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index b0557d58d6dd..23591480b160 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -1534,7 +1534,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return []
diff --git a/vllm/model_executor/models/qwen2_audio.py b/vllm/model_executor/models/qwen2_audio.py
index 4de6a19c1ff0..7e883a393aa8 100644
--- a/vllm/model_executor/models/qwen2_audio.py
+++ b/vllm/model_executor/models/qwen2_audio.py
@@ -439,7 +439,7 @@ def _process_audio_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         audio_input = self._parse_and_validate_audio_input(**kwargs)
         if audio_input is None:
             return []
diff --git a/vllm/model_executor/models/qwen2_moe.py b/vllm/model_executor/models/qwen2_moe.py
index c03bd6a3c6d7..2ff0d19df238 100644
--- a/vllm/model_executor/models/qwen2_moe.py
+++ b/vllm/model_executor/models/qwen2_moe.py
@@ -389,7 +389,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -403,7 +403,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -566,8 +566,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/qwen2_rm.py b/vllm/model_executor/models/qwen2_rm.py
index c5582218b852..eac46e0f8b05 100644
--- a/vllm/model_executor/models/qwen2_rm.py
+++ b/vllm/model_executor/models/qwen2_rm.py
@@ -73,8 +73,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index ff04baee91d1..13b54bbe1748 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -1507,7 +1507,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
diff --git a/vllm/model_executor/models/qwen3.py b/vllm/model_executor/models/qwen3.py
index f689ff79d761..8d7f22a33fe6 100644
--- a/vllm/model_executor/models/qwen3.py
+++ b/vllm/model_executor/models/qwen3.py
@@ -306,8 +306,8 @@ def get_eagle3_aux_hidden_state_layers(self) -> tuple[int, ...]:
         num_layers = len(self.model.layers)
         return (2, num_layers // 2, num_layers - 3)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/qwen3_moe.py b/vllm/model_executor/models/qwen3_moe.py
index d57b82cb0227..96751fee800b 100644
--- a/vllm/model_executor/models/qwen3_moe.py
+++ b/vllm/model_executor/models/qwen3_moe.py
@@ -427,7 +427,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # Track layers for auxiliary hidden state outputs (EAGLE3)
         self.aux_hidden_state_layers: tuple[int, ...] = ()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -441,7 +441,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -714,8 +714,8 @@ def get_eagle3_aux_hidden_state_layers(self) -> tuple[int, ...]:
         num_layers = len(self.model.layers)
         return (2, num_layers // 2, num_layers - 3)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/qwen3_next.py b/vllm/model_executor/models/qwen3_next.py
index 9cd342caacb0..86508a7c6431 100644
--- a/vllm/model_executor/models/qwen3_next.py
+++ b/vllm/model_executor/models/qwen3_next.py
@@ -998,7 +998,7 @@ def get_layer(prefix: str):
         else:
             self.norm = PPMissingLayer()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -1012,7 +1012,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -1217,8 +1217,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # Set MoE hyperparameters
         self.set_moe_parameters()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/qwen3_next_mtp.py b/vllm/model_executor/models/qwen3_next_mtp.py
index 9a552db029ee..83694caa5248 100644
--- a/vllm/model_executor/models/qwen3_next_mtp.py
+++ b/vllm/model_executor/models/qwen3_next_mtp.py
@@ -93,7 +93,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config.hidden_size, eps=config.rms_norm_eps
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -107,7 +107,7 @@ def forward(
     ) -> torch.Tensor:
         if get_pp_group().is_first_rank:
             if inputs_embeds is None:
-                inputs_embeds = self.get_input_embeddings(input_ids)
+                inputs_embeds = self.embed_input_ids(input_ids)
             assert hidden_states.shape[-1] == inputs_embeds.shape[-1]
             inputs_embeds = self.pre_fc_norm_embedding(inputs_embeds)
             hidden_states = self.pre_fc_norm_hidden(hidden_states)
@@ -257,8 +257,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.set_moe_parameters()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/qwen3_omni_moe_thinker.py b/vllm/model_executor/models/qwen3_omni_moe_thinker.py
index e6cb4442e2be..5df2372a842c 100755
--- a/vllm/model_executor/models/qwen3_omni_moe_thinker.py
+++ b/vllm/model_executor/models/qwen3_omni_moe_thinker.py
@@ -613,7 +613,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -1252,9 +1252,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(
-        self, **kwargs: object
-    ) -> MultiModalEmbeddings | None:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings | None:
         mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return []
@@ -1278,7 +1276,7 @@ def get_multimodal_embeddings(
                 multimodal_embeddings += tuple(audio_embeddings)
         return multimodal_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -1286,9 +1284,9 @@ def get_input_embeddings(
         is_multimodal: torch.Tensor | None = None,
         handle_oov_mm_token: bool = False,
     ) -> torch.Tensor:
-        inputs_embeds = self._get_text_embeddings(
+        inputs_embeds = self._embed_text_input_ids(
             input_ids,
-            self.language_model.get_input_embeddings,
+            self.language_model.embed_input_ids,
             is_multimodal=is_multimodal,
             handle_oov_mm_token=handle_oov_mm_token,
         )
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index 87494c6735cd..5f5bde1dd72d 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -1100,7 +1100,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -1493,9 +1493,7 @@ def get_mrope_input_positions(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(
-        self, **kwargs: object
-    ) -> MultiModalEmbeddings | None:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings | None:
         mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return None
@@ -1557,7 +1555,7 @@ def _compute_deepstack_embeds(
 
         return deepstack_input_embeds, multimodal_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -1565,9 +1563,9 @@ def get_input_embeddings(
         is_multimodal: torch.Tensor | None = None,
         handle_oov_mm_token: bool = False,
     ) -> torch.Tensor:
-        inputs_embeds = self._get_text_embeddings(
+        inputs_embeds = self._embed_text_input_ids(
             input_ids,
-            self.language_model.get_input_embeddings,
+            self.language_model.embed_input_ids,
             is_multimodal=is_multimodal,
             handle_oov_mm_token=handle_oov_mm_token,
         )
@@ -1577,7 +1575,7 @@ def get_input_embeddings(
 
         if is_multimodal is None:
             raise ValueError(
-                "`get_input_embeddings` now requires `is_multimodal` arg, "
+                "`embed_input_ids` now requires `is_multimodal` arg, "
                 "please update your model runner according to "
                 "https://github.com/vllm-project/vllm/pull/16229."
             )
diff --git a/vllm/model_executor/models/qwen3_vl_moe.py b/vllm/model_executor/models/qwen3_vl_moe.py
index 284b1301d07f..5c3205faf9c2 100644
--- a/vllm/model_executor/models/qwen3_vl_moe.py
+++ b/vllm/model_executor/models/qwen3_vl_moe.py
@@ -97,7 +97,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
diff --git a/vllm/model_executor/models/qwen_vl.py b/vllm/model_executor/models/qwen_vl.py
index cf74f72fe633..6a259cade9cf 100644
--- a/vllm/model_executor/models/qwen_vl.py
+++ b/vllm/model_executor/models/qwen_vl.py
@@ -777,7 +777,7 @@ def _process_image_input(self, image_input: QwenImageInputs) -> torch.Tensor:
     def get_language_model(self) -> torch.nn.Module:
         return self.transformer
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/roberta.py b/vllm/model_executor/models/roberta.py
index cfccb904f46c..31cc64509914 100644
--- a/vllm/model_executor/models/roberta.py
+++ b/vllm/model_executor/models/roberta.py
@@ -220,8 +220,8 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.jina_to_vllm_mapper)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.roberta.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.roberta.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/seed_oss.py b/vllm/model_executor/models/seed_oss.py
index 04da19a440a1..bf211d28f184 100644
--- a/vllm/model_executor/models/seed_oss.py
+++ b/vllm/model_executor/models/seed_oss.py
@@ -334,7 +334,7 @@ def __init__(
         else:
             self.norm = PPMissingLayer()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -348,7 +348,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -467,8 +467,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/siglip.py b/vllm/model_executor/models/siglip.py
index 3cbdd64acc4a..b175dd60cf65 100644
--- a/vllm/model_executor/models/siglip.py
+++ b/vllm/model_executor/models/siglip.py
@@ -595,7 +595,7 @@ def __init__(
         self.final_layer_norm = nn.LayerNorm(embed_dim, eps=config.layer_norm_eps)
         self.head = nn.Linear(embed_dim, config.projection_size)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings.token_embedding(input_ids)
 
     def forward(
@@ -1117,7 +1117,7 @@ def _process_image_inputs(self, inputs: SiglipImagePixelInputs) -> torch.Tensor:
     def get_language_model(self) -> torch.nn.Module:
         return self.text_model
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -1130,16 +1130,16 @@ def get_input_embeddings(
         )
 
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
             handle_oov_mm_token=handle_oov_mm_token,
         )
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/skyworkr1v.py b/vllm/model_executor/models/skyworkr1v.py
index 44550ae595d1..d825eb3a1c13 100644
--- a/vllm/model_executor/models/skyworkr1v.py
+++ b/vllm/model_executor/models/skyworkr1v.py
@@ -872,14 +872,14 @@ def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
 
         return self._process_image_input(image_input)
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -892,9 +892,9 @@ def get_input_embeddings(
 
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
diff --git a/vllm/model_executor/models/solar.py b/vllm/model_executor/models/solar.py
index 5b8bf150edf6..4ec855f79444 100644
--- a/vllm/model_executor/models/solar.py
+++ b/vllm/model_executor/models/solar.py
@@ -310,7 +310,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states", "residual"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -324,7 +324,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -478,8 +478,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/stablelm.py b/vllm/model_executor/models/stablelm.py
index a4e309e0aa6b..06eb7201c1a8 100644
--- a/vllm/model_executor/models/stablelm.py
+++ b/vllm/model_executor/models/stablelm.py
@@ -246,7 +246,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -260,7 +260,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -332,8 +332,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/starcoder2.py b/vllm/model_executor/models/starcoder2.py
index 4cdc90b1f5cb..0f2942acd500 100644
--- a/vllm/model_executor/models/starcoder2.py
+++ b/vllm/model_executor/models/starcoder2.py
@@ -249,7 +249,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -263,7 +263,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -333,8 +333,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/step3_text.py b/vllm/model_executor/models/step3_text.py
index 381b3f4932e5..4fff356b29e2 100644
--- a/vllm/model_executor/models/step3_text.py
+++ b/vllm/model_executor/models/step3_text.py
@@ -354,7 +354,7 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
             ["hidden_states"], config.hidden_size
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
     def forward(
@@ -368,7 +368,7 @@ def forward(
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
             else:
-                hidden_states = self.get_input_embeddings(input_ids)
+                hidden_states = self.embed_input_ids(input_ids)
             residual = None
         else:
             assert intermediate_tensors is not None
@@ -419,8 +419,8 @@ def __init__(
             self.model.make_empty_intermediate_tensors
         )
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/step3_vl.py b/vllm/model_executor/models/step3_vl.py
index dbb549ba3f98..5d16be1eb312 100644
--- a/vllm/model_executor/models/step3_vl.py
+++ b/vllm/model_executor/models/step3_vl.py
@@ -1075,14 +1075,14 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
         vision_embeddings = self._process_image_input(image_input)
         return vision_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -1093,9 +1093,9 @@ def get_input_embeddings(
     ) -> torch.Tensor:
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
@@ -1113,8 +1113,8 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
         elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
+            vision_embeddings = self.embed_multimodal(**kwargs)
+            inputs_embeds = self.embed_input_ids(
                 input_ids,
                 vision_embeddings,
                 is_multimodal=input_ids == self.config.image_token_id,
diff --git a/vllm/model_executor/models/tarsier.py b/vllm/model_executor/models/tarsier.py
index bfa1b5bbaf84..4d310712f303 100644
--- a/vllm/model_executor/models/tarsier.py
+++ b/vllm/model_executor/models/tarsier.py
@@ -576,7 +576,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -593,8 +593,8 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
         elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
+            vision_embeddings = self.embed_multimodal(**kwargs)
+            inputs_embeds = self.embed_input_ids(
                 input_ids,
                 vision_embeddings,
                 is_multimodal=input_ids == self.config.image_token_index,
diff --git a/vllm/model_executor/models/teleflm.py b/vllm/model_executor/models/teleflm.py
index 4dfeddb0b28e..8a0bec9dff84 100644
--- a/vllm/model_executor/models/teleflm.py
+++ b/vllm/model_executor/models/teleflm.py
@@ -57,7 +57,7 @@ def __init__(
         if self.use_mup:
             self.input_mult = self.config.input_mult
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         embedding = self.embed_tokens(input_ids)
         if self.use_mup:
             embedding = embedding * self.input_mult
diff --git a/vllm/model_executor/models/terratorch.py b/vllm/model_executor/models/terratorch.py
index e799e41e2c38..19052c8d49e4 100644
--- a/vllm/model_executor/models/terratorch.py
+++ b/vllm/model_executor/models/terratorch.py
@@ -251,7 +251,7 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
 
         self.pooler = DispatchPooler({"plugin": DummyPooler()})
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
diff --git a/vllm/model_executor/models/transformers/base.py b/vllm/model_executor/models/transformers/base.py
index eb992f7bec72..63096e57f8ee 100644
--- a/vllm/model_executor/models/transformers/base.py
+++ b/vllm/model_executor/models/transformers/base.py
@@ -385,7 +385,7 @@ def _init_parameters(module: nn.Module, dtype: torch.dtype | None):
 
         _init_parameters(module, dtype)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         inputs_embeds = self.model.get_input_embeddings()(input_ids)
         if self.embed_scale is not None:
             inputs_embeds *= self.embed_scale
@@ -416,7 +416,7 @@ def forward(
             and input_ids is not None
             and inputs_embeds is None
         ):
-            inputs_embeds = self.get_input_embeddings(input_ids)
+            inputs_embeds = self.embed_input_ids(input_ids)
             input_ids = None
 
         if self.model_config.uses_mrope:
diff --git a/vllm/model_executor/models/transformers/multimodal.py b/vllm/model_executor/models/transformers/multimodal.py
index 2efcef68d1c7..9b0463f41fa8 100644
--- a/vllm/model_executor/models/transformers/multimodal.py
+++ b/vllm/model_executor/models/transformers/multimodal.py
@@ -330,7 +330,7 @@ def __init__(self, multimodal_model):
 
         return LanguageModel(self)
 
-    def get_multimodal_embeddings(self, **kwargs):
+    def embed_multimodal(self, **kwargs):
         pixel_values: torch.Tensor | None = kwargs.pop("pixel_values", None)
         image_embeds: torch.Tensor | None = kwargs.pop("image_embeds", None)
         # Model might use `image_patches` instead of `pixel_values`
diff --git a/vllm/model_executor/models/ultravox.py b/vllm/model_executor/models/ultravox.py
index 95d574fb81d7..bb0f6bd036f1 100644
--- a/vllm/model_executor/models/ultravox.py
+++ b/vllm/model_executor/models/ultravox.py
@@ -579,14 +579,14 @@ def _process_audio_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         audio_input = self._parse_and_validate_audio_input(**kwargs)
         if audio_input is None:
             return []
         audio_embeddings = self._process_audio_input(audio_input)
         return audio_embeddings
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -597,9 +597,9 @@ def get_input_embeddings(
     ) -> torch.Tensor:
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
-            return super().get_input_embeddings(input_ids)
+            return super().embed_input_ids(input_ids)
 
-        return super().get_input_embeddings(
+        return super().embed_input_ids(
             input_ids,
             multimodal_embeddings=multimodal_embeddings,
             is_multimodal=is_multimodal,
diff --git a/vllm/model_executor/models/utils.py b/vllm/model_executor/models/utils.py
index e5ebd8138b0a..f14b79f2886c 100644
--- a/vllm/model_executor/models/utils.py
+++ b/vllm/model_executor/models/utils.py
@@ -474,7 +474,7 @@ def _merge_multimodal_embeddings(
 
 @deprecated(
     "`merge_multimodal_embeddings` has been replaced with "
-    "`SupportsMultiModal.get_input_embeddings` and will be "
+    "`SupportsMultiModal.embed_input_ids` and will be "
     "removed in v0.12."
 )
 def merge_multimodal_embeddings(
diff --git a/vllm/model_executor/models/voxtral.py b/vllm/model_executor/models/voxtral.py
index cce18984b67e..18ad8851fccd 100644
--- a/vllm/model_executor/models/voxtral.py
+++ b/vllm/model_executor/models/voxtral.py
@@ -399,7 +399,7 @@ def forward(
 
         return hidden_states
 
-    def get_multimodal_embeddings(
+    def embed_multimodal(
         self, **kwargs
     ) -> list[torch.Tensor] | torch.Tensor | tuple[torch.Tensor, ...] | None:
         audio_inputs = self._parse_and_validate_audio_arrays(**kwargs)
diff --git a/vllm/model_executor/models/whisper.py b/vllm/model_executor/models/whisper.py
index 23436a27d489..91a10b95a08c 100644
--- a/vllm/model_executor/models/whisper.py
+++ b/vllm/model_executor/models/whisper.py
@@ -570,7 +570,7 @@ def forward(
         positions: torch.Tensor,
         encoder_hidden_states: torch.Tensor | None,
     ):
-        inputs_embeds = self.get_input_embeddings(input_ids)
+        inputs_embeds = self.embed_input_ids(input_ids)
         positions = self.embed_positions(positions)
         hidden_states = inputs_embeds + positions
 
@@ -583,7 +583,7 @@ def forward(
         hidden_states = self.layer_norm(hidden_states)
         return hidden_states
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
 
@@ -907,12 +907,12 @@ def forward(
     def get_language_model(self) -> torch.nn.Module:
         return self.model.decoder
 
-    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+    def embed_multimodal(self, **kwargs: object) -> MultiModalEmbeddings:
         # Required as part of SupportsMultiModal interface.
         audio_input = self._parse_and_validate_audio_input(**kwargs)
         return [self.model.get_encoder_outputs(audio_input["input_features"])]
 
-    def get_input_embeddings(
+    def embed_input_ids(
         self,
         input_ids: torch.Tensor,
         multimodal_embeddings: MultiModalEmbeddings | None = None,
@@ -922,7 +922,7 @@ def get_input_embeddings(
     ) -> torch.Tensor:
         # This method just returns the decoder sequence embeddings since
         # Whisper does not have encoder text tokens.
-        return self.model.decoder.get_input_embeddings(input_ids)
+        return self.model.decoder.embed_input_ids(input_ids)
 
     def _parse_and_validate_audio_input(self, **kwargs: object) -> WhisperAudioInputs:
         input_features = kwargs.pop("input_features", None)
diff --git a/vllm/model_executor/models/zamba2.py b/vllm/model_executor/models/zamba2.py
index bf3107525bc5..64e6979c8fcf 100644
--- a/vllm/model_executor/models/zamba2.py
+++ b/vllm/model_executor/models/zamba2.py
@@ -756,7 +756,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         # Final layer normalization
         self.final_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         """Convert input token IDs to embeddings.
 
         Args:
@@ -786,7 +786,7 @@ def forward(
         """
         # Handle pipeline parallelism for first rank
         if inputs_embeds is None:
-            inputs_embeds = self.get_input_embeddings(input_ids)
+            inputs_embeds = self.embed_input_ids(input_ids)
         hidden_states = inputs_embeds
 
         # Process through layers
@@ -930,14 +930,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         # Initialize logits processing and sampling
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+    def embed_input_ids(self, input_ids: torch.Tensor) -> torch.Tensor:
         """Convert input token IDs to embeddings.
         Args:
             input_ids: Tensor of input token IDs
         Returns:
             Embedded representation of the input tokens
         """
-        return self.model.get_input_embeddings(input_ids)
+        return self.model.embed_input_ids(input_ids)
 
     def forward(
         self,
diff --git a/vllm/multimodal/processing.py b/vllm/multimodal/processing.py
index 55132a6036ef..85a03efd5bb9 100644
--- a/vllm/multimodal/processing.py
+++ b/vllm/multimodal/processing.py
@@ -208,7 +208,7 @@ class PromptUpdateDetails(Generic[_S]):
     `None` (default) means to assign embeddings to all positions of `full`.
 
     The embeddings are obtained by calling
-    [`SupportsMultiModal.get_multimodal_embeddings`][vllm.model_executor.models.interfaces.SupportsMultiModal.get_multimodal_embeddings].
+    [`SupportsMultiModal.embed_multimodal`][vllm.model_executor.models.interfaces.SupportsMultiModal.embed_multimodal].
     """
 
     @staticmethod
diff --git a/vllm/v1/spec_decode/eagle.py b/vllm/v1/spec_decode/eagle.py
index 55b04949ceb2..beef5203e039 100644
--- a/vllm/v1/spec_decode/eagle.py
+++ b/vllm/v1/spec_decode/eagle.py
@@ -279,7 +279,7 @@ def propose(
         if self.supports_mm_inputs:
             mm_embeds, is_mm_embed = mm_embed_inputs or (None, None)
 
-            self.inputs_embeds[:num_tokens] = self.model.get_input_embeddings(
+            self.inputs_embeds[:num_tokens] = self.model.embed_input_ids(
                 self.input_ids[:num_tokens],
                 multimodal_embeddings=mm_embeds,
                 is_multimodal=is_mm_embed,
@@ -447,9 +447,7 @@ def propose(
             self._set_positions(batch_size, clamped_positions)
             self.hidden_states[:batch_size] = hidden_states
             if self.supports_mm_inputs:
-                self.inputs_embeds[:batch_size] = self.model.get_input_embeddings(
-                    input_ids
-                )
+                self.inputs_embeds[:batch_size] = self.model.embed_input_ids(input_ids)
 
                 input_ids = None
                 inputs_embeds = self.inputs_embeds[:input_batch_size]
@@ -972,9 +970,7 @@ def load_model(self, target_model: nn.Module) -> None:
             # text-only draft models
             try:
                 dummy_input_ids = torch.tensor([[1]], device=self.input_ids.device)
-                self.model.get_input_embeddings(
-                    dummy_input_ids, multimodal_embeddings=None
-                )
+                self.model.embed_input_ids(dummy_input_ids, multimodal_embeddings=None)
             except (NotImplementedError, AttributeError, TypeError):
                 logger.warning(
                     "Draft model does not support multimodal inputs, "
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 987d451fd6ba..c9c64137ca04 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -1853,7 +1853,7 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
                         )
                     )
 
-                    micro_batch_outputs = model.get_multimodal_embeddings(
+                    micro_batch_outputs = model.embed_multimodal(
                         **micro_batch_mm_inputs
                     )
 
@@ -1866,7 +1866,7 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
                 # 2. A list or tuple (length: num_items) of tensors,
                 # each of shape (feature_size, hidden_size) in case the feature
                 # size is dynamic depending on the input multimodal items.
-                curr_group_outputs = model.get_multimodal_embeddings(**mm_kwargs_group)
+                curr_group_outputs = model.embed_multimodal(**mm_kwargs_group)
 
             sanity_check_mm_encoder_outputs(
                 curr_group_outputs,
@@ -2225,7 +2225,7 @@ def _preprocess(
             # NOTE(woosuk): To unify token ids and soft tokens (vision
             # embeddings), we always use embeddings (rather than token ids)
             # as input to the multimodal model, even when the input is text.
-            inputs_embeds_scheduled = self.model.get_input_embeddings(
+            inputs_embeds_scheduled = self.model.embed_input_ids(
                 self.input_ids.gpu[:num_scheduled_tokens],
                 multimodal_embeddings=mm_embeds,
                 is_multimodal=is_mm_embed,
@@ -2261,7 +2261,7 @@ def _preprocess(
             # Some tokens ids may need to become embeds
             if token_ids_idx.numel() > 0:
                 token_ids = self.input_ids.gpu[token_ids_idx]
-                tokens_to_embeds = self.model.get_input_embeddings(input_ids=token_ids)
+                tokens_to_embeds = self.model.embed_input_ids(input_ids=token_ids)
                 self.inputs_embeds.gpu[token_ids_idx] = tokens_to_embeds
 
             inputs_embeds = self.inputs_embeds.gpu[:num_input_tokens]
@@ -3889,7 +3889,7 @@ def profile_run(self) -> None:
                     )
 
                     # Run multimodal encoder.
-                    dummy_encoder_outputs = self.model.get_multimodal_embeddings(
+                    dummy_encoder_outputs = self.model.embed_multimodal(
                         **batched_dummy_mm_inputs
                     )
 
diff --git a/vllm/v1/worker/tpu_model_runner.py b/vllm/v1/worker/tpu_model_runner.py
index 26816ce0f209..0f90578671db 100644
--- a/vllm/v1/worker/tpu_model_runner.py
+++ b/vllm/v1/worker/tpu_model_runner.py
@@ -962,7 +962,7 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
             # (feature_size, hidden_size) in case the feature size is dynamic
             # depending on the input multimodal items.
             torch_xla.sync(wait=False)
-            curr_group_outputs = model.get_multimodal_embeddings(**mm_kwargs_group)
+            curr_group_outputs = model.embed_multimodal(**mm_kwargs_group)
             torch_xla.sync(wait=False)
 
             sanity_check_mm_encoder_outputs(
@@ -1065,7 +1065,7 @@ def _get_model_inputs(
             # NOTE(woosuk): To unify token ids and soft tokens (vision
             # embeddings), we always use embeddings (rather than token ids)
             # as input to the multimodal model, even when the input is text.
-            inputs_embeds = self.model.get_input_embeddings(
+            inputs_embeds = self.model.embed_input_ids(
                 input_ids,
                 multimodal_embeddings=mm_embeds,
                 is_multimodal=is_mm_embed,
@@ -1484,14 +1484,12 @@ def _precompile_mm_encoder(self) -> None:
                 )
                 # Run multimodal encoder.
                 torch_xla.sync(wait=False)
-                mm_embeds = self.model.get_multimodal_embeddings(
-                    **batched_dummy_mm_inputs
-                )
+                mm_embeds = self.model.embed_multimodal(**batched_dummy_mm_inputs)
                 torch_xla.sync(wait=False)
                 num_patches = mm_embeds[0].shape[0]
                 items_size = num_patches * num_items
 
-                # NOTE (NickLucche) pre-compile `get_input_embeddings` when mm
+                # NOTE (NickLucche) pre-compile `embed_input_ids` when mm
                 # embeddings are present. We assume `--disable-mm-chunked`,
                 # hence only whole items can be scheduled. This implies we just
                 # need to compile when `num_items` fit the (padded) `input_ids`
@@ -1519,7 +1517,7 @@ def _precompile_mm_encoder(self) -> None:
                         assert a is None
                         torch_xla.sync(wait=False)
 
-            # Pre-compile `get_input_embeddings` when mm_embeddings are not
+            # Pre-compile `embed_input_ids` when mm_embeddings are not
             # present. Chunk is only made of text, no mm_placeholders.
             for num_tokens in self.num_tokens_paddings:
                 placeholders_ids = torch.zeros(
@@ -1738,7 +1736,7 @@ def profile_run(
                     # impact of recompilation until it's fixed.
                     start = time.perf_counter()
                     torch_xla.sync(wait=False)
-                    dummy_encoder_outputs = self.model.get_multimodal_embeddings(
+                    dummy_encoder_outputs = self.model.embed_multimodal(
                         **batched_dummy_mm_inputs
                     )
                     torch_xla.sync(wait=False)
@@ -1974,11 +1972,11 @@ def apply_grammar_bitmask(
             )
         return logits_cloned
 
-    def get_multimodal_embeddings(self, *args, **kwargs):
-        return self.model.get_multimodal_embeddings(*args, **kwargs)
+    def embed_multimodal(self, *args, **kwargs):
+        return self.model.embed_multimodal(*args, **kwargs)
 
-    def get_input_embeddings(self, *args, **kwargs):
-        return self.model.get_input_embeddings(*args, **kwargs)
+    def embed_input_ids(self, *args, **kwargs):
+        return self.model.embed_input_ids(*args, **kwargs)
 
     def prepare_structured_decoding_input(
         self, logits: torch.Tensor, grammar_output: "GrammarOutput"
diff --git a/vllm/v1/worker/utils.py b/vllm/v1/worker/utils.py
index 0ca7e81a5c7b..095407a8b959 100644
--- a/vllm/v1/worker/utils.py
+++ b/vllm/v1/worker/utils.py
@@ -177,27 +177,27 @@ def sanity_check_mm_encoder_outputs(
 ) -> None:
     """
     Perform sanity checks for the result of
-    [`vllm.model_executor.models.SupportsMultiModal.get_multimodal_embeddings`][].
+    [`vllm.model_executor.models.SupportsMultiModal.embed_multimodal`][].
     """
     assert isinstance(mm_embeddings, (list, tuple, torch.Tensor)), (
         "Expected multimodal embeddings to be a list/tuple of 2D tensors, "
         f"or a single 3D tensor, but got {type(mm_embeddings)} "
         "instead. This is most likely due to incorrect implementation "
-        "of the model's `get_multimodal_embeddings` method."
+        "of the model's `embed_multimodal` method."
     )
 
     assert len(mm_embeddings) == expected_num_items, (
         "Expected number of multimodal embeddings to match number of "
         f"input items: {expected_num_items}, but got {len(mm_embeddings)=} "
         "instead. This is most likely due to incorrect implementation "
-        "of the model's `get_multimodal_embeddings` method."
+        "of the model's `embed_multimodal` method."
     )
 
     assert all(e.ndim == 2 for e in mm_embeddings), (
         "Expected multimodal embeddings to be a sequence of 2D tensors, "
         f"but got tensors with shapes {[e.shape for e in mm_embeddings]} "
         "instead. This is most likely due to incorrect implementation "
-        "of the model's `get_multimodal_embeddings` method."
+        "of the model's `embed_multimodal` method."
     )
 
 

From a1d3866dda6539a0e9e2cfc49e9cb1e887baaaec Mon Sep 17 00:00:00 2001
From: Jialin Ouyang <Jialin.Ouyang@gmail.com>
Date: Wed, 12 Nov 2025 19:36:07 -0800
Subject: [PATCH 132/183] [n-gen] DO NOT repeatedly return finished child
 requests (#28591)

Signed-off-by: Jialin Ouyang <Jialin.Ouyang@gmail.com>
---
 tests/v1/engine/test_parallel_sampling.py | 103 ++++++++++++++++++++++
 vllm/v1/engine/parallel_sampling.py       |  15 +++-
 2 files changed, 115 insertions(+), 3 deletions(-)
 create mode 100644 tests/v1/engine/test_parallel_sampling.py

diff --git a/tests/v1/engine/test_parallel_sampling.py b/tests/v1/engine/test_parallel_sampling.py
new file mode 100644
index 000000000000..736c0e54837f
--- /dev/null
+++ b/tests/v1/engine/test_parallel_sampling.py
@@ -0,0 +1,103 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from vllm import SamplingParams
+from vllm.outputs import CompletionOutput
+from vllm.sampling_params import RequestOutputKind
+from vllm.v1.engine.parallel_sampling import ParentRequest
+
+
+def test_parent_request_to_output_stream() -> None:
+    parent_request = ParentRequest("parent_id", SamplingParams(n=2))
+    parent_request.child_requests = {"child_id_0", "child_id_1"}
+    output_0 = CompletionOutput(
+        index=0, text="child 0", token_ids=[], cumulative_logprob=None, logprobs=None
+    )
+    output_1 = CompletionOutput(
+        index=1, text="child 1", token_ids=[], cumulative_logprob=None, logprobs=None
+    )
+    # Request not finished
+    assert ("parent_id", [output_0], False) == parent_request.get_outputs(
+        "child_id_0", output_0
+    )
+    assert ("parent_id", [output_1], False) == parent_request.get_outputs(
+        "child_id_1", output_1
+    )
+    assert ("parent_id", [output_0], False) == parent_request.get_outputs(
+        "child_id_0", output_0
+    )
+    assert ("parent_id", [output_1], False) == parent_request.get_outputs(
+        "child_id_1", output_1
+    )
+
+    # output_1 finished
+    output_1.finish_reason = "ended"
+    assert ("parent_id", [output_0], False) == parent_request.get_outputs(
+        "child_id_0", output_0
+    )
+    assert ("parent_id", [output_1], False) == parent_request.get_outputs(
+        "child_id_1", output_1
+    )
+    # Finished output_1 had already returned, DO NOT returned again
+    assert ("parent_id", [output_0], False) == parent_request.get_outputs(
+        "child_id_0", output_0
+    )
+    assert parent_request.get_outputs("child_id_1", output_1) == (
+        "parent_id",
+        [],
+        False,
+    )
+
+    # output_0 finished
+    output_0.finish_reason = "ended"
+    assert ("parent_id", [output_0], True) == parent_request.get_outputs(
+        "child_id_0", output_0
+    )
+    assert parent_request.get_outputs("child_id_1", output_1) == ("parent_id", [], True)
+    # Finished output_0 had already returned, DO NOT returned again
+    assert parent_request.get_outputs("child_id_0", output_0) == ("parent_id", [], True)
+    assert parent_request.get_outputs("child_id_1", output_1) == ("parent_id", [], True)
+
+
+def test_parent_request_to_output_final_only() -> None:
+    parent_request = ParentRequest(
+        "parent_id", SamplingParams(n=2, output_kind=RequestOutputKind.FINAL_ONLY)
+    )
+    parent_request.child_requests = {"child_id_0", "child_id_1"}
+    output_0 = CompletionOutput(
+        index=0, text="child 0", token_ids=[], cumulative_logprob=None, logprobs=None
+    )
+    output_1 = CompletionOutput(
+        index=1, text="child 1", token_ids=[], cumulative_logprob=None, logprobs=None
+    )
+    # Request not finished, return nothing
+    assert parent_request.get_outputs("child_id_0", output_0) == (
+        "parent_id",
+        [],
+        False,
+    )
+    assert parent_request.get_outputs("child_id_1", output_1) == (
+        "parent_id",
+        [],
+        False,
+    )
+    # output_1 finished, but outputs won't be returned until all child requests finished
+    output_1.finish_reason = "ended"
+    assert parent_request.get_outputs("child_id_0", output_0) == (
+        "parent_id",
+        [],
+        False,
+    )
+    assert parent_request.get_outputs("child_id_1", output_1) == (
+        "parent_id",
+        [],
+        False,
+    )
+    # output_0 finished, as all child requests finished, the output would be returned
+    output_0.finish_reason = "ended"
+    assert ("parent_id", [output_0, output_1], True) == parent_request.get_outputs(
+        "child_id_0", output_0
+    )
+    assert ("parent_id", [output_0, output_1], True) == parent_request.get_outputs(
+        "child_id_1", output_1
+    )
diff --git a/vllm/v1/engine/parallel_sampling.py b/vllm/v1/engine/parallel_sampling.py
index 26ee10d2b9bb..59aacd196307 100644
--- a/vllm/v1/engine/parallel_sampling.py
+++ b/vllm/v1/engine/parallel_sampling.py
@@ -97,12 +97,21 @@ def get_outputs(
         child_request_id: str,
         completion_output: CompletionOutput,
     ) -> tuple[str, list[CompletionOutput], bool]:
+        already_finished_and_returned: bool = False
         if completion_output.finished():
-            self.child_requests.remove(child_request_id)
+            if child_request_id in self.child_requests:
+                self.child_requests.remove(child_request_id)
+            else:
+                # child request ID is not available in child_requests
+                # which means the request had finished in previous
+                # batch step and returned to the client earlier
+                already_finished_and_returned = True
 
         if self.sampling_params.output_kind != RequestOutputKind.FINAL_ONLY:
-            # If streaming, just return the current output.
-            outputs = [completion_output]
+            # If streaming, just return the current output
+            #
+            # DO NOT output finished and already returned child request to client again
+            outputs = [] if already_finished_and_returned else [completion_output]
         else:
             # If not streaming, aggregate the n final outputs.
             self.output_aggregator[completion_output.index] = completion_output

From 7c38ed0f1c83077111bac6dd044d441c6e4fab67 Mon Sep 17 00:00:00 2001
From: Andrew Xia <axia@meta.com>
Date: Wed, 12 Nov 2025 20:03:23 -0800
Subject: [PATCH 133/183] [Frontend] split append tool output (#28333)

Signed-off-by: Andrew Xia <axia@fb.com>
Co-authored-by: Andrew Xia <axia@fb.com>
---
 .../openai/test_serving_responses.py          |   3 +
 vllm/entrypoints/context.py                   | 131 +++++++++---------
 vllm/entrypoints/openai/serving_engine.py     |   2 +-
 3 files changed, 73 insertions(+), 63 deletions(-)

diff --git a/tests/entrypoints/openai/test_serving_responses.py b/tests/entrypoints/openai/test_serving_responses.py
index 788a1e912182..93e11b61020c 100644
--- a/tests/entrypoints/openai/test_serving_responses.py
+++ b/tests/entrypoints/openai/test_serving_responses.py
@@ -34,6 +34,9 @@ def __init__(self):
     def append_output(self, output) -> None:
         pass
 
+    def append_tool_output(self, output) -> None:
+        pass
+
     async def call_tool(self):
         return []
 
diff --git a/vllm/entrypoints/context.py b/vllm/entrypoints/context.py
index 0041db822080..7a41c668d764 100644
--- a/vllm/entrypoints/context.py
+++ b/vllm/entrypoints/context.py
@@ -80,7 +80,11 @@ def copy(self):
 
 class ConversationContext(ABC):
     @abstractmethod
-    def append_output(self, output) -> None:
+    def append_output(self, output: RequestOutput) -> None:
+        pass
+
+    @abstractmethod
+    def append_tool_output(self, output) -> None:
         pass
 
     @abstractmethod
@@ -151,6 +155,9 @@ def append_output(self, output) -> None:
         self.num_cached_tokens = output.num_cached_tokens or 0
         self.num_output_tokens += len(output.outputs[0].token_ids or [])
 
+    def append_tool_output(self, output) -> None:
+        raise NotImplementedError("Should not be called.")
+
     def need_builtin_tool_call(self) -> bool:
         return False
 
@@ -205,28 +212,28 @@ def _update_num_reasoning_tokens(self):
         if self.parser.current_channel in {"analysis", "commentary"}:
             self.num_reasoning_tokens += 1
 
-    def append_output(self, output: RequestOutput | list[Message]) -> None:
-        if isinstance(output, RequestOutput):
-            output_token_ids = output.outputs[0].token_ids
-            self.parser = get_streamable_parser_for_assistant()
-            for token_id in output_token_ids:
-                self.parser.process(token_id)
-                # Check if the current token is part of reasoning content
-                self._update_num_reasoning_tokens()
-            self._update_prefill_token_usage(output)
-            self._update_decode_token_usage(output)
-            # Append current turn to all turn list for next turn's calculations
-            self.all_turn_metrics.append(self.current_turn_metrics.copy())
-            self.current_turn_metrics.reset()
-            # append_output is called only once before tool calling
-            # in non-streaming case
-            # so we can append all the parser messages to _messages
-            output_msgs = self.parser.messages
-            # The responses finish reason is set in the last message
-            self.finish_reason = output.outputs[0].finish_reason
-        else:
-            # Tool output.
-            output_msgs = output
+    def append_output(self, output: RequestOutput) -> None:
+        output_token_ids = output.outputs[0].token_ids
+        self.parser = get_streamable_parser_for_assistant()
+        for token_id in output_token_ids:
+            self.parser.process(token_id)
+            # Check if the current token is part of reasoning content
+            self._update_num_reasoning_tokens()
+        self._update_prefill_token_usage(output)
+        self._update_decode_token_usage(output)
+        # Append current turn to all turn list for next turn's calculations
+        self.all_turn_metrics.append(self.current_turn_metrics.copy())
+        self.current_turn_metrics.reset()
+        # append_output is called only once before tool calling
+        # in non-streaming case
+        # so we can append all the parser messages to _messages
+        output_msgs = self.parser.messages
+        # The responses finish reason is set in the last message
+        self.finish_reason = output.outputs[0].finish_reason
+        self._messages.extend(output_msgs)
+
+    def append_tool_output(self, output: list[Message]) -> None:
+        output_msgs = output
         self._messages.extend(output_msgs)
 
     def _update_prefill_token_usage(self, output: RequestOutput) -> None:
@@ -502,45 +509,45 @@ def __init__(self, *args, **kwargs):
     def messages(self) -> list:
         return self._messages
 
-    def append_output(self, output: RequestOutput | list[Message]) -> None:
-        if isinstance(output, RequestOutput):
-            # append_output is called for each output token in streaming case,
-            # so we only want to add the prompt tokens once for each message.
-            if self.first_tok_of_message:
-                self._update_prefill_token_usage(output)
-            # Reset self.first_tok_of_message if needed:
-            # if the current token is the last one of the current message
-            # (finished=True), then the next token processed will mark the
-            # beginning of a new message
-            self.first_tok_of_message = output.finished
-            for tok in output.outputs[0].token_ids:
-                self.parser.process(tok)
-            self._update_decode_token_usage(output)
-
-            # For streaming, update previous turn when message is complete
-            if output.finished:
-                self.all_turn_metrics.append(self.current_turn_metrics.copy())
-                self.current_turn_metrics.reset()
-            # Check if the current token is part of reasoning content
-            self._update_num_reasoning_tokens()
-            self.last_tok = tok
-            if len(self._messages) - self.num_init_messages < len(self.parser.messages):
-                self._messages.extend(
-                    self.parser.messages[len(self._messages) - self.num_init_messages :]
-                )
-        else:
-            # Handle the case of tool output in direct message format
-            assert len(output) == 1, "Tool output should be a single message"
-            msg = output[0]
-            # Sometimes the recipient is not set for tool messages,
-            # so we set it to "assistant"
-            if msg.author.role == Role.TOOL and msg.recipient is None:
-                msg.recipient = "assistant"
-            toks = self.encoding.render(msg)
-            for tok in toks:
-                self.parser.process(tok)
-            self.last_tok = toks[-1]
-            # TODO: add tool_output messages to self._messages
+    def append_output(self, output: RequestOutput) -> None:
+        # append_output is called for each output token in streaming case,
+        # so we only want to add the prompt tokens once for each message.
+        if self.first_tok_of_message:
+            self._update_prefill_token_usage(output)
+        # Reset self.first_tok_of_message if needed:
+        # if the current token is the last one of the current message
+        # (finished=True), then the next token processed will mark the
+        # beginning of a new message
+        self.first_tok_of_message = output.finished
+        for tok in output.outputs[0].token_ids:
+            self.parser.process(tok)
+        self._update_decode_token_usage(output)
+
+        # For streaming, update previous turn when message is complete
+        if output.finished:
+            self.all_turn_metrics.append(self.current_turn_metrics.copy())
+            self.current_turn_metrics.reset()
+        # Check if the current token is part of reasoning content
+        self._update_num_reasoning_tokens()
+        self.last_tok = tok
+        if len(self._messages) - self.num_init_messages < len(self.parser.messages):
+            self._messages.extend(
+                self.parser.messages[len(self._messages) - self.num_init_messages :]
+            )
+
+    def append_tool_output(self, output: list[Message]) -> None:
+        # Handle the case of tool output in direct message format
+        assert len(output) == 1, "Tool output should be a single message"
+        msg = output[0]
+        # Sometimes the recipient is not set for tool messages,
+        # so we set it to "assistant"
+        if msg.author.role == Role.TOOL and msg.recipient is None:
+            msg.recipient = "assistant"
+        toks = self.encoding.render(msg)
+        for tok in toks:
+            self.parser.process(tok)
+        self.last_tok = toks[-1]
+        # TODO: add tool_output messages to self._messages
 
     def is_expecting_start(self) -> bool:
         return self.parser.state == StreamState.EXPECT_START
diff --git a/vllm/entrypoints/openai/serving_engine.py b/vllm/entrypoints/openai/serving_engine.py
index 30b8499b08d5..1456727a3cdd 100644
--- a/vllm/entrypoints/openai/serving_engine.py
+++ b/vllm/entrypoints/openai/serving_engine.py
@@ -1227,7 +1227,7 @@ async def _generate_with_builtin_tools(
 
             # Call the tool and update the context with the result.
             tool_output = await context.call_tool()
-            context.append_output(tool_output)
+            context.append_tool_output(tool_output)
 
             # TODO: uncomment this and enable tool output streaming
             # yield context

From 1a0b157a2ea46eebd69072f78e5a97ece4f6a2e7 Mon Sep 17 00:00:00 2001
From: Andrew Xia <axia@meta.com>
Date: Wed, 12 Nov 2025 20:47:22 -0800
Subject: [PATCH 134/183] [Frontend][responsesAPI][1/n] convert responses API
 tool input to chat completions tool format (#28231)

Signed-off-by: Andrew Xia <axia@fb.com>
Co-authored-by: Andrew Xia <axia@fb.com>
Co-authored-by: Chauncey <chaunceyjiang@gmail.com>
---
 tests/entrypoints/test_responses_utils.py     | 30 +++++++++++++++++
 .../openai/serving_responses/conftest.py      |  5 ++-
 .../serving_responses/test_function_call.py   |  1 +
 vllm/entrypoints/openai/serving_responses.py  | 29 ++++++-----------
 vllm/entrypoints/responses_utils.py           | 32 +++++++++++++++++++
 5 files changed, 76 insertions(+), 21 deletions(-)
 create mode 100644 tests/entrypoints/test_responses_utils.py

diff --git a/tests/entrypoints/test_responses_utils.py b/tests/entrypoints/test_responses_utils.py
new file mode 100644
index 000000000000..48bf06088bc0
--- /dev/null
+++ b/tests/entrypoints/test_responses_utils.py
@@ -0,0 +1,30 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from vllm.entrypoints.responses_utils import (
+    convert_tool_responses_to_completions_format,
+)
+
+
+class TestResponsesUtils:
+    """Tests for convert_tool_responses_to_completions_format function."""
+
+    def test_convert_tool_responses_to_completions_format(self):
+        """Test basic conversion of a flat tool schema to nested format."""
+        input_tool = {
+            "type": "function",
+            "name": "get_weather",
+            "description": "Get the current weather in a given location",
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "location": {"type": "string"},
+                    "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
+                },
+                "required": ["location", "unit"],
+            },
+        }
+
+        result = convert_tool_responses_to_completions_format(input_tool)
+
+        assert result == {"type": "function", "function": input_tool}
diff --git a/tests/v1/entrypoints/openai/serving_responses/conftest.py b/tests/v1/entrypoints/openai/serving_responses/conftest.py
index 8081e5fa1d83..b948b6d058a5 100644
--- a/tests/v1/entrypoints/openai/serving_responses/conftest.py
+++ b/tests/v1/entrypoints/openai/serving_responses/conftest.py
@@ -30,7 +30,10 @@ def server_with_store(default_server_args):
     with RemoteOpenAIServer(
         MODEL_NAME,
         default_server_args,
-        env_dict={"VLLM_ENABLE_RESPONSES_API_STORE": "1"},
+        env_dict={
+            "VLLM_ENABLE_RESPONSES_API_STORE": "1",
+            "VLLM_SERVER_DEV_MODE": "1",
+        },
     ) as remote_server:
         yield remote_server
 
diff --git a/tests/v1/entrypoints/openai/serving_responses/test_function_call.py b/tests/v1/entrypoints/openai/serving_responses/test_function_call.py
index cf57956a9dea..90161e7c221b 100644
--- a/tests/v1/entrypoints/openai/serving_responses/test_function_call.py
+++ b/tests/v1/entrypoints/openai/serving_responses/test_function_call.py
@@ -116,6 +116,7 @@ async def test_function_tool_use(
         input=prompt,
         tools=tools,
         tool_choice=tool_choice,
+        temperature=0.0,
     )
 
     assert len(response.output) >= 1
diff --git a/vllm/entrypoints/openai/serving_responses.py b/vllm/entrypoints/openai/serving_responses.py
index 9b79e50c3208..06efb43ecb7b 100644
--- a/vllm/entrypoints/openai/serving_responses.py
+++ b/vllm/entrypoints/openai/serving_responses.py
@@ -48,7 +48,6 @@
 from openai.types.responses.response_reasoning_item import (
     Content as ResponseReasoningTextContent,
 )
-from openai.types.responses.tool import Tool
 from openai_harmony import Message as OpenAIHarmonyMessage
 
 from vllm import envs
@@ -94,7 +93,11 @@
 )
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
-from vllm.entrypoints.responses_utils import construct_chat_message_with_tool_call
+from vllm.entrypoints.responses_utils import (
+    construct_chat_message_with_tool_call,
+    convert_tool_responses_to_completions_format,
+    extract_tool_types,
+)
 from vllm.entrypoints.tool_server import ToolServer
 from vllm.inputs.data import TokensPrompt as EngineTokensPrompt
 from vllm.logger import init_logger
@@ -108,23 +111,6 @@
 logger = init_logger(__name__)
 
 
-def extract_tool_types(tools: list[Tool]) -> set[str]:
-    """
-    Extracts the tool types from the given tools.
-    """
-    tool_types: set[str] = set()
-    for tool in tools:
-        if tool.type == "mcp":
-            # Allow the MCP Tool type to enable built in tools if the
-            # server_label is allowlisted in
-            # envs.VLLM_GPT_OSS_SYSTEM_TOOL_MCP_LABELS
-            if tool.server_label in envs.VLLM_GPT_OSS_SYSTEM_TOOL_MCP_LABELS:
-                tool_types.add(tool.server_label)
-        else:
-            tool_types.add(tool.type)
-    return tool_types
-
-
 class OpenAIServingResponses(OpenAIServing):
     def __init__(
         self,
@@ -513,7 +499,10 @@ async def _make_request(
         ):
             tool_dicts = None
         else:
-            tool_dicts = [tool.model_dump() for tool in request.tools]
+            tool_dicts = [
+                convert_tool_responses_to_completions_format(tool.model_dump())
+                for tool in request.tools
+            ]
         # Construct the input messages.
         messages = self._construct_input_messages(request, prev_response)
         _, request_prompts, engine_prompts = await self._preprocess_chat(
diff --git a/vllm/entrypoints/responses_utils.py b/vllm/entrypoints/responses_utils.py
index 6eb7c0b70a67..d966f58804b6 100644
--- a/vllm/entrypoints/responses_utils.py
+++ b/vllm/entrypoints/responses_utils.py
@@ -10,7 +10,9 @@
     Function as FunctionCallTool,
 )
 from openai.types.responses import ResponseFunctionToolCall
+from openai.types.responses.tool import Tool
 
+from vllm import envs
 from vllm.entrypoints.openai.protocol import (
     ChatCompletionMessageParam,
     ResponseInputOutputItem,
@@ -43,3 +45,33 @@ def construct_chat_message_with_tool_call(
             tool_call_id=item.get("call_id"),
         )
     return item  # type: ignore
+
+
+def extract_tool_types(tools: list[Tool]) -> set[str]:
+    """
+    Extracts the tool types from the given tools.
+    """
+    tool_types: set[str] = set()
+    for tool in tools:
+        if tool.type == "mcp":
+            # Allow the MCP Tool type to enable built in tools if the
+            # server_label is allowlisted in
+            # envs.VLLM_GPT_OSS_SYSTEM_TOOL_MCP_LABELS
+            if tool.server_label in envs.VLLM_GPT_OSS_SYSTEM_TOOL_MCP_LABELS:
+                tool_types.add(tool.server_label)
+        else:
+            tool_types.add(tool.type)
+    return tool_types
+
+
+def convert_tool_responses_to_completions_format(tool: dict) -> dict:
+    """
+    Convert a flat tool schema:
+        {"type": "function", "name": "...", "description": "...", "parameters": {...}}
+    into:
+        {"type": "function", "function": {...}}
+    """
+    return {
+        "type": "function",
+        "function": tool,
+    }

From 7dca0c90cbd221bdc2650a46ba04a288fc95fd94 Mon Sep 17 00:00:00 2001
From: Pleaplusone <ygan@amd.com>
Date: Thu, 13 Nov 2025 13:18:56 +0800
Subject: [PATCH 135/183] [BugFix][ROCm] Fix `get_cu_count` missing variable
 error (#28608)

Signed-off-by: ganyi <ygan@amd.com>
---
 vllm/utils/platform_utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/utils/platform_utils.py b/vllm/utils/platform_utils.py
index 3327fce6707b..433c6734e8a9 100644
--- a/vllm/utils/platform_utils.py
+++ b/vllm/utils/platform_utils.py
@@ -24,7 +24,7 @@ def xpu_is_initialized() -> bool:
     return torch.xpu.is_initialized()
 
 
-def get_cu_count(cls, device_id: int = 0) -> int:
+def get_cu_count(device_id: int = 0) -> int:
     """Returns the total number of compute units (CU) on single GPU."""
     return torch.cuda.get_device_properties(device_id).multi_processor_count
 

From dbbe0c756a41e5a64d6e364c131fd7d12a56b926 Mon Sep 17 00:00:00 2001
From: Fanli Lin <fanli.lin@intel.com>
Date: Thu, 13 Nov 2025 13:31:42 +0800
Subject: [PATCH 136/183] [XPU] Support Triton path for LoRA operations on XPU 
  (#28511)

Signed-off-by: Fanli Lin <fanli.lin@intel.com>
---
 vllm/lora/ops/triton_ops/lora_expand_op.py | 1 +
 vllm/lora/ops/triton_ops/lora_shrink_op.py | 1 +
 vllm/platforms/xpu.py                      | 6 +++++-
 3 files changed, 7 insertions(+), 1 deletion(-)

diff --git a/vllm/lora/ops/triton_ops/lora_expand_op.py b/vllm/lora/ops/triton_ops/lora_expand_op.py
index 7f7d70cdc3a4..311c4b191859 100644
--- a/vllm/lora/ops/triton_ops/lora_expand_op.py
+++ b/vllm/lora/ops/triton_ops/lora_expand_op.py
@@ -48,6 +48,7 @@ def _lora_expand_kernel(
     SLICE_NUM: tl.constexpr,
     SAME_STRIDE: tl.constexpr,
     USE_GDC: tl.constexpr,
+    launch_pdl: tl.constexpr,
 ):
     cta_n_num = tl.cdiv(N, BLOCK_N)
     cta_m_num = tl.cdiv(M, BLOCK_M)
diff --git a/vllm/lora/ops/triton_ops/lora_shrink_op.py b/vllm/lora/ops/triton_ops/lora_shrink_op.py
index e78379cf684a..71bd5e361466 100644
--- a/vllm/lora/ops/triton_ops/lora_shrink_op.py
+++ b/vllm/lora/ops/triton_ops/lora_shrink_op.py
@@ -46,6 +46,7 @@ def _lora_shrink_kernel(
     GROUP_SIZE_M: tl.constexpr,
     SLICE_NUM: tl.constexpr,
     USE_GDC: tl.constexpr,
+    launch_pdl: tl.constexpr,
 ):
     cta_n_num = tl.cdiv(N, BLOCK_N)
     cta_m_num = tl.cdiv(M, BLOCK_M)
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index 0309ae0fe962..c629325f76a3 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -101,7 +101,11 @@ def get_device_name(cls, device_id: int = 0) -> str:
 
     @classmethod
     def get_punica_wrapper(cls) -> str:
-        return "vllm.lora.punica_wrapper.punica_xpu.PunicaWrapperXPU"
+        xpu_use_triton_kernel = os.getenv("XPU_USE_TRITON_KERNEL", "0") == "1"
+        if not xpu_use_triton_kernel:
+            return "vllm.lora.punica_wrapper.punica_xpu.PunicaWrapperXPU"
+        else:
+            return "vllm.lora.punica_wrapper.punica_gpu.PunicaWrapperGPU"
 
     @classmethod
     def get_device_total_memory(cls, device_id: int = 0) -> int:

From 7e082bc14e431af0311186dd18d4f4da7a757f3a Mon Sep 17 00:00:00 2001
From: Lucia Fang <116399278+luccafong@users.noreply.github.com>
Date: Wed, 12 Nov 2025 21:40:45 -0800
Subject: [PATCH 137/183] Support DeepEP for Kimi-k2-thinking through enabling
 gemm selection for compressed-tensor marlin wna16 (#28574)

Signed-off-by: Lu Fang <fanglu@fb.com>
---
 .../layers/fused_moe/fused_marlin_moe.py      | 75 +++++++++++++++++--
 .../compressed_tensors_moe.py                 | 52 ++++++++++++-
 2 files changed, 118 insertions(+), 9 deletions(-)

diff --git a/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py b/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py
index 3b0df6c416a0..0b0f59f67318 100644
--- a/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py
@@ -499,11 +499,35 @@ def batched_fused_marlin_moe(
 
 
 class MarlinExpertsBase(mk.FusedMoEPermuteExpertsUnpermute):
-    def __init__(self, quant_config: FusedMoEQuantConfig):
+    def __init__(
+        self,
+        quant_config: FusedMoEQuantConfig,
+        w13_g_idx: torch.Tensor | None = None,
+        w2_g_idx: torch.Tensor | None = None,
+        w13_g_idx_sort_indices: torch.Tensor | None = None,
+        w2_g_idx_sort_indices: torch.Tensor | None = None,
+        is_k_full: bool = True,
+    ):
         # TODO (varun) : Enable activation quantization
-        assert quant_config.use_mxfp4_w4a16, "Supports only mxfp4_w4a16"
+        assert quant_config.use_mxfp4_w4a16 or quant_config.use_int4_w4a16, (
+            "Supports only mxfp4_w4a16 or int4_w4a16"
+        )
+        self.w13_g_idx = w13_g_idx
+        self.w2_g_idx = w2_g_idx
+        self.w13_g_idx_sort_indices = w13_g_idx_sort_indices
+        self.w2_g_idx_sort_indices = w2_g_idx_sort_indices
+        self.is_k_full = is_k_full
         super().__init__(quant_config)
 
+    @property
+    def quant_type_id(self) -> int:
+        # uint4b8 will be set for int4 weight and float4_e2m1f will be used for mxfp4
+        return (
+            scalar_types.uint4b8.id
+            if self.quant_config.use_int4_w4a16
+            else scalar_types.float4_e2m1f.id
+        )
+
     def moe_problem_size(
         self,
         a1: torch.Tensor,
@@ -533,8 +557,23 @@ def moe_problem_size(
 
 
 class MarlinExperts(MarlinExpertsBase):
-    def __init__(self, quant_config: FusedMoEQuantConfig):
-        super().__init__(quant_config)
+    def __init__(
+        self,
+        quant_config: FusedMoEQuantConfig,
+        w13_g_idx: torch.Tensor | None = None,
+        w2_g_idx: torch.Tensor | None = None,
+        w13_g_idx_sort_indices: torch.Tensor | None = None,
+        w2_g_idx_sort_indices: torch.Tensor | None = None,
+        is_k_full: bool = True,
+    ):
+        super().__init__(
+            quant_config,
+            w13_g_idx,
+            w2_g_idx,
+            w13_g_idx_sort_indices,
+            w2_g_idx_sort_indices,
+            is_k_full,
+        )
 
     def supports_expert_map(self) -> bool:
         return True
@@ -616,7 +655,7 @@ def apply(
             gating_output=None,
             topk_weights=topk_weights,
             topk_ids=topk_ids,
-            quant_type_id=scalar_types.float4_e2m1f.id,  # works only for w4a16
+            quant_type_id=self.quant_type_id,
             apply_router_weight_on_input=apply_router_weight_on_input,
             global_num_experts=global_num_experts,
             activation=activation,
@@ -628,6 +667,11 @@ def apply(
             # output buffer allocation. Please refer to workspace_shapes().
             intermediate_cache13=workspace2,
             intermediate_cache2=workspace13,
+            g_idx1=self.w13_g_idx,
+            g_idx2=self.w2_g_idx,
+            sort_indices1=self.w13_g_idx_sort_indices,
+            sort_indices2=self.w2_g_idx_sort_indices,
+            is_k_full=self.is_k_full,
         )
 
     def moe_sum(self, input: torch.Tensor, output: torch.Tensor) -> None:
@@ -650,8 +694,20 @@ def __init__(
         max_num_tokens: int,
         num_dispatchers: int,
         quant_config: FusedMoEQuantConfig,
+        w13_g_idx: torch.Tensor | None = None,
+        w2_g_idx: torch.Tensor | None = None,
+        w13_g_idx_sort_indices: torch.Tensor | None = None,
+        w2_g_idx_sort_indices: torch.Tensor | None = None,
+        is_k_full: bool = True,
     ):
-        super().__init__(quant_config)
+        super().__init__(
+            quant_config,
+            w13_g_idx,
+            w2_g_idx,
+            w13_g_idx_sort_indices,
+            w2_g_idx_sort_indices,
+            is_k_full,
+        )
         self.max_num_tokens = max_num_tokens
         self.num_dispatchers = num_dispatchers
 
@@ -720,7 +776,7 @@ def apply(
             w1_scale=self.w1_scale,
             w2_scale=self.w2_scale,
             gating_output=None,
-            quant_type_id=scalar_types.float4_e2m1f.id,  # works only for w4a16
+            quant_type_id=self.quant_type_id,
             apply_router_weight_on_input=apply_router_weight_on_input,
             global_num_experts=global_num_experts,
             activation=activation,
@@ -728,4 +784,9 @@ def apply(
             output=output,
             intermediate_cache13=workspace13,
             intermediate_cache2=workspace2,
+            g_idx1=self.w13_g_idx,
+            g_idx2=self.w2_g_idx,
+            sort_indices1=self.w13_g_idx_sort_indices,
+            sort_indices2=self.w2_g_idx_sort_indices,
+            is_k_full=self.is_k_full,
         )
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
index bda94cee9e42..06ee96d55419 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
@@ -35,7 +35,11 @@
 from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe import (
     is_valid_flashinfer_cutlass_fused_moe,
 )
-from vllm.model_executor.layers.fused_moe.fused_marlin_moe import fused_marlin_moe
+from vllm.model_executor.layers.fused_moe.fused_marlin_moe import (
+    BatchedMarlinExperts,
+    MarlinExperts,
+    fused_marlin_moe,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes.compressed_tensors_wNa16 import (  # noqa
     WNA16_SUPPORTED_BITS,
     WNA16_SUPPORTED_TYPES_MAP,
@@ -1578,7 +1582,51 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
     def get_fused_moe_quant_config(
         self, layer: torch.nn.Module
     ) -> FusedMoEQuantConfig | None:
-        return None
+        if self.num_bits != 4:
+            return None
+        return int4_w4a16_moe_quant_config(
+            w1_scale=layer.w13_weight_scale,
+            w2_scale=layer.w2_weight_scale,
+            w1_zp=None,
+            w2_zp=None,
+            block_shape=[0, self.group_size],
+        )
+
+    def select_gemm_impl(
+        self,
+        prepare_finalize: mk.FusedMoEPrepareAndFinalize,
+        layer: torch.nn.Module,
+    ) -> mk.FusedMoEPermuteExpertsUnpermute:
+        assert self.num_bits == 4, "only supporting w4"
+        layer.w13_weight = layer.w13_weight_packed
+        layer.w2_weight = layer.w2_weight_packed
+        assert all([w is not None for w in [layer.w13_weight, layer.w2_weight]])
+        assert self.moe_quant_config is not None
+        if (
+            prepare_finalize.activation_format
+            == mk.FusedMoEActivationFormat.BatchedExperts
+        ):
+            max_num_tokens_per_rank = prepare_finalize.max_num_tokens_per_rank()
+            assert max_num_tokens_per_rank is not None
+            return BatchedMarlinExperts(
+                max_num_tokens=max_num_tokens_per_rank,
+                num_dispatchers=prepare_finalize.num_dispatchers(),
+                quant_config=self.moe_quant_config,
+                w13_g_idx=layer.w13_weight_g_idx,
+                w2_g_idx=layer.w2_weight_g_idx,
+                w13_g_idx_sort_indices=layer.w13_g_idx_sort_indices,
+                w2_g_idx_sort_indices=layer.w2_g_idx_sort_indices,
+                is_k_full=self.is_k_full,
+            )
+        else:
+            return MarlinExperts(
+                quant_config=self.moe_quant_config,
+                w13_g_idx=layer.w13_weight_g_idx,
+                w2_g_idx=layer.w2_weight_g_idx,
+                w13_g_idx_sort_indices=layer.w13_g_idx_sort_indices,
+                w2_g_idx_sort_indices=layer.w2_g_idx_sort_indices,
+                is_k_full=self.is_k_full,
+            )
 
     def apply(
         self,

From d44fbbab0ea383a768823e99285b5be364afcd09 Mon Sep 17 00:00:00 2001
From: Radu Salavat <radu.salavat@arm.com>
Date: Wed, 12 Nov 2025 21:43:08 -0800
Subject: [PATCH 138/183] [build][cmake]: Bundle static ACL and torch libgomp
 for CPU extension builds (#28059)

Signed-off-by: Radu Salavat <radu.salavat@arm.com>
---
 cmake/cpu_extension.cmake | 78 +++++++++++++++++++++++++++++----------
 1 file changed, 58 insertions(+), 20 deletions(-)

diff --git a/cmake/cpu_extension.cmake b/cmake/cpu_extension.cmake
index 51447cde0b29..bb0179c79c10 100644
--- a/cmake/cpu_extension.cmake
+++ b/cmake/cpu_extension.cmake
@@ -210,7 +210,30 @@ endif()
 if ((AVX512_FOUND AND NOT AVX512_DISABLED) OR (ASIMD_FOUND AND NOT APPLE_SILICON_FOUND) OR POWER9_FOUND OR POWER10_FOUND OR POWER11_FOUND)
     # Fetch and build Arm Compute Library (ACL) as oneDNN's backend for AArch64
     # TODO [fadara01]: remove this once ACL can be fetched and built automatically as a dependency of oneDNN
+    set(ONEDNN_AARCH64_USE_ACL OFF CACHE BOOL "")
     if(ASIMD_FOUND)
+        # Set number of parallel build processes
+        include(ProcessorCount)
+        ProcessorCount(NPROC)
+        if(NOT NPROC)
+            set(NPROC 4)
+        endif()
+        # locate PyTorch's libgomp (e.g. site-packages/torch.libs/libgomp-947d5fa1.so.1.0.0)
+        # and create a local shim dir with it
+        vllm_prepare_torch_gomp_shim(VLLM_TORCH_GOMP_SHIM_DIR)
+
+        find_library(OPEN_MP
+            NAMES gomp
+            PATHS ${VLLM_TORCH_GOMP_SHIM_DIR}
+            NO_DEFAULT_PATH
+            REQUIRED
+        )
+        # Set LD_LIBRARY_PATH to include the shim dir at build time to use the same libgomp as PyTorch
+        if (OPEN_MP)
+            set(ENV{LD_LIBRARY_PATH} "${VLLM_TORCH_GOMP_SHIM_DIR}:$ENV{LD_LIBRARY_PATH}")
+        endif()
+
+        # Fetch and populate ACL
         if(DEFINED ENV{ACL_ROOT_DIR} AND IS_DIRECTORY "$ENV{ACL_ROOT_DIR}")
             message(STATUS "Using ACL from specified source directory: $ENV{ACL_ROOT_DIR}")
         else()
@@ -224,38 +247,53 @@ if ((AVX512_FOUND AND NOT AVX512_DISABLED) OR (ASIMD_FOUND AND NOT APPLE_SILICON
                 GIT_PROGRESS   TRUE
             )
             set(ENV{ACL_ROOT_DIR} "${arm_compute_SOURCE_DIR}")
+            set(ACL_LIB_DIR "$ENV{ACL_ROOT_DIR}/build")
         endif()
 
-        # Build ACL with scons
-        include(ProcessorCount)
-        ProcessorCount(_NPROC)
-        set(_scons_cmd
-        scons -j${_NPROC}
-            Werror=0 debug=0 neon=1 examples=0 embed_kernels=0 os=linux
-            arch=armv8.2-a build=native benchmark_examples=0 fixed_format_kernels=1
-            multi_isa=1 openmp=1 cppthreads=0
+        # Build ACL with CMake
+        set(ARM_COMPUTE_BUILD_SHARED_LIB "OFF")
+        set(CMAKE_BUILD_TYPE "Release")
+        set(ARM_COMPUTE_ARCH "armv8.2-a")
+        set(ARM_COMPUTE_ENABLE_ASSERTS "OFF")
+        set(ARM_COMPUTE_ENABLE_CPPTHREADS "OFF")
+        set(ONEDNN_ENABLE_PRIMITIVE "MATMUL;REORDER")
+        set(ARM_COMPUTE_ENABLE_OPENMP "ON")
+        set(ARM_COMPUTE_ENABLE_WERROR "OFF")
+        set(ARM_COMPUTE_BUILD_EXAMPLES "OFF")
+        set(ARM_COMPUTE_BUILD_TESTING "OFF")
+
+        set(_cmake_config_cmd
+             ${CMAKE_COMMAND} -G Ninja -B build 
+            -DARM_COMPUTE_BUILD_SHARED_LIB=OFF 
+            -DCMAKE_BUILD_TYPE=Release 
+            -DARM_COMPUTE_ARCH=armv8.2-a 
+            -DARM_COMPUTE_ENABLE_ASSERTS=OFF 
+            -DARM_COMPUTE_ENABLE_CPPTHREADS=OFF 
+            -DARM_COMPUTE_ENABLE_OPENMP=ON 
+            -DARM_COMPUTE_ENABLE_WERROR=OFF 
+            -DARM_COMPUTE_BUILD_EXAMPLES=OFF 
+            -DARM_COMPUTE_BUILD_TESTING=OFF)
+        set(_cmake_build_cmd
+            ${CMAKE_COMMAND} --build build -- -j${NPROC}
         )
 
-        # locate PyTorch's libgomp (e.g. site-packages/torch.libs/libgomp-947d5fa1.so.1.0.0)
-        # and create a local shim dir with it
-        include("${CMAKE_CURRENT_LIST_DIR}/utils.cmake")
-        vllm_prepare_torch_gomp_shim(VLLM_TORCH_GOMP_SHIM_DIR)
-
-        if(NOT VLLM_TORCH_GOMP_SHIM_DIR STREQUAL "")
-            list(APPEND _scons_cmd extra_link_flags=-L${VLLM_TORCH_GOMP_SHIM_DIR})
-        endif()
-
         execute_process(
-            COMMAND ${_scons_cmd}
+            COMMAND ${_cmake_config_cmd}
+            WORKING_DIRECTORY "$ENV{ACL_ROOT_DIR}"
+        )
+        execute_process(
+            COMMAND ${_cmake_build_cmd}
             WORKING_DIRECTORY "$ENV{ACL_ROOT_DIR}"
             RESULT_VARIABLE _acl_rc
         )
+
         if(NOT _acl_rc EQUAL 0)
             message(FATAL_ERROR "ACL SCons build failed (exit ${_acl_rc}).")
         endif()
+        message(STATUS "Arm Compute Library (ACL) built successfully.")
 
-        set(ONEDNN_AARCH64_USE_ACL "ON")
-        set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wl,-rpath,$ENV{ACL_ROOT_DIR}/build/")
+        # VLLM/oneDNN settings for ACL
+        set(ONEDNN_AARCH64_USE_ACL ON CACHE BOOL "" FORCE)
         add_compile_definitions(VLLM_USE_ACL)
     endif()
 

From ca00b1bfc69e71d860485340f0a197bf584ec004 Mon Sep 17 00:00:00 2001
From: Pleaplusone <ygan@amd.com>
Date: Thu, 13 Nov 2025 13:43:42 +0800
Subject: [PATCH 139/183] [ROCm][BugFix] Remove the usage of `device_info` from
 aiter (#28383)

Signed-off-by: ganyi <ygan@amd.com>
---
 vllm/v1/attention/backends/rocm_aiter_fa.py | 11 +++++------
 1 file changed, 5 insertions(+), 6 deletions(-)

diff --git a/vllm/v1/attention/backends/rocm_aiter_fa.py b/vllm/v1/attention/backends/rocm_aiter_fa.py
index 4888ae51d1d3..c7f925817a6a 100644
--- a/vllm/v1/attention/backends/rocm_aiter_fa.py
+++ b/vllm/v1/attention/backends/rocm_aiter_fa.py
@@ -31,15 +31,14 @@
 
 if current_platform.is_rocm():
     import aiter
-    from aiter.ops.triton.utils.device_info import get_num_sms
 
     from vllm.triton_utils import tl, triton
 
     def block_size(x, head_dim):
         return min(65536 // x.element_size(), triton.next_power_of_2(head_dim))
 
-    def num_programs(head_dim):
-        return min(head_dim, get_num_sms())
+    def num_programs(total_tokens):
+        return min(total_tokens, current_platform.get_cu_count())
 
     @triton.jit
     def cp_mha_gather_cache_kernel(
@@ -58,11 +57,11 @@ def cp_mha_gather_cache_kernel(
         x,
         max_block_num,
         num_tokens,
+        num_programs,
         DEQUANT: tl.constexpr,
         PAGE_SIZE: tl.constexpr,
         CACHE_FORMAT: tl.constexpr,
         BLOCK_SIZE: tl.constexpr,
-        NUM_PRGMS: tl.constexpr,
     ):
         bid = tl.program_id(0)
         col_offsets = tl.arange(0, BLOCK_SIZE)
@@ -70,7 +69,7 @@ def cp_mha_gather_cache_kernel(
             k_scale = tl.load(k_scale_ptr)
             v_scale = tl.load(v_scale_ptr)
 
-        for token_id in tl.range(bid, num_tokens, NUM_PRGMS):
+        for token_id in tl.range(bid, num_tokens, num_programs):
             key_ptr_offset = key_ptr + token_id * head_size * num_heads
             value_ptr_offset = value_ptr + token_id * head_size * num_heads
             batch_idx = tl.load(token_to_batch_ptr + token_id)
@@ -162,11 +161,11 @@ def cp_mha_gather_cache(
             x,
             block_tables.size(1),
             total_tokens,
+            NUM_PRGMS,
             DEQUANT=dequant,
             PAGE_SIZE=page_size,
             CACHE_FORMAT=kv_cache_layout,
             BLOCK_SIZE=BLOCK_SIZE,
-            NUM_PRGMS=NUM_PRGMS,
         )
 
 

From 4504e8029bd15c60e164661a4283358381616846 Mon Sep 17 00:00:00 2001
From: tjandy98 <3953059+tjandy98@users.noreply.github.com>
Date: Thu, 13 Nov 2025 14:42:29 +0800
Subject: [PATCH 140/183] [Bugfix] Prevent crash on empty grammar string
 (#28210)

Signed-off-by: tjandy98 <3953059+tjandy98@users.noreply.github.com>
---
 .../openai/test_chat_completion.py            | 20 +++++++++++++++++++
 vllm/v1/engine/processor.py                   |  6 ++++++
 2 files changed, 26 insertions(+)

diff --git a/tests/v1/entrypoints/openai/test_chat_completion.py b/tests/v1/entrypoints/openai/test_chat_completion.py
index 522c72b55955..b5aa20448dfc 100644
--- a/tests/v1/entrypoints/openai/test_chat_completion.py
+++ b/tests/v1/entrypoints/openai/test_chat_completion.py
@@ -138,3 +138,23 @@ async def test_invalid_grammar(client: openai.AsyncOpenAI, model_name: str):
                 "structured_outputs": {"grammar": invalid_simplified_sql_grammar}
             },
         )
+
+
+@pytest.mark.asyncio
+@pytest.mark.parametrize(
+    "model_name",
+    [MODEL_NAME],
+)
+async def test_empty_grammar(client: openai.AsyncOpenAI, model_name: str) -> None:
+    prompt = "Say hello"
+    with pytest.raises((openai.BadRequestError, openai.APIError)):
+        await client.chat.completions.create(
+            model=model_name,
+            messages=[
+                {
+                    "role": "user",
+                    "content": prompt,
+                }
+            ],
+            extra_body={"structured_outputs": {"grammar": ""}},
+        )
diff --git a/vllm/v1/engine/processor.py b/vllm/v1/engine/processor.py
index c49fd1bde8b9..f2d992403e1a 100644
--- a/vllm/v1/engine/processor.py
+++ b/vllm/v1/engine/processor.py
@@ -270,6 +270,12 @@ def _validate_structured_output(self, params: SamplingParams) -> None:
             raise ValueError(
                 f"Choice '{params.structured_outputs.choice}' cannot be an empty list"  # noqa: E501
             )
+        # Reject empty string grammar early to avoid engine-side crashes
+        if (
+            isinstance(params.structured_outputs.grammar, str)
+            and params.structured_outputs.grammar.strip() == ""
+        ):
+            raise ValueError("structured_outputs.grammar cannot be an empty string")
 
         if backend.startswith("xgrammar"):
             # xgrammar with no fallback

From c33b87e7778d2a6900e73969c38785e0254f880b Mon Sep 17 00:00:00 2001
From: Huy Do <huydhn@gmail.com>
Date: Wed, 12 Nov 2025 22:48:53 -0800
Subject: [PATCH 141/183] Use official xformers-0.0.33 built for PT 2.9
 (#28600)

Signed-off-by: Huy Do <huydhn@gmail.com>
Co-authored-by: Roger Wang <hey@rogerw.io>
---
 requirements/cuda.txt | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/requirements/cuda.txt b/requirements/cuda.txt
index 4e393d6b6615..76874cbd2f48 100644
--- a/requirements/cuda.txt
+++ b/requirements/cuda.txt
@@ -9,7 +9,6 @@ torch==2.9.0
 torchaudio==2.9.0
 # These must be updated alongside torch
 torchvision==0.24.0 # Required for phi3v processor. See https://github.com/pytorch/vision?tab=readme-ov-file#installation for corresponding version
-# Build from https://github.com/facebookresearch/xformers/releases/tag/v0.0.32.post1
-xformers==0.0.33+5d4b92a5.d20251029; platform_system == 'Linux' and platform_machine == 'x86_64'  # Requires PyTorch >= 2.9
+xformers==0.0.33; platform_system == 'Linux' and platform_machine == 'x86_64'  # Requires PyTorch >= 2.9
 # FlashInfer should be updated together with the Dockerfile
 flashinfer-python==0.5.2

From 4ab34f6ef1bbd4720a915fe2613ecb9da3090913 Mon Sep 17 00:00:00 2001
From: usberkeley <150880684+usberkeley@users.noreply.github.com>
Date: Thu, 13 Nov 2025 15:03:52 +0800
Subject: [PATCH 142/183] Add NUMA node validation for CPU thread binding
 (#28555)

Signed-off-by: Bradley <bradley.b.pitt@gmail.com>
---
 csrc/cpu/utils.cpp | 10 ++++++++++
 1 file changed, 10 insertions(+)

diff --git a/csrc/cpu/utils.cpp b/csrc/cpu/utils.cpp
index 02514edce807..c5a48352e308 100644
--- a/csrc/cpu/utils.cpp
+++ b/csrc/cpu/utils.cpp
@@ -45,6 +45,16 @@ std::string init_cpu_threads_env(const std::string& cpu_ids) {
   // Memory node binding
   if (numa_available() != -1) {
     int mem_node_id = numa_node_of_cpu(omp_cpu_ids.front());
+    // Verify all CPUs are on the same NUMA node
+    for (size_t i = 1; i < omp_cpu_ids.size(); ++i) {
+      int node_id = numa_node_of_cpu(omp_cpu_ids[i]);
+      TORCH_CHECK(node_id == mem_node_id, "CPU ", omp_cpu_ids[i],
+                  " is on NUMA node ", node_id, ", but CPU ",
+                  omp_cpu_ids.front(), " is on NUMA node ", mem_node_id,
+                  ". All CPUs should be on the same NUMA node for optimal "
+                  "performance. Memory will be bound to NUMA node ",
+                  mem_node_id, ".");
+    }
     bitmask* mask = numa_parse_nodestring(std::to_string(mem_node_id).c_str());
     bitmask* src_mask = numa_get_membind();
 

From fa183e92713456dec682088a362dd9908100cc03 Mon Sep 17 00:00:00 2001
From: Jiangyun Zhu <riverclouds.zhu@qq.com>
Date: Thu, 13 Nov 2025 15:59:58 +0800
Subject: [PATCH 143/183] [Bugfix] fix kimi-linear crash (#28445)

Signed-off-by: zjy0516 <riverclouds.zhu@qq.com>
---
 vllm/model_executor/layers/kda.py | 21 ++++++++++++---------
 1 file changed, 12 insertions(+), 9 deletions(-)

diff --git a/vllm/model_executor/layers/kda.py b/vllm/model_executor/layers/kda.py
index 26458f2e3c4d..2e7500bac718 100644
--- a/vllm/model_executor/layers/kda.py
+++ b/vllm/model_executor/layers/kda.py
@@ -44,7 +44,6 @@ def kda_attention(
     k_proj_states: torch.Tensor,
     v_proj_states: torch.Tensor,
     g1: torch.Tensor,
-    g2: torch.Tensor,
     beta: torch.Tensor,
     core_attn_out: torch.Tensor,
     layer_name: str,
@@ -56,7 +55,6 @@ def kda_attention(
         k_proj_states=k_proj_states,
         v_proj_states=v_proj_states,
         g1=g1,
-        g2=g2,
         beta=beta,
         core_attn_out=core_attn_out,
     )
@@ -67,7 +65,6 @@ def kda_attention_fake(
     k_proj_states: torch.Tensor,
     v_proj_states: torch.Tensor,
     g1: torch.Tensor,
-    g2: torch.Tensor,
     beta: torch.Tensor,
     core_attn_out: torch.Tensor,
     layer_name: str,
@@ -284,7 +281,6 @@ def forward(
             k,
             v,
             g1,
-            g2,
             beta,
             core_attn_out,
             self.prefix,
@@ -299,7 +295,6 @@ def _forward(
         k_proj_states: torch.Tensor,
         v_proj_states: torch.Tensor,
         g1: torch.Tensor,
-        g2: torch.Tensor,
         beta: torch.Tensor,
         core_attn_out: torch.Tensor,
     ) -> None:
@@ -316,8 +311,15 @@ def _forward(
         has_initial_state = attn_metadata.has_initial_state
         non_spec_query_start_loc = attn_metadata.non_spec_query_start_loc
         non_spec_state_indices_tensor = attn_metadata.non_spec_state_indices_tensor  # noqa: E501
+        num_actual_tokens = attn_metadata.num_actual_tokens
         constant_caches = self.kv_cache[forward_context.virtual_engine]
 
+        q_proj_states = q_proj_states[:num_actual_tokens]
+        k_proj_states = k_proj_states[:num_actual_tokens]
+        v_proj_states = v_proj_states[:num_actual_tokens]
+        g1 = g1[:num_actual_tokens]
+        beta = beta[:num_actual_tokens]
+
         (conv_state_q, conv_state_k, conv_state_v, recurrent_state) = constant_caches
         # deal with strides
         conv_state_q = conv_state_q.transpose(-1, -2)
@@ -372,7 +374,7 @@ def _forward(
             ).transpose(0, 1)
         else:
             decode_conv_indices = non_spec_state_indices_tensor[
-                : attn_metadata.num_decodes
+                : attn_metadata.num_actual_tokens
             ]
             q = causal_conv1d_update(
                 q_proj_states,
@@ -438,8 +440,9 @@ def _forward(
                 beta=beta,
                 initial_state=recurrent_state,
                 use_qk_l2norm_in_kernel=True,
-                cu_seqlens=non_spec_query_start_loc,
+                cu_seqlens=non_spec_query_start_loc[: attn_metadata.num_decodes + 1],
                 ssm_state_indices=non_spec_state_indices_tensor,
             )
-        assert core_attn_out_non_spec.shape == core_attn_out.shape
-        core_attn_out[:] = core_attn_out_non_spec
+        core_attn_out[0, :num_actual_tokens] = core_attn_out_non_spec[
+            0, :num_actual_tokens
+        ]

From 5c9ad138d507320f6432cfc3d727980853fd5e91 Mon Sep 17 00:00:00 2001
From: Chauncey <chaunceyjiang@gmail.com>
Date: Thu, 13 Nov 2025 16:14:13 +0800
Subject: [PATCH 144/183] [Frontend] supports interleaved thinking (#28531)

Signed-off-by: chaunceyjiang <chaunceyjiang@gmail.com>
---
 docs/features/interleaved_thinking.md         | 118 ++++++++++++++++++
 ...penai_chat_completion_client_with_tools.py |   1 +
 vllm/entrypoints/chat_utils.py                |  17 ++-
 3 files changed, 135 insertions(+), 1 deletion(-)
 create mode 100644 docs/features/interleaved_thinking.md

diff --git a/docs/features/interleaved_thinking.md b/docs/features/interleaved_thinking.md
new file mode 100644
index 000000000000..7343324b4849
--- /dev/null
+++ b/docs/features/interleaved_thinking.md
@@ -0,0 +1,118 @@
+# Interleaved Thinking
+
+## Introduction
+
+Interleaved thinking allows models to reason between tool calls, enabling more sophisticated decision-making after receiving tool results. This feature helps models chain multiple tool calls with reasoning steps in between and make nuanced decisions based on intermediate results.
+
+Important: Interleaved thinking increases token usage and response latency. Consider your budget and performance requirements when enabling this feature.
+
+## How Interleaved Thinking Works
+
+With interleaved thinking, the model can:
+
+- Reason about the results of a tool call before deciding what to do next
+- Chain multiple tool calls with reasoning steps in between
+- Make more nuanced decisions based on intermediate results
+- Provide transparent reasoning for its tool selection process
+
+## Supported Models
+
+vLLM currently supports the following interleaved thinking models:
+
+| Model Series | Reasoning Parser Name |
+|--------------|-----------------------|
+| moonshotai/Kimi-K2-Thinking    |  kimi_k2  |
+| MiniMaxAI/MiniMax-M2           |  minimax_m2  |
+
+## Example Usage
+
+To use interleaved thinking with tool calls, specify a model that supports this feature and enable tool calls in your chat completion request. Here's an example:
+
+??? code
+
+    ```python
+    """
+    vllm serve MiniMaxAI/MiniMax-M2 \
+      --tensor-parallel-size 4 \
+      --tool-call-parser minimax_m2 \
+      --reasoning-parser minimax_m2 \
+      --enable-auto-tool-choice
+    """
+    import json
+    
+    from openai import OpenAI
+    
+    client = OpenAI(base_url="http://localhost:8000/v1",     api_key="dummy")
+    
+    
+    def get_current_weather(location: str, unit: "str"):
+        """Get the current weather in a given location"""
+        if unit == "celsius":
+            return f"The current temperature in {location} is 22°C."
+        else:
+            return f"The current temperature in {location} is 72°F."
+    
+    
+    tools = [
+        {
+            "type": "function",
+            "function": {
+                "name": "get_weather",
+                "description": "Get the current weather in a given     location",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "location": {
+                            "type": "string",
+                            "description": "City and state, e.g.,     'San Francisco, CA'",
+                        },
+                        "unit": {"type": "string", "enum":     ["celsius", "fahrenheit"]},
+                    },
+                    "required": ["location", "unit"],
+                },
+            },
+        }
+    ]
+    messages = [{"role": "user", "content": "What's the weather in Fahrenheit like in San Francisco?"}]
+    response = client.chat.completions.create(
+        model=client.models.list().data[0].id,
+        messages=messages,
+        tools=tools,
+        tool_choice="auto",
+    )
+    
+    tool_call = response.choices[0].message.tool_calls[0].function
+    
+    messages.append(
+        {
+            "role": "assistant",
+            "tool_calls": response.choices[0].message.tool_calls,
+            "reasoning": response.choices[0].message.reasoning, # append reasoning
+        }
+    )
+    
+    # Simulate tool execution
+    available_tools = {"get_weather": get_current_weather}
+    
+    completion_tool_calls = response.choices[0].message.tool_calls
+    for call in completion_tool_calls:
+        tool_to_call = available_tools[call.function.name]
+        args = json.loads(call.function.arguments)
+        result = tool_to_call(**args)
+        messages.append(
+            {
+                "role": "tool",
+                "content": result,
+                "tool_call_id": call.id,
+                "name": call.function.name,
+            }
+        )
+    response_2 = client.chat.completions.create(
+        model=client.models.list().data[0].id,
+        messages=messages,
+        tools=tools,
+        tool_choice="auto",
+    )
+    print(response_2.choices[0].message.content)
+    ```
+This example demonstrates how to set up interleaved thinking with tool calls using a weather retrieval function. The model reasons about the tool results before generating the final response.
diff --git a/examples/online_serving/openai_chat_completion_client_with_tools.py b/examples/online_serving/openai_chat_completion_client_with_tools.py
index 41dbb3236297..0bd1d05322f8 100644
--- a/examples/online_serving/openai_chat_completion_client_with_tools.py
+++ b/examples/online_serving/openai_chat_completion_client_with_tools.py
@@ -161,6 +161,7 @@ def main():
         {
             "role": "assistant",
             "tool_calls": chat_completion.choices[0].message.tool_calls,
+            "reasoning": chat_completion.choices[0].message.reasoning,
         }
     )
 
diff --git a/vllm/entrypoints/chat_utils.py b/vllm/entrypoints/chat_utils.py
index d7d6419d643b..3b722c2d9277 100644
--- a/vllm/entrypoints/chat_utils.py
+++ b/vllm/entrypoints/chat_utils.py
@@ -240,6 +240,9 @@ class CustomChatCompletionMessageParam(TypedDict, total=False):
     tool_calls: Iterable[ChatCompletionMessageToolCallParam] | None
     """The tool calls generated by the model, such as function calls."""
 
+    reasoning: str | None
+    """The reasoning content for interleaved thinking."""
+
 
 ChatCompletionMessageParam: TypeAlias = (
     OpenAIChatCompletionMessageParam
@@ -265,6 +268,12 @@ class ConversationMessage(TypedDict, total=False):
     tool_calls: Iterable[ChatCompletionMessageToolCallParam] | None
     """The tool calls generated by the model, such as function calls."""
 
+    reasoning: str | None
+    """The reasoning content for interleaved thinking."""
+
+    reasoning_content: str | None
+    """Deprecated: The reasoning content for interleaved thinking."""
+
 
 # Passed in by user
 ChatTemplateContentFormatOption = Literal["auto", "string", "openai"]
@@ -1374,7 +1383,7 @@ def _parse_chat_message_content(
 ) -> list[ConversationMessage]:
     role = message["role"]
     content = message.get("content")
-
+    reasoning = message.get("reasoning") or message.get("reasoning_content")
     if content is None:
         content = []
     elif isinstance(content, str):
@@ -1396,6 +1405,12 @@ def _parse_chat_message_content(
             # follow the OpenAI spec.
             if "tool_calls" in parsed_msg and parsed_msg["tool_calls"] is not None:
                 result_msg["tool_calls"] = list(parsed_msg["tool_calls"])
+            # Include reasoning if present for interleaved thinking.
+            if reasoning is not None:
+                result_msg["reasoning"] = cast(str, reasoning)
+                result_msg["reasoning_content"] = cast(
+                    str, reasoning
+                )  # keep compatibility
         elif role == "tool":
             parsed_msg = _ToolParser(message)
             if "tool_call_id" in parsed_msg:

From 11ac9ddd037c63a8c9404cd1f62f9f81a5f38652 Mon Sep 17 00:00:00 2001
From: Yong Hoon Shin <48474650+sarckk@users.noreply.github.com>
Date: Wed, 12 Nov 2025 22:57:20 -1000
Subject: [PATCH 145/183] Support all interleaved layer types (#28485)

Signed-off-by: Yong Hoon Shin <yhshin@meta.com>
---
 vllm/transformers_utils/config.py | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/vllm/transformers_utils/config.py b/vllm/transformers_utils/config.py
index 14cae2b168e1..b7418cfb7cc7 100644
--- a/vllm/transformers_utils/config.py
+++ b/vllm/transformers_utils/config.py
@@ -472,8 +472,7 @@ def is_interleaved(config: PretrainedConfig) -> bool:
     """
     text_config = config.get_text_config()
     if layer_types := getattr(text_config, "layer_types", None):
-        interleaved_types = {"full_attention", "sliding_attention"}
-        return interleaved_types.issubset(layer_types)
+        return len(set(layer_types)) > 1
     return False
 
 

From d168de0c16e3ce0894c4ea11c54abe729b4bd6e7 Mon Sep 17 00:00:00 2001
From: ilmarkov <markovilya197@gmail.com>
Date: Thu, 13 Nov 2025 10:02:55 +0000
Subject: [PATCH 146/183] Make ranges inclusive-inclusive

Signed-off-by: ilmarkov <markovilya197@gmail.com>
---
 tests/compile/test_compile_ranges.py  | 12 ++++++------
 vllm/compilation/collective_fusion.py |  2 +-
 vllm/compilation/piecewise_backend.py |  9 +++++----
 vllm/config/compilation.py            | 15 ++++++++++-----
 vllm/config/utils.py                  | 12 ++++--------
 vllm/config/vllm.py                   | 13 +++----------
 vllm/v1/worker/gpu_worker.py          |  4 ++--
 7 files changed, 31 insertions(+), 36 deletions(-)

diff --git a/tests/compile/test_compile_ranges.py b/tests/compile/test_compile_ranges.py
index b15f90395c6a..1467d6d5b1ba 100644
--- a/tests/compile/test_compile_ranges.py
+++ b/tests/compile/test_compile_ranges.py
@@ -70,11 +70,11 @@ def uuid(self) -> str:
 def test_compile_ranges():
     post_grad_pass_manager = PostGradPassManagerCheckRanges(
         [
-            Range(start=1, end=9),
+            Range(start=1, end=8),
             Range(start=16, end=16),
-            Range(start=9, end=33),
+            Range(start=9, end=32),
             Range(start=64, end=64),
-            Range(start=33, end=8193),
+            Range(start=33, end=8192),
         ]
     )
     torch.set_default_device("cuda")
@@ -119,7 +119,7 @@ def test_compile_config_get_compile_ranges():
         compilation_config=compilation_config,
     )
     assert compilation_config.get_compile_ranges() == [
-        Range(start=1, end=9),
-        Range(start=9, end=33),
-        Range(start=33, end=8193),
+        Range(start=1, end=8),
+        Range(start=9, end=32),
+        Range(start=33, end=8192),
     ]
diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index bef8925661cd..2717738dd7c2 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -1188,7 +1188,7 @@ def register_patterns(self):
         self.disabled = False
 
     def is_applicable_for_range(self, compile_range: Range) -> bool:
-        return compile_range.end - 1 <= self.max_token_num
+        return compile_range.end <= self.max_token_num
 
     @VllmInductorPass.time_and_log
     def __call__(self, graph: fx.Graph):
diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index b59cc50f70bc..d53fa62bdc11 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -79,10 +79,11 @@ def __init__(
         # We only keep compilation management inside this class directly.
         for size in self.compile_sizes:
             range = Range(start=size, end=size)
-            self.range_entries[range] = RangeEntry(
-                compile_range=range,
-            )
-            self.to_be_compiled_ranges.add(range)
+            if range not in self.compile_ranges:
+                self.range_entries[range] = RangeEntry(
+                    compile_range=range,
+                )
+                self.to_be_compiled_ranges.add(range)
 
         for range in self.compile_ranges:
             self.range_entries[range] = RangeEntry(
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 85118544117d..42b459b6626a 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -349,11 +349,16 @@ class CompilationConfig:
     compile_ranges_split_points: list[int] | None = None
     """Split points that represent compile ranges for inductor.
     The compile ranges are 
-    [1, split_points[0] + 1), 
-    [split_points[0] + 1, split_points[1] + 1), ..., 
-    [split_points[-1] + 1, max_num_batched_tokens + 1).
+    [1, split_points[0]], 
+    [split_points[0] + 1, split_points[1]], ..., 
+    [split_points[-1] + 1, max_num_batched_tokens].
     Compile sizes are also used single element ranges,
-    the range is represented as [compile_sizes[i], compile_sizes[i] + 1).
+    the range is represented as [compile_sizes[i], compile_sizes[i]].
+    
+    If a range overlaps with the compile size, graph for compile size 
+    will be prioritized, i.e. if we have a range [1, 8] and a compile size 4,
+    graph for compile size 4 will be compiled and used instead of the graph
+    for range [1, 8].
     """
 
     inductor_compile_config: dict = field(default_factory=dict)
@@ -964,5 +969,5 @@ def get_compile_ranges(self) -> list[Range]:
             if i == 0:
                 compile_ranges.append(Range(start=1, end=s))
             else:
-                compile_ranges.append(Range(start=split_points[i - 1], end=s))
+                compile_ranges.append(Range(start=split_points[i - 1] + 1, end=s))
         return compile_ranges
diff --git a/vllm/config/utils.py b/vllm/config/utils.py
index 20304696ffcc..c4e9a5ef6ff5 100644
--- a/vllm/config/utils.py
+++ b/vllm/config/utils.py
@@ -182,7 +182,7 @@ def update_config(config: ConfigT, overrides: dict[str, Any]) -> ConfigT:
 class Range:
     """
     A range of numbers.
-    Inclusive of start, exclusive of end.
+    Inclusive of start, inclusive of end.
     """
 
     start: int
@@ -192,10 +192,10 @@ def is_single_size(self) -> bool:
         return self.start == self.end
 
     def __contains__(self, size: int) -> bool:
-        # Inclusive of start, exclusive of end
+        # Inclusive of start, inclusive of end
         if self.is_single_size():
             return size == self.start
-        return self.start <= size < self.end
+        return self.start <= size <= self.end
 
     def __eq__(self, other: object) -> bool:
         if not isinstance(other, Range):
@@ -206,11 +206,7 @@ def __hash__(self) -> int:
         return hash((self.start, self.end))
 
     def __str__(self) -> str:
-        return (
-            f"[{self.start}, {self.end + 1})"
-            if self.is_single_size()
-            else f"[{self.start}, {self.end})"
-        )
+        return f"[{self.start}, {self.end}]"
 
     def __repr__(self) -> str:
         return self.__str__()
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 2d71bec7c517..6a88f96b1eea 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -938,10 +938,7 @@ def _set_compile_ranges(self):
         # The upper bound of the compile ranges is the max_num_batched_tokens
         max_num_batched_tokens = self.scheduler_config.max_num_batched_tokens
         if max_num_batched_tokens is not None:
-            # We add 1 because the bounds checks in the compiler are exclusive
-            # and we want to include the max_num_batched_tokens
-            # in the compile range
-            computed_compile_ranges_split_points.append(max_num_batched_tokens + 1)
+            computed_compile_ranges_split_points.append(max_num_batched_tokens)
 
         # Add the compile ranges for flashinfer
         if compilation_config.pass_config.enable_fi_allreduce_fusion:
@@ -952,26 +949,22 @@ def _set_compile_ranges(self):
                     self.model_config.get_hidden_size()
                     * self.model_config.dtype.itemsize
                 )
-                # We add 1 because the bounds checks in the compiler are
-                # exclusive and we want to include the max_token_num in the
-                # compile range
                 if (
                     max_num_batched_tokens is not None
                     and max_token_num < max_num_batched_tokens
                 ):
-                    computed_compile_ranges_split_points.append(max_token_num + 1)
+                    computed_compile_ranges_split_points.append(max_token_num)
 
         if compilation_config.compile_ranges_split_points is not None:
             for x in compilation_config.compile_ranges_split_points:
                 assert isinstance(x, int)
                 assert x > 0, f"Invalid compile range split point: {x}"
-                # Split points need to be inclusive of the end so we add 1.
                 if (
                     max_num_batched_tokens is not None
                     and x < max_num_batched_tokens
                     and x > 1
                 ):
-                    computed_compile_ranges_split_points.append(x + 1)
+                    computed_compile_ranges_split_points.append(x)
         compilation_config.compile_ranges_split_points = sorted(
             computed_compile_ranges_split_points
         )  # type: ignore
diff --git a/vllm/v1/worker/gpu_worker.py b/vllm/v1/worker/gpu_worker.py
index 0bc9aa5ee863..04d8656e03b3 100644
--- a/vllm/v1/worker/gpu_worker.py
+++ b/vllm/v1/worker/gpu_worker.py
@@ -415,12 +415,12 @@ def compile_or_warm_up_model(self) -> None:
 
         # For each compile_range, if none of the batch sizes
         # in warmup_sizes or cudagraph_capture_sizes are in the range,
-        # add the start of the range to ensure compilation/warmup.
+        # add the end of the range to ensure compilation/warmup.
         all_sizes = set(self.vllm_config.compilation_config.cudagraph_capture_sizes)
         all_sizes.update(warmup_sizes)
         for compile_range in compile_ranges:
             if not any(x in compile_range for x in all_sizes):
-                warmup_sizes.append(compile_range.end - 1)
+                warmup_sizes.append(compile_range.end)
 
         # We skip EPLB here since we don't want to record dummy metrics
         for size in sorted(warmup_sizes, reverse=True):

From e63fd445605b442a81a4eb2f402206cc337ab8dd Mon Sep 17 00:00:00 2001
From: Di Wu <95495325+dw2761@users.noreply.github.com>
Date: Thu, 13 Nov 2025 18:57:44 +0800
Subject: [PATCH 147/183] Fix: Correctly filter special tokens in
 benchmark_prefix_caching (#28615)

Signed-off-by: Di Wu <dw2761@nyu.edu>
---
 benchmarks/benchmark_prefix_caching.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/benchmarks/benchmark_prefix_caching.py b/benchmarks/benchmark_prefix_caching.py
index 146c268a6b7f..28fc383a318d 100644
--- a/benchmarks/benchmark_prefix_caching.py
+++ b/benchmarks/benchmark_prefix_caching.py
@@ -69,7 +69,7 @@ def sample_tokens(tokenizer: PreTrainedTokenizerBase, length: int) -> list[int]:
 
     # Remove the special tokens.
     return random.choices(
-        [v for k, v in vocab.items() if k not in all_special_ids],
+        [v for v in vocab.values() if v not in all_special_ids],
         k=length,
     )
 

From 5e973209aaf5fa15459555eaa42bcd20ea63aa0d Mon Sep 17 00:00:00 2001
From: Zijing Liu <liuzijing2014@users.noreply.github.com>
Date: Thu, 13 Nov 2025 03:30:04 -0800
Subject: [PATCH 148/183] [BugFix] Fix type error when assign a trition kernel
 tensor to a torch.nn.Parameter (#28603)

Signed-off-by: Zijing Liu <liuzijing2014@gmail.com>
---
 vllm/model_executor/layers/quantization/mxfp4.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/mxfp4.py b/vllm/model_executor/layers/quantization/mxfp4.py
index 0f69a18a1f3f..5552c1ae5edf 100644
--- a/vllm/model_executor/layers/quantization/mxfp4.py
+++ b/vllm/model_executor/layers/quantization/mxfp4.py
@@ -755,8 +755,8 @@ def _interleave_mxfp4_cutlass_sm90(w):
 
             self.w13_weight = w13_weight
             self.w2_weight = w2_weight
-            layer.w13_weight = w13_weight
-            layer.w2_weight = w2_weight
+            layer.w13_weight = Parameter(w13_weight.data, requires_grad=False)
+            layer.w2_weight = Parameter(w2_weight.data, requires_grad=False)
         else:
             raise ValueError(f"Unsupported backend: {self.mxfp4_backend}")
 

From c428e8d80b2bc17b0a306d1e80c8e4567b9dd9f4 Mon Sep 17 00:00:00 2001
From: baonudesifeizhai <85092850+baonudesifeizhai@users.noreply.github.com>
Date: Thu, 13 Nov 2025 06:34:14 -0500
Subject: [PATCH 149/183] Fix io processor pooling  #28273 (#28484)

Signed-off-by: baonudesifeizhai <baonudesifeizhai@gmail.com>
---
 vllm/entrypoints/openai/serving_pooling.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/vllm/entrypoints/openai/serving_pooling.py b/vllm/entrypoints/openai/serving_pooling.py
index 0eade272111f..ee4c5c8bacaa 100644
--- a/vllm/entrypoints/openai/serving_pooling.py
+++ b/vllm/entrypoints/openai/serving_pooling.py
@@ -4,7 +4,7 @@
 import asyncio
 import json
 import time
-from collections.abc import AsyncGenerator
+from collections.abc import AsyncGenerator, Sequence
 from typing import Final, cast
 
 import jinja2
@@ -122,6 +122,10 @@ async def create_pooling(
                 engine_prompts = await self.io_processor.pre_process_async(
                     prompt=validated_prompt, request_id=request_id
                 )
+                if not isinstance(engine_prompts, Sequence) or isinstance(
+                    engine_prompts, (str, bytes, bytearray)
+                ):
+                    engine_prompts = [engine_prompts]
 
             elif isinstance(request, PoolingChatRequest):
                 error_check_ret = self._validate_chat_template(

From c47b6c85ac25ecb0a26dfff76c70a0b1a9a4a6bf Mon Sep 17 00:00:00 2001
From: zofia <110436990+zufangzhu@users.noreply.github.com>
Date: Thu, 13 Nov 2025 19:35:04 +0800
Subject: [PATCH 150/183] [XPU] add sym params to IPEXConfig (#28611)

Signed-off-by: Zhu, Zufang <zufang.zhu@intel.com>
---
 .../layers/quantization/ipex_quant.py         | 20 +++++++++++++++++--
 1 file changed, 18 insertions(+), 2 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/ipex_quant.py b/vllm/model_executor/layers/quantization/ipex_quant.py
index e0234191c62b..5ca9167faec8 100644
--- a/vllm/model_executor/layers/quantization/ipex_quant.py
+++ b/vllm/model_executor/layers/quantization/ipex_quant.py
@@ -52,6 +52,7 @@ def __init__(
         modules_to_not_convert: list[str] | None = None,
         desc_act: bool | None = None,
         lm_head_quantized: bool | None = None,
+        is_sym: bool | None = None,
     ) -> None:
         super().__init__()
         self.method = method
@@ -60,6 +61,7 @@ def __init__(
         self.modules_to_not_convert = modules_to_not_convert or []
         self.desc_act = desc_act
         self.lm_head_quantized = lm_head_quantized
+        self.is_sym = is_sym
         self.pack_factor = 32 // self.weight_bits
 
         if self.weight_bits not in [4]:
@@ -108,15 +110,25 @@ def from_config(cls, config: dict[str, Any]) -> "IPEXConfig":
             modules_to_not_convert = cls.get_from_keys_or(
                 config, ["modules_to_not_convert"], None
             )
+            is_sym = not cls.get_from_keys_or(config, ["zero_point"], default=False)
             return cls(
-                method, weight_bits, group_size, modules_to_not_convert, False, False
+                method,
+                weight_bits,
+                group_size,
+                modules_to_not_convert,
+                False,
+                False,
+                is_sym,
             )
         # otherwise for gptq
         weight_bits = cls.get_from_keys(config, ["bits"])
         group_size = cls.get_from_keys(config, ["group_size"])
         lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"], default=False)
         desc_act = cls.get_from_keys_or(config, ["desc_act"], default=False)
-        return cls(method, weight_bits, group_size, [], desc_act, lm_head_quantized)
+        is_sym = cls.get_from_keys_or(config, ["sym"], default=True)
+        return cls(
+            method, weight_bits, group_size, [], desc_act, lm_head_quantized, is_sym
+        )
 
     @classmethod
     def override_quantization_method(
@@ -180,6 +192,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # The float activation will be quantized (dynamic, per-token) to INT8.
         act_quant_mode = ipex.quantization.WoqActQuantMode.PER_BATCH_IC_BLOCK
 
+        assert isinstance(self.quant_config, IPEXConfig)
         qconfig = ipex.quantization.get_weight_only_quant_qconfig_mapping(
             weight_dtype=weight_dtype,
             lowp_mode=lowp_mode,
@@ -200,6 +213,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                 bias=bias,
                 group_size=self.quant_config.group_size,
                 quant_method=IPEXConfig.IPEX_QUANT_METHOD_MAP["gptq"],
+                weight_qscheme="sym" if self.quant_config.is_sym else "asym",
             )
         )
 
@@ -250,6 +264,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # The float activation will be quantized (dynamic, per-token) to INT8.
         act_quant_mode = ipex.quantization.WoqActQuantMode.PER_BATCH
 
+        assert isinstance(self.quant_config, IPEXConfig)
         qconfig = ipex.quantization.get_weight_only_quant_qconfig_mapping(
             weight_dtype=weight_dtype,
             lowp_mode=lowp_mode,
@@ -269,6 +284,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                 bias=bias,
                 group_size=self.quant_config.group_size,
                 quant_method=IPEXConfig.IPEX_QUANT_METHOD_MAP["awq"],  # type: ignore
+                weight_qscheme="sym" if self.quant_config.is_sym else "asym",
             )
         )
 

From c9fe6abe7c0b03d552420edd63c6c678ed683dea Mon Sep 17 00:00:00 2001
From: Fanli Lin <fanli.lin@intel.com>
Date: Thu, 13 Nov 2025 21:06:06 +0800
Subject: [PATCH 151/183] [Bugfix] Fix FPS value type for Qwen2.5-Omni video
 processing (#28630)

Signed-off-by: Lin, Fanli <fanli.lin@intel.com>
---
 examples/offline_inference/vision_language.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/examples/offline_inference/vision_language.py b/examples/offline_inference/vision_language.py
index 371cf6309a67..624de2a2debc 100644
--- a/examples/offline_inference/vision_language.py
+++ b/examples/offline_inference/vision_language.py
@@ -1536,7 +1536,7 @@ def run_qwen2_5_omni(questions: list[str], modality: str):
         mm_processor_kwargs={
             "min_pixels": 28 * 28,
             "max_pixels": 1280 * 28 * 28,
-            "fps": [1],
+            "fps": 1,
         },
         limit_mm_per_prompt={modality: 1},
     )

From 86d15bfd8d681a2ca2f3b2e550149a5ba3282ef1 Mon Sep 17 00:00:00 2001
From: Akash kaothalkar <61960177+Akashcodes732@users.noreply.github.com>
Date: Thu, 13 Nov 2025 19:02:21 +0530
Subject: [PATCH 152/183] [Hardware][PowerPC] Fix fp16 compilation error for
 Power in cpu attention backend and bump oneDNN version (#28535)

Signed-off-by: Akash Kaothalkar <akash.kaothalkar@ibm.com>
Co-authored-by: Akash Kaothalkar <akash.kaothalkar@ibm.com>
---
 cmake/cpu_extension.cmake  | 4 ++--
 csrc/cpu/cpu_attn_impl.hpp | 2 ++
 2 files changed, 4 insertions(+), 2 deletions(-)

diff --git a/cmake/cpu_extension.cmake b/cmake/cpu_extension.cmake
index bb0179c79c10..aa84125818d1 100644
--- a/cmake/cpu_extension.cmake
+++ b/cmake/cpu_extension.cmake
@@ -242,7 +242,7 @@ if ((AVX512_FOUND AND NOT AVX512_DISABLED) OR (ASIMD_FOUND AND NOT APPLE_SILICON
                 SUBBUILD_DIR "${FETCHCONTENT_BASE_DIR}/arm_compute-subbuild"
                 SOURCE_DIR   "${FETCHCONTENT_BASE_DIR}/arm_compute-src"
                 GIT_REPOSITORY https://github.com/ARM-software/ComputeLibrary.git
-                GIT_TAG        v52.2.0
+                GIT_TAG        v52.6.0
                 GIT_SHALLOW    TRUE
                 GIT_PROGRESS   TRUE
             )
@@ -310,7 +310,7 @@ if ((AVX512_FOUND AND NOT AVX512_DISABLED) OR (ASIMD_FOUND AND NOT APPLE_SILICON
         FetchContent_Declare(
             oneDNN
             GIT_REPOSITORY https://github.com/oneapi-src/oneDNN.git
-            GIT_TAG v3.9
+            GIT_TAG v3.10
             GIT_PROGRESS TRUE
             GIT_SHALLOW TRUE
         )
diff --git a/csrc/cpu/cpu_attn_impl.hpp b/csrc/cpu/cpu_attn_impl.hpp
index 8f4c78099802..c317453530af 100644
--- a/csrc/cpu/cpu_attn_impl.hpp
+++ b/csrc/cpu/cpu_attn_impl.hpp
@@ -821,10 +821,12 @@ struct VecTypeTrait<c10::BFloat16> {
   using vec_t = vec_op::BF16Vec16;
 };
 
+#if !defined(__powerpc__)
 template <>
 struct VecTypeTrait<c10::Half> {
   using vec_t = vec_op::FP16Vec16;
 };
+#endif
 
 template <typename T>
 void print_logits(const char* name, T* ptr, int32_t row, int32_t col,

From 8da2f28f53c14e2c21c50821d89e3909d9c84af6 Mon Sep 17 00:00:00 2001
From: Pleaplusone <ygan@amd.com>
Date: Thu, 13 Nov 2025 22:18:20 +0800
Subject: [PATCH 153/183] [ROCm][BugFix]Fix `get_cu_count` in rocm_aiter_fa.py
 (#28618)

Signed-off-by: ganyi <ygan@amd.com>
---
 vllm/v1/attention/backends/rocm_aiter_fa.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/vllm/v1/attention/backends/rocm_aiter_fa.py b/vllm/v1/attention/backends/rocm_aiter_fa.py
index c7f925817a6a..ad454daa582e 100644
--- a/vllm/v1/attention/backends/rocm_aiter_fa.py
+++ b/vllm/v1/attention/backends/rocm_aiter_fa.py
@@ -18,6 +18,7 @@
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.utils.math_utils import cdiv
+from vllm.utils.platform_utils import get_cu_count
 from vllm.v1.attention.backends.utils import (
     AttentionCGSupport,
     AttentionMetadataBuilder,
@@ -38,7 +39,7 @@ def block_size(x, head_dim):
         return min(65536 // x.element_size(), triton.next_power_of_2(head_dim))
 
     def num_programs(total_tokens):
-        return min(total_tokens, current_platform.get_cu_count())
+        return min(total_tokens, get_cu_count())
 
     @triton.jit
     def cp_mha_gather_cache_kernel(

From a7791eac9d29a4a26b007db42130a9e28b3e77ee Mon Sep 17 00:00:00 2001
From: amdfaa <107946068+amdfaa@users.noreply.github.com>
Date: Thu, 13 Nov 2025 09:34:55 -0500
Subject: [PATCH 154/183] [CI/Build] Install uv for AMD MI300: Language Models
 Tests (Hybrid) %N (#28142)

Signed-off-by: amdfaa <107946068+amdfaa@users.noreply.github.com>
Signed-off-by: zhewenli <zhewenli@meta.com>
Co-authored-by: zhewenli <zhewenli@meta.com>
---
 docker/Dockerfile.rocm | 35 +++++++++++++++++++++++++++--------
 1 file changed, 27 insertions(+), 8 deletions(-)

diff --git a/docker/Dockerfile.rocm b/docker/Dockerfile.rocm
index 06d229f315bd..137452cad2c1 100644
--- a/docker/Dockerfile.rocm
+++ b/docker/Dockerfile.rocm
@@ -15,6 +15,20 @@ RUN apt-get update -q -y && apt-get install -q -y \
 # Remove sccache
 RUN python3 -m pip install --upgrade pip
 RUN apt-get purge -y sccache; python3 -m pip uninstall -y sccache; rm -f "$(which sccache)"
+
+# Install UV
+RUN curl -LsSf https://astral.sh/uv/install.sh | sh
+
+# Activate virtual environment and add uv to PATH
+ENV PATH="/root/.local/bin:$PATH"
+
+# This timeout (in seconds) is necessary when installing some dependencies via uv since it's likely to time out
+# Reference: https://github.com/astral-sh/uv/pull/1694
+ENV UV_HTTP_TIMEOUT=500
+ENV UV_INDEX_STRATEGY="unsafe-best-match"
+# Use copy mode to avoid hardlink failures with Docker cache mounts
+ENV UV_LINK_MODE=copy
+
 ARG COMMON_WORKDIR
 WORKDIR ${COMMON_WORKDIR}
 
@@ -59,13 +73,15 @@ FROM base AS test
 
 RUN python3 -m pip install --upgrade pip && rm -rf /var/lib/apt/lists/*
 
-# Install vLLM
+# Install vLLM using uv (inherited from base stage)
+# Note: No -U flag to avoid upgrading PyTorch ROCm to CUDA version
 RUN --mount=type=bind,from=export_vllm,src=/,target=/install \
+    --mount=type=cache,target=/root/.cache/uv \
     cd /install \
-    && pip install -U -r requirements/rocm.txt \
-    && pip install -U -r requirements/rocm-test.txt \
+    && uv pip install --system -r requirements/rocm.txt \
+    && uv pip install --system -r requirements/rocm-test.txt \
     && pip uninstall -y vllm \
-    && pip install *.whl
+    && uv pip install --system *.whl
 
 WORKDIR /vllm-workspace
 ARG COMMON_WORKDIR
@@ -89,14 +105,17 @@ RUN case "$(which python3)" in \
             rm -rf /opt/conda/envs/py_3.9/lib/python3.9/site-packages/numpy-1.20.3.dist-info/;; \
         *) ;; esac
 
-RUN python3 -m pip install --upgrade huggingface-hub[cli]
+RUN --mount=type=cache,target=/root/.cache/uv \
+    uv pip install --system --upgrade huggingface-hub[cli]
 
-# Install vLLM
+# Install vLLM using uv (inherited from base stage)
+# Note: No -U flag to avoid upgrading PyTorch ROCm to CUDA version
 RUN --mount=type=bind,from=export_vllm,src=/,target=/install \
+    --mount=type=cache,target=/root/.cache/uv \
     cd /install \
-    && pip install -U -r requirements/rocm.txt \
+    && uv pip install --system -r requirements/rocm.txt \
     && pip uninstall -y vllm \
-    && pip install *.whl
+    && uv pip install --system *.whl
 
 ARG COMMON_WORKDIR
 

From 07a606aa7eb30923a3cc631185d93de9e51b37cb Mon Sep 17 00:00:00 2001
From: Huamin Li <3ericli@gmail.com>
Date: Thu, 13 Nov 2025 07:11:27 -0800
Subject: [PATCH 155/183] [CI Failure] Fix backend selection for encoder-only
 models (#28534)

Signed-off-by: Huamin Li <3ericli@gmail.com>
---
 vllm/attention/backends/abstract.py               | 14 ++++++++++++++
 vllm/attention/layer.py                           |  1 +
 vllm/attention/layers/encoder_only_attention.py   |  6 +++++-
 vllm/attention/selector.py                        |  5 +++++
 vllm/platforms/cpu.py                             |  1 +
 vllm/platforms/cuda.py                            | 10 ++++++++++
 vllm/platforms/interface.py                       |  1 +
 vllm/platforms/rocm.py                            |  1 +
 vllm/platforms/tpu.py                             |  1 +
 vllm/platforms/xpu.py                             |  1 +
 vllm/v1/attention/backends/cpu_attn.py            | 11 +++++++++++
 vllm/v1/attention/backends/flash_attn.py          | 12 ++++++++++++
 vllm/v1/attention/backends/flex_attention.py      |  7 +++++++
 vllm/v1/attention/backends/mla/flashmla_sparse.py | 10 +++++-----
 14 files changed, 75 insertions(+), 6 deletions(-)

diff --git a/vllm/attention/backends/abstract.py b/vllm/attention/backends/abstract.py
index 697beed91869..9275d70fd86a 100644
--- a/vllm/attention/backends/abstract.py
+++ b/vllm/attention/backends/abstract.py
@@ -142,6 +142,17 @@ def supports_sink(cls) -> bool:
     def is_sparse(cls) -> bool:
         return False
 
+    @classmethod
+    def supports_attn_type(cls, attn_type: str) -> bool:
+        """Check if backend supports a given attention type.
+
+        By default, only supports decoder attention.
+        Backends should override this to support other attention types.
+        """
+        from vllm.attention import AttentionType
+
+        return attn_type == AttentionType.DECODER
+
     @classmethod
     def supports_compute_capability(cls, capability: "DeviceCapability") -> bool:
         return True
@@ -171,6 +182,7 @@ def validate_configuration(
         has_sink: bool,
         use_sparse: bool,
         device_capability: "DeviceCapability",
+        attn_type: str,
     ) -> list[str]:
         invalid_reasons = []
         if not cls.supports_head_size(head_size):
@@ -195,6 +207,8 @@ def validate_configuration(
                 invalid_reasons.append("non-sparse not supported")
         if not cls.supports_compute_capability(device_capability):
             invalid_reasons.append("compute capability not supported")
+        if not cls.supports_attn_type(attn_type):
+            invalid_reasons.append(f"attention type {attn_type} not supported")
         combination_reason = cls.supports_combination(
             head_size,
             dtype,
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index 487bba76babf..37f9a4b383ce 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -291,6 +291,7 @@ def __init__(
                 block_size,
                 use_mla=False,
                 has_sink=self.has_sink,
+                attn_type=attn_type,
             )
         else:
             self.attn_backend = attn_backend
diff --git a/vllm/attention/layers/encoder_only_attention.py b/vllm/attention/layers/encoder_only_attention.py
index 4929bbf5efc7..5e99c9901003 100644
--- a/vllm/attention/layers/encoder_only_attention.py
+++ b/vllm/attention/layers/encoder_only_attention.py
@@ -74,7 +74,11 @@ def __init__(
             block_size = 16
 
         underlying_attn_backend = get_attn_backend(
-            head_size, dtype, kv_cache_dtype, block_size
+            head_size,
+            dtype,
+            kv_cache_dtype,
+            block_size,
+            attn_type=AttentionType.ENCODER_ONLY,
         )
 
         attn_backend = create_encoder_only_attention_backend(underlying_attn_backend)
diff --git a/vllm/attention/selector.py b/vllm/attention/selector.py
index 262cdf0e575b..1a092db9ce37 100644
--- a/vllm/attention/selector.py
+++ b/vllm/attention/selector.py
@@ -76,6 +76,7 @@ def get_attn_backend(
     use_mla: bool = False,
     has_sink: bool = False,
     use_sparse: bool = False,
+    attn_type: str | None = None,
 ) -> type[AttentionBackend]:
     """Selects which attention backend to use and lazily imports it."""
 
@@ -94,6 +95,7 @@ def get_attn_backend(
         use_mla=use_mla,
         has_sink=has_sink,
         use_sparse=use_sparse,
+        attn_type=attn_type,
     )
 
 
@@ -106,6 +108,7 @@ def _cached_get_attn_backend(
     use_mla: bool = False,
     has_sink: bool = False,
     use_sparse: bool = False,
+    attn_type: str | None = None,
 ) -> type[AttentionBackend]:
     # Check whether a particular choice of backend was
     # previously forced.
@@ -159,6 +162,7 @@ def _cached_get_attn_backend(
             use_mla,
             has_sink,
             use_sparse,
+            attn_type,
         )
     else:
         attention_cls = current_platform.get_attn_backend_cls(
@@ -170,6 +174,7 @@ def _cached_get_attn_backend(
             use_mla,
             has_sink,
             use_sparse,
+            attn_type,
         )
     if not attention_cls:
         raise ValueError(
diff --git a/vllm/platforms/cpu.py b/vllm/platforms/cpu.py
index 8b3b8d4cb44f..cf954768689f 100644
--- a/vllm/platforms/cpu.py
+++ b/vllm/platforms/cpu.py
@@ -134,6 +134,7 @@ def get_attn_backend_cls(
         use_mla: bool,
         has_sink: bool,
         use_sparse: bool,
+        attn_type: str | None = None,
     ) -> str:
         from vllm.attention.backends.registry import AttentionBackendEnum
 
diff --git a/vllm/platforms/cuda.py b/vllm/platforms/cuda.py
index ebcc290a64cd..2e4dd8bb808b 100644
--- a/vllm/platforms/cuda.py
+++ b/vllm/platforms/cuda.py
@@ -298,6 +298,7 @@ def get_valid_backends(
         has_sink,
         use_sparse,
         device_capability,
+        attn_type,
     ) -> tuple[
         list[tuple["AttentionBackendEnum", int]],
         dict["AttentionBackendEnum", list[str]],
@@ -318,6 +319,7 @@ def get_valid_backends(
                     has_sink,
                     use_sparse,
                     device_capability,
+                    attn_type,
                 )
             except ImportError:
                 invalid_reasons_i = ["ImportError"]
@@ -339,7 +341,13 @@ def get_attn_backend_cls(
         use_mla: bool,
         has_sink: bool,
         use_sparse: bool,
+        attn_type: str | None = None,
     ) -> str:
+        from vllm.attention import AttentionType
+
+        if attn_type is None:
+            attn_type = AttentionType.DECODER
+
         device_capability = cls.get_device_capability()
         assert device_capability is not None
 
@@ -356,6 +364,7 @@ def get_attn_backend_cls(
                     has_sink,
                     use_sparse,
                     device_capability,
+                    attn_type,
                 )
             except ImportError:
                 invalid_reasons = ["ImportError"]
@@ -379,6 +388,7 @@ def get_attn_backend_cls(
             has_sink,
             use_sparse,
             device_capability,
+            attn_type,
         )
         reasons_str = (
             "{"
diff --git a/vllm/platforms/interface.py b/vllm/platforms/interface.py
index 12c377384270..0471c20429b1 100644
--- a/vllm/platforms/interface.py
+++ b/vllm/platforms/interface.py
@@ -222,6 +222,7 @@ def get_attn_backend_cls(
         use_mla: bool,
         has_sink: bool,
         use_sparse: bool,
+        attn_type: str | None = None,
     ) -> str:
         """Get the attention backend class of a device."""
         return ""
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index d20dc9e6b067..788f9d69c357 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -216,6 +216,7 @@ def get_attn_backend_cls(
         use_mla,
         has_sink,
         use_sparse,
+        attn_type: str | None = None,
     ) -> str:
         from vllm._aiter_ops import rocm_aiter_ops
         from vllm.attention.backends.registry import AttentionBackendEnum
diff --git a/vllm/platforms/tpu.py b/vllm/platforms/tpu.py
index 4773fef6829d..b997bb9e6999 100644
--- a/vllm/platforms/tpu.py
+++ b/vllm/platforms/tpu.py
@@ -61,6 +61,7 @@ def get_attn_backend_cls(
         use_mla: bool,
         has_sink,
         use_sparse,
+        attn_type: str | None = None,
     ) -> str:
         from vllm.attention.backends.registry import AttentionBackendEnum
 
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index c629325f76a3..5552e4ca4b2f 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -51,6 +51,7 @@ def get_attn_backend_cls(
         use_mla: bool,
         has_sink: bool,
         use_sparse,
+        attn_type: str | None = None,
     ) -> str:
         from vllm.v1.attention.backends.utils import set_kv_cache_layout
 
diff --git a/vllm/v1/attention/backends/cpu_attn.py b/vllm/v1/attention/backends/cpu_attn.py
index 674398e19c4c..f1254352c058 100644
--- a/vllm/v1/attention/backends/cpu_attn.py
+++ b/vllm/v1/attention/backends/cpu_attn.py
@@ -48,6 +48,17 @@ def get_supported_head_sizes(cls) -> list[int]:
     def get_name() -> str:
         return "CPU_ATTN"
 
+    @classmethod
+    def supports_attn_type(cls, attn_type: str) -> bool:
+        """CPU attention supports decoder and encoder-only attention."""
+        from vllm.attention import AttentionType
+
+        return attn_type in (
+            AttentionType.DECODER,
+            AttentionType.ENCODER,
+            AttentionType.ENCODER_ONLY,
+        )
+
     @staticmethod
     def get_impl_cls() -> type["CPUAttentionBackendImpl"]:
         return CPUAttentionBackendImpl
diff --git a/vllm/v1/attention/backends/flash_attn.py b/vllm/v1/attention/backends/flash_attn.py
index d9bd52d8f980..bfb4a45c2b56 100755
--- a/vllm/v1/attention/backends/flash_attn.py
+++ b/vllm/v1/attention/backends/flash_attn.py
@@ -66,6 +66,18 @@ class FlashAttentionBackend(AttentionBackend):
     def get_name() -> str:
         return "FLASH_ATTN"
 
+    @classmethod
+    def supports_attn_type(cls, attn_type: str) -> bool:
+        """FlashAttention supports all attention types."""
+        from vllm.attention import AttentionType
+
+        return attn_type in (
+            AttentionType.DECODER,
+            AttentionType.ENCODER,
+            AttentionType.ENCODER_ONLY,
+            AttentionType.ENCODER_DECODER,
+        )
+
     @staticmethod
     def get_impl_cls() -> type["FlashAttentionImpl"]:
         return FlashAttentionImpl
diff --git a/vllm/v1/attention/backends/flex_attention.py b/vllm/v1/attention/backends/flex_attention.py
index e53cd0d8af4f..7768827d26dc 100644
--- a/vllm/v1/attention/backends/flex_attention.py
+++ b/vllm/v1/attention/backends/flex_attention.py
@@ -84,6 +84,13 @@ class FlexAttentionBackend(AttentionBackend):
     def get_name() -> str:
         return "FLEX_ATTENTION"
 
+    @classmethod
+    def supports_attn_type(cls, attn_type: str) -> bool:
+        """FlexAttention supports both decoder and encoder-only attention."""
+        from vllm.attention import AttentionType
+
+        return attn_type in (AttentionType.DECODER, AttentionType.ENCODER_ONLY)
+
     @staticmethod
     def get_impl_cls() -> type["FlexAttentionImpl"]:
         return FlexAttentionImpl
diff --git a/vllm/v1/attention/backends/mla/flashmla_sparse.py b/vllm/v1/attention/backends/mla/flashmla_sparse.py
index 5fe9c69d3500..bb8d914d1571 100644
--- a/vllm/v1/attention/backends/mla/flashmla_sparse.py
+++ b/vllm/v1/attention/backends/mla/flashmla_sparse.py
@@ -40,14 +40,14 @@
 """
 NOTE: FlashMLA Sparse uses an fp8 cache with the following format
 
-In the "FP8 with scale" format, each token's KV cache is 656 Bytes, 
+In the "FP8 with scale" format, each token's KV cache is 656 Bytes,
 structured as:
--   **First 512 bytes:** The "quantized NoPE" part, containing 512 
+-   **First 512 bytes:** The "quantized NoPE" part, containing 512
     `float8_e4m3` values.
--   **Next 16 bytes:** Scale factors, containing 4 `float32` values. 
-    The first `float32` is the scale for the first 128 `float8_e4m3` values, 
+-   **Next 16 bytes:** Scale factors, containing 4 `float32` values.
+    The first `float32` is the scale for the first 128 `float8_e4m3` values,
     the second for the next 128, and so on.
--   **Last 128 bytes:** The "RoPE" part, containing 64 `bfloat16` values. This 
+-   **Last 128 bytes:** The "RoPE" part, containing 64 `bfloat16` values. This
     part is not quantized for accuracy.
 """
 

From 3035d1a166821272d4e7eb204e2c613bb02bacd7 Mon Sep 17 00:00:00 2001
From: Yuanping Song <yuanping.song@outlook.com>
Date: Thu, 13 Nov 2025 10:24:35 -0500
Subject: [PATCH 156/183] [BugFix] DeepSeek-OCR: apply
 NoRepeatNGramLogitsProcessor to greedy path (#28617)

Signed-off-by: Yuanping Song <yuanping.song@outlook.com>
---
 vllm/model_executor/models/deepseek_ocr.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/models/deepseek_ocr.py b/vllm/model_executor/models/deepseek_ocr.py
index c89caab93a1e..8179f916ff41 100644
--- a/vllm/model_executor/models/deepseek_ocr.py
+++ b/vllm/model_executor/models/deepseek_ocr.py
@@ -161,7 +161,7 @@ def validate_params(cls, params: SamplingParams):
             )
 
     def is_argmax_invariant(self) -> bool:
-        return True
+        return False
 
     def new_req_logits_processor(
         self,

From b230286fbc0b6d192e176ead55000471fd4f1080 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Thu, 13 Nov 2025 16:02:42 +0000
Subject: [PATCH 157/183] Fix `get_num_experts` when config sets it explicitly
 to `None` (#28652)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Co-authored-by: bruceszchen <bruceszchen@tencent.com>
---
 vllm/config/model.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/vllm/config/model.py b/vllm/config/model.py
index c47b619118ff..f4ed99689e5b 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -1342,7 +1342,8 @@ def get_num_experts(self) -> int:
             # Ernie VL's remote code uses list[int]...
             # The values are always the same so we just take the first one.
             return num_experts[0]
-        return num_experts
+        # Coerce to 0 if explicitly set to None
+        return num_experts or 0
 
     def get_layers_start_end_indices(
         self, parallel_config: ParallelConfig

From d3387750f191f3bcf6607db95436147bbccfacb3 Mon Sep 17 00:00:00 2001
From: Roger Wang <hey@rogerw.io>
Date: Thu, 13 Nov 2025 08:38:08 -0800
Subject: [PATCH 158/183] [Misc] Turn off encoder torch compile by default
 (#28634)

Signed-off-by: Roger Wang <hey@rogerw.io>
---
 tests/compile/test_multimodal_compile.py          | 9 ++++++---
 tests/models/multimodal/generation/test_common.py | 2 ++
 vllm/config/compilation.py                        | 5 +++--
 3 files changed, 11 insertions(+), 5 deletions(-)

diff --git a/tests/compile/test_multimodal_compile.py b/tests/compile/test_multimodal_compile.py
index b76c29819a2d..621f6a51a918 100644
--- a/tests/compile/test_multimodal_compile.py
+++ b/tests/compile/test_multimodal_compile.py
@@ -10,8 +10,8 @@
 
 def test_compile():
     vllm_config = VllmConfig()
-    # Default configuration compiles mm encoder
-    assert vllm_config.compilation_config.compile_mm_encoder
+    # Default configuration does not compile mm encoder
+    assert not vllm_config.compilation_config.compile_mm_encoder
 
 
 # forked needed to workaround https://github.com/vllm-project/vllm/issues/21073
@@ -39,7 +39,10 @@ def test_qwen2_5_vl_compilation(vllm_runner, monkeypatch):
             "Qwen/Qwen2.5-VL-3B-Instruct",
             max_model_len=2048,
             gpu_memory_utilization=0.8,
-            compilation_config={"mode": CompilationMode.VLLM_COMPILE},
+            compilation_config={
+                "mode": CompilationMode.VLLM_COMPILE,
+                "compile_mm_encoder": True,
+            },
         ) as _,
     ):
         pass
diff --git a/tests/models/multimodal/generation/test_common.py b/tests/models/multimodal/generation/test_common.py
index 5504c417fda4..22083d9f1614 100644
--- a/tests/models/multimodal/generation/test_common.py
+++ b/tests/models/multimodal/generation/test_common.py
@@ -131,6 +131,7 @@
         prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
         img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>",
         video_idx_to_prompt=lambda idx: "<|vision_start|><|video_pad|><|vision_end|>",
+        enforce_eager=False,
         max_model_len=4096,
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
@@ -160,6 +161,7 @@
             VLMTestType.MULTI_IMAGE,
             VLMTestType.VIDEO,
         ),
+        enforce_eager=False,
         needs_video_metadata=True,
         prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
         img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>",  # noqa: E501
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index b0d1bc2bab30..10673041aa68 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -320,9 +320,10 @@ class CompilationConfig:
 
     If None, defaults to attention ops for piecewise cudagraphs.
     If empty list [], no ops are excluded (suitable for full cudagraphs)."""
-    compile_mm_encoder: bool = True
+    compile_mm_encoder: bool = False
     """Whether or not to compile the multimodal encoder.
-    Currently, this only works for `Qwen2_5_vl`."""
+    Currently, this only works for `Qwen2_5_vl` on selected platforms. 
+    Disabled by default until more models are supported/tested to work."""
 
     # Inductor capture
     use_inductor: bool | None = None

From 06c4873d959feb0d4cb062ef17cdd0dd09dbf10f Mon Sep 17 00:00:00 2001
From: "Jane (Yuan) Xu" <31798555+janeyx99@users.noreply.github.com>
Date: Thu, 13 Nov 2025 11:52:50 -0500
Subject: [PATCH 159/183] Rewrite C++ meta funcs to Python (#28595)

Signed-off-by: Jane Xu <janeyx@meta.com>
---
 .../gptq_marlin/awq_marlin_repack.cu          | 16 --------
 .../gptq_marlin/gptq_marlin_repack.cu         | 16 --------
 vllm/_custom_ops.py                           | 39 ++++++++++++++++++-
 3 files changed, 38 insertions(+), 33 deletions(-)

diff --git a/csrc/quantization/gptq_marlin/awq_marlin_repack.cu b/csrc/quantization/gptq_marlin/awq_marlin_repack.cu
index 8ba617a9e655..e607107b3e77 100644
--- a/csrc/quantization/gptq_marlin/awq_marlin_repack.cu
+++ b/csrc/quantization/gptq_marlin/awq_marlin_repack.cu
@@ -247,22 +247,6 @@ torch::Tensor awq_marlin_repack(torch::Tensor& b_q_weight, int64_t size_k,
   return out;
 }
 
-torch::Tensor awq_marlin_repack_meta(torch::Tensor& b_q_weight,
-                                     c10::SymInt size_k, c10::SymInt size_n,
-                                     int64_t num_bits) {
-  int const pack_factor = 32 / num_bits;
-  auto options = torch::TensorOptions()
-                     .dtype(b_q_weight.dtype())
-                     .device(b_q_weight.device());
-  return torch::empty_symint(
-      {size_k / marlin::tile_size, size_n * marlin::tile_size / pack_factor},
-      options);
-}
-
 TORCH_LIBRARY_IMPL_EXPAND(TORCH_EXTENSION_NAME, CUDA, m) {
   m.impl("awq_marlin_repack", &awq_marlin_repack);
 }
-
-TORCH_LIBRARY_IMPL_EXPAND(TORCH_EXTENSION_NAME, Meta, m) {
-  m.impl("awq_marlin_repack", &awq_marlin_repack_meta);
-}
diff --git a/csrc/quantization/gptq_marlin/gptq_marlin_repack.cu b/csrc/quantization/gptq_marlin/gptq_marlin_repack.cu
index 7c2d089a70d9..ad80d51ece94 100644
--- a/csrc/quantization/gptq_marlin/gptq_marlin_repack.cu
+++ b/csrc/quantization/gptq_marlin/gptq_marlin_repack.cu
@@ -321,22 +321,6 @@ torch::Tensor gptq_marlin_repack(torch::Tensor& b_q_weight, torch::Tensor& perm,
   return out;
 }
 
-torch::Tensor gptq_marlin_repack_meta(torch::Tensor& b_q_weight,
-                                      torch::Tensor& perm, c10::SymInt size_k,
-                                      c10::SymInt size_n, int64_t num_bits) {
-  int const pack_factor = 32 / num_bits;
-  auto options = torch::TensorOptions()
-                     .dtype(b_q_weight.dtype())
-                     .device(b_q_weight.device());
-  return torch::empty_symint(
-      {size_k / marlin::tile_size, size_n * marlin::tile_size / pack_factor},
-      options);
-}
-
 TORCH_LIBRARY_IMPL_EXPAND(TORCH_EXTENSION_NAME, CUDA, m) {
   m.impl("gptq_marlin_repack", &gptq_marlin_repack);
 }
-
-TORCH_LIBRARY_IMPL_EXPAND(TORCH_EXTENSION_NAME, Meta, m) {
-  m.impl("gptq_marlin_repack", &gptq_marlin_repack_meta);
-}
diff --git a/vllm/_custom_ops.py b/vllm/_custom_ops.py
index 7d70c01cefbb..096266c9764e 100644
--- a/vllm/_custom_ops.py
+++ b/vllm/_custom_ops.py
@@ -1174,13 +1174,50 @@ def gptq_marlin_repack(
     return torch.ops._C.gptq_marlin_repack(b_q_weight, perm, size_k, size_n, num_bits)
 
 
-# gptq_marlin
+if hasattr(torch.ops._C, "gptq_marlin_repack"):
+
+    @register_fake("_C::gptq_marlin_repack")
+    def _gptq_marlin_repack_fake(
+        b_q_weight: torch.Tensor,
+        perm: torch.Tensor,
+        size_k: torch.SymInt,
+        size_n: torch.SymInt,
+        num_bits: int,
+    ) -> torch.Tensor:
+        pack_factor = 32 // num_bits
+        marlin_tile_size = 16
+        return torch.empty(
+            (size_k // marlin_tile_size, size_n * marlin_tile_size // pack_factor),
+            dtype=b_q_weight.dtype,
+            device=b_q_weight.device,
+        )
+
+
+# awq_marlin
 def awq_marlin_repack(
     b_q_weight: torch.Tensor, size_k: int, size_n: int, num_bits: int
 ) -> torch.Tensor:
     return torch.ops._C.awq_marlin_repack(b_q_weight, size_k, size_n, num_bits)
 
 
+if hasattr(torch.ops._C, "awq_marlin_repack"):
+
+    @register_fake("_C::awq_marlin_repack")
+    def _awq_marlin_repack_fake(
+        b_q_weight: torch.Tensor,
+        size_k: torch.SymInt,
+        size_n: torch.SymInt,
+        num_bits: int,
+    ) -> torch.Tensor:
+        pack_factor = 32 // num_bits
+        marlin_tile_size = 16
+        return torch.empty(
+            (size_k // marlin_tile_size, size_n * marlin_tile_size // pack_factor),
+            dtype=b_q_weight.dtype,
+            device=b_q_weight.device,
+        )
+
+
 def gptq_marlin_moe_repack(
     b_q_weight: torch.Tensor,
     perm: torch.Tensor,

From 327c0a9a23f2939923d02fbf882640753bf1e030 Mon Sep 17 00:00:00 2001
From: Nick Hill <nhill@redhat.com>
Date: Thu, 13 Nov 2025 09:14:08 -0800
Subject: [PATCH 160/183] [BugFix] Ensure `EngineArgs.create_engine_config` is
 idempotent (#28515)

Signed-off-by: Nick Hill <nhill@redhat.com>
---
 vllm/engine/arg_utils.py | 19 +++++++++----------
 1 file changed, 9 insertions(+), 10 deletions(-)

diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index 13c7704f5bf3..ca7f5e5e3e05 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -1631,40 +1631,39 @@ def create_engine_config(
             )
 
         observability_config = ObservabilityConfig(
-            show_hidden_metrics_for_version=(self.show_hidden_metrics_for_version),
+            show_hidden_metrics_for_version=self.show_hidden_metrics_for_version,
             otlp_traces_endpoint=self.otlp_traces_endpoint,
             collect_detailed_traces=self.collect_detailed_traces,
         )
 
         # Compilation config overrides
+        compilation_config = copy.deepcopy(self.compilation_config)
         if self.cuda_graph_sizes is not None:
             logger.warning(
                 "--cuda-graph-sizes is deprecated and will be removed in v0.13.0 or "
                 "v1.0.0, whichever is soonest. Please use --cudagraph-capture-sizes "
                 "instead."
             )
-            if self.compilation_config.cudagraph_capture_sizes is not None:
+            if compilation_config.cudagraph_capture_sizes is not None:
                 raise ValueError(
                     "cuda_graph_sizes and compilation_config."
                     "cudagraph_capture_sizes are mutually exclusive"
                 )
-            self.compilation_config.cudagraph_capture_sizes = self.cuda_graph_sizes
+            compilation_config.cudagraph_capture_sizes = self.cuda_graph_sizes
         if self.cudagraph_capture_sizes is not None:
-            if self.compilation_config.cudagraph_capture_sizes is not None:
+            if compilation_config.cudagraph_capture_sizes is not None:
                 raise ValueError(
                     "cudagraph_capture_sizes and compilation_config."
                     "cudagraph_capture_sizes are mutually exclusive"
                 )
-            self.compilation_config.cudagraph_capture_sizes = (
-                self.cudagraph_capture_sizes
-            )
+            compilation_config.cudagraph_capture_sizes = self.cudagraph_capture_sizes
         if self.max_cudagraph_capture_size is not None:
-            if self.compilation_config.max_cudagraph_capture_size is not None:
+            if compilation_config.max_cudagraph_capture_size is not None:
                 raise ValueError(
                     "max_cudagraph_capture_size and compilation_config."
                     "max_cudagraph_capture_size are mutually exclusive"
                 )
-            self.compilation_config.max_cudagraph_capture_size = (
+            compilation_config.max_cudagraph_capture_size = (
                 self.max_cudagraph_capture_size
             )
 
@@ -1679,7 +1678,7 @@ def create_engine_config(
             load_config=load_config,
             structured_outputs_config=self.structured_outputs_config,
             observability_config=observability_config,
-            compilation_config=self.compilation_config,
+            compilation_config=compilation_config,
             kv_transfer_config=self.kv_transfer_config,
             kv_events_config=self.kv_events_config,
             ec_transfer_config=self.ec_transfer_config,

From fdfd5075aa0b9b32e3000554d719f1622acff800 Mon Sep 17 00:00:00 2001
From: Johnny Yang <24908445+jcyang43@users.noreply.github.com>
Date: Thu, 13 Nov 2025 09:36:54 -0800
Subject: [PATCH 161/183] [TPU] patch TPU wheel build script to resolve
 metadata issue (#27279)

Signed-off-by: Johnny Yang <johnnyyang@google.com>
---
 setup.py                |  4 +++-
 tools/vllm-tpu/build.sh | 28 ++++++++++++++++++++++++++++
 2 files changed, 31 insertions(+), 1 deletion(-)

diff --git a/setup.py b/setup.py
index 0934a8608eb1..e9b36e2a2e03 100644
--- a/setup.py
+++ b/setup.py
@@ -545,7 +545,9 @@ def get_vllm_version() -> str:
     # Allow overriding the version. This is useful to build platform-specific
     # wheels (e.g. CPU, TPU) without modifying the source.
     if env_version := os.getenv("VLLM_VERSION_OVERRIDE"):
-        return env_version
+        print(f"Overriding VLLM version with {env_version} from VLLM_VERSION_OVERRIDE")
+        os.environ["SETUPTOOLS_SCM_PRETEND_VERSION"] = env_version
+        return get_version(write_to="vllm/_version.py")
 
     version = get_version(write_to="vllm/_version.py")
     sep = "+" if "+" not in version else "."  # dev versions might contain +
diff --git a/tools/vllm-tpu/build.sh b/tools/vllm-tpu/build.sh
index fbc91e379df3..45ef8dfcb1db 100755
--- a/tools/vllm-tpu/build.sh
+++ b/tools/vllm-tpu/build.sh
@@ -7,6 +7,13 @@ TOOLS_DIR=$(cd "$(dirname "$SCRIPT_PATH_PARAM")" && pwd) # Absolute path to the
 REPO_ROOT=$(cd "$TOOLS_DIR/../../" && pwd) # Absolute path to the repo root
 VLLM_DIR="$REPO_ROOT/" # Path to the vllm sources
 
+CHANGE_FILE_LIST=(
+  "vllm/entrypoints/cli/main.py"
+  "vllm/entrypoints/cli/run_batch.py"
+  "vllm/utils/__init__.py"
+  "vllm/platforms/__init__.py"
+)
+
 # Ensure we are not running from within the vllm directory if SCRIPT_PATH_PARAM is relative like "."
 if [ "$TOOLS_DIR" = "$VLLM_DIR" ]; then
     echo "Error: This script should not be run from the vllm directory directly if using relative paths."
@@ -30,6 +37,20 @@ if ! grep -q "name = \"vllm-tpu\"" "$PYPROJECT_FILE"; then
     echo "Patching pyproject.toml project name to vllm-tpu..."
     cp "$PYPROJECT_FILE" "${PYPROJECT_FILE}.bak"
     sed -i '0,/^name = "vllm"/s//name = "vllm-tpu"/' "$PYPROJECT_FILE"
+
+    echo "Patching ${CHANGE_FILE_LIST[@]} vllm to vllm-tpu..."
+    # patching
+    #   importlib.metadata.version('vllm') -> importlib.metadata.version('vllm-tpu')
+    #   importlib.metadata.version("vllm") -> importlib.metadata.version("vllm-tpu")
+    #   importlib.metadata.metadata('vllm') -> importlib.metadata.metadata('vllm-tpu')
+    #   importlib.metadata.metadata("vllm") -> importlib.metadata.metadata("vllm-tpu")
+    #   version('vllm') -> version('vllm-tpu')
+    #   version("vllm") -> version("vllm-tpu")
+    sed -i \
+        -e "s/importlib.metadata.version(\(['\"]\)vllm\1)/importlib.metadata.version(\1vllm-tpu\1)/" \
+        -e "s/importlib.metadata.metadata(\(['\"]\)vllm\1)/importlib.metadata.metadata(\1vllm-tpu\1)/" \
+        -e "s/version(\(['\"]\)vllm\1)/version(\1vllm-tpu\1)/" \
+        "${CHANGE_FILE_LIST[@]}"
     PATCHED=true
 else
     PATCHED=false
@@ -45,6 +66,13 @@ cleanup() {
         echo "Restoring original pyproject.toml..."
         cp "${PYPROJECT_FILE}.bak" "$PYPROJECT_FILE"
         rm -f "${PYPROJECT_FILE}.bak"
+
+        echo "Restoring vllm code..."
+        sed -i \
+            -e "s/importlib.metadata.version(\(['\"]\)vllm-tpu\1)/importlib.metadata.version(\1vllm\1)/" \
+            -e "s/importlib.metadata.metadata(\(['\"]\)vllm-tpu\1)/importlib.metadata.metadata(\1vllm\1)/" \
+            -e "s/version(\(['\"]\)vllm-tpu\1)/version(\1vllm\1)/" \
+            "${CHANGE_FILE_LIST[@]}"
     fi
 }
 trap cleanup EXIT HUP INT QUIT PIPE TERM # Register cleanup function to run on script exit and various signals

From fe1cd7704ddd3266ddc97181ab24a167b3c9223c Mon Sep 17 00:00:00 2001
From: Varun Sundar Rabindranath <varunsundar08@gmail.com>
Date: Thu, 13 Nov 2025 13:16:55 -0500
Subject: [PATCH 162/183] [Performance][B200] silu_mul_quant: pack scales in
 int32 (#28358)

Signed-off-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
Co-authored-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
---
 csrc/quantization/activation_kernels.cu       | 164 ++++++---
 tests/conftest.py                             |  13 +
 tests/kernels/moe/test_deepep_deepgemm_moe.py |  18 +-
 tests/kernels/moe/test_deepep_moe.py          |   2 +-
 .../moe/test_silu_mul_fp8_quant_deep_gemm.py  | 311 +++++++++++++-----
 .../layers/fused_moe/batched_deep_gemm_moe.py |  76 +++--
 vllm/utils/deep_gemm.py                       |  23 ++
 7 files changed, 461 insertions(+), 146 deletions(-)

diff --git a/csrc/quantization/activation_kernels.cu b/csrc/quantization/activation_kernels.cu
index 2521b2797e2c..0c3bcf3b64b2 100644
--- a/csrc/quantization/activation_kernels.cu
+++ b/csrc/quantization/activation_kernels.cu
@@ -279,17 +279,17 @@ __device__ __forceinline__ void token_bounds(int32_t n_tokens,
 }
 
 template <int BLOCK_COUNT, int SMEM_SIZE_BYTES_Y, typename fp8_type,
-          int THREADS, typename Idx_t, bool USE_UE8M0, int GROUP_SIZE = 128,
-          int NUM_STAGES = 3>
+          typename scale_t, int THREADS, typename Idx_t, bool CEIL_UE8M0,
+          int GROUP_SIZE = 128, int NUM_STAGES = 3>
 __global__ void silu_mul_fp8_quant_deep_gemm_kernel(
     const __nv_bfloat16* __restrict__ _input, fp8_type* __restrict__ _y_q,
-    float* __restrict__ _y_s, const int32_t* __restrict__ tokens_per_expert,
+    scale_t* __restrict__ _y_s, const int32_t* __restrict__ tokens_per_expert,
     // sizes
     Idx_t E, Idx_t T, Idx_t H,
     // strides (in elements)
     Idx_t stride_i_e, Idx_t stride_i_t, Idx_t stride_i_h, Idx_t stride_yq_e,
     Idx_t stride_yq_t, Idx_t stride_yq_h, Idx_t stride_ys_e, Idx_t stride_ys_t,
-    Idx_t stride_ys_g, Idx_t stride_counts_e) {
+    Idx_t stride_ys_g, Idx_t stride_ys_p, Idx_t stride_counts_e) {
 #ifndef USE_ROCM
   static constexpr int NUM_WARPS = THREADS / WARP_SIZE;
 
@@ -466,9 +466,22 @@ __global__ void silu_mul_fp8_quant_deep_gemm_kernel(
 
   __nv_fp8x4_e4m3* y_q_base_ptr =
       reinterpret_cast<__nv_fp8x4_e4m3*>(_y_q) + lane_id;
-  auto y_scale_base_ptr = _y_s + warp_position_scales * stride_ys_g;
+
+  Idx_t scale_group_offset = 0;
+  if constexpr (std::is_same<scale_t, uint8_t>::value) {
+    // packed int32_t format
+    int pack_id = warp_position_scales / 4;
+    int scale_in_pack = warp_position_scales % 4;
+    scale_group_offset = pack_id * stride_ys_p + scale_in_pack * stride_ys_g;
+  } else {
+    scale_group_offset = warp_position_scales * stride_ys_g;
+  }
+
+  scale_t* const y_scale_base_ptr = _y_s + scale_group_offset;
 
   for (auto j = tokens_lower; j < tokens_upper; j++) {
+    int current_group_id = warp_position_scales;  // Running count of which
+                                                  // group is being processed
     const Idx_t base_ys = expert_id * stride_ys_e;
     auto y_s_ptr = y_scale_base_ptr + base_ys + token_offset * stride_ys_t;
     __nv_fp8x4_e4m3* y_q_ptr =
@@ -509,7 +522,7 @@ __global__ void silu_mul_fp8_quant_deep_gemm_kernel(
 
       __nv_bfloat16 y_s = __hmul(warp_max(_y_max2.x), fp8_inv);
 
-      if constexpr (USE_UE8M0) {
+      if constexpr (CEIL_UE8M0) {
         y_s = hexp2(hceil(hlog2(y_s)));
       }
 
@@ -527,8 +540,24 @@ __global__ void silu_mul_fp8_quant_deep_gemm_kernel(
       y_q_ptr += WARP_SIZE * stride_yq_h;
 
       if (!lane_id) {
-        *y_s_ptr = y_s;
-        y_s_ptr += stride_ys_g;
+        // Store scales.
+        if constexpr (std::is_same<scale_t, uint8_t>::value) {
+          // Packed UE8MO format. Remove Mantissa.
+          *y_s_ptr = reinterpret_cast<int16_t&>(y_s) >> 7;
+
+          bool const jump_pack = (current_group_id + 1) % 4 == 0;
+          // Minus 3 because we need to get to the first group in the
+          // next pack.
+          y_s_ptr += jump_pack ? (stride_ys_p - 3) : stride_ys_g;
+
+        } else {
+          // float32 format
+          static_assert(std::is_same<scale_t, float>::value);
+          *y_s_ptr = y_s;
+          y_s_ptr += stride_ys_g;
+        }
+
+        current_group_id += 1;
       }
     }
   }
@@ -573,7 +602,7 @@ void persistent_masked_m_silu_mul_quant(
     const at::Tensor& tokens_per_expert,  // (E)
     at::Tensor& y_q,                      // (E, T, H) [OUT]
     at::Tensor& y_s,                      // (E, T, H//group_size) [OUT]
-    bool use_ue8m0) {
+    bool cast_scale_ue8m0) {
 #ifndef USE_ROCM
 
   // This kernel currently only supports H % 128 == 0 and assumes a
@@ -583,9 +612,12 @@ void persistent_masked_m_silu_mul_quant(
   TORCH_CHECK(input.dtype() == torch::kBFloat16);
   TORCH_CHECK(y_q.dtype() == torch::kFloat8_e4m3fn ||
               y_q.dtype() == torch::kFloat8_e4m3fnuz);
-  TORCH_CHECK(y_s.dtype() == torch::kFloat32);
   TORCH_CHECK(input.size(-1) % (GROUP_SIZE * 2) == 0);
 
+  bool const is_packed_ue8m0 =
+      (y_s.dtype() == torch::kInt32 && cast_scale_ue8m0);
+  TORCH_CHECK(y_s.dtype() == torch::kFloat32 || is_packed_ue8m0);
+
   using Idx_t = int64_t;
 
   Idx_t E = input.size(0);
@@ -597,15 +629,18 @@ void persistent_masked_m_silu_mul_quant(
   Idx_t stride_yq_e = y_q.stride(0);
   Idx_t stride_yq_t = y_q.stride(1);
   Idx_t stride_yq_h = y_q.stride(2);
-  Idx_t stride_ys_e = y_s.stride(0);
-  Idx_t stride_ys_t = y_s.stride(1);
-  Idx_t stride_ys_g = y_s.stride(2);
 
   Idx_t stride_counts_e = tokens_per_expert.stride(0);
 
+  int const NUM_GROUPS = H / GROUP_SIZE;
+
   const cudaStream_t stream = at::cuda::getCurrentCUDAStream();
 
-  #define KERNEL(BLOCK_COUNT, USE_UE8M0, THREAD_COUNT, STAGES)                 \
+  // TODO: Get this from cuda_arch ?
+  static constexpr int SILU_V2_BLOCK_COUNT = 132 * 32;
+
+  #define KERNEL(BLOCK_COUNT, scale_t, STRIDE_YS_E, STRIDE_YS_T, STRIDE_YS_G,  \
+                 STRIDE_YS_P, CEIL_UE8M0, THREAD_COUNT, STAGES)                \
     static constexpr int NUM_WARPS = THREAD_COUNT / WARP_SIZE;                 \
     int sms = SILU_V2_BLOCK_COUNT;                                             \
     static constexpr int max_shared_mem_bytes =                                \
@@ -615,43 +650,86 @@ void persistent_masked_m_silu_mul_quant(
     VLLM_DISPATCH_FP8_TYPES(                                                   \
         y_q.scalar_type(), "silu_mul_fp8_quant_deep_gemm_kernel", [&] {        \
           vllm::silu_mul_fp8_quant_deep_gemm_kernel<                           \
-              BLOCK_COUNT, max_shared_mem_bytes, fp8_t, THREAD_COUNT, Idx_t,   \
-              USE_UE8M0, GROUP_SIZE, STAGES>                                   \
+              BLOCK_COUNT, max_shared_mem_bytes, fp8_t, scale_t, THREAD_COUNT, \
+              Idx_t, CEIL_UE8M0, GROUP_SIZE, STAGES>                           \
               <<<grid, block, max_shared_mem_bytes + (E + 1) * 16, stream>>>(  \
                   reinterpret_cast<__nv_bfloat16*>(input.data_ptr()),          \
-                  (fp8_t*)y_q.data_ptr(), y_s.data_ptr<float>(),               \
+                  (fp8_t*)y_q.data_ptr(),                                      \
+                  reinterpret_cast<scale_t*>(y_s.data_ptr()),                  \
                   reinterpret_cast<int32_t*>(tokens_per_expert.data_ptr()), E, \
                   T, H, stride_i_e, stride_i_t, stride_i_h, stride_yq_e,       \
-                  stride_yq_t, stride_yq_h, stride_ys_e, stride_ys_t,          \
-                  stride_ys_g, stride_counts_e);                               \
+                  stride_yq_t, stride_yq_h, STRIDE_YS_E, STRIDE_YS_T,          \
+                  STRIDE_YS_G, STRIDE_YS_P, stride_counts_e);                  \
         });
 
-  static constexpr int SILU_V2_BLOCK_COUNT = 132 * 32;
-
-  int const NUM_GROUPS = H / GROUP_SIZE;
-  if (!use_ue8m0) {
-    if (H >= 4096 && (NUM_GROUPS % 8 == 0)) {
-      /* 8 warps config */
-      static constexpr int NUM_STAGES = 4;
-      static constexpr int THREAD_COUNT = 256;
-      KERNEL(SILU_V2_BLOCK_COUNT, false, THREAD_COUNT, NUM_STAGES);
-    } else {
-      /* 1 warp config */
-      static constexpr int THREAD_COUNT = 32;
-      KERNEL(SILU_V2_BLOCK_COUNT, false, THREAD_COUNT, 2);
-    }
-  } else {
-    if (H >= 4096 && (NUM_GROUPS % 8 == 0)) {
-      /* 8 warps config */
-      static constexpr int NUM_STAGES = 4;
-      static constexpr int THREAD_COUNT = 256;
-      KERNEL(SILU_V2_BLOCK_COUNT, true, THREAD_COUNT, NUM_STAGES);
-    } else {
-      /* 1 warp config */
-      static constexpr int THREAD_COUNT = 32;
-      KERNEL(SILU_V2_BLOCK_COUNT, true, THREAD_COUNT, 2);
+  #define LAUNCH_ON_H(scale_t, STRIDE_YS_E, STRIDE_YS_T, STRIDE_YS_G,         \
+                      STRIDE_YS_P, CEIL_UE8M0)                                \
+    if (H >= 4096 && (NUM_GROUPS % 8) == 0) {                                 \
+      /* 8 warp config */                                                     \
+      static constexpr int NUM_STAGES = 4;                                    \
+      static constexpr int THREAD_COUNT = 256;                                \
+      KERNEL(SILU_V2_BLOCK_COUNT, scale_t, STRIDE_YS_E, STRIDE_YS_T,          \
+             STRIDE_YS_G, STRIDE_YS_P, CEIL_UE8M0, THREAD_COUNT, NUM_STAGES); \
+    } else {                                                                  \
+      /* 1 warp config */                                                     \
+      static constexpr int THREAD_COUNT = 32;                                 \
+      KERNEL(SILU_V2_BLOCK_COUNT, scale_t, STRIDE_YS_E, STRIDE_YS_T,          \
+             STRIDE_YS_G, STRIDE_YS_P, CEIL_UE8M0, THREAD_COUNT, 2);          \
     }
+
+  Idx_t stride_ys_e = y_s.stride(0);
+  Idx_t stride_ys_t = y_s.stride(1);
+  Idx_t stride_ys_g = y_s.stride(2);
+  Idx_t stride_ys_p = 0;
+  if (!cast_scale_ue8m0) {
+    TORCH_CHECK(!is_packed_ue8m0);
+    LAUNCH_ON_H(float, stride_ys_e, stride_ys_t, stride_ys_g, stride_ys_p,
+                false);
+    return;
+  }
+
+  if (!is_packed_ue8m0) {
+    // UE8M0 but not packed
+    LAUNCH_ON_H(float, stride_ys_e, stride_ys_t, stride_ys_g, stride_ys_p,
+                true);
+    return;
   }
 
+  TORCH_CHECK(cast_scale_ue8m0 && is_packed_ue8m0);
+  TORCH_CHECK(y_s.dtype() == torch::kInt32);
+
+  // Int32 packed ue8m0 scales tensor.
+  // Let E, T, G be the number to experts, number of tokens and number of groups
+  // respectively. Let, E = 2, T = 4, G = 6, in this case the int32 scales
+  // tensor are of shape [1, 4, 2] and stride [8, 1, 4]. The scales are expected
+  // to be arranged as follows,
+  // [[T0G0-T0G1-T0G2-T0G3, T0G4-T0G5-X-X,],
+  //  [T1G0-T1G1-T1G2-T1G3, T1G4-T1G5-X-X,]
+  //  [T2G0-T2G1-T2G2-T2G3, T2G4-T2G5-X-X,]
+  //  [T3G0-T3G1-T3G2-T3G3, T3G4-T3G5-X-X,]]
+  // where, TxGy is the scale ue8m0 scale value of Token x, Group y.
+  //
+  // In memory (in bytes) the scale values are arranged as,
+  //  [T0G0, T0G1, T0G2, T0G3, T1G0, T1G2, T1G3, T1G4, T2G0, T2G1, T2G3, T2G4,
+  //   T3G0, T3G1, T3G2, T3G3, T0G4, T0G5, X, X, T1G4, T1G5, X, X, T2G4, T2G5,
+  //   X, X, T3G4, T3G5, X, X]
+  //
+  // An Int32 tensor of size [1, 4, 2] and stride [8, 1, 4] can be represented
+  // as an uint8 tensor of shape [1, 2, 4, 4] and stride [32, 16, 4, 1]. In
+  // english, ignoring the Experts dimension, the original int32 tensor is
+  // simply treated as two packed [4, 4] uint8 tensor (or two [4, 1] int32
+  // tensor). The following strides setting reflects this change. Caveat: This
+  // means that the G dimension is no longer contiguous. i.e. Note that to move
+  // from G3 to G4, we need to jump along the packing dimension. The kernel
+  // handles this case.
+
+  stride_ys_e *= sizeof(int32_t);
+  stride_ys_p = T * sizeof(int32_t);  // Packing dimension
+  stride_ys_t = sizeof(int32_t);
+  stride_ys_g = 1;
+
+  LAUNCH_ON_H(uint8_t, stride_ys_e, stride_ys_t, stride_ys_g, stride_ys_p,
+              true);
+
 #endif
 }
diff --git a/tests/conftest.py b/tests/conftest.py
index 5e127e4e939e..b17081352edc 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -1384,3 +1384,16 @@ def image_urls(request, local_asset_server) -> list[str]:
     """Indirect fixture: takes a list of names, returns list of full URLs."""
     names: list[str] = request.param
     return [local_asset_server.url_for(name) for name in names]
+
+
+@pytest.fixture
+def disable_deepgemm_ue8m0(monkeypatch):
+    from vllm.utils.deep_gemm import is_deep_gemm_e8m0_used
+
+    with monkeypatch.context() as monkeypatch_ctx:
+        monkeypatch_ctx.setenv("VLLM_USE_DEEP_GEMM_E8M0", "0")
+        is_deep_gemm_e8m0_used.cache_clear()
+        yield
+        # Clear cache so the next time it is used it is processed with the
+        # default VLLM_USE_DEEP_GEMM_E8M0  setting.
+        is_deep_gemm_e8m0_used.cache_clear()
diff --git a/tests/kernels/moe/test_deepep_deepgemm_moe.py b/tests/kernels/moe/test_deepep_deepgemm_moe.py
index 9d039b81690a..0faf8bc95d2e 100644
--- a/tests/kernels/moe/test_deepep_deepgemm_moe.py
+++ b/tests/kernels/moe/test_deepep_deepgemm_moe.py
@@ -21,7 +21,11 @@
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_experts
 from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
 from vllm.platforms import current_platform
-from vllm.utils.deep_gemm import is_deep_gemm_e8m0_used, is_deep_gemm_supported
+from vllm.utils.deep_gemm import (
+    get_mk_alignment_for_contiguous_layout,
+    is_deep_gemm_e8m0_used,
+    is_deep_gemm_supported,
+)
 from vllm.utils.import_utils import has_deep_ep, has_deep_gemm
 
 from ...utils import multi_gpu_test
@@ -413,19 +417,16 @@ def _test_deepep_deepgemm_moe(
 @multi_gpu_test(num_gpus=2)
 @requires_deep_ep
 @requires_deep_gemm
-@pytest.mark.skipif(
-    is_deep_gemm_e8m0_used(), reason="Skipping test for Blackwell DeepGEMM"
-)
 def test_ht_deepep_deepgemm_moe(
     mnk: tuple[int, int, int],
     num_experts: int,
     topk: int,
     world_dp_size: tuple[int, int],
+    disable_deepgemm_ue8m0,
 ):
     """
     Tests for High-Throughput DeepEP + DeepGemm integration.
     """
-    import deep_gemm
 
     m, n, k = mnk
     current_platform.seed_everything(7)
@@ -433,7 +434,7 @@ def test_ht_deepep_deepgemm_moe(
     if topk > num_experts:
         pytest.skip(f"Skipping test: topk={topk} > E={num_experts}")
 
-    block_m = deep_gemm.get_m_alignment_for_contiguous_layout()
+    block_m = get_mk_alignment_for_contiguous_layout()[0]
     block_size = [block_m, block_m]
 
     world_size, dp_size = world_dp_size
@@ -487,9 +488,6 @@ def test_ht_deepep_deepgemm_moe(
 @multi_gpu_test(num_gpus=2)
 @requires_deep_ep
 @requires_deep_gemm
-@pytest.mark.skipif(
-    is_deep_gemm_e8m0_used(), reason="Skipping test for Blackwell DeepGEMM"
-)
 def test_ll_deepep_deepgemm_moe(
     mnk: tuple[int, int, int],
     num_experts: int,
@@ -497,10 +495,12 @@ def test_ll_deepep_deepgemm_moe(
     use_fp8_dispatch: bool,
     block_size: list[int],
     world_dp_size: tuple[int, int],
+    disable_deepgemm_ue8m0,
 ):
     """
     Tests for Low-Latency DeepEP + DeepGemm integration.
     """
+    assert not is_deep_gemm_e8m0_used()
 
     m, n, k = mnk
     current_platform.seed_everything(7)
diff --git a/tests/kernels/moe/test_deepep_moe.py b/tests/kernels/moe/test_deepep_moe.py
index b49319a7e6f5..d78b8250463a 100644
--- a/tests/kernels/moe/test_deepep_moe.py
+++ b/tests/kernels/moe/test_deepep_moe.py
@@ -294,7 +294,7 @@ def torch_moe_impl(
         # blockwise quant and de-quant.
         assert not per_act_token_quant
         a = test_tensors.rank_tokens
-        aq, aq_scale = per_token_group_quant_fp8(a, 128)
+        aq, aq_scale = per_token_group_quant_fp8(a, 128, use_ue8m0=False)
         a = (
             (aq.view(-1, 128).to(torch.float32) * aq_scale.view(-1, 1))
             .view(a.shape)
diff --git a/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py b/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
index 420dbbffaac0..d6b78dd2c232 100644
--- a/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
+++ b/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
@@ -1,6 +1,9 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+
+import random
+
 import pytest
 import torch
 
@@ -8,27 +11,30 @@
     persistent_masked_m_silu_mul_quant,
 )
 from vllm.platforms import current_platform
-from vllm.utils.math_utils import cdiv
+from vllm.utils.deep_gemm import DeepGemmQuantScaleFMT, has_deep_gemm
+from vllm.utils.math_utils import cdiv, round_up
 
 fp8_dtype = torch.float8_e4m3fn
 
 CASES = [
     (1, 1, 128, fp8_dtype),
-    (1, 4, 128, fp8_dtype),
-    (2, 4, 256, fp8_dtype),
-    (32, 64, 256, fp8_dtype),
-    (17, 31, 768, fp8_dtype),
-    (1, 1, 128 * 1, fp8_dtype),
-    (1, 1, 128 * 3, fp8_dtype),
-    (1, 1, 128 * 4, fp8_dtype),
-    (8, 16, 128 * 1, fp8_dtype),
-    (8, 16, 128 * 2, fp8_dtype),
-    (8, 16, 128 * 3, fp8_dtype),
+    (1, 4, 128 * 1, fp8_dtype),
+    (2, 4, 128 * 2, fp8_dtype),
+    (1, 4, 128 * 3, fp8_dtype),
+    (8, 16, 128 * 4, fp8_dtype),
+    (8, 16, 128 * 5, fp8_dtype),
+    (8, 16, 128 * 6, fp8_dtype),
+    (8, 16, 128 * 7, fp8_dtype),
+    (8, 16, 128 * 8, fp8_dtype),
+    (8, 16, 128 * 9, fp8_dtype),
     (8, 64, 7168, fp8_dtype),
     (8, 128, 128 * 33, fp8_dtype),
+    (1, 4, 128 * 10, fp8_dtype),
     (8, 128, 7168, fp8_dtype),
     (8, 512, 7168, fp8_dtype),
     (8, 1024, 7168, fp8_dtype),
+    (17, 31, 768, fp8_dtype),
+    (32, 64, 256, fp8_dtype),
     (256, 8, 7168, fp8_dtype),
     (256, 32, 7168, fp8_dtype),
     (256, 64, 7168, fp8_dtype),
@@ -38,14 +44,159 @@
 ]
 
 
+def as_uint8(x) -> torch.Tensor:
+    return (
+        torch.empty(x.shape, dtype=x.dtype, device=x.device).copy_(x).view(torch.uint8)
+    )
+
+
+def silu(x: torch.Tensor) -> torch.Tensor:
+    one_f32 = torch.tensor([1.0], device=x.device, dtype=torch.float32)
+    x_f32 = x.to(torch.float32)
+    act_f32 = x_f32 / (one_f32 + torch.exp(-x_f32))
+    assert act_f32.dtype == torch.float32
+    return act_f32.to(torch.bfloat16)
+
+
+def do_quant(x: torch.Tensor, group_size: int, ceil_ue8m0: bool):
+    eps_bf16 = torch.tensor([1e-10], device=x.device, dtype=torch.bfloat16)
+    one_bf16 = torch.tensor([1.0], device=x.device, dtype=torch.bfloat16)
+    fp8_max_bf16 = torch.tensor(
+        [torch.finfo(fp8_dtype).max], device=x.device, dtype=torch.bfloat16
+    )
+    fp8_min_bf16 = torch.tensor(
+        [torch.finfo(fp8_dtype).min], device=x.device, dtype=torch.bfloat16
+    )
+    fp8_max_inv = one_bf16 / fp8_max_bf16
+    assert fp8_max_inv.dtype == torch.bfloat16
+
+    assert x.size(-1) % group_size == 0
+    num_groups = x.numel() // group_size
+    x_og_shape = x.shape
+
+    x = x.to(torch.bfloat16)
+    x = x.view((-1, group_size))
+    amax = x.abs().amax(dim=1).clamp(min=eps_bf16)
+    assert amax.dtype == torch.bfloat16
+    s = amax * fp8_max_inv
+
+    if ceil_ue8m0:
+        s = torch.exp2(
+            torch.ceil(torch.log2(s).to(torch.bfloat16)).to(torch.bfloat16)
+        ).to(torch.bfloat16)
+
+    inv_s = one_bf16 / s
+    inv_s = inv_s.view((num_groups, 1))
+    xq = torch.clamp(x * inv_s, min=fp8_min_bf16.item(), max=fp8_max_bf16.item()).to(
+        fp8_dtype
+    )
+
+    xq = xq.view(x_og_shape)
+    xs = s.view((-1, xq.size(-1) // group_size))
+    return xq, xs
+
+
+def silu_mul_quant(
+    gate: torch.Tensor, up: torch.Tensor, group_size: int, ceil_ue8m0: bool
+) -> tuple[torch.Tensor, torch.Tensor]:
+    assert gate.size(-1) % group_size == 0
+    assert up.size(-1) % group_size == 0
+
+    assert gate.dtype == torch.bfloat16
+    assert up.dtype == torch.bfloat16
+
+    act_bf16 = silu(gate)
+    assert act_bf16.dtype == torch.bfloat16
+
+    # act & mul
+    a_m = act_bf16 * up
+    assert a_m.dtype == torch.bfloat16
+
+    q, s = do_quant(a_m, group_size, ceil_ue8m0)
+    return q, s
+
+
+def pack_scales(x: torch.Tensor, tokens_per_expert: torch.Tensor) -> torch.Tensor:
+    """
+    pack float32 scales into a int32 tensor
+    """
+    assert x.dtype == torch.float32
+    E, T, G = x.size()
+
+    # Add i32_padding here so we can view it as a i32 tensor later on.
+    i32_padding = round_up(G, 4) - G
+    ref_s_i8 = torch.empty((E, T, G + i32_padding), dtype=torch.uint8, device="cuda")
+    for e in range(E):
+        nt = tokens_per_expert[e].item()
+        ref_s_i8[e, :nt, :G] = x[e, :nt].view(torch.int32) >> 23
+
+    ref_s_i32 = ref_s_i8.view(torch.int32)
+
+    return ref_s_i32
+
+
+def ref_with_scale_fmt(
+    E: int,
+    T: int,
+    H: int,
+    group_size: int,
+    tokens_per_expert: torch.Tensor,
+    gate: torch.Tensor,
+    up: torch.Tensor,
+    scale_fmt: DeepGemmQuantScaleFMT,
+) -> tuple[torch.Tensor, torch.Tensor]:
+    """
+    The precision types of the operations triggered by this function
+    match closely with the kernel implementation so we compare more
+    accurately.
+    """
+    scale_dtype = (
+        torch.int32 if scale_fmt == DeepGemmQuantScaleFMT.UE8M0 else torch.float32
+    )
+    ceil_ue8m0 = scale_fmt in [
+        DeepGemmQuantScaleFMT.UE8M0,
+        DeepGemmQuantScaleFMT.FLOAT32_CEIL_UE8M0,
+    ]
+
+    ref_q = torch.empty((E, T, H), dtype=fp8_dtype, device="cuda")
+    ref_s_f32 = torch.empty(
+        (E, T, cdiv(H, group_size)), dtype=torch.float32, device="cuda"
+    )
+
+    for e in range(E):
+        nt = tokens_per_expert[e].item()
+        if nt == 0:
+            continue
+        ref_q[e, :nt], ref_s_f32[e, :nt] = silu_mul_quant(
+            gate[e, :nt], up[e, :nt], group_size, ceil_ue8m0=ceil_ue8m0
+        )
+
+    if scale_dtype == torch.float32:
+        return ref_q, ref_s_f32
+
+    assert scale_dtype == torch.int32
+    return ref_q, pack_scales(ref_s_f32, tokens_per_expert)
+
+
+def token_random(E, T, H2, tokens_per_expert):
+    """
+    Initialize each token in a random range so we test a range of
+    scale values.
+    """
+    y = torch.empty((E, T, H2), dtype=torch.bfloat16, device="cuda")
+    for e in range(E):
+        for t in range(tokens_per_expert[e].item()):
+            exp = random.choice(range(1, 20))
+            y[e, t].uniform_(-(2**exp), 2**exp)
+    return y
+
+
 @pytest.mark.parametrize("E,T,H,fp8_type", CASES)
 @torch.inference_mode()
-def test_silu_mul_fp8_quant_deep_gemm(E, T, H, fp8_type):
+def test_silu_mul_fp8_quant_deep_gemm(E: int, T: int, H: int, fp8_type: torch.dtype):
     group_size = 128
     current_platform.seed_everything(42)
 
-    # Input tensor of shape (E, T, 2*H)
-    y = torch.randn((E, T, 2 * H), dtype=torch.bfloat16, device="cuda")
     tokens_per_expert = torch.randint(
         low=0,
         high=T,
@@ -54,71 +205,83 @@ def test_silu_mul_fp8_quant_deep_gemm(E, T, H, fp8_type):
         device="cuda",
     )
 
-    # Run the SiLU V2 kernel
-    # TODO (varun): use_e8m0 is set to false as the reference impl does
-    # not handle that case.
-    y_q, y_s = persistent_masked_m_silu_mul_quant(
-        y, tokens_per_expert, group_size=group_size, use_ue8m0=False
-    )
+    # Input tensor of shape (E, T, 2*H)
+    y = token_random(E, T, 2 * H, tokens_per_expert)
 
-    torch.cuda.synchronize()
-    fp8_info = torch.finfo(fp8_dtype)
-    fp8_max = fp8_info.max
-    fp8_min = fp8_info.min
-    eps = 1e-10
+    gate = y[..., :H].to(torch.bfloat16)
+    up = y[..., H:].to(torch.bfloat16)
 
-    y1 = y[..., :H].float()
-    y2 = y[..., H:]
-    silu_x = y1 * torch.sigmoid(y1)
-    merged = silu_x * y2
+    scale_fmts = [
+        DeepGemmQuantScaleFMT.FLOAT32,
+        DeepGemmQuantScaleFMT.FLOAT32_CEIL_UE8M0,
+        DeepGemmQuantScaleFMT.UE8M0,
+    ]
 
-    for e in range(E):
-        nt = tokens_per_expert[e].item()
-        ref_s = torch.empty(
-            (T, cdiv(H, group_size)), dtype=torch.float32, device="cuda"
+    # Run the SiLU V2 kernel
+    for scale_fmt in scale_fmts:
+        y_q, y_s = persistent_masked_m_silu_mul_quant(
+            y,
+            tokens_per_expert,
+            group_size=group_size,
+            quant_scale_fmt=scale_fmt,
         )
-        ref_q = torch.empty((T, H), dtype=fp8_dtype, device="cuda")
 
-        for t in range(nt):
-            data = merged[e, t].float()
-            ref_q_row = torch.empty_like(data)
+        ref_y_q, ref_y_s = ref_with_scale_fmt(
+            E, T, H, group_size, tokens_per_expert, gate, up, scale_fmt=scale_fmt
+        )
 
-            # process full groups
-            n_full_groups = H // group_size
-            if n_full_groups > 0:
-                data_grp = data[: n_full_groups * group_size].view(
-                    n_full_groups, group_size
-                )
-                amax = data_grp.abs().amax(dim=1).clamp(min=eps)
-                scale = amax / fp8_max
-                scaled = data[: n_full_groups * group_size] / scale.repeat_interleave(
-                    group_size
-                )
-                ref_q_row[: n_full_groups * group_size] = scaled.clamp(
-                    fp8_min, fp8_max
-                ).to(fp8_dtype)
-                ref_s[t, :n_full_groups] = scale
-
-            # process remainder group
-            rem = H % group_size
-            if rem > 0:
-                data_rem = data[-rem:]
-                amax = data_rem.abs().amax().clamp(min=eps)
-                scale = amax / fp8_max
-                scaled = data_rem / scale
-                ref_q_row[-rem:] = scaled.clamp(fp8_min, fp8_max).to(fp8_dtype)
-                ref_s[t, -1] = scale
-
-            ref_q[t] = ref_q_row
-
-        y_se = y_s[e].float()
-        y_qe = y_q[e].float()
-
-        torch.testing.assert_close(
-            y_qe[:nt].to(torch.float32),
-            ref_q[:nt].to(torch.float32),
-            atol=2,
-            rtol=2e-1,
+        # deepgemm scales transform
+        dg_scales = None
+        if (
+            has_deep_gemm()
+            and current_platform.has_device_capability(100)
+            and scale_fmt == DeepGemmQuantScaleFMT.UE8M0
+        ):
+            from deep_gemm import transform_sf_into_required_layout
+
+            _q, _s = ref_with_scale_fmt(
+                E,
+                T,
+                H,
+                group_size,
+                tokens_per_expert,
+                gate,
+                up,
+                scale_fmt=DeepGemmQuantScaleFMT.FLOAT32_CEIL_UE8M0,
+            )
+            dg_scales = transform_sf_into_required_layout(
+                sf=_s,
+                mn=_q.size(1),
+                k=_q.size(2),
+                recipe=(1, 128, 128),
+                num_groups=_q.size(0),
+                is_sfa=True,
+            )
+
+        expected_scale_dtype = (
+            torch.int32 if scale_fmt == DeepGemmQuantScaleFMT.UE8M0 else torch.float32
         )
+        assert y_s.dtype == expected_scale_dtype
+        assert ref_y_s.dtype == expected_scale_dtype
 
-        torch.testing.assert_close(y_se[:nt], ref_s[:nt], atol=1e-4, rtol=1e-2)
+        for e in range(E):
+            nt = tokens_per_expert[e].item()
+
+            torch.testing.assert_close(
+                y_q[e, :nt].to(torch.float32),
+                ref_y_q[e, :nt].to(torch.float32),
+            )
+
+            if scale_fmt == DeepGemmQuantScaleFMT.UE8M0:
+                G = H // group_size
+                y_s_sliced = as_uint8(y_s[e])
+                ref_s_sliced = as_uint8(ref_y_s[e])
+                torch.testing.assert_close(y_s_sliced[:nt, :G], ref_s_sliced[:nt, :G])
+                if dg_scales is not None:
+                    dg_sliced = as_uint8(dg_scales[e])
+                    torch.testing.assert_close(y_s_sliced[:nt, :G], dg_sliced[:nt, :G])
+            else:
+                torch.testing.assert_close(
+                    y_s[e, :nt],
+                    ref_y_s[e, :nt],
+                )
diff --git a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
index 869082f8231d..79c92eb48612 100644
--- a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+
 import torch
 
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
@@ -13,14 +14,33 @@
 from vllm.platforms import current_platform
 from vllm.triton_utils import tl, triton
 from vllm.utils.deep_gemm import (
+    DeepGemmQuantScaleFMT,
     fp8_m_grouped_gemm_nt_masked,
     get_mk_alignment_for_contiguous_layout,
     is_deep_gemm_e8m0_used,
 )
+from vllm.utils.math_utils import cdiv
 
 logger = init_logger(__name__)
 
 
+def scales_shape_stride_dtype(
+    E: int, T: int, G: int, quant_scale_fmt: DeepGemmQuantScaleFMT
+) -> tuple[tuple[int, ...], tuple[int, ...], torch.dtype]:
+    shape = (E, T, G)
+    strides = (T * G, 1, T)
+    if quant_scale_fmt in [
+        DeepGemmQuantScaleFMT.FLOAT32,
+        DeepGemmQuantScaleFMT.FLOAT32_CEIL_UE8M0,
+    ]:
+        return shape, strides, torch.float32
+
+    assert quant_scale_fmt == DeepGemmQuantScaleFMT.UE8M0
+    shape = (E, T, cdiv(G, 4))
+    strides = (T * cdiv(G, 4), 1, T)
+    return shape, strides, torch.int32
+
+
 @triton.jit
 def _silu_mul_fp8_quant_deep_gemm(
     # Pointers ------------------------------------------------------------
@@ -49,7 +69,7 @@ def _silu_mul_fp8_quant_deep_gemm(
     eps: tl.constexpr,
     fp8_min: tl.constexpr,
     fp8_max: tl.constexpr,
-    use_ue8m0: tl.constexpr,
+    ceil_ue8m0: tl.constexpr,
     # Meta ---------------------------------------------------------------
     BLOCK: tl.constexpr,
     NUM_STAGES: tl.constexpr,
@@ -86,7 +106,7 @@ def _silu_mul_fp8_quant_deep_gemm(
         y = gate * up
 
         y_s = tl.maximum(tl.max(tl.abs(y)), eps) / fp8_max
-        if use_ue8m0:
+        if ceil_ue8m0:
             y_s = tl.exp2(tl.ceil(tl.log2(y_s)))
 
         y_q = tl.clamp(y / y_s, fp8_min, fp8_max).to(y_q_ptr.dtype.element_ty)
@@ -100,7 +120,7 @@ def persistent_masked_m_silu_mul_quant(
     tokens_per_expert: torch.Tensor,  # (E,) number of valid tokens per expert
     num_parallel_tokens=16,
     group_size: int = 128,
-    use_ue8m0: bool | None = None,
+    quant_scale_fmt: DeepGemmQuantScaleFMT = DeepGemmQuantScaleFMT.FLOAT32,
 ) -> tuple[torch.Tensor, torch.Tensor]:
     """Quantize silu(y[..., :H]) * y[..., H:] to FP8 with group per-token scales
     y has shape (E, T, 2*H). The first half of the last dimension is
@@ -137,7 +157,13 @@ def persistent_masked_m_silu_mul_quant(
 
     Returns `(y_q, y_s)` where
     * `y_q`: FP8 tensor, shape (E, T, H), same layout as y[..., :H]
-    * `y_s`: FP32 tensor, shape (E, T, H // group_size), strides (T*G, 1, T)
+    * `y_s` depends on quant_scale_fmt,
+      - quant_scale_fmt == FLOAT32,
+         `y_s`: FP32 tensor, shape (E, T, H // group_size), strides (T*G, 1, T)
+      - quant_scale_fmt == E8M0,
+         `y_s`: Int32 tensor, shape (E, T, H // group_size // 4), strides (T*G, 1, T)
+      - quant_scale_fmt == E8M0_FLOAT32_SPARSE
+         `y_s`: FP32 tensor, shape (E, T, H // group_size), strides (T*G, 1, T)
     Let NUM_WARPS be the number of warps in a single thread block and
     `GROUP_SIZE = 128` be the size of the quantization group.
     """
@@ -155,17 +181,18 @@ def persistent_masked_m_silu_mul_quant(
     fp8_dtype = torch.float8_e4m3fn
     y_q = torch.empty((E, T, H), dtype=fp8_dtype, device=y.device)
 
-    stride_ys_e = T * G
-    stride_ys_t = 1
-    stride_ys_g = T
+    ys_shape, ys_strides, ys_dtype = scales_shape_stride_dtype(E, T, G, quant_scale_fmt)
     y_s = torch.empty_strided(
-        (E, T, G),
-        (stride_ys_e, stride_ys_t, stride_ys_g),
-        dtype=torch.float32,
+        ys_shape,
+        ys_strides,
+        dtype=ys_dtype,
         device=y.device,
     )
 
-    use_ue8m0 = use_ue8m0 if use_ue8m0 is not None else is_deep_gemm_e8m0_used()
+    ceil_ue8m0 = quant_scale_fmt in [
+        DeepGemmQuantScaleFMT.FLOAT32_CEIL_UE8M0,
+        DeepGemmQuantScaleFMT.UE8M0,
+    ]
 
     cuda_arch = current_platform.get_device_capability(
         device_id=y.device.index
@@ -173,7 +200,7 @@ def persistent_masked_m_silu_mul_quant(
 
     if cuda_arch >= 80:
         torch.ops._C.persistent_masked_m_silu_mul_quant(
-            y, tokens_per_expert, y_q, y_s, use_ue8m0
+            y, tokens_per_expert, y_q, y_s, ceil_ue8m0
         )
     else:
         stride_cnt_e = tokens_per_expert.stride()[0]
@@ -189,6 +216,10 @@ def persistent_masked_m_silu_mul_quant(
         fp8_max = f_info.max
         fp8_min = f_info.min
         eps: float = 1e-10
+        assert y_s.dtype == torch.float32, (
+            "_silu_mul_fp8_quant_deep_gemm does"
+            "not support {y_s.dtype} scales. Only torch.float32 supported."
+        )
         _silu_mul_fp8_quant_deep_gemm[grid](
             y,
             y_q,
@@ -202,14 +233,14 @@ def persistent_masked_m_silu_mul_quant(
             stride_yq_e,
             stride_yq_t,
             stride_yq_h,
-            stride_ys_e,
-            stride_ys_t,
-            stride_ys_g,
+            ys_strides[0],
+            ys_strides[1],
+            ys_strides[2],
             stride_cnt_e,
             eps,
             fp8_min,
             fp8_max,
-            is_deep_gemm_e8m0_used(),
+            ceil_ue8m0,
             BLOCK=group_size,
             NUM_STAGES=4,
             num_warps=1,
@@ -255,7 +286,7 @@ def supports_packed_ue8m0_act_scales(self) -> bool:
         """
         DeepGemm supports packed ue8m0 activation scales format in devices == sm100
         """
-        return current_platform.is_device_capability(100)
+        return is_deep_gemm_e8m0_used() and current_platform.is_device_capability(100)
 
     def finalize_weight_and_reduce_impl(self) -> mk.TopKWeightAndReduce:
         # Let PrepareAndFinalize::finalize() decide the impl.
@@ -329,10 +360,17 @@ def apply(
             expected_m,
         )
 
+        quant_scale_fmt = DeepGemmQuantScaleFMT.from_oracle()
         a2q, a2q_scale = persistent_masked_m_silu_mul_quant(
-            workspace1, expert_num_tokens
+            workspace1,
+            expert_num_tokens,
+            quant_scale_fmt=quant_scale_fmt,
         )
 
         fp8_m_grouped_gemm_nt_masked(
-            (a2q, a2q_scale), (w2, self.w2_scale), output, expert_num_tokens, expected_m
+            (a2q, a2q_scale),
+            (w2, self.w2_scale),
+            output,
+            expert_num_tokens,
+            expected_m,
         )
diff --git a/vllm/utils/deep_gemm.py b/vllm/utils/deep_gemm.py
index 4c15baf7a8f9..b5ab37534dd7 100644
--- a/vllm/utils/deep_gemm.py
+++ b/vllm/utils/deep_gemm.py
@@ -9,6 +9,7 @@
 import importlib
 import os
 from collections.abc import Callable
+from enum import Enum
 from typing import Any, NoReturn
 
 import torch
@@ -20,6 +21,28 @@
 from vllm.utils.math_utils import cdiv
 
 
+class DeepGemmQuantScaleFMT(Enum):
+    # Float32 scales in Float32 tensor
+    FLOAT32 = 0
+    # Compute float32 scales and ceil the scales to UE8M0.
+    # Keep the scales in Float32 tensor.
+    FLOAT32_CEIL_UE8M0 = 1
+    # Compute float32 scales and ceil the scales to UE8M0.
+    # Pack the scales into a int32 tensor where each int32
+    # element contains 4 scale values.
+    UE8M0 = 2
+
+    @staticmethod
+    def from_oracle() -> "DeepGemmQuantScaleFMT":
+        if not is_deep_gemm_e8m0_used():
+            return DeepGemmQuantScaleFMT.FLOAT32
+        return (
+            DeepGemmQuantScaleFMT.UE8M0
+            if current_platform.is_device_capability(100)
+            else DeepGemmQuantScaleFMT.FLOAT32_CEIL_UE8M0
+        )
+
+
 @functools.cache
 def is_deep_gemm_supported() -> bool:
     """Return `True` if DeepGEMM is supported on the current platform.

From 119c4927b33f78cb8bb2283a57ee0e3a14021777 Mon Sep 17 00:00:00 2001
From: Yannick Schnider <Yannick.Schnider1@ibm.com>
Date: Thu, 13 Nov 2025 19:18:47 +0100
Subject: [PATCH 163/183] [Bugfix] Fix validate model input for decoder models
 (#27099)

Signed-off-by: Yannick Schnider <yannick.schnider1@ibm.com>
Signed-off-by: Yannick Schnider <Yannick.Schnider1@ibm.com>
Signed-off-by: Michael Goin <mgoin64@gmail.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Co-authored-by: Michael Goin <mgoin64@gmail.com>
Co-authored-by: Roger Wang <hey@rogerw.io>
---
 tests/v1/e2e/test_context_length.py | 63 +++++++++++++++++++++++++++++
 vllm/v1/engine/processor.py         | 15 +++++++
 2 files changed, 78 insertions(+)
 create mode 100644 tests/v1/e2e/test_context_length.py

diff --git a/tests/v1/e2e/test_context_length.py b/tests/v1/e2e/test_context_length.py
new file mode 100644
index 000000000000..0ac40bec35fe
--- /dev/null
+++ b/tests/v1/e2e/test_context_length.py
@@ -0,0 +1,63 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""
+Tests for vLLM `vllm/v1/engine/processor.Processor._validate_model_input()`
+handling of maximum context length for decoder models.
+
+This test ensures:
+- A prompt that is one token shorter than the model's maximum context length
+  can be processed successfully when requesting one additional token.
+- A prompt that reaches the model's maximum context length throws a
+  `ValueError` when requesting at least one additional token.
+"""
+
+import pytest
+
+from tests.conftest import VllmRunner
+from tests.utils import create_new_process_for_each_test
+
+
+@create_new_process_for_each_test()
+@pytest.mark.parametrize("model, max_model_len", [("JackFram/llama-160m", 2048)])
+@pytest.mark.parametrize(
+    "prompt_len, max_tokens",
+    [
+        (2047, 1),  # prompt_len = max_model_len - 1 -> allowed
+        (2048, 1),  # prompt_len = max_model_len -> not allowed
+    ],
+)
+def test_decoder_max_context_length_validation(
+    model: str,
+    max_model_len: int,
+    vllm_runner: type[VllmRunner],
+    prompt_len: int,
+    max_tokens: int,
+) -> None:
+    """Check vLLM decoder model input validation for edge cases where
+    the prompt length is (almost) equal to the max model length."""
+
+    prompt_ids = [[43] * prompt_len]
+
+    with vllm_runner(
+        model_name=model,
+        tokenizer_name=model,
+        max_model_len=max_model_len,
+        max_num_seqs=1,
+        tensor_parallel_size=1,
+    ) as vllm_model:
+        if prompt_len + max_tokens <= max_model_len:
+            # Should succeed as constraints are met
+            vllm_model.generate_greedy(prompt_ids, max_tokens)
+        else:
+            # Should raise the ValueError defined in
+            # vllm/v1/engine/processor.Processor_validate_model_input()
+            expected_msg = (
+                f"The decoder prompt (length {prompt_len}) plus the number of "
+                f"requested output tokens (at least 1) is longer than "
+                f"the maximum model length of {max_model_len}. "
+                "Make sure that `max_model_len` is no smaller than the number of "
+                "text tokens (prompt + requested output tokens)."
+            )
+            with pytest.raises(ValueError) as excinfo:
+                vllm_model.generate_greedy(prompt_ids, max_tokens)
+            assert expected_msg in str(excinfo.value)
diff --git a/vllm/v1/engine/processor.py b/vllm/v1/engine/processor.py
index f2d992403e1a..69509d5d4712 100644
--- a/vllm/v1/engine/processor.py
+++ b/vllm/v1/engine/processor.py
@@ -575,6 +575,21 @@ def _validate_model_input(
             # check that chunked prefill does not truncate them
             # max_batch_len = self.scheduler_config.max_num_batched_tokens
 
+        if (
+            prompt_len == max_prompt_len
+            and prompt_type == "decoder"
+            and not model_config.is_multimodal_model
+        ):
+            suggestion = (
+                "Make sure that `max_model_len` is no smaller than the "
+                "number of text tokens (prompt + requested output tokens)."
+            )
+            raise ValueError(
+                f"The {prompt_type} prompt (length {prompt_len}) plus the number of "
+                f"requested output tokens (at least 1) is longer than the maximum "
+                f"model length of {max_prompt_len}. {suggestion}"
+            )
+
     def stat_mm_cache(self) -> MultiModalCacheStats | None:
         return self.input_preprocessor.stat_mm_cache()
 

From f9f3b596f374c4a01acef275ee1f35398bb05164 Mon Sep 17 00:00:00 2001
From: Matthew Bonanni <mbonanni@redhat.com>
Date: Thu, 13 Nov 2025 12:20:01 -0600
Subject: [PATCH 164/183] [Attention][Bugfix] Fix FA sink support (#28660)

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
---
 vllm/v1/attention/backends/flash_attn.py | 6 ++++++
 1 file changed, 6 insertions(+)

diff --git a/vllm/v1/attention/backends/flash_attn.py b/vllm/v1/attention/backends/flash_attn.py
index bfb4a45c2b56..81623549ae85 100755
--- a/vllm/v1/attention/backends/flash_attn.py
+++ b/vllm/v1/attention/backends/flash_attn.py
@@ -130,6 +130,12 @@ def supports_kv_cache_dtype(cls, kv_cache_dtype: CacheDType | None) -> bool:
             return flash_attn_supports_fp8()
         return kv_cache_dtype in ["auto"]
 
+    @classmethod
+    def supports_sink(cls) -> bool:
+        if not is_flash_attn_varlen_func_available():
+            return False
+        return flash_attn_supports_sinks()
+
     @classmethod
     def supports_compute_capability(cls, capability: DeviceCapability) -> bool:
         return capability >= DeviceCapability(8, 0)

From 5d6ce2b9601f3251487e44eb9e00c098101c4af6 Mon Sep 17 00:00:00 2001
From: elvischenv <219235043+elvischenv@users.noreply.github.com>
Date: Fri, 14 Nov 2025 02:21:25 +0800
Subject: [PATCH 165/183] [Perf] Support stream interval for reducing host
 overhead (#27869)

Signed-off-by: elvischenv <219235043+elvischenv@users.noreply.github.com>
Co-authored-by: Nick Hill <nhill@redhat.com>
---
 tests/v1/engine/test_output_processor.py | 18 ++++++++++--
 vllm/config/scheduler.py                 |  6 ++++
 vllm/engine/arg_utils.py                 |  6 ++++
 vllm/v1/engine/async_llm.py              |  3 +-
 vllm/v1/engine/llm_engine.py             |  3 +-
 vllm/v1/engine/output_processor.py       | 36 +++++++++++++++++++++++-
 6 files changed, 67 insertions(+), 5 deletions(-)

diff --git a/tests/v1/engine/test_output_processor.py b/tests/v1/engine/test_output_processor.py
index d77a119ec60f..8e1198b315bd 100644
--- a/tests/v1/engine/test_output_processor.py
+++ b/tests/v1/engine/test_output_processor.py
@@ -49,10 +49,15 @@ def _ref_convert_id_to_token(
 @pytest.mark.parametrize(
     "request_output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY]
 )
+@pytest.mark.parametrize("stream_interval", [1, 5, 10])
 def test_incremental_detokenization(
-    request_output_kind: RequestOutputKind, dummy_test_vectors
+    request_output_kind: RequestOutputKind,
+    stream_interval: int,
+    dummy_test_vectors,
 ):
-    output_processor = OutputProcessor(dummy_test_vectors.tokenizer, log_stats=False)
+    output_processor = OutputProcessor(
+        dummy_test_vectors.tokenizer, log_stats=False, stream_interval=stream_interval
+    )
     engine_core = MockEngineCore(tokens_list=dummy_test_vectors.generation_tokens)
 
     # Make N requests.
@@ -104,9 +109,18 @@ def test_incremental_detokenization(
             if request_id not in gen_strings:
                 gen_strings[request_id] = new_text
                 gen_tokens[request_id] = new_tokens
+                if request_output_kind == RequestOutputKind.DELTA:
+                    assert len(new_tokens) == 1, f"{len(new_tokens)=}"
             else:
                 gen_strings[request_id] += new_text
                 gen_tokens[request_id].extend(new_tokens)
+                if (
+                    request_output_kind == RequestOutputKind.DELTA
+                    and not request_output.finished
+                ):
+                    assert len(new_tokens) >= stream_interval, (
+                        f"{len(new_tokens)=}, {stream_interval=}"
+                    )
 
     # Confirmed tracked values matches what we expected.
     for idx, (ref_gen_str, ref_gen_toks) in enumerate(
diff --git a/vllm/config/scheduler.py b/vllm/config/scheduler.py
index 47aa343527b3..71a06e167fd9 100644
--- a/vllm/config/scheduler.py
+++ b/vllm/config/scheduler.py
@@ -142,6 +142,12 @@ class SchedulerConfig:
     speculative decoding and pipeline parallelism.
     """
 
+    stream_interval: int = Field(default=1, ge=1)
+    """The interval (or buffer size) for streaming in terms of token length.
+    A smaller value (1) makes streaming smoother by sending each token immediately,
+    while a larger value (e.g., 10) reduces host overhead and may increase throughput
+    by batching multiple tokens before sending."""
+
     def get_scheduler_cls(self) -> type["SchedulerInterface"]:
         if self.scheduler_cls is None:
             if self.async_scheduling:
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index ca7f5e5e3e05..b025004ea022 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -558,6 +558,8 @@ class EngineArgs:
 
     async_scheduling: bool | None = SchedulerConfig.async_scheduling
 
+    stream_interval: int = SchedulerConfig.stream_interval
+
     kv_sharing_fast_prefill: bool = CacheConfig.kv_sharing_fast_prefill
 
     kv_offloading_size: float | None = CacheConfig.kv_offloading_size
@@ -1067,6 +1069,9 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
         scheduler_group.add_argument(
             "--async-scheduling", **scheduler_kwargs["async_scheduling"]
         )
+        scheduler_group.add_argument(
+            "--stream-interval", **scheduler_kwargs["stream_interval"]
+        )
 
         # Compilation arguments
         compilation_kwargs = get_kwargs(CompilationConfig)
@@ -1562,6 +1567,7 @@ def create_engine_config(
             long_prefill_token_threshold=self.long_prefill_token_threshold,
             disable_hybrid_kv_cache_manager=self.disable_hybrid_kv_cache_manager,
             async_scheduling=self.async_scheduling,
+            stream_interval=self.stream_interval,
         )
 
         if not model_config.is_multimodal_model and self.default_mm_loras:
diff --git a/vllm/v1/engine/async_llm.py b/vllm/v1/engine/async_llm.py
index aee21fb3fffe..48ea6ef8515c 100644
--- a/vllm/v1/engine/async_llm.py
+++ b/vllm/v1/engine/async_llm.py
@@ -120,8 +120,9 @@ def __init__(
         )
 
         # OutputProcessor (converts EngineCoreOutputs --> RequestOutput).
+        stream_interval = self.vllm_config.scheduler_config.stream_interval
         self.output_processor = OutputProcessor(
-            self.tokenizer, log_stats=self.log_stats
+            self.tokenizer, log_stats=self.log_stats, stream_interval=stream_interval
         )
         endpoint = self.observability_config.otlp_traces_endpoint
         if endpoint is not None:
diff --git a/vllm/v1/engine/llm_engine.py b/vllm/v1/engine/llm_engine.py
index 6224af5700b7..1db83446ba0b 100644
--- a/vllm/v1/engine/llm_engine.py
+++ b/vllm/v1/engine/llm_engine.py
@@ -96,8 +96,9 @@ def __init__(
         )
 
         # OutputProcessor (convert EngineCoreOutputs --> RequestOutput).
+        stream_interval = self.vllm_config.scheduler_config.stream_interval
         self.output_processor = OutputProcessor(
-            self.tokenizer, log_stats=self.log_stats
+            self.tokenizer, log_stats=self.log_stats, stream_interval=stream_interval
         )
         endpoint = self.observability_config.otlp_traces_endpoint
         if endpoint is not None:
diff --git a/vllm/v1/engine/output_processor.py b/vllm/v1/engine/output_processor.py
index d8d03f19d466..bdbbfe2595f8 100644
--- a/vllm/v1/engine/output_processor.py
+++ b/vllm/v1/engine/output_processor.py
@@ -104,6 +104,7 @@ def __init__(
         arrival_time: float,
         queue: RequestOutputCollector | None,
         log_stats: bool,
+        stream_interval: int,
         top_p: float | None = None,
         n: int | None = None,
         temperature: float | None = None,
@@ -131,6 +132,10 @@ def __init__(
 
         self.stats = RequestStateStats(arrival_time=arrival_time) if log_stats else None
 
+        # Stream Interval
+        self.stream_interval = stream_interval
+        self.sent_tokens_offset = 0  # Offset of sent tokens
+
     @classmethod
     def from_new_request(
         cls,
@@ -141,6 +146,7 @@ def from_new_request(
         request_index: int,
         queue: RequestOutputCollector | None,
         log_stats: bool,
+        stream_interval: int,
     ) -> "RequestState":
         if sampling_params := request.sampling_params:
             if not sampling_params.detokenize:
@@ -188,6 +194,7 @@ def from_new_request(
             arrival_time=request.arrival_time,
             queue=queue,
             log_stats=log_stats,
+            stream_interval=stream_interval,
         )
 
     def make_request_output(
@@ -205,6 +212,29 @@ def make_request_output(
             # Only the final output is required in FINAL_ONLY mode.
             return None
 
+        if self.stream_interval > 1:
+            assert self.detokenizer is not None
+
+            # Send output request only when
+            # 1. It has finished, or
+            # 2. It is the first token, or
+            # 3. It has reached the stream interval number of tokens
+            if not (
+                finished
+                or self.sent_tokens_offset == 0
+                or len(self.detokenizer.output_token_ids) - self.sent_tokens_offset
+                >= self.stream_interval
+            ):
+                return None
+
+            if self.output_kind == RequestOutputKind.DELTA:
+                # Send tokens from the offset in DELTA mode, otherwise all
+                # tokens are sent.
+                new_token_ids = self.detokenizer.output_token_ids[
+                    self.sent_tokens_offset :
+                ]
+                self.sent_tokens_offset = len(self.detokenizer.output_token_ids)
+
         request_id = self.request_id
         if pooling_output is not None:
             return self._new_request_output(
@@ -310,9 +340,12 @@ def _new_pooling_output(
 class OutputProcessor:
     """Process EngineCoreOutputs into RequestOutputs."""
 
-    def __init__(self, tokenizer: AnyTokenizer, log_stats: bool):
+    def __init__(
+        self, tokenizer: AnyTokenizer, log_stats: bool, stream_interval: int = 1
+    ):
         self.log_stats = log_stats
         self.tokenizer = tokenizer
+        self.stream_interval = stream_interval
         self.request_states: dict[str, RequestState] = {}
         self.parent_requests: dict[str, ParentRequest] = {}
         self.lora_states = LoRARequestStates(log_stats)
@@ -385,6 +418,7 @@ def add_request(
             request_index=request_index,
             queue=queue,
             log_stats=self.log_stats,
+            stream_interval=self.stream_interval,
         )
         self.request_states[request_id] = req_state
         if parent_req:

From 968060c15adc0b68a76d37db00acf1273a23b829 Mon Sep 17 00:00:00 2001
From: Qiu <qiuchunshuo@huawei.com>
Date: Fri, 14 Nov 2025 03:29:22 +0800
Subject: [PATCH 166/183] [bugfix] correct local_chunk_len for DCP in
 reorg_kvcache with long context (#28526)

Signed-off-by: QiuChunshuo <qiuchunshuo@huawei.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
---
 vllm/v1/attention/backends/mla/common.py | 29 ++++++++++++++++++++----
 1 file changed, 25 insertions(+), 4 deletions(-)

diff --git a/vllm/v1/attention/backends/mla/common.py b/vllm/v1/attention/backends/mla/common.py
index 467c01cd9d06..2ccdd1f143ce 100755
--- a/vllm/v1/attention/backends/mla/common.py
+++ b/vllm/v1/attention/backends/mla/common.py
@@ -337,6 +337,7 @@ class ChunkedContextMetadata:
         local_context_lens_allranks: list[list[int]] | None = None
         padded_local_cu_seq_lens: torch.Tensor | None = None
         cu_seq_lens_lst: list[list[int]] | None = None
+        chunk_size: int | None = None
 
     block_table: torch.Tensor
     query_start_loc: torch.Tensor
@@ -902,6 +903,7 @@ def build(
                             device, non_blocking=True
                         ),
                         cu_seq_lens_lst=cu_seq_lens_cpu.tolist(),
+                        chunk_size=padded_local_max_context_chunk_across_ranks,
                     )
                 else:
                     chunked_context_metadata = chunked_context_metadata_cls(
@@ -986,6 +988,8 @@ def reorg_kvcache(
     local_context_lens_allranks: list[list[int]],
     sum_seq_len: int,
     max_seq_len: int,
+    chunk_size: int,
+    chunk_idx: int,
     toks: int,
 ) -> tuple[torch.Tensor, torch.Tensor]:
     """
@@ -1001,6 +1005,9 @@ def reorg_kvcache(
         local_context_lens_allranks: local context lengths on each CP rank.
         sum_seq_len: the sum of cp_chunk_seq_lens_lst.
         max_seq_len: the max value of cp_chunk_seq_lens_lst.
+        chunk_size: the local padded max context chunk from
+            chunked_context_metadata building.
+        chunk_idx: chunk idx of chunked_prefill.
         toks: the number of tokens for local gather cache.
     """
     kv_c_segments = []
@@ -1012,20 +1019,31 @@ def reorg_kvcache(
     ):
         cur_seq_len = 0
         for rank, local_context_len in enumerate(local_context_lens):
-            if local_context_len != 0:
+            # Note(qcs): We split the context into multiple chunks,
+            # depending on the size of the workspace.
+            # local_context in dcp0:   |-----------------|
+            # local_context in dcp1:   |--------------|
+            # n*padded_local_chunk:    |-----|-----|-----|
+            # local_chunk_len in dcp1: |-----|-----|--|
+            # so we need update the last chunk length in dcp1.
+            local_chunk_len = min(
+                max(0, local_context_len - chunk_idx * chunk_size),
+                padded_local_chunk_seq_len,
+            )
+            if local_chunk_len != 0:
                 kv_c_segment = allgatered_kv_c_normed[
                     rank * toks + src_token_idx : rank * toks
                     + src_token_idx
-                    + local_context_len
+                    + local_chunk_len
                 ]
                 k_pe_segment = allgatered_k_pe[
                     rank * toks + src_token_idx : rank * toks
                     + src_token_idx
-                    + local_context_len
+                    + local_chunk_len
                 ]
                 kv_c_segments.append(kv_c_segment)
                 k_pe_segments.append(k_pe_segment)
-                cur_seq_len += local_context_len
+                cur_seq_len += local_chunk_len
         max_seq_len_check = max(max_seq_len_check, cur_seq_len)
         src_token_idx += padded_local_chunk_seq_len
     reorganized_kv_c_normed = torch.cat(kv_c_segments, dim=0)
@@ -1676,6 +1694,7 @@ def _context_parallel_compute_prefill_context(
         assert prefill_metadata.chunked_context.local_context_lens_allranks is not None
         assert prefill_metadata.chunked_context.padded_local_cu_seq_lens is not None
         assert prefill_metadata.chunked_context.cu_seq_lens_lst is not None
+        assert prefill_metadata.chunked_context.chunk_size is not None
 
         output = None
         iters = len(prefill_metadata.chunked_context.seq_tot)
@@ -1725,6 +1744,8 @@ def _context_parallel_compute_prefill_context(
                 local_context_lens_allranks=prefill_metadata.chunked_context.local_context_lens_allranks,
                 sum_seq_len=prefill_metadata.chunked_context.cu_seq_lens_lst[i][-1],
                 max_seq_len=prefill_metadata.chunked_context.max_seq_lens[i],
+                chunk_size=prefill_metadata.chunked_context.chunk_size,
+                chunk_idx=i,
                 toks=toks,
             )
 

From 262d263f6c56fa95e15422d3a475da8efdf67cc1 Mon Sep 17 00:00:00 2001
From: Yanan Cao <gmagogsfm@users.noreply.github.com>
Date: Thu, 13 Nov 2025 12:09:05 -0800
Subject: [PATCH 167/183] [Bugfix] Eliminate tuple inputs to submodules in
 graph partitioning (#28533)

Signed-off-by: Yanan Cao <gmagogsfm@gmail.com>
---
 .buildkite/test-pipeline.yaml         |   1 +
 tests/compile/test_graph_partition.py | 124 ++++++++++++++++++++++++++
 vllm/compilation/backends.py          |  17 +++-
 3 files changed, 140 insertions(+), 2 deletions(-)
 create mode 100644 tests/compile/test_graph_partition.py

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index be1b79ddc432..52539728215b 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -445,6 +445,7 @@ steps:
     - vllm/
     - tests/compile
   commands:
+    - pytest -v -s compile/test_graph_partition.py
     - pytest -v -s compile/test_config.py
     - pytest -v -s compile/test_pass_manager.py
     - pytest -v -s compile/test_fusion.py
diff --git a/tests/compile/test_graph_partition.py b/tests/compile/test_graph_partition.py
new file mode 100644
index 000000000000..1cd783843a62
--- /dev/null
+++ b/tests/compile/test_graph_partition.py
@@ -0,0 +1,124 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import operator
+
+import pytest
+import torch
+from torch.fx.experimental.proxy_tensor import make_fx
+
+from vllm.compilation.backends import split_graph
+
+
+def test_getitem_moved_to_producer_subgraph():
+    """
+    Test that getitem operations are moved to the same subgraph as their input,
+    preventing tuple inputs to submodules.
+    """
+
+    def model_fn(x: torch.Tensor) -> torch.Tensor:
+        # torch.split returns a tuple, creating real getitem operations
+        # Should become first submodule that produces tuple
+        chunks = torch.split(x, x.shape[0] // 2, dim=0)
+
+        # Following ops should become second submodule that consumes tuple
+        result_0 = torch.relu(chunks[0])
+        result_1 = torch.relu(chunks[1])
+        return torch.cat([result_0, result_1], dim=0)
+
+    x = torch.randn(4, 3)
+    gm = make_fx(model_fn)(x)
+
+    has_getitem = any(
+        node.op == "call_function" and node.target == operator.getitem
+        for node in gm.graph.nodes
+    )
+    assert has_getitem, "Test setup failed: graph should contain getitem operations"
+
+    # Split on tuple producer aten::split
+    split_ops = ["aten::split.Tensor"]
+    split_gm, split_items = split_graph(gm, split_ops)
+    assert len(split_items) == 2, "Graph should be split into 2 submodules"
+
+    for split_item in split_items:
+        submodule = split_item.graph
+
+        getitem_on_placeholder = []
+        for node in submodule.graph.nodes:
+            if (
+                node.op == "call_function"
+                and node.target == operator.getitem
+                and node.args[0].op == "placeholder"
+            ):
+                getitem_on_placeholder.append(node)
+
+        assert len(getitem_on_placeholder) == 0, (
+            f"Submodule {split_item.submod_name} has getitem operations on "
+            f"placeholder nodes: {[n.name for n in getitem_on_placeholder]}. "
+            "This means tuple inputs were not properly eliminated."
+        )
+
+    new_x = torch.randn(4, 3)
+    output_original = gm(new_x)
+    output_split = split_gm(new_x)
+
+    assert torch.allclose(output_original, output_split), "Output mismatch"
+
+
+def test_no_tuple_inputs_with_multiple_consumers():
+    """
+    Test that when a tuple is consumed by multiple split operations,
+    getitem operations are properly moved to avoid tuple inputs.
+    """
+
+    def model_fn(x: torch.Tensor) -> torch.Tensor:
+        # torch.split returns a tuple, creating real getitem operations
+        # Should become first submodule that produces tuple
+        chunks = torch.split(x, x.shape[0] // 2, dim=0)
+
+        # These should become second submodule consuming tuple
+        result_1 = torch.relu(chunks[0])
+        result_2 = torch.relu(chunks[1])
+
+        # Artificial graph splitting point to create another
+        # independent submodule that consumes tuple later
+        # This would become the third submodule
+        result_1 = torch.sigmoid(result_1)
+
+        # Fourth submodule that consumes tuple
+        result = torch.cat([chunks[0], chunks[1], result_1, result_2])
+        return result
+
+    x = torch.randn(4, 3)
+    gm = make_fx(model_fn)(x)
+
+    has_getitem = any(
+        node.op == "call_function" and node.target == operator.getitem
+        for node in gm.graph.nodes
+    )
+    assert has_getitem, "Test setup failed: graph should contain getitem operations"
+
+    split_ops = ["aten::split.Tensor", "aten::sigmoid"]
+    split_gm, split_items = split_graph(gm, split_ops)
+    assert len(split_items) == 4, "Graph should be split into 4 submodules"
+
+    for split_item in split_items:
+        submodule = split_item.graph
+
+        for node in submodule.graph.nodes:
+            if (
+                node.op == "call_function"
+                and node.target == operator.getitem
+                and node.args[0].op == "placeholder"
+            ):
+                pytest.fail(
+                    f"Submodule {split_item.submod_name} has getitem on "
+                    f"placeholder {node.args[0].name}, indicating it receives "
+                    "a tuple input"
+                )
+
+    new_x = torch.randn(4, 3)
+    output_original = gm(new_x)
+    output_split = split_gm(new_x)
+
+    assert torch.allclose(output_original, output_split), "Output mismatch after split"
diff --git a/vllm/compilation/backends.py b/vllm/compilation/backends.py
index be69075f94f0..60ef6eef2166 100644
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -4,6 +4,7 @@
 import ast
 import dataclasses
 import hashlib
+import operator
 import os
 import pprint
 import time
@@ -307,12 +308,24 @@ def split_graph(
 ) -> tuple[fx.GraphModule, list[SplitItem]]:
     # split graph by ops
     subgraph_id = 0
-    node_to_subgraph_id = {}
-    split_op_graphs = []
+    node_to_subgraph_id: dict[fx.Node, int] = {}
+    split_op_graphs: list[int] = []
     for node in graph.graph.nodes:
         if node.op in ("output", "placeholder"):
             continue
 
+        # Check if this is a getitem operation on a node from an earlier subgraph.
+        # If so, assign it to the same subgraph as its input to avoid passing entire
+        # tuple as input to submodules, which is against standalone_compile and
+        # AoTAutograd input requirement.
+        if node.op == "call_function" and node.target == operator.getitem:
+            # Assign this getitem to the same subgraph as its input
+            input_node = node.args[0]
+            if input_node.op != "placeholder":
+                assert input_node in node_to_subgraph_id
+                node_to_subgraph_id[node] = node_to_subgraph_id[input_node]
+                continue
+
         if should_split(node, splitting_ops):
             subgraph_id += 1
             node_to_subgraph_id[node] = subgraph_id

From faed7bf07ec831529c5ed54e15b21e30b30dc16e Mon Sep 17 00:00:00 2001
From: Kebe <mail@kebe7jun.com>
Date: Fri, 14 Nov 2025 05:48:08 +0900
Subject: [PATCH 168/183] [Bugfix] [CPU] bump torch to 2.9.0 for Darwin to fix
 segmentation fault (#27791)

Signed-off-by: Kebe <mail@kebe7jun.com>
Signed-off-by: Michael Goin <mgoin64@gmail.com>
Co-authored-by: Michael Goin <mgoin64@gmail.com>
---
 requirements/cpu.txt | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/requirements/cpu.txt b/requirements/cpu.txt
index 605ce73bff9c..d11787df4d92 100644
--- a/requirements/cpu.txt
+++ b/requirements/cpu.txt
@@ -8,7 +8,7 @@ packaging>=24.2
 setuptools>=77.0.3,<81.0.0
 --extra-index-url https://download.pytorch.org/whl/cpu
 torch==2.8.0+cpu; platform_machine == "x86_64" or platform_machine == "s390x"
-torch==2.8.0; platform_system == "Darwin"
+torch==2.9.0; platform_system == "Darwin"
 torch==2.8.0; platform_machine == "ppc64le" or platform_machine == "aarch64"
 
 # required for the image processor of minicpm-o-2_6, this must be updated alongside torch

From 1b622deba73347f044c13fa80a09a5647d21a45c Mon Sep 17 00:00:00 2001
From: Simon Mo <simon.mo@hey.com>
Date: Thu, 13 Nov 2025 13:01:43 -0800
Subject: [PATCH 169/183] [Misc] Update CODEOWNERS for simon-mo and comaniac
 (#28675)

Signed-off-by: Simon Mo <simon.mo@hey.com>
---
 .github/CODEOWNERS | 16 ++++++++--------
 1 file changed, 8 insertions(+), 8 deletions(-)

diff --git a/.github/CODEOWNERS b/.github/CODEOWNERS
index f26c782bccf2..bfb0e91fd06e 100644
--- a/.github/CODEOWNERS
+++ b/.github/CODEOWNERS
@@ -3,8 +3,8 @@
 
 # This lists cover the "core" components of vLLM that require careful review
 /vllm/attention @LucasWilkinson
-/vllm/attention/backends/abstract.py @WoosukKwon @zhuohan123 @youkaichao @alexm-redhat @comaniac @njhill
-/vllm/executor/executor_base.py @zhuohan123 @youkaichao @alexm-redhat @comaniac @njhill @22quinn
+/vllm/attention/backends/abstract.py @WoosukKwon @zhuohan123 @youkaichao @alexm-redhat @njhill
+/vllm/executor/executor_base.py @zhuohan123 @youkaichao @alexm-redhat @njhill @22quinn
 /vllm/model_executor/layers/fused_moe @mgoin @pavanimajety
 /vllm/model_executor/layers/quantization @mgoin @robertgshaw2-redhat @tlrmchlsmth @yewentao256 @pavanimajety
 /vllm/model_executor/layers/mamba @tdoublep
@@ -20,15 +20,15 @@ CMakeLists.txt @tlrmchlsmth @LucasWilkinson
 
 # Any change to the VllmConfig changes can have a large user-facing impact,
 # so spam a lot of people
-/vllm/config @simon-mo @WoosukKwon @youkaichao @robertgshaw2-redhat @mgoin @tlrmchlsmth @houseroad @hmellor @yewentao256 @ProExpertProg
-/vllm/config/cache.py @simon-mo @WoosukKwon @youkaichao @robertgshaw2-redhat @mgoin @tlrmchlsmth @houseroad @hmellor @yewentao256 @ProExpertProg @heheda12345
+/vllm/config @WoosukKwon @youkaichao @robertgshaw2-redhat @mgoin @tlrmchlsmth @houseroad @hmellor @yewentao256 @ProExpertProg
+/vllm/config/cache.py @WoosukKwon @youkaichao @robertgshaw2-redhat @mgoin @tlrmchlsmth @houseroad @hmellor @yewentao256 @ProExpertProg @heheda12345
 
 # vLLM V1
 /vllm/v1/attention @LucasWilkinson
 /vllm/v1/attention/backends/mla @pavanimajety
 /vllm/v1/attention/backends/flashinfer.py @mgoin @pavanimajety
 /vllm/v1/attention/backends/triton_attn.py @tdoublep
-/vllm/v1/core @WoosukKwon @robertgshaw2-redhat @njhill @ywang96 @comaniac @alexm-redhat @heheda12345 @ApostaC
+/vllm/v1/core @WoosukKwon @robertgshaw2-redhat @njhill @ywang96 @alexm-redhat @heheda12345 @ApostaC
 /vllm/v1/sample @22quinn @houseroad @njhill
 /vllm/v1/spec_decode @benchislett @luccafong
 /vllm/v1/structured_output @mgoin @russellb @aarnphm @benchislett
@@ -36,11 +36,11 @@ CMakeLists.txt @tlrmchlsmth @LucasWilkinson
 /vllm/v1/offloading @ApostaC
 
 # Test ownership
-/.buildkite/lm-eval-harness @mgoin @simon-mo
+/.buildkite/lm-eval-harness @mgoin 
 /tests/distributed/test_multi_node_assignment.py @youkaichao
 /tests/distributed/test_pipeline_parallel.py @youkaichao
 /tests/distributed/test_same_node.py @youkaichao
-/tests/entrypoints @DarkLight1337 @robertgshaw2-redhat @simon-mo @aarnphm @NickLucche
+/tests/entrypoints @DarkLight1337 @robertgshaw2-redhat @aarnphm @NickLucche
 /tests/evals @mgoin
 /tests/kernels @mgoin @tlrmchlsmth @WoosukKwon @yewentao256
 /tests/models @DarkLight1337 @ywang96
@@ -49,7 +49,7 @@ CMakeLists.txt @tlrmchlsmth @LucasWilkinson
 /tests/test_inputs.py @DarkLight1337 @ywang96
 /tests/v1/entrypoints/llm/test_struct_output_generate.py @mgoin @russellb @aarnphm
 /tests/v1/structured_output @mgoin @russellb @aarnphm
-/tests/v1/core @WoosukKwon @robertgshaw2-redhat @njhill @ywang96 @comaniac @alexm-redhat @heheda12345 @ApostaC
+/tests/v1/core @WoosukKwon @robertgshaw2-redhat @njhill @ywang96 @alexm-redhat @heheda12345 @ApostaC
 /tests/weight_loading @mgoin @youkaichao @yewentao256
 /tests/lora @jeejeelee
 /tests/models/language/generation/test_hybrid.py @tdoublep

From e64011f29a63ef9c4fc67bad1fd42af4f3cfad35 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Thu, 13 Nov 2025 17:19:35 -0500
Subject: [PATCH 170/183] [CI] Bug: Fix ci entrypoint pooling (#28684)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
---
 vllm/v1/engine/processor.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/vllm/v1/engine/processor.py b/vllm/v1/engine/processor.py
index 69509d5d4712..0404f6ff2771 100644
--- a/vllm/v1/engine/processor.py
+++ b/vllm/v1/engine/processor.py
@@ -579,6 +579,7 @@ def _validate_model_input(
             prompt_len == max_prompt_len
             and prompt_type == "decoder"
             and not model_config.is_multimodal_model
+            and self.model_config.runner_type != "pooling"
         ):
             suggestion = (
                 "Make sure that `max_model_len` is no smaller than the "

From 6e25b1cddfd78eab307acdb5e3ec14475e465d90 Mon Sep 17 00:00:00 2001
From: Mark McLoughlin <markmc@redhat.com>
Date: Thu, 13 Nov 2025 23:30:59 +0000
Subject: [PATCH 171/183] [KV Connector] Test async mode in scheduler tests
 (#28550)

Signed-off-by: Mark McLoughlin <markmc@redhat.com>
---
 tests/v1/core/test_scheduler.py     | 100 ++++++++++++++++++----------
 tests/v1/core/utils.py              |  24 +++++--
 tests/v1/kv_connector/unit/utils.py |  86 +++++++++++++++++++++++-
 3 files changed, 165 insertions(+), 45 deletions(-)

diff --git a/tests/v1/core/test_scheduler.py b/tests/v1/core/test_scheduler.py
index d5b829e79b8f..d31338220fca 100644
--- a/tests/v1/core/test_scheduler.py
+++ b/tests/v1/core/test_scheduler.py
@@ -31,11 +31,11 @@
     KVCacheConfig,
     KVCacheGroupSpec,
 )
-from vllm.v1.outputs import DraftTokenIds, ModelRunnerOutput
+from vllm.v1.outputs import DraftTokenIds, KVConnectorOutput, ModelRunnerOutput
 from vllm.v1.request import Request, RequestStatus
 from vllm.v1.structured_output import StructuredOutputManager
 
-from .utils import EOS_TOKEN_ID, create_requests, create_scheduler
+from .utils import EOS_TOKEN_ID, create_requests, create_scheduler, mock_kv
 
 pytestmark = pytest.mark.cpu_test
 
@@ -888,27 +888,65 @@ def _step_until_done(
         all_finished = all_done
 
 
-def test_kv_connector_basic():
+def _step_until_kv_transfer_finished(scheduler: Scheduler, req_ids: list[str]):
+    """Cycle requests through a KV transfer cyle."""
+
+    # Requests should first transition to WAITING_FOR_REMOTE_KVS
+    output = scheduler.schedule()
+    assert len(scheduler.waiting) == len(req_ids)
+    assert len(scheduler.running) == 0
+    assert len(output.scheduled_new_reqs) == 0
+    for req in scheduler.requests.values():
+        assert req.status == RequestStatus.WAITING_FOR_REMOTE_KVS
+
+    # No model execution yet
+    EMPTY_OUTPUT = ModelRunnerOutput(
+        req_ids=[],
+        req_id_to_index={},
+        sampled_token_ids=[],
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=[],
+    )
+    scheduler.update_from_output(output, EMPTY_OUTPUT)
+
+    # Simulate KV transfer completion using KVConnectorOutput.finished_recving
+    output = scheduler.schedule()
+    assert len(scheduler.waiting) == len(req_ids)
+    assert len(scheduler.running) == 0
+
+    MODEL_RUNNER_OUTPUT = ModelRunnerOutput(
+        req_ids=[],
+        req_id_to_index={},
+        sampled_token_ids=[],
+        logprobs=None,
+        prompt_logprobs_dict={},
+        pooler_output=[],
+        kv_connector_output=KVConnectorOutput(finished_recving=req_ids),
+    )
+    scheduler.update_from_output(output, MODEL_RUNNER_OUTPUT)
+    for req_id in req_ids:
+        assert req_id in scheduler.finished_recving_kv_req_ids
+
+
+@pytest.mark.parametrize("is_async", [False, True])
+def test_kv_connector_basic(is_async: bool):
     """
     Test whether Scheduler with KVConnector schedules tokens, allocates
     memory, and cleans up requests as expected under normal operation.
     """
 
     # Setup Scheduler.
+    BLOCK_SIZE = 16
+    NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE * 2
     scheduler = create_scheduler(
         enable_prefix_caching=True,
-        use_kv_connector=True,
+        use_kv_connector=mock_kv(
+            matched_tokens=NUM_MATCHED_NEW_TOKENS, is_async=is_async
+        ),
+        block_size=BLOCK_SIZE,
     )
     NUM_TOTAL_BLOCKS = scheduler.kv_cache_manager.block_pool.get_num_free_blocks()
-    BLOCK_SIZE = scheduler.cache_config.block_size
-
-    # Mock External Cache Hit.
-    NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE * 2
-    scheduler.connector.get_num_new_matched_tokens = Mock(name="method")
-    scheduler.connector.get_num_new_matched_tokens.return_value = (
-        NUM_MATCHED_NEW_TOKENS,
-        False,
-    )
 
     ######################################################
     # FIRST SET OF REQUESTS - External Hit Only
@@ -928,6 +966,9 @@ def test_kv_connector_basic():
         req_ids.append(request.request_id)
         req_to_index[request.request_id] = i
 
+    if is_async:
+        _step_until_kv_transfer_finished(scheduler, req_ids)
+
     MODEL_RUNNER_OUTPUT = ModelRunnerOutput(
         req_ids=req_ids,
         req_id_to_index=req_to_index,
@@ -978,6 +1019,9 @@ def test_kv_connector_basic():
         req_ids.append(request.request_id)
         req_to_index[request.request_id] = i
 
+    if is_async:
+        _step_until_kv_transfer_finished(scheduler, req_ids)
+
     MODEL_RUNNER_OUTPUT = ModelRunnerOutput(
         req_ids=req_ids,
         req_id_to_index=req_to_index,
@@ -1020,17 +1064,10 @@ def test_external_prefix_cache_metrics():
     """
 
     # Setup Scheduler.
+    NUM_MATCHED_NEW_TOKENS = 4
     scheduler = create_scheduler(
         enable_prefix_caching=False,
-        use_kv_connector=True,
-    )
-
-    # Mock connector to simulate a partial external cache hit
-    NUM_MATCHED_NEW_TOKENS = 4
-    scheduler.connector.get_num_new_matched_tokens = Mock(name="method")
-    scheduler.connector.get_num_new_matched_tokens.return_value = (
-        NUM_MATCHED_NEW_TOKENS,
-        False,
+        use_kv_connector=mock_kv(matched_tokens=NUM_MATCHED_NEW_TOKENS, is_async=False),
     )
 
     # --- Prepare simple requests ---
@@ -1085,21 +1122,16 @@ def test_kv_connector_unable_to_allocate(use_ec_connector, ec_role):
     # Setup Scheduler With Mock External Cache Hit.
     BLOCK_SIZE = 4
     NUM_BLOCKS = 10
+    NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE * 2
     scheduler = create_scheduler(
         enable_prefix_caching=True,
-        use_kv_connector=True,
+        use_kv_connector=mock_kv(matched_tokens=NUM_MATCHED_NEW_TOKENS, is_async=False),
         block_size=BLOCK_SIZE,
         num_blocks=NUM_BLOCKS,
         # encoder connector should not affect test results
         use_ec_connector=use_ec_connector,
         ec_role=ec_role,
     )
-    NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE * 2
-    scheduler.connector.get_num_new_matched_tokens = Mock(name="method")
-    scheduler.connector.get_num_new_matched_tokens.return_value = (
-        NUM_MATCHED_NEW_TOKENS,
-        False,
-    )
 
     # Create two requests. The second request will not be able to
     # allocate slots because it will not have enough blocks.
@@ -1174,9 +1206,10 @@ def test_kv_connector_handles_preemption(use_ec_connector, ec_role):
     BLOCK_SIZE = 2
     # NOTE: there is 1 null block, so this is 6 blocks.
     NUM_BLOCKS = 7
+    NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE
     scheduler = create_scheduler(
         enable_prefix_caching=True,
-        use_kv_connector=True,
+        use_kv_connector=mock_kv(matched_tokens=NUM_MATCHED_NEW_TOKENS, is_async=False),
         block_size=BLOCK_SIZE,
         num_blocks=NUM_BLOCKS,
         # encoder connector should not affect test results
@@ -1184,13 +1217,6 @@ def test_kv_connector_handles_preemption(use_ec_connector, ec_role):
         ec_role=ec_role,
     )
 
-    NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE
-    scheduler.connector.get_num_new_matched_tokens = Mock(name="method")
-    scheduler.connector.get_num_new_matched_tokens.return_value = (
-        NUM_MATCHED_NEW_TOKENS,
-        False,
-    )
-
     # Create two requests.
     # Both can be scheduled at first, but the second request
     # will be preempted and re-scheduled.
diff --git a/tests/v1/core/utils.py b/tests/v1/core/utils.py
index 3692e633322e..65511c17473b 100644
--- a/tests/v1/core/utils.py
+++ b/tests/v1/core/utils.py
@@ -3,6 +3,7 @@
 
 import torch
 
+from tests.v1.kv_connector.unit.utils import MockKVConfig
 from vllm.config import (
     CacheConfig,
     ECTransferConfig,
@@ -33,6 +34,10 @@
 EOS_TOKEN_ID = 50256
 
 
+def mock_kv(matched_tokens: int, is_async: bool):
+    return MockKVConfig(matched_tokens=matched_tokens, is_async=is_async)
+
+
 def create_scheduler(
     model: str = "facebook/opt-125m",
     max_num_seqs: int = 16,
@@ -40,7 +45,7 @@ def create_scheduler(
     enable_prefix_caching: bool | None = None,
     long_prefill_token_threshold: int = 0,
     disable_chunked_mm_input: bool = False,
-    use_kv_connector: bool = False,
+    use_kv_connector: None | bool | MockKVConfig = None,
     num_blocks: int = 10000,
     block_size: int = 16,
     max_model_len: int | None = None,
@@ -94,15 +99,22 @@ def create_scheduler(
         cache_dtype="auto",
         **kwargs_cache,
     )
-    kv_transfer_config = (
-        KVTransferConfig(
+    kv_transfer_config = None
+    if isinstance(use_kv_connector, MockKVConfig):
+        kv_transfer_config = KVTransferConfig(
+            kv_connector="MockKVConnector",
+            kv_role="kv_both",
+            kv_connector_extra_config={
+                "matched_tokens": use_kv_connector.matched_tokens,
+                "is_async": use_kv_connector.is_async,
+            },
+        )
+    elif use_kv_connector:
+        kv_transfer_config = KVTransferConfig(
             kv_connector="SharedStorageConnector",
             kv_role="kv_both",
             kv_connector_extra_config={"shared_storage_path": "local_storage"},
         )
-        if use_kv_connector
-        else None
-    )
 
     speculative_config: SpeculativeConfig | None = None
     if num_speculative_tokens is not None:
diff --git a/tests/v1/kv_connector/unit/utils.py b/tests/v1/kv_connector/unit/utils.py
index f0031643aa9d..f35f91bb3adf 100644
--- a/tests/v1/kv_connector/unit/utils.py
+++ b/tests/v1/kv_connector/unit/utils.py
@@ -3,7 +3,8 @@
 import tempfile
 from collections import defaultdict
 from collections.abc import Callable
-from itertools import count
+from dataclasses import dataclass
+from itertools import chain, count
 from typing import Any
 
 import torch
@@ -18,13 +19,18 @@
     VllmConfig,
 )
 from vllm.distributed.kv_transfer.kv_connector.factory import KVConnectorFactory
+from vllm.distributed.kv_transfer.kv_connector.v1.base import (
+    KVConnectorBase_V1,
+    KVConnectorMetadata,
+    KVConnectorRole,
+)
 from vllm.distributed.kv_transfer.kv_connector.v1.shared_storage_connector import (  # noqa
     SharedStorageConnector,
 )
 from vllm.utils.hashing import sha256
 from vllm.v1.core.kv_cache_manager import KVCacheBlocks
 from vllm.v1.core.kv_cache_utils import get_request_block_hasher, init_none_hash
-from vllm.v1.core.sched.scheduler import Scheduler
+from vllm.v1.core.sched.scheduler import Scheduler, SchedulerOutput
 from vllm.v1.kv_cache_interface import (
     FullAttentionSpec,
     KVCacheConfig,
@@ -307,6 +313,82 @@ def wrapper(*args, **kwargs):
         return attr
 
 
+@dataclass(frozen=True)
+class MockKVConfig:
+    matched_tokens: int = 0
+    is_async: bool = False
+
+
+class MockKVConnectorMetadata(KVConnectorMetadata):
+    def __init__(self):
+        # Scheduler tests check metadata.requests
+        self.requests: list = []
+
+
+class MockKVConnector(KVConnectorBase_V1):
+    """Mock KV connector for scheduler tests, supporting both sync and async mode."""
+
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        role: KVConnectorRole,
+        kv_cache_config: KVCacheConfig | None = None,
+    ):
+        super().__init__(vllm_config, role, kv_cache_config)
+        extra_config = self._kv_transfer_config.kv_connector_extra_config
+        self.config = MockKVConfig(
+            matched_tokens=extra_config["matched_tokens"],
+            is_async=extra_config["is_async"],
+        )
+
+    def get_num_new_matched_tokens(
+        self,
+        request: Request,
+        num_computed_tokens: int,
+    ) -> tuple[int | None, bool]:
+        return (self.config.matched_tokens, self.config.is_async)
+
+    def update_state_after_alloc(
+        self,
+        request: Request,
+        blocks: KVCacheBlocks,
+        num_external_tokens: int,
+    ):
+        pass
+
+    def build_connector_meta(
+        self, scheduler_output: SchedulerOutput
+    ) -> KVConnectorMetadata:
+        metadata = MockKVConnectorMetadata()
+        cached_reqs = scheduler_output.scheduled_cached_reqs
+        for req_id in chain(
+            (req.req_id for req in scheduler_output.scheduled_new_reqs),
+            (
+                req_id
+                for req_id in cached_reqs.req_ids
+                if req_id in cached_reqs.resumed_req_ids
+            ),
+        ):
+            metadata.requests.append({"req_id": req_id})
+        return metadata
+
+    def start_load_kv(self, kv_caches, finished_req_ids):
+        pass
+
+    def wait_for_layer_load(self, layer_name):
+        pass
+
+    def save_kv_layer(self, layer_name, kv_layer, attn_metadata, **kwargs):
+        pass
+
+    def wait_for_save(self):
+        pass
+
+
 KVConnectorFactory.register_connector(
     "TestSharedStorageConnector", __name__, TestSharedStorageConnector.__name__
 )
+
+KVConnectorFactory.register_connector(
+    "MockKVConnector", __name__, MockKVConnector.__name__
+)

From f2b8e1c5510cf3621dc4b910f0eba5289d9fee88 Mon Sep 17 00:00:00 2001
From: Alexei-V-Ivanov-AMD
 <156011006+Alexei-V-Ivanov-AMD@users.noreply.github.com>
Date: Thu, 13 Nov 2025 18:16:34 -0600
Subject: [PATCH 172/183] Mirrored test group definitions for AMD (2025-11-11)
 (#28573)

Signed-off-by: Alexei V. Ivanov <alexei.ivanov@amd.com>
---
 .buildkite/test-amd.yaml | 163 ++++++++++++++++++++++++++++++++++++---
 1 file changed, 153 insertions(+), 10 deletions(-)

diff --git a/.buildkite/test-amd.yaml b/.buildkite/test-amd.yaml
index 5fd048c2ad0c..e232000511c3 100644
--- a/.buildkite/test-amd.yaml
+++ b/.buildkite/test-amd.yaml
@@ -226,6 +226,27 @@ steps:
   - VLLM_ALLOW_INSECURE_SERIALIZATION=1 RAY_DEDUP_LOGS=0 python3 rlhf_colocate.py
   - popd
 
+- label: Distributed Tests (8 GPUs) # 4min
+  timeout_in_minutes: 10
+  mirror_hardwares: [amdexperimental]
+  agent_pool: mi325_8
+  # grade: Blocking
+  gpu: h100
+  num_gpus: 8
+  working_dir: "/vllm-workspace/tests"
+  source_file_dependencies:
+  - examples/offline_inference/torchrun_dp_example.py
+  - vllm/config/parallel.py
+  - vllm/distributed/
+  - vllm/v1/engine/llm_engine.py
+  - vllm/v1/executor/uniproc_executor.py
+  - vllm/v1/worker/gpu_worker.py
+  commands:
+  # https://github.com/NVIDIA/nccl/issues/1838
+  #- export NCCL_CUMEM_HOST_ENABLE=0
+  # test with torchrun tp=2 and dp=4 with ep
+  - torchrun --nproc-per-node=8 ../examples/offline_inference/torchrun_dp_example.py --tp-size=2 --pp-size=1 --dp-size=4 --enable-ep
+
 - label: EPLB Algorithm Test # 5min
   mirror_hardwares: [amdexperimental, amdproduction]
   agent_pool: mi325_1
@@ -238,11 +259,11 @@ steps:
   commands:
   - pytest -v -s distributed/test_eplb_algo.py
 
-- label: EPLB Execution Test # 5min
+- label: EPLB Execution Test # 10min
   mirror_hardwares: [amdexperimental, amdproduction]
   agent_pool: mi325_4
   # grade: Blocking
-  timeout_in_minutes: 15
+  timeout_in_minutes: 20
   working_dir: "/vllm-workspace/tests"
   num_gpus: 4
   source_file_dependencies:
@@ -250,6 +271,7 @@ steps:
   - tests/distributed/test_eplb_execute.py
   commands:
   - pytest -v -s distributed/test_eplb_execute.py
+  - pytest -v -s distributed/test_eplb_spec_decode.py
 
 - label: Metrics, Tracing Test # 12min
   timeout_in_minutes: 20
@@ -273,7 +295,7 @@ steps:
 
 - label: Regression Test # 7min
   timeout_in_minutes: 20
-  mirror_hardwares: [amdexperimental, amdproduction]
+  mirror_hardwares: [amdexperimental, amdproduction, amdtentative]
   agent_pool: mi325_1
   grade: Blocking
   source_file_dependencies:
@@ -288,7 +310,7 @@ steps:
   timeout_in_minutes: 40
   mirror_hardwares: [amdexperimental, amdproduction]
   agent_pool: mi325_1
-  #grade: Blocking
+  # grade: Blocking
   source_file_dependencies:
   - vllm/
   - tests/engine
@@ -337,6 +359,7 @@ steps:
     - tests/v1
   commands:
     # split the test to avoid interference
+    - uv pip install --system -r /vllm-workspace/requirements/kv_connectors.txt
     - pytest -v -s -m 'not cpu_test' v1/core
     - pytest -v -s v1/executor
     - pytest -v -s v1/kv_offload
@@ -344,7 +367,7 @@ steps:
     - pytest -v -s v1/logits_processors
     - pytest -v -s v1/worker
     - pytest -v -s v1/spec_decode
-    - pytest -v -s -m 'not cpu_test' v1/kv_connector/unit --ignore=v1/kv_connector/unit/test_lmcache_integration.py
+    - pytest -v -s -m 'not cpu_test' v1/kv_connector/unit
     - pytest -v -s -m 'not cpu_test' v1/metrics
     - pytest -v -s v1/test_oracle.py
     - pytest -v -s v1/test_request.py
@@ -353,6 +376,20 @@ steps:
     - pip install -U git+https://github.com/robertgshaw2-redhat/lm-evaluation-harness.git@streaming-api
     - pytest -v -s entrypoints/openai/correctness/test_lmeval.py::test_lm_eval_accuracy_v1_engine
 
+# TODO: Add the "V1 Test attetion (MI300)" test group
+
+- label: V1 Test attention (H100) # 10min
+  mirror_hardwares: [amdexperimental]
+  agent_pool: mi325_1
+  # grade: Blocking
+  timeout_in_minutes: 30
+  gpu: h100
+  source_file_dependencies:
+    - vllm/v1/attention
+    - tests/v1/attention
+  commands:
+    - pytest -v -s v1/attention
+
 - label: V1 Test others (CPU) # 5 mins
   mirror_hardwares: [amdexperimental, amdproduction]
   agent_pool: mi325_1
@@ -479,10 +516,11 @@ steps:
   - tests/compile
   commands:
   - pytest -v -s compile/test_basic_correctness.py
+  - pytest -v -s compile/test_multimodal_compile.py
   - pytest -v -s compile/piecewise/
 
-- label: PyTorch Fullgraph Test # 22min
-  timeout_in_minutes: 35
+- label: PyTorch Fullgraph Test # 27min
+  timeout_in_minutes: 40
   mirror_hardwares: [amdexperimental, amdproduction]
   agent_pool: mi325_1
   # grade: Blocking
@@ -491,8 +529,23 @@ steps:
   - vllm/
   - tests/compile
   commands:
-  - pytest -v -s compile/test_full_graph.py
-  - pytest -v -s compile/test_fusions_e2e.py
+  - pytest -v -s compile/test_full_graph.py -k 'not test_fp8_kv_scale_compile'
+    # Limit to no custom ops to reduce running time
+    # Wrap with quotes to escape yaml and avoid starting -k string with a -
+  - "pytest -v -s compile/test_fusions_e2e.py -k 'TRITON and -quant_fp8'"
+
+- label: Cudagraph test
+  timeout_in_minutes: 20
+  mirror_hardwares: [amdexperimental, amdproduction]
+  agent_pool: mi325_1
+  source_file_dependencies:
+  - tests/v1/cudagraph
+  - vllm/v1/cudagraph_dispatcher.py
+  - vllm/config/compilation.py
+  - vllm/compilation
+  commands:
+    - pytest -v -s v1/cudagraph/test_cudagraph_dispatch.py
+    - pytest -v -s v1/cudagraph/test_cudagraph_mode.py
 
 - label: Kernels Core Operation Test # 48min
   timeout_in_minutes: 75
@@ -544,6 +597,8 @@ steps:
   - tests/kernels/moe
   - vllm/model_executor/layers/fused_moe/
   - vllm/distributed/device_communicators/
+  - vllm/envs.py
+  - vllm/config
   commands:
     - pytest -v -s kernels/moe --shard-id=$$BUILDKITE_PARALLEL_JOB --num-shards=$$BUILDKITE_PARALLEL_JOB_COUNT
   parallelism: 2
@@ -562,10 +617,13 @@ steps:
 
 - label: Model Executor Test # 23min
   timeout_in_minutes: 35
+  torch_nightly: true
   mirror_hardwares: [amdexperimental, amdproduction]
   agent_pool: mi325_1
   # grade: Blocking
   source_file_dependencies:
+  - vllm/engine/arg_utils.py
+  - vllm/config/model.py
   - vllm/model_executor
   - tests/model_executor
   - tests/entrypoints/openai/test_tensorizer_entrypoint.py
@@ -861,9 +919,10 @@ steps:
     - cd .. && VLLM_WORKER_MULTIPROC_METHOD=spawn pytest -v -s tests/models/multimodal/generation/test_whisper.py -m core_model  # Otherwise, mp_method="spawn" doesn't work
 
 - label: Multi-Modal Accuracy Eval (Small Models) # 10min
+  timeout_in_minutes: 70
   mirror_hardwares: [amdexperimental, amdproduction]
   agent_pool: mi325_1
-  timeout_in_minutes: 15
+  # grade: Blocking
   working_dir: "/vllm-workspace/.buildkite/lm-eval-harness"
   source_file_dependencies:
   - vllm/multimodal/
@@ -934,6 +993,7 @@ steps:
 - label: Transformers Nightly Models Test
   mirror_hardwares: [amdexperimental]
   agent_pool: mi325_1
+  # grade: Blocking
   working_dir: "/vllm-workspace/"
   optional: true
   commands:
@@ -961,11 +1021,16 @@ steps:
   - vllm/model_executor/layers/fused_moe/flashinfer_cutlass_prepare_finalize.py
   - vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
   - vllm/v1/attention/backends/flashinfer.py
+  - vllm/v1/attention/backends/mla/cutlass_mla.py
+  - vllm/v1/attention/backends/mla/flashinfer_mla.py
+  - vllm/platforms/cuda.py
+  - vllm/attention/selector.py
   commands:
     - nvidia-smi
     - python3 examples/offline_inference/basic/chat.py
     # Attention
     # num_heads2 broken by https://github.com/flashinfer-ai/flashinfer/issues/1353
+    - pytest -v -s tests/kernels/attention/test_attention_selector.py
     - pytest -v -s tests/kernels/attention/test_flashinfer.py -k 'not num_heads2'
     - pytest -v -s tests/kernels/attention/test_flashinfer_trtllm_attention.py
     - pytest -v -s tests/kernels/attention/test_cutlass_mla_decode.py
@@ -1002,7 +1067,33 @@ steps:
     - pytest -v -s tests/compile/test_silu_mul_quant_fusion.py
     # this runner has 2 GPUs available even though num_gpus=2 is not set
     - pytest -v -s tests/compile/test_fusion_all_reduce.py
+    # Limit to Inductor partition, no custom ops, and allreduce & attn fusion to reduce running time
+    # Wrap with quotes to escape yaml 
+    - "pytest -v -s tests/compile/test_fusions_e2e.py::test_tp2_attn_quant_allreduce_rmsnorm -k 'True and Llama-3.1 and -quant_fp8 and -rms_norm'"
+
+- label: Blackwell Fusion E2E Tests # 30 min
+  timeout_in_minutes: 40
+  working_dir: "/vllm-workspace/"
+  gpu: b200
+  optional: true
+  num_gpus: 2
+  source_file_dependencies:
+  - csrc/quantization/fp4/
+  - vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
+  - vllm/v1/attention/backends/flashinfer.py
+  - vllm/compilation/
+  # can affect pattern matching
+  - vllm/model_executor/layers/layernorm.py
+  - vllm/model_executor/layers/activation.py
+  - vllm/model_executor/layers/quantization/input_quant_fp8.py
+  - tests/compile/test_fusions_e2e.py
+  - tests/compile/test_full_graph.py
+  commands:
+    - nvidia-smi
+    # Run all e2e fusion tests
     - pytest -v -s tests/compile/test_fusions_e2e.py
+    # test_fp8_kv_scale_compile requires FlashAttention (not supported on default L4/L40)
+    - pytest -v -s tests/compile/test_full_graph.py::test_fp8_kv_scale_compile
 
 - label: Blackwell GPT-OSS Eval
   timeout_in_minutes: 60
@@ -1253,6 +1344,7 @@ steps:
 - label: NixlConnector PD accuracy tests (Distributed) # 30min
   mirror_hardwares: [amdexperimental]
   agent_pool: mi325_4
+  # grade: Blocking
   timeout_in_minutes: 30
   working_dir: "/vllm-workspace/tests"
   num_gpus: 4
@@ -1267,6 +1359,9 @@ steps:
 ##### A100 test #####
 
 - label: Distributed Tests (A100) # optional
+  mirror_hardwares: [amdexperimental]
+  agent_pool: mi325_4
+  # grade: Blocking
   gpu: a100
   optional: true
   num_gpus: 4
@@ -1281,6 +1376,9 @@ steps:
   - pytest -v -s -x lora/test_mixtral.py
 
 - label: LM Eval Large Models # optional
+  mirror_hardwares: [amdexperimental, amdproduction]
+  agent_pool: mi325_4
+  # grade: Blocking
   gpu: a100
   optional: true
   num_gpus: 4
@@ -1292,8 +1390,27 @@ steps:
   - export VLLM_WORKER_MULTIPROC_METHOD=spawn
   - pytest -s -v test_lm_eval_correctness.py --config-list-file=configs/models-large.txt --tp-size=4
 
+##### H100 test #####
+- label: LM Eval Large Models (H100) # optional
+  mirror_hardwares: [amdexperimental, amdproduction]
+  agent_pool: mi325_4
+  # grade: Blocking
+  gpu: h100
+  optional: true
+  num_gpus: 4
+  working_dir: "/vllm-workspace/.buildkite/lm-eval-harness"
+  source_file_dependencies:
+  - csrc/
+  - vllm/model_executor/layers/quantization
+  commands:
+    - export VLLM_USE_DEEP_GEMM=0  # We found Triton is faster than DeepGEMM for H100
+    - pytest -s -v test_lm_eval_correctness.py --config-list-file=configs/models-large-hopper.txt --tp-size=4
+
 ##### H200 test #####
 - label: Distributed Tests (H200) # optional
+  mirror_hardwares: [amdexperimental]
+  agent_pool: mi325_2
+  # grade: Blocking
   gpu: h200
   optional: true
   working_dir: "/vllm-workspace/"
@@ -1305,6 +1422,7 @@ steps:
     - pytest -v -s tests/compile/test_fusions_e2e.py::test_tp2_attn_quant_allreduce_rmsnorm
     - pytest -v -s tests/distributed/test_context_parallel.py
     - CUDA_VISIBLE_DEVICES=1,2 VLLM_ALL2ALL_BACKEND=deepep_high_throughput VLLM_USE_DEEP_GEMM=1 VLLM_LOGGING_LEVEL=DEBUG python3 examples/offline_inference/data_parallel.py --model Qwen/Qwen1.5-MoE-A2.7B --tp-size=1  --dp-size=2 --max-model-len 2048
+    - pytest -v -s tests/v1/distributed/test_dbo.py
 
 ##### B200 test #####
 - label: Distributed Tests (B200) # optional
@@ -1315,6 +1433,7 @@ steps:
   commands:
     - pytest -v -s tests/distributed/test_context_parallel.py
     - pytest -v -s tests/distributed/test_nccl_symm_mem_allreduce.py
+    - pytest -v -s tests/v1/distributed/test_dbo.py
 
 ##### RL Integration Tests #####
 - label: Prime-RL Integration Test # 15min
@@ -1330,3 +1449,27 @@ steps:
   - .buildkite/scripts/run-prime-rl-test.sh
   commands:
     - bash .buildkite/scripts/run-prime-rl-test.sh
+
+- label: DeepSeek V2-Lite Accuracy
+  mirror_hardwares: [amdexperimental]
+  agent_pool: mi325_4
+  # grade: Blocking
+  timeout_in_minutes: 60
+  gpu: h100
+  optional: true
+  num_gpus: 4
+  working_dir: "/vllm-workspace"
+  commands:
+  - bash .buildkite/scripts/scheduled_integration_test/deepseek_v2_lite_ep_eplb.sh 0.25 200 8010
+
+- label: Qwen3-30B-A3B-FP8-block Accuracy
+  mirror_hardwares: [amdexperimental]
+  agent_pool: mi325_4
+  # grade: Blocking
+  timeout_in_minutes: 60
+  gpu: h100
+  optional: true
+  num_gpus: 4
+  working_dir: "/vllm-workspace"
+  commands:
+  - bash .buildkite/scripts/scheduled_integration_test/qwen30b_a3b_fp8_block_ep.sh 0.8 200 8020

From 4d5943bda63c306275afc1a10edee26da45cd4ef Mon Sep 17 00:00:00 2001
From: Hank_ <37239608+ILikeIneine@users.noreply.github.com>
Date: Fri, 14 Nov 2025 09:24:10 +0800
Subject: [PATCH 173/183] [quantization][config] enable override existing
 quant_config (#28510)

Signed-off-by: Hank <hcc.mayday@gmail.com>
Co-authored-by: Michael Goin <mgoin64@gmail.com>
---
 .../test_register_quantization_config.py           | 12 +++++++++---
 .../model_executor/layers/quantization/__init__.py | 14 +++++++++++---
 2 files changed, 20 insertions(+), 6 deletions(-)

diff --git a/tests/quantization/test_register_quantization_config.py b/tests/quantization/test_register_quantization_config.py
index aeef4c2fd8a7..8da048703df9 100644
--- a/tests/quantization/test_register_quantization_config.py
+++ b/tests/quantization/test_register_quantization_config.py
@@ -7,6 +7,7 @@
 Run `pytest tests/quantization/test_register_quantization_config.py`.
 """
 
+import logging
 from typing import Any
 
 import pytest
@@ -100,17 +101,22 @@ def get_quant_method(
         return None
 
 
-def test_register_quantization_config():
+def test_register_quantization_config(caplog_vllm):
     """Test register custom quantization config."""
 
     # The quantization method `custom_quant` should be registered.
     assert get_quantization_config("custom_quant") == CustomQuantConfig
 
     # The quantization method `custom_quant` is already exists,
-    # should raise an error.
-    with pytest.raises(ValueError):
+    # should raise a warning when re-registering it.
+    with caplog_vllm.at_level(logging.WARNING):
         register_quantization_config("custom_quant")(CustomQuantConfig)
 
+    assert any(
+        "The quantization method 'custom_quant' already exists" in message
+        for message in caplog_vllm.messages
+    ), "Expected a warning when re-registering custom_quant"
+
 
 @pytest.mark.parametrize(
     argnames="model",
diff --git a/vllm/model_executor/layers/quantization/__init__.py b/vllm/model_executor/layers/quantization/__init__.py
index b92fb8d266b7..bb42b10f8718 100644
--- a/vllm/model_executor/layers/quantization/__init__.py
+++ b/vllm/model_executor/layers/quantization/__init__.py
@@ -3,8 +3,11 @@
 
 from typing import Literal, get_args
 
+from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.base_config import QuantizationConfig
 
+logger = init_logger(__name__)
+
 QuantizationMethods = Literal[
     "awq",
     "deepspeedfp",
@@ -70,15 +73,20 @@ def register_quantization_config(quantization: str):
 
     def _wrapper(quant_config_cls):
         if quantization in QUANTIZATION_METHODS:
-            raise ValueError(
-                f"The quantization method `{quantization}` is already exists."
+            logger.warning(
+                "The quantization method '%s' already exists and will be "
+                "overwritten by the quantization config %s.",
+                quantization,
+                quant_config_cls,
             )
+        else:
+            QUANTIZATION_METHODS.append(quantization)
+
         if not issubclass(quant_config_cls, QuantizationConfig):
             raise ValueError(
                 "The quantization config must be a subclass of `QuantizationConfig`."
             )
         _CUSTOMIZED_METHOD_TO_QUANT_CONFIG[quantization] = quant_config_cls
-        QUANTIZATION_METHODS.append(quantization)
         return quant_config_cls
 
     return _wrapper

From 2aa75c752bdd9ce3ebc994353fa49146caad1940 Mon Sep 17 00:00:00 2001
From: Sage Moore <sage@neuralmagic.com>
Date: Thu, 13 Nov 2025 17:24:28 -0800
Subject: [PATCH 174/183] [ROCm] Bump up the version of amd-smi to 6.4.3
 (#28680)

Signed-off-by: Sage Moore <sage@neuralmagic.com>
---
 requirements/rocm-build.txt | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/requirements/rocm-build.txt b/requirements/rocm-build.txt
index 51f58e57a785..b977e80be067 100644
--- a/requirements/rocm-build.txt
+++ b/requirements/rocm-build.txt
@@ -13,5 +13,5 @@ setuptools>=77.0.3,<80.0.0
 setuptools-scm>=8
 wheel
 jinja2>=3.1.6
-amdsmi==6.2.4
+amdsmi==6.4.3
 timm>=1.0.17

From 622e6106a9e3d64fb4927e3d9dc6e4f5289d174c Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Thu, 13 Nov 2025 20:49:55 -0500
Subject: [PATCH 175/183] [CPU][Bugfix] Fix Apple Silicon M1 compilation
 failure (#28681)

Signed-off-by: mgoin <mgoin64@gmail.com>
---
 csrc/cpu/cpu_attn_impl.hpp | 28 ++++++++++++++++++++++++++++
 1 file changed, 28 insertions(+)

diff --git a/csrc/cpu/cpu_attn_impl.hpp b/csrc/cpu/cpu_attn_impl.hpp
index c317453530af..5de8a114b2b5 100644
--- a/csrc/cpu/cpu_attn_impl.hpp
+++ b/csrc/cpu/cpu_attn_impl.hpp
@@ -5,6 +5,10 @@
 #include <type_traits>
 #include <cstddef>
 
+#if defined(__APPLE__)
+  #include <sys/sysctl.h>
+#endif
+
 #include "cpu_types.hpp"
 #include "scratchpad_manager.h"
 #include "cpu_attn_macros.h"
@@ -741,9 +745,21 @@ class AttentionScheduler {
 
   static int64_t get_available_l2_size() {
     static int64_t size = []() {
+#if defined(__APPLE__)
+      // macOS doesn't have _SC_LEVEL2_CACHE_SIZE. Use sysctlbyname.
+      int64_t l2_cache_size = 0;
+      size_t len = sizeof(l2_cache_size);
+      if (sysctlbyname("hw.l2cachesize", &l2_cache_size, &len, NULL, 0) == 0 &&
+          l2_cache_size > 0) {
+        return l2_cache_size >> 1;  // use 50% of L2 cache
+      }
+      // Fallback if sysctlbyname fails
+      return 128 * 1024 >> 1;  // use 50% of 128KB
+#else
       long l2_cache_size = sysconf(_SC_LEVEL2_CACHE_SIZE);
       TORCH_CHECK_NE(l2_cache_size, -1);
       return l2_cache_size >> 1;  // use 50% of L2 cache
+#endif
     }();
     return size;
   }
@@ -816,10 +832,14 @@ struct VecTypeTrait<float> {
   using vec_t = vec_op::FP32Vec16;
 };
 
+// ARM only supports BF16 with ARMv8.6-A extension
+#if (defined(__aarch64__) && !defined(ARM_BF16_SUPPORT))
+#else
 template <>
 struct VecTypeTrait<c10::BFloat16> {
   using vec_t = vec_op::BF16Vec16;
 };
+#endif
 
 #if !defined(__powerpc__)
 template <>
@@ -1588,9 +1608,17 @@ class AttentionMainLoop {
 
               if (use_sink) {
                 alignas(64) float s_aux_fp32[16];
+#if defined(__aarch64__) && !defined(ARM_BF16_SUPPORT)
+                // ARM without native BF16 support: manual conversion
+                for (int i = 0; i < 16; ++i) {
+                  s_aux_fp32[i] = static_cast<float>(curr_s_aux[i]);
+                }
+#else
+                // All other platforms have BF16Vec16 available
                 vec_op::BF16Vec16 vec_bf16(curr_s_aux);
                 vec_op::FP32Vec16 vec_fp32(vec_bf16);
                 vec_fp32.save(s_aux_fp32);
+#endif
 
                 float* __restrict__ curr_sum_buffer = sum_buffer;
                 float* __restrict__ curr_max_buffer = max_buffer;

From b39a5026ebac9242740e48debc79ce8db92c868b Mon Sep 17 00:00:00 2001
From: Bradley D <bradleyhd@meta.com>
Date: Thu, 13 Nov 2025 18:44:36 -0800
Subject: [PATCH 176/183] [ci][amd] fix basic models extra init test (#28676)

Signed-off-by: Bradley Davis <bradleyhd@meta.com>
---
 .buildkite/scripts/hardware_ci/run-amd-test.sh | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/.buildkite/scripts/hardware_ci/run-amd-test.sh b/.buildkite/scripts/hardware_ci/run-amd-test.sh
index 0e5b21ddf25b..864eb470bb0a 100755
--- a/.buildkite/scripts/hardware_ci/run-amd-test.sh
+++ b/.buildkite/scripts/hardware_ci/run-amd-test.sh
@@ -59,7 +59,7 @@ while true; do
         fi
 done
 
-echo "--- Pulling container" 
+echo "--- Pulling container"
 image_name="rocm/vllm-ci:${BUILDKITE_COMMIT}"
 container_name="rocm_${BUILDKITE_COMMIT}_$(tr -dc A-Za-z0-9 < /dev/urandom | head -c 10; echo)"
 docker pull "${image_name}"
@@ -177,13 +177,13 @@ if [[ -z "$render_gid" ]]; then
   exit 1
 fi
 
-# check if the command contains shard flag, we will run all shards in parallel because the host have 8 GPUs. 
+# check if the command contains shard flag, we will run all shards in parallel because the host have 8 GPUs.
 if [[ $commands == *"--shard-id="* ]]; then
-  # assign job count as the number of shards used   
-  commands=${commands//"--num-shards= "/"--num-shards=${PARALLEL_JOB_COUNT} "}
+  # assign job count as the number of shards used
+  commands=$(echo "$commands" | sed -E "s/--num-shards[[:blank:]]*=[[:blank:]]*[0-9]*/--num-shards=${PARALLEL_JOB_COUNT} /g" | sed 's/ \\ / /g')
   for GPU in $(seq 0 $(($PARALLEL_JOB_COUNT-1))); do
     # assign shard-id for each shard
-    commands_gpu=${commands//"--shard-id= "/"--shard-id=${GPU} "}
+    commands_gpu=$(echo "$commands" | sed -E "s/--shard-id[[:blank:]]*=[[:blank:]]*[0-9]*/--shard-id=${GPU} /g" | sed 's/ \\ / /g')
     echo "Shard ${GPU} commands:$commands_gpu"
     echo "Render devices: $BUILDKITE_AGENT_META_DATA_RENDER_DEVICES"
     docker run \

From 01bea115c426a86c5e565a1fc0b9563f58e0bd1a Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 14 Nov 2025 11:10:10 +0800
Subject: [PATCH 177/183] [Misc] Remove `warn_for_unimplemented_methods`
 (#28613)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 vllm/utils/__init__.py        | 45 -----------------------------------
 vllm/v1/worker/worker_base.py |  2 --
 2 files changed, 47 deletions(-)

diff --git a/vllm/utils/__init__.py b/vllm/utils/__init__.py
index 9b0045279a67..040c0416c5ea 100644
--- a/vllm/utils/__init__.py
+++ b/vllm/utils/__init__.py
@@ -1,10 +1,8 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-import inspect
 import uuid
 import warnings
-from functools import wraps
 from typing import Any, TypeVar
 
 import torch
@@ -69,49 +67,6 @@ def random_uuid() -> str:
     return str(uuid.uuid4().hex)
 
 
-def warn_for_unimplemented_methods(cls: type[T]) -> type[T]:
-    """
-    A replacement for `abc.ABC`.
-    When we use `abc.ABC`, subclasses will fail to instantiate
-    if they do not implement all abstract methods.
-    Here, we only require `raise NotImplementedError` in the
-    base class, and log a warning if the method is not implemented
-    in the subclass.
-    """
-
-    original_init = cls.__init__
-
-    def find_unimplemented_methods(self: object):
-        unimplemented_methods = []
-        for attr_name in dir(self):
-            # bypass inner method
-            if attr_name.startswith("_"):
-                continue
-
-            try:
-                attr = getattr(self, attr_name)
-                # get the func of callable method
-                if callable(attr):
-                    attr_func = attr.__func__
-            except AttributeError:
-                continue
-            src = inspect.getsource(attr_func)
-            if "NotImplementedError" in src:
-                unimplemented_methods.append(attr_name)
-        if unimplemented_methods:
-            method_names = ",".join(unimplemented_methods)
-            msg = f"Methods {method_names} not implemented in {self}"
-            logger.debug(msg)
-
-    @wraps(original_init)
-    def wrapped_init(self, *args, **kwargs) -> None:
-        original_init(self, *args, **kwargs)
-        find_unimplemented_methods(self)
-
-    type.__setattr__(cls, "__init__", wrapped_init)
-    return cls
-
-
 def length_from_prompt_token_ids_or_embeds(
     prompt_token_ids: list[int] | None,
     prompt_embeds: torch.Tensor | None,
diff --git a/vllm/v1/worker/worker_base.py b/vllm/v1/worker/worker_base.py
index 30ea0ab77bd9..3991c16eefba 100644
--- a/vllm/v1/worker/worker_base.py
+++ b/vllm/v1/worker/worker_base.py
@@ -13,7 +13,6 @@
 from vllm.lora.request import LoRARequest
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import worker_receiver_cache_from_config
-from vllm.utils import warn_for_unimplemented_methods
 from vllm.utils.import_utils import resolve_obj_by_qualname
 from vllm.utils.system_utils import update_environment_variables
 from vllm.v1.kv_cache_interface import KVCacheSpec
@@ -33,7 +32,6 @@
 _R = TypeVar("_R")
 
 
-@warn_for_unimplemented_methods
 class WorkerBase:
     """Worker interface that allows vLLM to cleanly separate implementations for
     different hardware. Also abstracts control plane communication, e.g., to

From da14ae0fad3165b88fcdc03a8f59f1813f8e832a Mon Sep 17 00:00:00 2001
From: Kunshang Ji <kunshang.ji@intel.com>
Date: Fri, 14 Nov 2025 11:15:50 +0800
Subject: [PATCH 178/183] [XPU][CI]disable lm cache uts (#28696)

Signed-off-by: Kunshang Ji <kunshang.ji@intel.com>
---
 .buildkite/scripts/hardware_ci/run-xpu-test.sh | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.buildkite/scripts/hardware_ci/run-xpu-test.sh b/.buildkite/scripts/hardware_ci/run-xpu-test.sh
index 27ed67c4517e..d49f3e2f47cf 100644
--- a/.buildkite/scripts/hardware_ci/run-xpu-test.sh
+++ b/.buildkite/scripts/hardware_ci/run-xpu-test.sh
@@ -46,6 +46,6 @@ docker run \
     pytest -v -s v1/worker --ignore=v1/worker/test_gpu_model_runner.py
     pytest -v -s v1/structured_output
     pytest -v -s v1/spec_decode --ignore=v1/spec_decode/test_max_len.py --ignore=v1/spec_decode/test_tree_attention.py --ignore=v1/spec_decode/test_speculators_eagle3.py
-    pytest -v -s v1/kv_connector/unit --ignore=v1/kv_connector/unit/test_multi_connector.py --ignore=v1/kv_connector/unit/test_nixl_connector.py --ignore=v1/kv_connector/unit/test_shared_storage_connector.py
+    pytest -v -s v1/kv_connector/unit --ignore=v1/kv_connector/unit/test_multi_connector.py --ignore=v1/kv_connector/unit/test_nixl_connector.py --ignore=v1/kv_connector/unit/test_shared_storage_connector.py --ignore=v1/kv_connector/unit/test_lmcache_integration.py
     pytest -v -s v1/test_serial_utils.py
 '

From 0aecd9138f45f6f687858ac1e0c5206d30c8425e Mon Sep 17 00:00:00 2001
From: Roger Wang <hey@rogerw.io>
Date: Thu, 13 Nov 2025 21:52:53 -0800
Subject: [PATCH 179/183] [Misc] Update xformers to 0.33.0.post1 (#28678)

Signed-off-by: Roger Wang <hey@rogerw.io>
---
 requirements/cuda.txt | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/requirements/cuda.txt b/requirements/cuda.txt
index 76874cbd2f48..d63fe9e1e77c 100644
--- a/requirements/cuda.txt
+++ b/requirements/cuda.txt
@@ -9,6 +9,6 @@ torch==2.9.0
 torchaudio==2.9.0
 # These must be updated alongside torch
 torchvision==0.24.0 # Required for phi3v processor. See https://github.com/pytorch/vision?tab=readme-ov-file#installation for corresponding version
-xformers==0.0.33; platform_system == 'Linux' and platform_machine == 'x86_64'  # Requires PyTorch >= 2.9
+xformers==0.0.33.post1; platform_system == 'Linux' and platform_machine == 'x86_64'  # Requires PyTorch >= 2.9
 # FlashInfer should be updated together with the Dockerfile
 flashinfer-python==0.5.2

From 0b25498990f01ea2553c02731d6e2ce2d550156a Mon Sep 17 00:00:00 2001
From: haoyangli-amd <lihaoyang0109@gmail.com>
Date: Fri, 14 Nov 2025 13:56:35 +0800
Subject: [PATCH 180/183] [Misc] add ignore mapper for quark quantization
 (#28275)

Signed-off-by: Haoyang Li <lihaoyang0109@gmail.com>
---
 .../layers/quantization/quark/quark.py               | 12 +++++++++---
 1 file changed, 9 insertions(+), 3 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/quark/quark.py b/vllm/model_executor/layers/quantization/quark/quark.py
index 095a66ef10f9..1bb698faf46d 100644
--- a/vllm/model_executor/layers/quantization/quark/quark.py
+++ b/vllm/model_executor/layers/quantization/quark/quark.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 import fnmatch
-from typing import Any, Optional, cast
+from typing import TYPE_CHECKING, Any, Optional, cast
 
 import torch
 
@@ -34,6 +34,9 @@
 )
 from vllm.platforms import current_platform
 
+if TYPE_CHECKING:
+    from vllm.model_executor.models.utils import WeightsMapper
+
 __all__ = ["QuarkLinearMethod"]
 
 logger = init_logger(__name__)
@@ -54,6 +57,7 @@ def __init__(
         self.kv_cache_group = kv_cache_group
         self.kv_cache_config = kv_cache_config
         self.pack_method = pack_method
+        self.ignore: list[str] = cast(list[str], self.quant_config.get("exclude", []))
 
     def get_linear_method(self) -> "QuarkLinearMethod":
         return QuarkLinearMethod(self)
@@ -74,9 +78,8 @@ def get_quant_method(
         from vllm.attention.layer import Attention  # Avoid circular import
 
         # Check if the layer is skipped for quantization.
-        exclude_layers = cast(list[str], self.quant_config.get("exclude"))
         if should_ignore_layer(
-            prefix, ignore=exclude_layers, fused_mapping=self.packed_modules_mapping
+            prefix, ignore=self.ignore, fused_mapping=self.packed_modules_mapping
         ):
             return UnquantizedLinearMethod()
         if isinstance(layer, LinearBase):
@@ -90,6 +93,9 @@ def get_quant_method(
             return QuarkMoEMethod.get_moe_method(self, module=layer, layer_name=prefix)
         return None
 
+    def apply_vllm_mapper(self, hf_to_vllm_mapper: "WeightsMapper"):
+        self.ignore = hf_to_vllm_mapper.apply_list(self.ignore)
+
     @classmethod
     def from_config(cls, config: dict[str, Any]) -> "QuarkConfig":
         export_config = config.get("export")

From 15ae8e0784d3889c6aa2c487ca00df4e3fde6f44 Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Fri, 14 Nov 2025 00:34:01 -0600
Subject: [PATCH 181/183] [Bugfix][CI/Test][Spec Decode] Fix illegal memory
 access in offline_inference/spec_decode.py (Issue  27619) (#28432)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
Co-authored-by: TJian <tunjian.tan@embeddedllm.com>
---
 vllm/attention/ops/triton_reshape_and_cache_flash.py | 6 ++++--
 1 file changed, 4 insertions(+), 2 deletions(-)

diff --git a/vllm/attention/ops/triton_reshape_and_cache_flash.py b/vllm/attention/ops/triton_reshape_and_cache_flash.py
index bbcd560ad56e..5d2ba154ae01 100644
--- a/vllm/attention/ops/triton_reshape_and_cache_flash.py
+++ b/vllm/attention/ops/triton_reshape_and_cache_flash.py
@@ -97,7 +97,6 @@ def triton_reshape_and_cache_flash(
     k_scale: torch.Tensor,  # float32
     v_scale: torch.Tensor,  # float32
 ):
-    num_tokens = key.shape[0]
     num_heads = key.shape[1]
     head_size = key.shape[2]
     block_size = key_cache.shape[1]
@@ -155,7 +154,10 @@ def triton_reshape_and_cache_flash(
 
     # TODO(ngl): maybe replace with static launch grid to avoid overhead if
     #   using cudagraphs
-    grid = lambda meta: (int(num_tokens), triton.cdiv(n, meta["TILE_SIZE"]))
+    grid = lambda meta: (
+        slot_mapping.shape[0],
+        triton.cdiv(n, meta["TILE_SIZE"]),
+    )
 
     reshape_and_cache_kernel_flash[grid](
         key_ptr=key,

From 93103575ce0480f36fc1a3603eb51d9a89f38a00 Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Fri, 14 Nov 2025 00:41:29 -0600
Subject: [PATCH 182/183] [BugFix][CI/Build][ROCM] Fix import error and apply
 assert in appropriate case in test_struct_output_generate (#28311)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
---
 .../v1/entrypoints/llm/test_struct_output_generate.py | 11 ++++++++---
 1 file changed, 8 insertions(+), 3 deletions(-)

diff --git a/tests/v1/entrypoints/llm/test_struct_output_generate.py b/tests/v1/entrypoints/llm/test_struct_output_generate.py
index 4cd26e7b41d3..a7d769c8542a 100644
--- a/tests/v1/entrypoints/llm/test_struct_output_generate.py
+++ b/tests/v1/entrypoints/llm/test_struct_output_generate.py
@@ -677,9 +677,14 @@ def test_structured_output_with_reasoning_matrices(
     reasoning, content = run_reasoning_extraction(reasoner, [generated_text])
     print(f"Prompt: {prompt!r}\nReasoning: {reasoning!r}\nContent: {content!r}")
 
-    assert content is not None and reasoning is not None
-    output_json = json.loads(content)
-    jsonschema.validate(instance=output_json, schema=reasoning_schema)
+    if "Qwen3" in model_name:
+        assert content is not None
+
+    assert reasoning is not None
+
+    if content is not None:
+        output_json = json.loads(content)
+        jsonschema.validate(instance=output_json, schema=reasoning_schema)
 
 
 @pytest.mark.skip_global_cleanup

From 529cea343da8662f135a69d9c3157f388f5eb64a Mon Sep 17 00:00:00 2001
From: Yan Ma <yan.ma@intel.com>
Date: Fri, 14 Nov 2025 16:55:29 +0800
Subject: [PATCH 183/183] use default CCL_ZE_IPC_EXCHANGE (#28700)

Signed-off-by: Yan Ma <yan.ma@intel.com>
---
 vllm/v1/worker/xpu_worker.py | 2 --
 1 file changed, 2 deletions(-)

diff --git a/vllm/v1/worker/xpu_worker.py b/vllm/v1/worker/xpu_worker.py
index 31fa3f3bd6ac..26c6f8d06bdc 100644
--- a/vllm/v1/worker/xpu_worker.py
+++ b/vllm/v1/worker/xpu_worker.py
@@ -159,12 +159,10 @@ def init_device(self):
         else:
             raise RuntimeError(f"Not support device type: {self.device_config.device}")
 
-        ENV_CCL_ZE_IPC_EXCHANGE = os.getenv("CCL_ZE_IPC_EXCHANGE", "pidfd")
         ENV_CCL_ATL_TRANSPORT = os.getenv("CCL_ATL_TRANSPORT", "ofi")
         ENV_LOCAL_WORLD_SIZE = os.getenv(
             "LOCAL_WORLD_SIZE", str(self.parallel_config.world_size)
         )
-        os.environ["CCL_ZE_IPC_EXCHANGE"] = ENV_CCL_ZE_IPC_EXCHANGE
         os.environ["CCL_ATL_TRANSPORT"] = ENV_CCL_ATL_TRANSPORT
         os.environ["LOCAL_WORLD_SIZE"] = ENV_LOCAL_WORLD_SIZE
         os.environ["LOCAL_RANK"] = str(self.local_rank)