finalize report

yiheng-wang-nv · yiheng-wang-nv · commit f4840a76f2c0 · 2025-03-08T03:53:36.000Z
Signed-off-by: Yiheng Wang &lt;vennw@nvidia.com&gt;
diff --git a/acceleration/fast_inference_tutorial/fast_inference_tutorial.ipynb b/acceleration/fast_inference_tutorial/fast_inference_tutorial.ipynb
diff --git a/acceleration/fast_inference_tutorial/run_benchmark.py b/acceleration/fast_inference_tutorial/run_benchmark.py
@@ -49,6 +49,7 @@ def get_transforms(device, gpu_loading_flag=False, gpu_transforms_flag=False):
 
     return infer_transforms
 
+
 def get_post_transforms(infer_transforms):
     post_transforms = Compose(
         [
@@ -65,6 +66,7 @@ def get_post_transforms(infer_transforms):
     )
     return post_transforms
 
+
 def get_model(device, weights_path, trt_model_path, trt_flag=False):
     if not trt_flag:
         model = SegResNet(
@@ -84,11 +86,12 @@ def get_model(device, weights_path, trt_model_path, trt_flag=False):
         model = torch.jit.load(trt_model_path)
     return model
 
+
 def run_inference(data_list, infer_transforms, model, device, benchmark_type):
     total_time_dict = {}
     roi_size = (96, 96, 96)
-    sw_batch_size = 1
-    
+    sw_batch_size = 4
+
     for idx, sample in enumerate(data_list):
         start = timer()
         data = infer_transforms({"image": sample})
@@ -114,9 +117,10 @@ def run_inference(data_list, infer_transforms, model, device, benchmark_type):
         sample_name = sample.split("/")[-1]
         if idx > 0:
             total_time_dict[sample_name] = end - start
-
+            print(f"Time taken for {sample_name}: {end - start} seconds")
     return total_time_dict
 
+
 def main():
     parser = argparse.ArgumentParser(description="Run inference benchmark.")
     parser.add_argument("--benchmark_type", type=str, default="original", help="Type of benchmark to run")
@@ -128,8 +132,8 @@ def main():
     torch_tensorrt.runtime.set_multi_device_safe_mode(True)
     device = torch.device("cuda:0") if torch.cuda.is_available() else torch.device("cpu")
     train_files = prepare_test_datalist(root_dir)
-    # since the dataset is too large, the smallest 21 files are used for warm up (1 file) and benchmarking (11 files)
-    train_files = sorted(train_files, key=lambda x: os.path.getsize(x), reverse=False)[:21]
+    # since the dataset is too large, the smallest 31 files are used for warm up (1 file) and benchmarking (30 files)
+    train_files = sorted(train_files, key=lambda x: os.path.getsize(x), reverse=False)[:31]
     weights_path = prepare_model_weights(root_dir=root_dir, bundle_name="wholeBody_ct_segmentation")
     trt_model_name = "model_trt.ts"
     trt_model_path = prepare_tensorrt_model(root_dir, weights_path, trt_model_name)
@@ -146,5 +150,6 @@ def main():
     df = pd.DataFrame(list(total_time_dict.items()), columns=["file_name", "time"])
     df.to_csv(os.path.join(root_dir, f"time_{args.benchmark_type}.csv"), index=False)
 
+
 if __name__ == "__main__":
     main()
diff --git a/acceleration/fast_inference_tutorial/utils.py b/acceleration/fast_inference_tutorial/utils.py
@@ -78,7 +78,7 @@ def prepare_tensorrt_model(root_dir, weights_path, trt_model_name="model_trt.ts"
             model=model,
             precision="fp16",
             input_shape=[1, 1, 96, 96, 96],
-            dynamic_batchsize=[1, 1, 1],
+            dynamic_batchsize=[1, 4, 4],
             use_trace=True,
             verify=False,
         )
diff --git a/runner.sh b/runner.sh
@@ -70,6 +70,7 @@ doesnt_contain_max_epochs=("${doesnt_contain_max_epochs[@]}" TCIA_PROSTATEx_Pros
 doesnt_contain_max_epochs=("${doesnt_contain_max_epochs[@]}" lazy_resampling_functional.ipynb)
 doesnt_contain_max_epochs=("${doesnt_contain_max_epochs[@]}" lazy_resampling_compose.ipynb)
 doesnt_contain_max_epochs=("${doesnt_contain_max_epochs[@]}" TensorRT_inference_acceleration.ipynb)
+doesnt_contain_max_epochs=("${doesnt_contain_max_epochs[@]}" fast_inference_tutorial.ipynb)
 doesnt_contain_max_epochs=("${doesnt_contain_max_epochs[@]}" lazy_resampling_benchmark.ipynb)
 doesnt_contain_max_epochs=("${doesnt_contain_max_epochs[@]}" modular_patch_inferer.ipynb)
 doesnt_contain_max_epochs=("${doesnt_contain_max_epochs[@]}" GDS_dataset.ipynb)
@@ -117,6 +118,7 @@ skip_run_papermill=("${skip_run_papermill[@]}" .*swinunetr_finetune*)
 skip_run_papermill=("${skip_run_papermill[@]}" .*active_learning*)
 skip_run_papermill=("${skip_run_papermill[@]}" .*transform_visualization*)  # https://github.com/Project-MONAI/tutorials/issues/1155
 skip_run_papermill=("${skip_run_papermill[@]}" .*TensorRT_inference_acceleration*)
+skip_run_papermill=("${skip_run_papermill[@]}" .*fast_inference_tutorial*)
 skip_run_papermill=("${skip_run_papermill[@]}" .*mednist_classifier_ray*)  # https://github.com/Project-MONAI/tutorials/issues/1307
 skip_run_papermill=("${skip_run_papermill[@]}" .*TorchIO_MONAI_PyTorch_Lightning*)  # https://github.com/Project-MONAI/tutorials/issues/1324
 skip_run_papermill=("${skip_run_papermill[@]}" .*GDS_dataset*)  # https://github.com/Project-MONAI/tutorials/issues/1324

Original file line number	Diff line number	Diff line change
`@@ -78,7 +78,7 @@ def prepare_tensorrt_model(root_dir, weights_path, trt_model_name="model_trt.ts"`
`78`	`78`	`model=model,`
`79`	`79`	`precision="fp16",`
`80`	`80`	`input_shape=[1, 1, 96, 96, 96],`
`81`		`- dynamic_batchsize=[1, 1, 1],`
	`81`	`+ dynamic_batchsize=[1, 4, 4],`
`82`	`82`	`use_trace=True,`
`83`	`83`	`verify=False,`
`84`	`84`	`)`