deepnote · misrasaurabh1 · Nov 6, 2025 · Nov 13, 2025 · coderabbitai · Nov 13, 2025
@@ -34,15 +34,17 @@ def flatten_column_name(item):
 
 
 def fix_nan_category(df):
-    for i in range(len(df.columns)):
-        column = df.iloc[
-            :, i
-        ]  # We need to use iloc because it works if column names have duplicates
-
-        # If the column is categorical, we need to create a category for nan
-        if column.dtype.name == "category":
-            df.iloc[:, i] = column.cat.add_categories("nan")
-
+    # Collect indices of categorical columns to avoid repeated dtype checks
+    categorical_indices = [
+        i for i, dtype in enumerate(df.dtypes) if dtype.name == "category"
+    ]
+    if not categorical_indices:
+        return df
+
+    # Apply add_categories in bulk for categorical columns
+    for i in categorical_indices:
+        column = df.iloc[:, i]
+        df.iloc[:, i] = column.cat.add_categories("nan")
-    for i in categorical_indices:
-        column = df.iloc[:, i]
-        df.iloc[:, i] = column.cat.add_categories("nan")
+    for i in categorical_indices:
+        df.iloc[:, i] = df.iloc[:, i].cat.add_categories("nan")
-    for i in categorical_indices:
-        column = df.iloc[:, i]
-        df.iloc[:, i] = column.cat.add_categories("nan")
+    for i in categorical_indices:
+        df.iloc[:, i] = df.iloc[:, i].cat.add_categories("nan")
     return df