Merge pull request #100 from greenmonn/string-summary

Naireen · web-flow · commit 4ee5ac5c0787 · 2020-01-12T23:12:31.000-05:00
Add interface for returning summary string
diff --git a/.gitignore b/.gitignore
@@ -1,2 +1,3 @@
 __pycache__
 *.pyc
+.vscode/
diff --git a/torchsummary/__init__.py b/torchsummary/__init__.py
@@ -1 +1 @@
-from .torchsummary import summary
+from .torchsummary import summary, summary_string
diff --git a/torchsummary/tests/unit_tests/torchsummary_test.py b/torchsummary/tests/unit_tests/torchsummary_test.py
@@ -1,8 +1,10 @@
 import unittest
-from torchsummary import summary
+from torchsummary import summary, summary_string
 from torchsummary.tests.test_models.test_model import SingleInputNet, MultipleInputNet, MultipleInputNetDifferentDtypes
 import torch
 
+gpu_if_available = "cuda:0" if torch.cuda.is_available() else "cpu"
+
 class torchsummaryTests(unittest.TestCase):
     def test_single_input(self):
         model = SingleInputNet()
@@ -15,7 +17,8 @@ def test_multiple_input(self):
         model = MultipleInputNet()
         input1 = (1, 300)
         input2 = (1, 300)
-        total_params, trainable_params = summary(model, [input1, input2], device="cpu")
+        total_params, trainable_params = summary(
+            model, [input1, input2], device="cpu")
         self.assertEqual(total_params, 31120)
         self.assertEqual(trainable_params, 31120)
 
@@ -28,9 +31,10 @@ def test_single_layer_network(self):
 
     def test_single_layer_network_on_gpu(self):
         model = torch.nn.Linear(2, 5)
-        model.cuda()
+        if torch.cuda.is_available():
+            model.cuda()
         input = (1, 2)
-        total_params, trainable_params = summary(model, input, device="cuda:0")
+        total_params, trainable_params = summary(model, input, device=gpu_if_available)
         self.assertEqual(total_params, 15)
         self.assertEqual(trainable_params, 15)
 
@@ -39,9 +43,22 @@ def test_multiple_input_types(self):
         input1 = (1, 300)
         input2 = (1, 300)
         dtypes = [torch.FloatTensor, torch.LongTensor]
-        total_params, trainable_params = summary(model, [input1, input2], device="cpu", dtypes=dtypes)
+        total_params, trainable_params = summary(
+            model, [input1, input2], device="cpu", dtypes=dtypes)
         self.assertEqual(total_params, 31120)
         self.assertEqual(trainable_params, 31120)
 
+
+class torchsummarystringTests(unittest.TestCase):
+    def test_single_input(self):
+        model = SingleInputNet()
+        input = (1, 28, 28)
+        result, (total_params, trainable_params) = summary_string(
+            model, input, device="cpu")
+        self.assertEqual(type(result), str)
+        self.assertEqual(total_params, 21840)
+        self.assertEqual(trainable_params, 21840)
+
+
 if __name__ == '__main__':
     unittest.main(buffer=True)
diff --git a/torchsummary/torchsummary.py b/torchsummary/torchsummary.py
@@ -7,11 +7,20 @@
 
 
 def summary(model, input_size, batch_size=-1, device=torch.device('cuda:0'), dtypes=None):
+    result, params_info = summary_string(
+        model, input_size, batch_size, device, dtypes)
+    print(result)
+
+    return params_info
+
+
+def summary_string(model, input_size, batch_size=-1, device=torch.device('cuda:0'), dtypes=None):
     if dtypes == None:
         dtypes = [torch.FloatTensor]*len(input_size)
 
-    def register_hook(module):
+    summary_str = ''
 
+    def register_hook(module):
         def hook(module, input, output):
             class_name = str(module.__class__).split(".")[-1].split("'")[0]
             module_idx = len(summary)
@@ -46,9 +55,9 @@ def hook(module, input, output):
     if isinstance(input_size, tuple):
         input_size = [input_size]
 
-
     # batch_size of 2 for batchnorm
-    x = [ torch.rand(2, *in_size).type(dtype).to(device=device) for in_size, dtype in zip(input_size, dtypes)]
+    x = [torch.rand(2, *in_size).type(dtype).to(device=device)
+         for in_size, dtype in zip(input_size, dtypes)]
 
     # create properties
     summary = OrderedDict()
@@ -65,10 +74,11 @@ def hook(module, input, output):
     for h in hooks:
         h.remove()
 
-    print("----------------------------------------------------------------")
-    line_new = "{:>20}  {:>25} {:>15}".format("Layer (type)", "Output Shape", "Param #")
-    print(line_new)
-    print("================================================================")
+    summary_str += "----------------------------------------------------------------" + "\n"
+    line_new = "{:>20}  {:>25} {:>15}".format(
+        "Layer (type)", "Output Shape", "Param #")
+    summary_str += line_new + "\n"
+    summary_str += "================================================================" + "\n"
     total_params = 0
     total_output = 0
     trainable_params = 0
@@ -85,23 +95,26 @@ def hook(module, input, output):
         if "trainable" in summary[layer]:
             if summary[layer]["trainable"] == True:
                 trainable_params += summary[layer]["nb_params"]
-        print(line_new)
+        summary_str += line_new + "\n"
 
     # assume 4 bytes/number (float on cuda).
-    total_input_size = abs(np.prod(sum(input_size, ())) * batch_size * 4. / (1024 ** 2.))
-    total_output_size = abs(2. * total_output * 4. / (1024 ** 2.))  # x2 for gradients
+    total_input_size = abs(np.prod(sum(input_size, ()))
+                           * batch_size * 4. / (1024 ** 2.))
+    total_output_size = abs(2. * total_output * 4. /
+                            (1024 ** 2.))  # x2 for gradients
     total_params_size = abs(total_params * 4. / (1024 ** 2.))
     total_size = total_params_size + total_output_size + total_input_size
 
-    print("================================================================")
-    print("Total params: {0:,}".format(total_params))
-    print("Trainable params: {0:,}".format(trainable_params))
-    print("Non-trainable params: {0:,}".format(total_params - trainable_params))
-    print("----------------------------------------------------------------")
-    print("Input size (MB): %0.2f" % total_input_size)
-    print("Forward/backward pass size (MB): %0.2f" % total_output_size)
-    print("Params size (MB): %0.2f" % total_params_size)
-    print("Estimated Total Size (MB): %0.2f" % total_size)
-    print("----------------------------------------------------------------")
+    summary_str += "================================================================" + "\n"
+    summary_str += "Total params: {0:,}".format(total_params) + "\n"
+    summary_str += "Trainable params: {0:,}".format(trainable_params) + "\n"
+    summary_str += "Non-trainable params: {0:,}".format(total_params -
+                                                        trainable_params) + "\n"
+    summary_str += "----------------------------------------------------------------" + "\n"
+    summary_str += "Input size (MB): %0.2f" % total_input_size + "\n"
+    summary_str += "Forward/backward pass size (MB): %0.2f" % total_output_size + "\n"
+    summary_str += "Params size (MB): %0.2f" % total_params_size + "\n"
+    summary_str += "Estimated Total Size (MB): %0.2f" % total_size + "\n"
+    summary_str += "----------------------------------------------------------------" + "\n"
     # return summary
-    return total_params, trainable_params
+    return summary_str, (total_params, trainable_params)

Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,3 @@`
`1`	`1`	`__pycache__`
`2`	`2`	`*.pyc`
	`3`	`+.vscode/`
Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-from .torchsummary import summary`
	`1`	`+from .torchsummary import summary, summary_string`