python-cloud
diff --git a/‎pytorch_ipynb/cnn/cnn-basic.ipynb
+139-130 b/‎pytorch_ipynb/cnn/cnn-basic.ipynb
+139-130
@@ -23,7 +23,7 @@
       "CPython 3.6.8\n",
       "IPython 7.2.0\n",
       "\n",
-      "torch 1.0.0\n"
+      "torch 1.1.0\n"
      ]
     }
    ],
@@ -171,7 +171,7 @@
     "        \n",
     "        # 28x28x1 => 28x28x4\n",
     "        self.conv_1 = torch.nn.Conv2d(in_channels=1,\n",
-    "                                      out_channels=4,\n",
+    "                                      out_channels=8,\n",
     "                                      kernel_size=(3, 3),\n",
     "                                      stride=(1, 1),\n",
     "                                      padding=1) # (1(28-1) - 28 + 3) / 2 = 1\n",
@@ -180,18 +180,27 @@
     "                                         stride=(2, 2),\n",
     "                                         padding=0) # (2(14-1) - 28 + 2) = 0                                       \n",
     "        # 14x14x4 => 14x14x8\n",
-    "        self.conv_2 = torch.nn.Conv2d(in_channels=4,\n",
-    "                                      out_channels=8,\n",
+    "        self.conv_2 = torch.nn.Conv2d(in_channels=8,\n",
+    "                                      out_channels=16,\n",
     "                                      kernel_size=(3, 3),\n",
     "                                      stride=(1, 1),\n",
     "                                      padding=1) # (1(14-1) - 14 + 3) / 2 = 1                 \n",
     "        # 14x14x8 => 7x7x8                             \n",
     "        self.pool_2 = torch.nn.MaxPool2d(kernel_size=(2, 2),\n",
     "                                         stride=(2, 2),\n",
     "                                         padding=0) # (2(7-1) - 14 + 2) = 0\n",
-    "        \n",
-    "        self.linear_1 = torch.nn.Linear(7*7*8, num_classes)\n",
     "\n",
+    "        self.linear_1 = torch.nn.Linear(7*7*16, num_classes)\n",
+    "\n",
+    "        # optionally initialize weights from Gaussian;\n",
+    "        # Guassian weight init is not recommended and only for demonstration purposes\n",
+    "        for m in self.modules():\n",
+    "            if isinstance(m, torch.nn.Conv2d) or isinstance(m, torch.nn.Linear):\n",
+    "                m.weight.data.normal_(0.0, 0.01)\n",
+    "                m.bias.data.zero_()\n",
+    "                if m.bias is not None:\n",
+    "                    m.bias.detach().zero_()\n",
+    "        \n",
     "        \n",
     "    def forward(self, x):\n",
     "        out = self.conv_1(x)\n",
@@ -202,7 +211,7 @@
     "        out = F.relu(out)\n",
     "        out = self.pool_2(out)\n",
     "        \n",
-    "        logits = self.linear_1(out.view(-1, 7*7*8))\n",
+    "        logits = self.linear_1(out.view(-1, 7*7*16))\n",
     "        probas = F.softmax(logits, dim=1)\n",
     "        return logits, probas\n",
     "\n",
@@ -231,127 +240,127 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Epoch: 001/010 | Batch 000/469 | Cost: 2.3016\n",
-      "Epoch: 001/010 | Batch 050/469 | Cost: 2.2714\n",
-      "Epoch: 001/010 | Batch 100/469 | Cost: 1.6118\n",
-      "Epoch: 001/010 | Batch 150/469 | Cost: 0.7966\n",
-      "Epoch: 001/010 | Batch 200/469 | Cost: 0.5077\n",
-      "Epoch: 001/010 | Batch 250/469 | Cost: 0.3221\n",
-      "Epoch: 001/010 | Batch 300/469 | Cost: 0.2850\n",
-      "Epoch: 001/010 | Batch 350/469 | Cost: 0.3116\n",
-      "Epoch: 001/010 | Batch 400/469 | Cost: 0.2836\n",
-      "Epoch: 001/010 | Batch 450/469 | Cost: 0.3169\n",
-      "Epoch: 001/010 training accuracy: 92.72%\n",
-      "Time elapsed: 0.21 min\n",
-      "Epoch: 002/010 | Batch 000/469 | Cost: 0.2469\n",
-      "Epoch: 002/010 | Batch 050/469 | Cost: 0.2342\n",
-      "Epoch: 002/010 | Batch 100/469 | Cost: 0.2883\n",
-      "Epoch: 002/010 | Batch 150/469 | Cost: 0.2920\n",
-      "Epoch: 002/010 | Batch 200/469 | Cost: 0.1798\n",
-      "Epoch: 002/010 | Batch 250/469 | Cost: 0.2277\n",
-      "Epoch: 002/010 | Batch 300/469 | Cost: 0.1747\n",
-      "Epoch: 002/010 | Batch 350/469 | Cost: 0.2430\n",
-      "Epoch: 002/010 | Batch 400/469 | Cost: 0.1578\n",
-      "Epoch: 002/010 | Batch 450/469 | Cost: 0.1279\n",
-      "Epoch: 002/010 training accuracy: 95.07%\n",
-      "Time elapsed: 0.41 min\n",
-      "Epoch: 003/010 | Batch 000/469 | Cost: 0.1223\n",
-      "Epoch: 003/010 | Batch 050/469 | Cost: 0.1999\n",
-      "Epoch: 003/010 | Batch 100/469 | Cost: 0.2212\n",
-      "Epoch: 003/010 | Batch 150/469 | Cost: 0.0905\n",
-      "Epoch: 003/010 | Batch 200/469 | Cost: 0.1502\n",
-      "Epoch: 003/010 | Batch 250/469 | Cost: 0.2391\n",
-      "Epoch: 003/010 | Batch 300/469 | Cost: 0.1108\n",
-      "Epoch: 003/010 | Batch 350/469 | Cost: 0.1734\n",
-      "Epoch: 003/010 | Batch 400/469 | Cost: 0.1426\n",
-      "Epoch: 003/010 | Batch 450/469 | Cost: 0.1253\n",
-      "Epoch: 003/010 training accuracy: 96.21%\n",
+      "Epoch: 001/010 | Batch 000/469 | Cost: 2.3026\n",
+      "Epoch: 001/010 | Batch 050/469 | Cost: 2.3036\n",
+      "Epoch: 001/010 | Batch 100/469 | Cost: 2.3001\n",
+      "Epoch: 001/010 | Batch 150/469 | Cost: 2.3050\n",
+      "Epoch: 001/010 | Batch 200/469 | Cost: 2.2984\n",
+      "Epoch: 001/010 | Batch 250/469 | Cost: 2.2986\n",
+      "Epoch: 001/010 | Batch 300/469 | Cost: 2.2983\n",
+      "Epoch: 001/010 | Batch 350/469 | Cost: 2.2941\n",
+      "Epoch: 001/010 | Batch 400/469 | Cost: 2.2962\n",
+      "Epoch: 001/010 | Batch 450/469 | Cost: 2.2265\n",
+      "Epoch: 001/010 training accuracy: 65.38%\n",
+      "Time elapsed: 0.29 min\n",
+      "Epoch: 002/010 | Batch 000/469 | Cost: 1.8989\n",
+      "Epoch: 002/010 | Batch 050/469 | Cost: 0.6029\n",
+      "Epoch: 002/010 | Batch 100/469 | Cost: 0.6099\n",
+      "Epoch: 002/010 | Batch 150/469 | Cost: 0.4786\n",
+      "Epoch: 002/010 | Batch 200/469 | Cost: 0.4518\n",
+      "Epoch: 002/010 | Batch 250/469 | Cost: 0.3553\n",
+      "Epoch: 002/010 | Batch 300/469 | Cost: 0.3167\n",
+      "Epoch: 002/010 | Batch 350/469 | Cost: 0.2241\n",
+      "Epoch: 002/010 | Batch 400/469 | Cost: 0.2259\n",
+      "Epoch: 002/010 | Batch 450/469 | Cost: 0.3056\n",
+      "Epoch: 002/010 training accuracy: 93.11%\n",
       "Time elapsed: 0.62 min\n",
-      "Epoch: 004/010 | Batch 000/469 | Cost: 0.1368\n",
-      "Epoch: 004/010 | Batch 050/469 | Cost: 0.1984\n",
-      "Epoch: 004/010 | Batch 100/469 | Cost: 0.1296\n",
-      "Epoch: 004/010 | Batch 150/469 | Cost: 0.1439\n",
-      "Epoch: 004/010 | Batch 200/469 | Cost: 0.1141\n",
-      "Epoch: 004/010 | Batch 250/469 | Cost: 0.0566\n",
-      "Epoch: 004/010 | Batch 300/469 | Cost: 0.1119\n",
-      "Epoch: 004/010 | Batch 350/469 | Cost: 0.1777\n",
-      "Epoch: 004/010 | Batch 400/469 | Cost: 0.2209\n",
-      "Epoch: 004/010 | Batch 450/469 | Cost: 0.1390\n",
-      "Epoch: 004/010 training accuracy: 96.77%\n",
-      "Time elapsed: 0.82 min\n",
-      "Epoch: 005/010 | Batch 000/469 | Cost: 0.1305\n",
-      "Epoch: 005/010 | Batch 050/469 | Cost: 0.0445\n",
-      "Epoch: 005/010 | Batch 100/469 | Cost: 0.1327\n",
-      "Epoch: 005/010 | Batch 150/469 | Cost: 0.0846\n",
-      "Epoch: 005/010 | Batch 200/469 | Cost: 0.0760\n",
-      "Epoch: 005/010 | Batch 250/469 | Cost: 0.0795\n",
-      "Epoch: 005/010 | Batch 300/469 | Cost: 0.1364\n",
-      "Epoch: 005/010 | Batch 350/469 | Cost: 0.1419\n",
-      "Epoch: 005/010 | Batch 400/469 | Cost: 0.0903\n",
-      "Epoch: 005/010 | Batch 450/469 | Cost: 0.0599\n",
-      "Epoch: 005/010 training accuracy: 97.15%\n",
-      "Time elapsed: 1.03 min\n",
-      "Epoch: 006/010 | Batch 000/469 | Cost: 0.0721\n",
-      "Epoch: 006/010 | Batch 050/469 | Cost: 0.0481\n",
-      "Epoch: 006/010 | Batch 100/469 | Cost: 0.0386\n",
-      "Epoch: 006/010 | Batch 150/469 | Cost: 0.0421\n",
-      "Epoch: 006/010 | Batch 200/469 | Cost: 0.1176\n",
-      "Epoch: 006/010 | Batch 250/469 | Cost: 0.0719\n",
-      "Epoch: 006/010 | Batch 300/469 | Cost: 0.0534\n",
-      "Epoch: 006/010 | Batch 350/469 | Cost: 0.0230\n",
-      "Epoch: 006/010 | Batch 400/469 | Cost: 0.0941\n",
-      "Epoch: 006/010 | Batch 450/469 | Cost: 0.0848\n",
-      "Epoch: 006/010 training accuracy: 97.43%\n",
-      "Time elapsed: 1.23 min\n",
-      "Epoch: 007/010 | Batch 000/469 | Cost: 0.1986\n",
-      "Epoch: 007/010 | Batch 050/469 | Cost: 0.0445\n",
-      "Epoch: 007/010 | Batch 100/469 | Cost: 0.0524\n",
-      "Epoch: 007/010 | Batch 150/469 | Cost: 0.0639\n",
-      "Epoch: 007/010 | Batch 200/469 | Cost: 0.0667\n",
-      "Epoch: 007/010 | Batch 250/469 | Cost: 0.0952\n",
-      "Epoch: 007/010 | Batch 300/469 | Cost: 0.0294\n",
-      "Epoch: 007/010 | Batch 350/469 | Cost: 0.0974\n",
-      "Epoch: 007/010 | Batch 400/469 | Cost: 0.1130\n",
-      "Epoch: 007/010 | Batch 450/469 | Cost: 0.0552\n",
-      "Epoch: 007/010 training accuracy: 97.77%\n",
-      "Time elapsed: 1.43 min\n",
-      "Epoch: 008/010 | Batch 000/469 | Cost: 0.1190\n",
-      "Epoch: 008/010 | Batch 050/469 | Cost: 0.1556\n",
-      "Epoch: 008/010 | Batch 100/469 | Cost: 0.0912\n",
-      "Epoch: 008/010 | Batch 150/469 | Cost: 0.0401\n",
-      "Epoch: 008/010 | Batch 200/469 | Cost: 0.0832\n",
-      "Epoch: 008/010 | Batch 250/469 | Cost: 0.0418\n",
-      "Epoch: 008/010 | Batch 300/469 | Cost: 0.0886\n",
-      "Epoch: 008/010 | Batch 350/469 | Cost: 0.0844\n",
-      "Epoch: 008/010 | Batch 400/469 | Cost: 0.0673\n",
-      "Epoch: 008/010 | Batch 450/469 | Cost: 0.1391\n",
-      "Epoch: 008/010 training accuracy: 97.55%\n",
-      "Time elapsed: 1.64 min\n",
-      "Epoch: 009/010 | Batch 000/469 | Cost: 0.0826\n",
-      "Epoch: 009/010 | Batch 050/469 | Cost: 0.1026\n",
-      "Epoch: 009/010 | Batch 100/469 | Cost: 0.1812\n",
-      "Epoch: 009/010 | Batch 150/469 | Cost: 0.0658\n",
-      "Epoch: 009/010 | Batch 200/469 | Cost: 0.0883\n",
-      "Epoch: 009/010 | Batch 250/469 | Cost: 0.1577\n",
-      "Epoch: 009/010 | Batch 300/469 | Cost: 0.0479\n",
-      "Epoch: 009/010 | Batch 350/469 | Cost: 0.0779\n",
-      "Epoch: 009/010 | Batch 400/469 | Cost: 0.0407\n",
-      "Epoch: 009/010 | Batch 450/469 | Cost: 0.0236\n",
-      "Epoch: 009/010 training accuracy: 97.82%\n",
-      "Time elapsed: 1.84 min\n",
-      "Epoch: 010/010 | Batch 000/469 | Cost: 0.0183\n",
-      "Epoch: 010/010 | Batch 050/469 | Cost: 0.0740\n",
-      "Epoch: 010/010 | Batch 100/469 | Cost: 0.0425\n",
-      "Epoch: 010/010 | Batch 150/469 | Cost: 0.0332\n",
-      "Epoch: 010/010 | Batch 200/469 | Cost: 0.0795\n",
-      "Epoch: 010/010 | Batch 250/469 | Cost: 0.0568\n",
-      "Epoch: 010/010 | Batch 300/469 | Cost: 0.1070\n",
-      "Epoch: 010/010 | Batch 350/469 | Cost: 0.1660\n",
-      "Epoch: 010/010 | Batch 400/469 | Cost: 0.0204\n",
-      "Epoch: 010/010 | Batch 450/469 | Cost: 0.0613\n",
-      "Epoch: 010/010 training accuracy: 97.77%\n",
-      "Time elapsed: 2.04 min\n",
-      "Total Training Time: 2.04 min\n"
+      "Epoch: 003/010 | Batch 000/469 | Cost: 0.3313\n",
+      "Epoch: 003/010 | Batch 050/469 | Cost: 0.1042\n",
+      "Epoch: 003/010 | Batch 100/469 | Cost: 0.1328\n",
+      "Epoch: 003/010 | Batch 150/469 | Cost: 0.2803\n",
+      "Epoch: 003/010 | Batch 200/469 | Cost: 0.0975\n",
+      "Epoch: 003/010 | Batch 250/469 | Cost: 0.1839\n",
+      "Epoch: 003/010 | Batch 300/469 | Cost: 0.1774\n",
+      "Epoch: 003/010 | Batch 350/469 | Cost: 0.1143\n",
+      "Epoch: 003/010 | Batch 400/469 | Cost: 0.1753\n",
+      "Epoch: 003/010 | Batch 450/469 | Cost: 0.1543\n",
+      "Epoch: 003/010 training accuracy: 95.68%\n",
+      "Time elapsed: 0.93 min\n",
+      "Epoch: 004/010 | Batch 000/469 | Cost: 0.1057\n",
+      "Epoch: 004/010 | Batch 050/469 | Cost: 0.1035\n",
+      "Epoch: 004/010 | Batch 100/469 | Cost: 0.1851\n",
+      "Epoch: 004/010 | Batch 150/469 | Cost: 0.1608\n",
+      "Epoch: 004/010 | Batch 200/469 | Cost: 0.1458\n",
+      "Epoch: 004/010 | Batch 250/469 | Cost: 0.1913\n",
+      "Epoch: 004/010 | Batch 300/469 | Cost: 0.1295\n",
+      "Epoch: 004/010 | Batch 350/469 | Cost: 0.1518\n",
+      "Epoch: 004/010 | Batch 400/469 | Cost: 0.1717\n",
+      "Epoch: 004/010 | Batch 450/469 | Cost: 0.0792\n",
+      "Epoch: 004/010 training accuracy: 96.46%\n",
+      "Time elapsed: 1.24 min\n",
+      "Epoch: 005/010 | Batch 000/469 | Cost: 0.0905\n",
+      "Epoch: 005/010 | Batch 050/469 | Cost: 0.1622\n",
+      "Epoch: 005/010 | Batch 100/469 | Cost: 0.1934\n",
+      "Epoch: 005/010 | Batch 150/469 | Cost: 0.1874\n",
+      "Epoch: 005/010 | Batch 200/469 | Cost: 0.0742\n",
+      "Epoch: 005/010 | Batch 250/469 | Cost: 0.1056\n",
+      "Epoch: 005/010 | Batch 300/469 | Cost: 0.0997\n",
+      "Epoch: 005/010 | Batch 350/469 | Cost: 0.0948\n",
+      "Epoch: 005/010 | Batch 400/469 | Cost: 0.0575\n",
+      "Epoch: 005/010 | Batch 450/469 | Cost: 0.1157\n",
+      "Epoch: 005/010 training accuracy: 96.97%\n",
+      "Time elapsed: 1.56 min\n",
+      "Epoch: 006/010 | Batch 000/469 | Cost: 0.1326\n",
+      "Epoch: 006/010 | Batch 050/469 | Cost: 0.1549\n",
+      "Epoch: 006/010 | Batch 100/469 | Cost: 0.0784\n",
+      "Epoch: 006/010 | Batch 150/469 | Cost: 0.0898\n",
+      "Epoch: 006/010 | Batch 200/469 | Cost: 0.0991\n",
+      "Epoch: 006/010 | Batch 250/469 | Cost: 0.0965\n",
+      "Epoch: 006/010 | Batch 300/469 | Cost: 0.0477\n",
+      "Epoch: 006/010 | Batch 350/469 | Cost: 0.0712\n",
+      "Epoch: 006/010 | Batch 400/469 | Cost: 0.1109\n",
+      "Epoch: 006/010 | Batch 450/469 | Cost: 0.0325\n",
+      "Epoch: 006/010 training accuracy: 97.60%\n",
+      "Time elapsed: 1.88 min\n",
+      "Epoch: 007/010 | Batch 000/469 | Cost: 0.0665\n",
+      "Epoch: 007/010 | Batch 050/469 | Cost: 0.0868\n",
+      "Epoch: 007/010 | Batch 100/469 | Cost: 0.0427\n",
+      "Epoch: 007/010 | Batch 150/469 | Cost: 0.0385\n",
+      "Epoch: 007/010 | Batch 200/469 | Cost: 0.0611\n",
+      "Epoch: 007/010 | Batch 250/469 | Cost: 0.0484\n",
+      "Epoch: 007/010 | Batch 300/469 | Cost: 0.1288\n",
+      "Epoch: 007/010 | Batch 350/469 | Cost: 0.0309\n",
+      "Epoch: 007/010 | Batch 400/469 | Cost: 0.0359\n",
+      "Epoch: 007/010 | Batch 450/469 | Cost: 0.0139\n",
+      "Epoch: 007/010 training accuracy: 97.64%\n",
+      "Time elapsed: 2.19 min\n",
+      "Epoch: 008/010 | Batch 000/469 | Cost: 0.0939\n",
+      "Epoch: 008/010 | Batch 050/469 | Cost: 0.1478\n",
+      "Epoch: 008/010 | Batch 100/469 | Cost: 0.0769\n",
+      "Epoch: 008/010 | Batch 150/469 | Cost: 0.0713\n",
+      "Epoch: 008/010 | Batch 200/469 | Cost: 0.1272\n",
+      "Epoch: 008/010 | Batch 250/469 | Cost: 0.0446\n",
+      "Epoch: 008/010 | Batch 300/469 | Cost: 0.0525\n",
+      "Epoch: 008/010 | Batch 350/469 | Cost: 0.1729\n",
+      "Epoch: 008/010 | Batch 400/469 | Cost: 0.0672\n",
+      "Epoch: 008/010 | Batch 450/469 | Cost: 0.0754\n",
+      "Epoch: 008/010 training accuracy: 96.67%\n",
+      "Time elapsed: 2.50 min\n",
+      "Epoch: 009/010 | Batch 000/469 | Cost: 0.0988\n",
+      "Epoch: 009/010 | Batch 050/469 | Cost: 0.0409\n",
+      "Epoch: 009/010 | Batch 100/469 | Cost: 0.1046\n",
+      "Epoch: 009/010 | Batch 150/469 | Cost: 0.0523\n",
+      "Epoch: 009/010 | Batch 200/469 | Cost: 0.0815\n",
+      "Epoch: 009/010 | Batch 250/469 | Cost: 0.0811\n",
+      "Epoch: 009/010 | Batch 300/469 | Cost: 0.0416\n",
+      "Epoch: 009/010 | Batch 350/469 | Cost: 0.0747\n",
+      "Epoch: 009/010 | Batch 400/469 | Cost: 0.0467\n",
+      "Epoch: 009/010 | Batch 450/469 | Cost: 0.0669\n",
+      "Epoch: 009/010 training accuracy: 97.90%\n",
+      "Time elapsed: 2.78 min\n",
+      "Epoch: 010/010 | Batch 000/469 | Cost: 0.0257\n",
+      "Epoch: 010/010 | Batch 050/469 | Cost: 0.0357\n",
+      "Epoch: 010/010 | Batch 100/469 | Cost: 0.1469\n",
+      "Epoch: 010/010 | Batch 150/469 | Cost: 0.0170\n",
+      "Epoch: 010/010 | Batch 200/469 | Cost: 0.0493\n",
+      "Epoch: 010/010 | Batch 250/469 | Cost: 0.0489\n",
+      "Epoch: 010/010 | Batch 300/469 | Cost: 0.1348\n",
+      "Epoch: 010/010 | Batch 350/469 | Cost: 0.0815\n",
+      "Epoch: 010/010 | Batch 400/469 | Cost: 0.0552\n",
+      "Epoch: 010/010 | Batch 450/469 | Cost: 0.0422\n",
+      "Epoch: 010/010 training accuracy: 97.99%\n",
+      "Time elapsed: 3.02 min\n",
+      "Total Training Time: 3.02 min\n"
      ]
     }
    ],
@@ -418,7 +427,7 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Test accuracy: 97.77%\n"
+      "Test accuracy: 97.97%\n"
      ]
     }
    ],
@@ -437,7 +446,7 @@
      "output_type": "stream",
      "text": [
       "numpy       1.15.4\n",
-      "torch       1.0.0\n",
+      "torch       1.1.0\n",
       "\n"
      ]
     }
@@ -463,7 +472,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.7.1"
+   "version": "3.6.8"
   },
   "toc": {
    "nav_menu": {},