add train,test

jiasenlu · jiasenlu · commit 21855f555a87 · 2017-08-23T15:43:54.000-04:00
diff --git a/_init_paths.py b/_init_paths.py
@@ -0,0 +1,15 @@
+import os.path as osp
+import sys
+
+def add_path(path):
+    if path not in sys.path:
+        sys.path.insert(0, path)
+
+this_dir = osp.dirname(__file__)
+
+# Add lib to PYTHONPATH
+lib_path = osp.join(this_dir, 'lib')
+add_path(lib_path)
+
+coco_path = osp.join(this_dir, 'data', 'coco', 'PythonAPI')
+add_path(coco_path)
diff --git a/cfgs/res101-lg.yml b/cfgs/res101-lg.yml
@@ -0,0 +1,23 @@
+EXP_DIR: res101-lg
+TRAIN:
+  HAS_RPN: True
+  # IMS_PER_BATCH: 1
+  BBOX_NORMALIZE_TARGETS_PRECOMPUTED: True
+  RPN_POSITIVE_OVERLAP: 0.7
+  RPN_BATCHSIZE: 256
+  PROPOSAL_METHOD: gt
+  BG_THRESH_LO: 0.0
+  DISPLAY: 20
+  BATCH_SIZE: 256
+  WEIGHT_DECAY: 0.0001
+  DOUBLE_BIAS: False
+  SNAPSHOT_PREFIX: res101_faster_rcnn
+  SCALES: [800]
+  MAX_SIZE: 1333
+TEST:
+  HAS_RPN: True
+  SCALES: [800]
+  MAX_SIZE: 1333
+  RPN_POST_NMS_TOP_N: 1000
+POOLING_MODE: crop
+ANCHOR_SCALES: [2,4,8,16,32]
diff --git a/cfgs/res101.yml b/cfgs/res101.yml
@@ -0,0 +1,17 @@
+EXP_DIR: res101
+TRAIN:
+  HAS_RPN: True
+  # IMS_PER_BATCH: 1
+  BBOX_NORMALIZE_TARGETS_PRECOMPUTED: True
+  RPN_POSITIVE_OVERLAP: 0.7
+  RPN_BATCHSIZE: 256
+  PROPOSAL_METHOD: gt
+  BG_THRESH_LO: 0.0
+  DISPLAY: 20
+  BATCH_SIZE: 256
+  WEIGHT_DECAY: 0.0001
+  DOUBLE_BIAS: False
+  SNAPSHOT_PREFIX: res101_faster_rcnn
+TEST:
+  HAS_RPN: True
+POOLING_MODE: crop
diff --git a/cfgs/res50.yml b/cfgs/res50.yml
@@ -0,0 +1,17 @@
+EXP_DIR: res50
+TRAIN:
+  HAS_RPN: True
+  # IMS_PER_BATCH: 1
+  BBOX_NORMALIZE_TARGETS_PRECOMPUTED: True
+  RPN_POSITIVE_OVERLAP: 0.7
+  RPN_BATCHSIZE: 256
+  PROPOSAL_METHOD: gt
+  BG_THRESH_LO: 0.0
+  DISPLAY: 20
+  BATCH_SIZE: 256
+  WEIGHT_DECAY: 0.0001
+  DOUBLE_BIAS: False
+  SNAPSHOT_PREFIX: res50_faster_rcnn
+TEST:
+  HAS_RPN: True
+POOLING_MODE: crop
diff --git a/cfgs/vgg16.yml b/cfgs/vgg16.yml
@@ -0,0 +1,12 @@
+EXP_DIR: vgg16
+TRAIN:
+  HAS_RPN: True
+  # IMS_PER_BATCH: 1
+  BBOX_NORMALIZE_TARGETS_PRECOMPUTED: False
+  RPN_POSITIVE_OVERLAP: 0.7
+  RPN_BATCHSIZE: 256
+  PROPOSAL_METHOD: gt
+  BG_THRESH_LO: 0.0
+  BATCH_SIZE: 256
+TEST:
+  HAS_RPN: True
diff --git a/test_net.py b/test_net.py
@@ -0,0 +1,248 @@
+# --------------------------------------------------------
+# Tensorflow Faster R-CNN
+# Licensed under The MIT License [see LICENSE for details]
+# Written by Jiasen Lu, Jianwei Yang, based on code from Ross Girshick
+# --------------------------------------------------------
+from __future__ import absolute_import
+from __future__ import division
+from __future__ import print_function
+
+import _init_paths
+import os
+import sys
+import numpy as np
+import argparse
+import pprint
+import pdb
+import time
+import cv2
+import cPickle
+import torch
+from torch.autograd import Variable
+import torch.nn as nn
+import torch.optim as optim
+
+import torchvision.transforms as transforms
+
+from roi_data_layer.roidb import combined_roidb
+from roi_data_layer.roibatchLoader import roibatchLoader
+from model.utils.config import cfg, cfg_from_file, cfg_from_list, get_output_dir
+from model.faster_rcnn.faster_rcnn import _fasterRCNN
+from model.rpn.bbox_transform import clip_boxes
+from model.nms.nms_wrapper import nms
+from model.fast_rcnn.nms_wrapper import nms
+from model.rpn.bbox_transform import bbox_transform_inv
+from model.utils.network import save_net, load_net, vis_detections
+import pdb
+
+def parse_args():
+  """
+  Parse input arguments
+  """
+  parser = argparse.ArgumentParser(description='Train a Fast R-CNN network')
+  parser.add_argument('--cfg', dest='cfg_file',
+                      help='optional config file',
+                      default='cfgs/vgg16.yml', type=str)
+  parser.add_argument('--imdb', dest='imdb_name',
+                      help='dataset to train on',
+                      default='voc_2007_trainval', type=str)
+  parser.add_argument('--imdbval', dest='imdbval_name',
+                      help='dataset to validate on',
+                      default='voc_2007_test', type=str)
+  parser.add_argument('--net', dest='net',
+                      help='vgg16, res50, res101, res152',
+                      default='vgg16', type=str)
+  parser.add_argument('--set', dest='set_cfgs',
+                      help='set config keys', default=None,
+                      nargs=argparse.REMAINDER)
+  parser.add_argument('--load_dir', dest='load_dir',
+                      help='directory to load models', default="models",
+                      nargs=argparse.REMAINDER)
+  parser.add_argument('--ngpu', dest='ngpu',
+                      help='number of gpu',
+                      default=1, type=int)
+  parser.add_argument('--checksession', dest='checksession',
+                      help='checksession to load model',
+                      default=1, type=int)
+  parser.add_argument('--checkepoch', dest='checkepoch',
+                      help='checkepoch to load network',
+                      default=1, type=int)
+  parser.add_argument('--checkpoint', dest='checkpoint',
+                      help='checkpoint to load network',
+                      default=10000, type=int)
+
+  args = parser.parse_args()
+  return args
+
+lr = cfg.TRAIN.LEARNING_RATE
+momentum = cfg.TRAIN.MOMENTUM
+weight_decay = cfg.TRAIN.WEIGHT_DECAY
+
+if __name__ == '__main__':
+
+  args = parse_args()
+
+  print('Called with args:')
+  print(args)
+
+  if args.cfg_file is not None:
+    cfg_from_file(args.cfg_file)
+  if args.set_cfgs is not None:
+    cfg_from_list(args.set_cfgs)
+
+  print('Using config:')
+  pprint.pprint(cfg)
+  np.random.seed(cfg.RNG_SEED)
+
+  # train set
+  # -- Note: Use validation set and disable the flipped to enable faster loading.
+  cfg.TRAIN.USE_FLIPPED = False
+  imdb, roidb = combined_roidb(args.imdbval_name)
+  imdb.competition_mode(on=True)
+
+  print('{:d} roidb entries'.format(len(roidb)))
+
+  input_dir = args.load_dir + "/" + args.net
+  if not os.path.exists(input_dir):
+    raise Exception('There is no input directory for loading network')
+  load_name = os.path.join(input_dir,
+    'faster_rcnn_{}_{}_{}.pth'.format(args.checksession, args.checkepoch, args.checkpoint))
+
+  pdb.set_trace()
+  checkpoint = torch.load(load_name)
+  fasterRCNN = checkpoint['model']
+
+  print("load checkpoint %s" % (load_name))
+
+  # initilize the tensor holder here.
+  im_data = torch.FloatTensor(1)
+  im_info = torch.FloatTensor(1)
+  num_boxes = torch.LongTensor(1)
+  gt_boxes = torch.FloatTensor(1)
+
+  # ship to cuda
+  if args.ngpu > 0:
+    im_data = im_data.cuda()
+    im_info = im_info.cuda()
+    num_boxes = num_boxes.cuda()
+    gt_boxes = gt_boxes.cuda()
+
+  # make variable
+  im_data = Variable(im_data, volatile=True)
+  im_info = Variable(im_info, volatile=True)
+  num_boxes = Variable(num_boxes, volatile=True)
+  gt_boxes = Variable(gt_boxes, volatile=True)
+
+  if args.ngpu > 0:
+    cfg.CUDA = True
+
+  fasterRCNN = torch.load(load_name)
+  print('load model successfully!')
+
+  if args.ngpu > 0:
+    fasterRCNN.cuda()
+
+  fasterRCNN.eval()
+
+  start = time.time()
+  max_per_image = 100
+  thresh = 0.05
+  vis = False
+
+  save_name = 'faster_rcnn_10'
+  num_images = len(imdb.image_index)
+  all_boxes = [[[] for _ in xrange(num_images)]
+               for _ in xrange(imdb.num_classes)]
+
+  output_dir = get_output_dir(imdb, save_name)
+
+
+  dataset = roibatchLoader(roidb, imdb.num_classes, training=False,
+                        normalize = transforms.Normalize(
+                        mean=[0.485, 0.456, 0.406],
+                        std=[0.229, 0.224, 0.225]))
+
+  dataloader = torch.utils.data.DataLoader(dataset, batch_size=1,
+                            shuffle=False, num_workers=0,
+                            pin_memory=True)
+
+  data_iter = iter(dataloader)
+
+  _t = {'im_detect': time.time(), 'misc': time.time()}
+  det_file = os.path.join(output_dir, 'detections.pkl')
+
+  for i in range(num_images):
+
+      data = data_iter.next()
+      im_data.data.resize_(data[0].size()).copy_(data[0])
+      im_info.data.resize_(data[1].size()).copy_(data[1])
+      gt_boxes.data.resize_(data[2].size()).copy_(data[2])
+      num_boxes.data.resize_(data[3].size()).copy_(data[3])
+
+      det_tic = time.time()
+      rois, cls_prob, bbox_pred, rpn_loss, rcnn_loss = fasterRCNN(im_data, im_info, gt_boxes, num_boxes)
+      scores = cls_prob.data
+      boxes = rois[:, :, 1:5] / data[1][0][2]
+
+      if cfg.TEST.BBOX_REG:
+          # Apply bounding-box regression deltas
+          box_deltas = bbox_pred.data
+          pred_boxes = bbox_transform_inv(boxes, box_deltas, 1)
+          pred_boxes = clip_boxes(pred_boxes, im_info.data, 1)
+      else:
+          # Simply repeat the boxes, once for each class
+          pred_boxes = np.tile(boxes, (1, scores.shape[1]))
+
+      scores = scores.squeeze().cpu().numpy()
+      pred_boxes = pred_boxes.squeeze().cpu().numpy()
+      # _t['im_detect'].tic()
+      det_toc = time.time()
+      detect_time = det_toc - det_tic
+
+      misc_tic = time.time()
+
+      if vis:
+          im = cv2.imread(imdb.image_path_at(i))
+          im2show = np.copy(im)
+
+      for j in xrange(1, imdb.num_classes):
+          inds = np.where(scores[:, j] > thresh)[0]
+          cls_scores = scores[inds, j]
+          cls_boxes = pred_boxes[inds, j * 4:(j + 1) * 4]
+          cls_dets = np.hstack((cls_boxes, cls_scores[:, np.newaxis])) \
+              .astype(np.float32, copy=False)
+          keep = nms(cls_dets, cfg.TEST.NMS)
+          cls_dets = cls_dets[keep, :]
+          if vis:
+              im2show = vis_detections(im2show, imdb.classes[j], cls_dets)
+          all_boxes[j][i] = cls_dets
+
+      # Limit to max_per_image detections *over all classes*
+      if max_per_image > 0:
+          image_scores = np.hstack([all_boxes[j][i][:, -1]
+                                    for j in xrange(1, imdb.num_classes)])
+          if len(image_scores) > max_per_image:
+              image_thresh = np.sort(image_scores)[-max_per_image]
+              for j in xrange(1, imdb.num_classes):
+                  keep = np.where(all_boxes[j][i][:, -1] >= image_thresh)[0]
+                  all_boxes[j][i] = all_boxes[j][i][keep, :]
+
+      misc_toc = time.time()
+      nms_time = misc_toc - misc_tic
+
+      sys.stdout.write('im_detect: {:d}/{:d} {:.3f}s {:.3f}s   \r' \
+          .format(i + 1, num_images, detect_time, nms_time))
+      sys.stdout.flush()
+
+      if vis:
+          cv2.imshow('test', im2show)
+          cv2.waitKey(0)
+
+  with open(det_file, 'wb') as f:
+      cPickle.dump(all_boxes, f, cPickle.HIGHEST_PROTOCOL)
+
+  print('Evaluating detections')
+  imdb.evaluate_detections(all_boxes, output_dir)
+
+  end = time.time()
+  print("test time: %0.4fs" % (end - start))
diff --git a/trainval_net.py b/trainval_net.py