train_bce.py

from model import UNet
from dataset import SegmentationDataset

import torch.optim as optim
import sys

from torch import manual_seed, cuda
from torch.utils.data import random_split, DataLoader
import torch
import numpy as np

from glob import glob
import os

from loss_fns import DiceLoss

dataset_root = 'data/dataset-sample/'
img_dir = dataset_root + 'image-chips/'
label_dir = dataset_root + 'label-chips/'

epochs = 1
network_width_param = 64
test_set_portion = .2

gpu_cuda = torch.cuda.is_available()
device = torch.device('cuda' if gpu_cuda else 'cpu')


#OPTIMIZER
lr = .001
momentum = .9
nesterov = True
weight_decay = 5e-4

#LR_SCHEDULER - for MultiStepLR Parameters
milestones = [2,4,6]
    #list of epoch indeces, must be increasing
gamma = .1

#DATALOADER
batch_size = 2
num_workers = 0

out_channels = 6

save = True

def main():
    print("Using CUDA:      {}".format(gpu_cuda))
    model = lambda: UNet(in_channels=3, out_channels=out_channels, features=network_width_param)

    optimizer = lambda m: optim.Adam(m.parameters(), lr=lr, weight_decay=weight_decay)

    lr_scheduler = lambda o: optim.lr_scheduler.MultiStepLR(o, milestones=milestones, gamma=gamma)
    
    loss_fn = torch.nn.BCEWithLogitsLoss()

    model = model()

    if gpu_cuda:
        model = model.cuda()

    optimizer = optimizer(model)
    lr_scheduler = lr_scheduler(optimizer)

    best_metrics = dict()
    best_metrics['loss'] = sys.maxsize
    for item in ('precision', 'recall', 'f1_score', 'pixel_acc'):
            best_metrics[item] = 0.0

    dataset = SegmentationDataset(img_dir, label_dir, scale=1, mode='nearest')

    n_test = int(len(dataset) * test_set_portion)
    n_train = len(dataset) - n_test
    manual_seed(101)
    train_set, test_set = random_split(dataset, [n_train, n_test])

    train_loader = DataLoader(train_set, batch_size=batch_size, shuffle=True, \
        num_workers=num_workers, pin_memory=torch.cuda.is_available())
    test_loader = DataLoader(test_set, batch_size=batch_size, shuffle=False, \
        num_workers=num_workers, pin_memory=torch.cuda.is_available())

    
    #TRAIN
    
    for epoch in range(epochs):

        print('------- EPOCH [{} / {}] -------'.format(epoch + 1, epochs))

        #train, store metrics
        train_loss = train(model, optimizer, train_loader, loss_fn, device)

        print("Average Loss = {}".format(train_loss))
        #test, store metrics
        test_loss = test(model, test_loader, loss_fn, device)
        print("Test Loss = {}".format(test_loss))
        lr_scheduler.step()

        #update best metrics

        # if best metrics improved, or it is the first epoch, save model

        # display best metrics

    #Save Model    
    path = 'saved_models/model-'
    if(save == True):
        path += str(len(glob(os.path.join('saved_models/', '*.pth'))))
        path += '.pth'
        torch.save(model, path)
        print("Train Complete: Model Saved as " + path)


def train(model, optimizer, loader, loss_fn, device):
    model.train()

    n_batches = len(loader)
    running_loss = 0.
    with torch.set_grad_enabled(True):
        for batch_idx, (imgs, labels) in enumerate(loader):
            imgs, labels = map(lambda x: x.to(device, dtype=torch.float32), (imgs, labels))
            if gpu_cuda:
                logits = model(imgs).cuda()
            else:
                logits = model(imgs)
            loss = loss_fn.forward(logits, labels)

            running_loss += loss.item()
            
            # Backprop
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

            logits.detach()

            print("Batch: {}/{} | Loss: {} | LR: {}".format(batch_idx + 1, n_batches, loss, get_lr(optimizer)))

    return running_loss / (n_batches)


def test(model, loader, loss_fn, device):
    model.eval()
    n_batches = len(loader)
    running_loss = 0.

    with torch.set_grad_enabled(False):
        for batch_idx, (imgs, labels) in enumerate(loader):
            imgs, labels = map(lambda x: x.to(device, dtype=torch.float32), (imgs, labels))
            
            if gpu_cuda:
                logits = model(imgs).cuda()
            else:
                logits = model(imgs)

            try:
                loss = loss_fn.forward(logits, labels)
                running_loss += loss.item()
            except:
                print("EXCEPTION CAUGHT: Test Batch Skipped")

    return running_loss / (n_batches)
    

def get_lr(optimizer):
    for param_group in optimizer.param_groups:
        return param_group['lr']

if(__name__ == "__main__"):
    main()