run.py

# Libs import
import numpy as np
import torch
import torch.nn as nn
from torchvision import transforms, utils

# My imports
from models import UNet3D
from dataloader import BddDaloaderFactory
from train import train_model, test_model
from loss import LossFunction
from utils import log

# Hiperparameters and configurations
RUN_NAME = ''
SEED = 12
BATCH_SIZE = 8
EPOCHS = 100
TRAIN_FILE_PATH = 'data_utils/bdd_day[90-110]_train_5k_40.csv'
TEST_FILE_PATH = ''
EXPOSURE = 'under'
TEST_INTERVAL = 500 #video unit
CHECKPOINT_INTERVAL = 500 #video unit

# Set host or device
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
#torch.cuda.empty_cache()

# Set seeds
torch.manual_seed(SEED)
torch.cuda.manual_seed(SEED)
torch.backends.cudnn.deterministic = True

# Set dataloaders
train_loader = BddDaloaderFactory(EXPOSURE, TRAIN_FILE_PATH, BATCH_SIZE)
test_loader = BddDaloaderFactory(EXPOSURE, TEST_FILE_PATH, BATCH_SIZE)

# Set model
model = UNet3D(3, 3).to(device)

# Set optimizer
optimizer = torch.optim.SGD(model.parameters(), lr=0.1, momentum=0.9)
#optimizer = torch.optim.Adam(model.parameters())

# Set criterion
criterion = LossFunction().to(device)

# Log model configurations
#log.log_model_eval(model)
#log.log_model_params(model)

n_samples = 0
for epoch in range(num_epochs):
    log.log_time('Epoch {}/{}'.format(epoch, num_epochs - 1))
    
    # Iterate over videos.
    for video_step, video_loader in enumerate(train_loader):
        video_loss = []

        # Iterate over frames.
        for _, sample in  enumerate(video_loader):
            n_samples += 1                                                
            
            # Send data to device
            y, x = sample['y'].to(device), sample['x'].to(device)
    
            # Train model with sample
            loss = train_model(model, {'x':x, 'y':y}, criterion, optimizer)
	        video_loss.append(loss) 
    
        # Logs per video
		log.log_time('Video: {}\tTotal Loss: {:.6f}\tAvg Loss: {:.6f}'
            .format(n_samples, np.sum(video_loss), np.average(video_loss)))
        
        # Test model
        # NOTE: len(train_loader) must be >> len(test_loader)

        if video_step % TEST_INTERVAL == 0:
            test_loss = []
            # Iterate over videos.
            for video_step, video_loader in enumerate(test_loader):
                # Iterate over frames.
                for _, sample in  enumerate(video_loader):
                    
                    # Send data to device
                    y, x = sample['y'].to(device), sample['x'].to(device)
                    
                    # Test model with sample
                    loss = test_model(model, {'x':x, 'y':y}, criterion, optimizer)
	                test_loss.append(loss) 
		            #log.log_images(x, y,'<PATH>/{}_'.format(n_samples))
            
            # Logs after test
		    log.log_time('Test: {}\tTotal Loss: {:.6f}\tAvg Loss: {:.6f}'
            .format(n_samples, np.sum(test_loss), np.average(test_loss)))
            

		# Checkpoint
        if video_step % TEST_INTERVAL == 0:   
		    torch.save(model.state_dict(), './results/{}/3dcnn_weigths_{}_{}.pth'.format(RUN_NAME, epoch, video_step))