Merge pull request #236 from ymurenko/master

fix "cuda out of memory" when resuming training
2025-07-08 04:32:50 +00:00 · 2023-04-12 22:09:42 -07:00 · 2023-04-12 22:09:42 -07:00 · 2457471c9c
commit 2457471c9c
parent 553f949f46 4ac2e8ce3a
1 changed files with 1 additions and 0 deletions
--- a/train.py
+++ b/train.py
@ -190,6 +190,7 @@ scaler = torch.cuda.amp.GradScaler(enabled=(dtype == 'float16'))
 optimizer = model.configure_optimizers(weight_decay, learning_rate, (beta1, beta2), device_type)
 if init_from == 'resume':
    optimizer.load_state_dict(checkpoint['optimizer'])
 checkpoint = None # free up memory
 # compile the model
 if compile: