PyTorch-Distributed-Tutorials

Detailed blog on various Distributed Training startegies can be read here.

To train standalone PyTorch script run:

python train.py

To train DataParallel PyTorch script run:

python train_dataparallel.py

To train DistributedDataParallel(DDP) PyTorch script run:

torchrun --nnodes=1 --nproc-per-node=4 train_ddp.py

To train FullyShardedDataParallel(FSDP) PyTorch script run:

torchrun --nnodes=1 --nproc-per-node=4 train_fsdp.py

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.gitignore		.gitignore
README.md		README.md
train.py		train.py
train_dataparallel.py		train_dataparallel.py
train_ddp.py		train_ddp.py
train_fsdp.py		train_fsdp.py

Provide feedback