Denoising Diffusion Probabilistic Model (DDPM) Implementation

An unofficial PyTorch implementation of the paper "Denoising Diffusion Probabilistic Models" (Ho et al., 2020). This implementation is based on the official TensorFlow implementation

Overview

This implementation includes:

A complete DDPM training pipeline
Support for CelebA-HQ and CIFAR-10 datasets
Multi-GPU training support via PyTorch Lightning
Configurable model architecture and training parameters
TensorBoard logging for training metrics and image generation

Requirements

Python 3.10+
CUDA-capable GPU (recommended)
Dependencies listed in environment.yml or requirements.txt

Cost

Training on CelebA-HQ dataset (256x256 images) costs around $435 for 0.5M steps. It took ~11 days on 4x RTX A6000
Training on CIFAR-10 dataset (32x32 images) costs around $70 for 0.8M steps. It took ~3 days on 1x RTX 4090

Installation

Clone the repository:

$ git clone https://github.com/AhmedEssam19/ddpm-pytorch.git
$ cd ddpm-pytorch

Create and activate conda environment:

$ conda env create -f environment.yml
$ conda activate image-generation-finetuning

Alternatively, you can use pip:

$ pip install --no-cache-dir -r requirements.txt

Project Structure

model.py: Contains the U-Net architecture with attention mechanisms
diffusion_utils.py: Implementation of the diffusion process utilities
train.py: Training script with PyTorch Lightning
pl_utils.py: Lightning model and callbacks
dataset.py: Dataset implementations for CelebA-HQ and CIFAR-10
config.py: Configuration management
sample.py: Image generation script
configs/: Configuration files for different datasets

Training

Choose or modify a configuration file in the configs/ directory. Two default configurations are provided:
- celeba.yml: For CelebA-HQ dataset (256x256 images)
- cifar10.yml: For CIFAR-10 dataset (32x32 images)
Start training:

$ python train.py configs/celeba.yml

To resume training from a checkpoint:

$ python train.py configs/celeba.yml --continue-training --checkpoint-path path/to/checkpoint.ckpt

Generating Images

To generate images using a trained model:

$ python3 sample.py --help          
                                                                                                                                                                 
Usage: sample.py [OPTIONS] CHECKPOINT_PATH                                                                                                                      
                                                                                                                                                                 
╭─ Arguments ───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╮
│ *    checkpoint_path      TEXT  [default: None] [required]                                                                                                    │
╰───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╯
╭─ Options ─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╮
│ --device            TEXT     [default: cuda]                                                                                                                  │
│ --num-images        INTEGER  [default: 8]                                                                                                                     │
│ --image-size        INTEGER  [default: 256]                                                                                                                   │
│ --timesteps         INTEGER  [default: 1000]                                                                                                                  │
│ --batch-size        INTEGER  [default: 8]                                                                                                                     │
│ --output-dir        TEXT     [default: samples]                                                                                                               │
│ --help                       Show this message and exit.                                                                                                      │

Model Architecture

The implementation uses a U-Net architecture with:

Residual blocks with group normalization
Self-attention layers at specified resolutions
Time embedding through sinusoidal positional encoding
Skip connections between encoder and decoder

Training Process

The training follows the DDPM paper's approach to the tiniest details:

Forward diffusion process adds Gaussian noise gradually
Model learns to reverse the diffusion process
Uses linear noise schedule
Implements linear warmup for learning rate

Monitoring

Training progress can be monitored using TensorBoard:

tensorboard --logdir lightning_logs

This will show:

Training loss
Generated samples during training
Validation metrics

Citation

If you use this implementation in your research, please cite the original DDPM paper:

@article{ho2020denoising,
  title={Denoising Diffusion Probabilistic Models},
  author={Ho, Jonathan and Jain, Ajay and Abbeel, Pieter},
  journal={arXiv preprint arXiv:2006.11239},
  year={2020}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Denoising Diffusion Probabilistic Model (DDPM) Implementation

Overview

Requirements

Cost

Installation

Project Structure

Training

Generating Images

Model Architecture

Training Process

Monitoring

Citation

About

Releases

Packages

Contributors 2

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
configs		configs
.gitignore		.gitignore
README.md		README.md
config.py		config.py
dataset.py		dataset.py
diffusion_utils.py		diffusion_utils.py
environment.yml		environment.yml
model.py		model.py
pl_utils.py		pl_utils.py
requirements.txt		requirements.txt
sample.py		sample.py
train.py		train.py

AhmedEssam19/ddpm-pytorch

Folders and files

Latest commit

History

Repository files navigation

Denoising Diffusion Probabilistic Model (DDPM) Implementation

Overview

Requirements

Cost

Installation

Project Structure

Training

Generating Images

Model Architecture

Training Process

Monitoring

Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages