✨ Awesome Optimizers 📉

This repository is concieved to provide aid in literature reiviews to Optimization researchers by offering an up-to-date list of literature and corresponding summaries.

If this repository has been useful to you in your research, please cite it using the cite this repository option available in Github. This repository would not have been possible without these open-source contributors. Thanks! 💖

Legend

Symbol	Meaning	Count
📄	Paper	20
📤	Summary	3
💻	Code	0

Survey Papers

An overview of gradient descent optimization algorithms Sebastian Ruder; 2016
Descending through a Crowded Valley - Benchmarking Deep Learning Optimizers Robin M. Schmidt, Frank Schneider, Philipp Hennig; 2020

First-order Optimizers

Nesterov Accelerated Gradient momentum 📤 💻 Yuri Nesterov; Unknown
KOALA: A Kalman Optimization Algorithm with Loss Adaptivity 📤 💻 Aram Davtyan, Sepehr Sameni, Llukman Cerkezi, Givi Meishvilli, Adam Bielski, Paolo Favaro; 2021

Momentum based Optimizers

On the Momentum Term in Gradient Descent Learning Algorithms 📤 💻 Ning Qian; 1999
Symbolic Discovery of Optimization Algorithms 📤 💻 Xiangning Chen, Chen Liang, Da Huang; 2023
Demon: Improved Neural Network Training with Momentum Decay John Chen, Cameron Wolfe, Zhao Li, Anastasios Kyrillidis ; 2021

Adaptive Optimizers

Adaptive Subgradient Methods for Online Learning and Stochastic Optimization 📤 💻 John Duchi, Elad Hazan, Yoram Singer; 2011
ADADELTA: An Adaptive Learning Rate Method 📤 💻 Matthew D. Zeiler; 2012
RMSProp 📤 💻 Geoffrey Hinton; 2013

Adam Family of Optimizers

Adam: A Method for Stochastic Optimization 📤 💻 Diederik P. Kingma, Jimmy Ba; 2014
AdamP: Slowing Down the Slowdown for Momentum Optimizers on Scale-invariant Weights 📤 💻 Byeongho Heo, Sanghyuk Chun, Seong Joon Oh, Dongyoon Han; 2020
On the Variance of the Adaptive Learning Rate and Beyond 📤 💻 Liyuan Liu, Haoming Jiang, Pengcheng He; 2021
AdaBelief Optimizer: Adapting Stepsizes by the Belief in Observed Gradients Juntang Zhuang, Tommy Tang, Yifan Ding, Sekhar Tatikonda, Nicha Dvornek, Xenophon Papademetris, James S. Duncan ; 2020
Momentum Centering and Asynchronous Update for Adaptive Gradient Methods Juntang Zhuang, Yifan Ding, Tommy Tang, Nicha Dvornek, Sekhar Tatikonda, James S. Duncan ; 2021

Second-order Optimizers

Shampoo: Preconditioned Stochastic Tensor Optimization 📤 💻 Vineet Gupta, Tomer Koren, Yoram Singer; 2018

Other Optimisation-Related Research

General Improvements

Gradient Centralization: A New Optimization Technique for Deep Neural Networks 📤 💻 Hongwei Yong, Jianqiang Huang, Xiansheng Hua, Lei Zhang; 2020

Optimizer Analysis and Meta-research

On Empirical Comparisons of Optimizers for Deep Learning 📤 Dami Choi, Christopher J. Shallue, Zachary Nado, Jaehoon Lee, Chris J. Maddison, George E. Dahl; 2019
Adam Can Converge Without Any Modification on Update Rules 📤 Yushun Zhang, Congliang Chen, Naichen Shi, Ruoyu Sun, Zhi-Quan Luo; 2022

Hyperparameter Tuning

Gradient Descent: The Ultimate Optimizer 📤 💻 Kartik Chandra, Audrey Xie, Jonathan Ragan-Kelley, Erik Meijer; 2019

Name		Name	Last commit message	Last commit date
Latest commit History 57 Commits
survey		survey
template		template
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

✨ Awesome Optimizers 📉

Table of Contents

Legend

Survey Papers

First-order Optimizers

Momentum based Optimizers

Adaptive Optimizers

Adam Family of Optimizers

Second-order Optimizers

Other Optimisation-Related Research

General Improvements

Optimizer Analysis and Meta-research

Hyperparameter Tuning

About

Releases 2

Packages

Contributors 2

License

OptimalFoundation/awesome-optimizers

Folders and files

Latest commit

History

Repository files navigation

✨ Awesome Optimizers 📉

Table of Contents

Legend

Survey Papers

First-order Optimizers

Momentum based Optimizers

Adaptive Optimizers

Adam Family of Optimizers

Second-order Optimizers

Other Optimisation-Related Research

General Improvements

Optimizer Analysis and Meta-research

Hyperparameter Tuning

About

Topics

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases 2

Packages 0

Contributors 2

Packages