MOE Merger

Merge moe layers and make a smaller model

install the script by:

git clone https://github.com/isEmmanuelOlowe/moe_merger
cd moe_merger
pip install -r requirements.txt

This will convert Jamba 16 experts into 4 experts.

The notebook is available here here.

python main.py --model_id "ai21labs/Jamba-v0.1" --temp_dir "tmp/temp" --save_dir "tmp/Jamba-4xMoE_slerp" --num_experts_per_tok=2 --num_local_experts=4

This script is inspired by work on Mistral Merger availabele here.

Name		Name	Last commit message	Last commit date
Latest commit Cannot retrieve latest commit at this time. History 5 Commits
README.md		README.md
jamba_merger.ipynb		jamba_merger.ipynb
main.py		main.py
requirmenets.txt		requirmenets.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MOE Merger

About

Releases

Packages

Languages

isEmmanuelOlowe/moe_merger

Folders and files

Latest commit

History

Repository files navigation

MOE Merger

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages