Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 7 hours ago

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt2

ChibuUkachi updated a dataset about 8 hours ago

inference-optimization/every-eval-ever-demo

ChibuUkachi published a dataset about 8 hours ago

inference-optimization/every-eval-ever-demo

View all activity

inference-optimization 's models 379

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt2

0.6B • Updated about 7 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21k

2B • Updated 1 day ago

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle3-qwen3arch-ckpt1

1B • Updated 1 day ago

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1-20260609-0052

0.6B • Updated 2 days ago • 5

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-ep0p11

2B • Updated 2 days ago • 95

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1

0.6B • Updated 3 days ago • 136

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt0.5

0.6B • Updated 3 days ago • 11

inference-optimization/Qwen3-8B-speculator.dflash.swa.unified-ep0p28

2B • Updated 3 days ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.unified-ep0p19

2B • Updated 3 days ago

inference-optimization/DFlash-SWA-Causal-Qwen3-8B-Magpie-Ultrachat

2B • Updated 6 days ago • 183

inference-optimization/DFlash-SWA-Causal-Qwen3-8B-PerfectBlend

2B • Updated 6 days ago • 51

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt0

0.6B • Updated 6 days ago • 106

inference-optimization/gpt-oss-2.5B-A1.3B

3B • Updated 8 days ago • 21

inference-optimization/Llama-4-Scout-1.7B-0.4B-Instruct

Image-Text-to-Text • 2B • Updated 8 days ago • 23

inference-optimization/ctest-Qwen3.5-9B-sliding-window-all-speculator.dflash

2B • Updated 8 days ago • 39

inference-optimization/Llama-3.2-0.5B-Instruct

Text Generation • 0.5B • Updated 8 days ago • 986

inference-optimization/ctest-Qwen3.6-27B-speculator-regen.dflash

3B • Updated 8 days ago • 91

inference-optimization/ctest-Qwen3.5-9B-sliding-window-speculator.dflash

2B • Updated 8 days ago • 56

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt6

0.6B • Updated 9 days ago • 105

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt5

0.6B • Updated 9 days ago • 444

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt4

0.6B • Updated 10 days ago • 118

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt3

0.6B • Updated 10 days ago • 345

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt2

0.6B • Updated 13 days ago • 131

inference-optimization/dflash-DeepSeek-V4-Flash-speculators-50k

2B • Updated 13 days ago • 30

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt1

0.6B • Updated 14 days ago • 131

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

4B • Updated 16 days ago • 122

inference-optimization/Qwen3-1.6B-A0.9B

Text Generation • 2B • Updated 18 days ago • 751

inference-optimization/gemma-4-1B-0.8B-tiny

1B • Updated 18 days ago • 18 • 1

inference-optimization/ctest-Qwen3.5-9B-subset-397-speculator.dflash

2B • Updated 22 days ago • 67

inference-optimization/Qwen3-235B-A22B-Thinking-2507-quantized.w4a16

Text Generation • 32B • Updated 22 days ago • 197