Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 2 hours ago

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1-20260609-0052

nm-research published a model about 2 hours ago

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1-20260609-0052

nm-research updated a model about 2 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-ep0p11

View all activity

inference-optimization 's models 376

inference-optimization/Qwen3-8B-6.5-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 5

inference-optimization/Qwen3-8B-6.5-bits-mode-hybrid-per-tensor

7B • Updated Apr 22 • 4

inference-optimization/Qwen3-8B-6.5-bits-mode-heuristic-per-tensor

7B • Updated Apr 22 • 6

inference-optimization/Qwen3-8B-6-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 5

inference-optimization/Qwen3-8B-6-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 5

inference-optimization/Qwen3-8B-6-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 7

inference-optimization/Qwen3-8B-5.5-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 4

inference-optimization/Qwen3-8B-5.5-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 4

inference-optimization/Qwen3-8B-5.5-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 5

inference-optimization/Qwen3-8B-5-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 5

inference-optimization/Qwen3-8B-5-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 5

inference-optimization/Qwen3-8B-5-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 4

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-noise-per-tensor

7B • Updated Apr 22 • 5

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-hybrid-per-tensor

7B • Updated Apr 22 • 6

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-heuristic-per-tensor

7B • Updated Apr 22 • 4

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-noise-per-tensor

7B • Updated Apr 22 • 6

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-hybrid-per-tensor

7B • Updated Apr 22 • 6

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-heuristic-per-tensor

7B • Updated Apr 22 • 4

inference-optimization/Llama-3.1-8B-Instruct-6-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 6

inference-optimization/Llama-3.1-8B-Instruct-6-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 6

inference-optimization/Llama-3.1-8B-Instruct-6-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 6

inference-optimization/Llama-3.1-8B-Instruct-5.5-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 5

inference-optimization/Llama-3.1-8B-Instruct-5.5-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 5

inference-optimization/Llama-3.1-8B-Instruct-5.5-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 5

inference-optimization/Llama-3.1-8B-Instruct-5-bits-mode-noise-per-tensor

5B • Updated Apr 22 • 5

inference-optimization/Llama-3.1-8B-Instruct-5-bits-mode-hybrid-per-tensor

5B • Updated Apr 22 • 5

inference-optimization/Llama-3.1-8B-Instruct-5-bits-mode-heuristic-per-tensor

5B • Updated Apr 22 • 5

inference-optimization/Llama-3.2-3B-Instruct-7-bits-mode-noise-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-7-bits-mode-hybrid-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-7-bits-mode-heuristic-per-tensor

3B • Updated Apr 22 • 3