Best LLMs for 24 GB VRAM

Written by Jakub Rusinowski · Last updated July 30, 2026

These are the strongest local models that fit entirely in 24 GB of VRAM, ranked by capability, with the quantization level and estimated tokens/sec needed to fit.

GPUs at This Tier

Ranked Models

Qwen 2.5 Family — Qwen 2.5 Coder 32B	Q4_K_M · 19.5 GB · ~49 tok/s on AMD Radeon RX 7900 XTX
Qwen 3 — Qwen 3 32B	Q4_K_M · 19.5 GB · ~49 tok/s on AMD Radeon RX 7900 XTX
DeepSeek R1 — DeepSeek R1 Distill Qwen 32B	Q4_K_M · 19.5 GB · ~49 tok/s on AMD Radeon RX 7900 XTX
Kimi K2.5 / K2.6 — Kimi K2.6	Q4_K_M · 19 GB · ~51 tok/s on AMD Radeon RX 7900 XTX
Qwen 2.5 Family — Qwen 2.5 14B Instruct	Q4_K_M · 9.5 GB · ~101 tok/s on AMD Radeon RX 7900 XTX
Kimi K2.5 / K2.6 — Kimi K2.5	Q4_K_M · 19 GB · ~51 tok/s on AMD Radeon RX 7900 XTX
Qwen 3.5 (Legacy Listing — Unverified) — Qwen 3.5 122B-A10B (MoE)	Q4_K_M · 13.5 GB · ~400 tok/s on AMD Radeon RX 7900 XTX
Gemma 4 (Legacy Listing — Unverified) — Gemma 4 27B ⭐	Q4_K_M · 14 GB · ~69 tok/s on AMD Radeon RX 7900 XTX
Qwen 3 — Qwen 3 14B	Q4_K_M · 9.5 GB · ~101 tok/s on AMD Radeon RX 7900 XTX
Codestral — Codestral 22B	Q4_K_M · 13 GB · ~74 tok/s on AMD Radeon RX 7900 XTX
DeepSeek R1 — DeepSeek R1 Distill Qwen 14B	Q4_K_M · 9.2 GB · ~104 tok/s on AMD Radeon RX 7900 XTX
Phi-4 Family — Phi-4 (14B)	Q4_K_M · 9.2 GB · ~104 tok/s on AMD Radeon RX 7900 XTX
Gemma 4 — Gemma 4 31B	Q4_K_M · 18 GB · ~53 tok/s on AMD Radeon RX 7900 XTX
Qwen 3.5 (Legacy Listing — Unverified) — Qwen 3.5 32B	Q4_K_M · 19.5 GB · ~49 tok/s on AMD Radeon RX 7900 XTX
Qwen3-Coder — Qwen3-Coder 80B-A3B (MoE)	Q4_K_M · 7.5 GB · ~400 tok/s on AMD Radeon RX 7900 XTX

FAQ

What LLMs run well with 24 GB VRAM?

Qwen 2.5 Family, Qwen 3, DeepSeek R1, Kimi K2.5 / K2.6, Qwen 2.5 Family all fit in 24 GB VRAM.

Which GPUs have 24 GB VRAM?

AMD Radeon RX 7900 XTX, Apple M2, Apple M3, NVIDIA GeForce RTX 3090.

Can-I-Run Pages Near 24 GB

Adjacent VRAM Tiers

Buying Guide

Best GPU Buyer Guide 2026

← All VRAM Tiers | Check Your Hardware