KI-Infrastruktur

CPU-only LLM: Wann es reicht und wann nicht

// 15. März 2026 - Florian Bugar - 8 min Lesezeit

KI-InfrastrukturOllamaPerformance

Der Ausgangspunkt

qwen2.5:14b auf 192GB RAM ohne GPU. Fuer kreative Aufgaben mit Abstrichen brauchbar. Fuer strukturierte Daten eine Katastrophe.

Deterministischer Pipeline-Agent statt LLM fuer strukturierte Daten. Das LLM bleibt fuer natuerlichsprachliche Kommunikation.

CPU-only LLM ist kein generelles Problem, sondern eine Architekturentscheidung.