Der Ausgangspunkt
qwen2.5:14b auf 192GB RAM ohne GPU. Fuer kreative Aufgaben mit Abstrichen brauchbar. Fuer strukturierte Daten eine Katastrophe.
Was wir gelernt haben
Deterministischer Pipeline-Agent statt LLM fuer strukturierte Daten. Das LLM bleibt fuer natuerlichsprachliche Kommunikation.
CPU-only LLM ist kein generelles Problem, sondern eine Architekturentscheidung.