// Insights

Engineering-Blog.

Ehrliche Berichte aus der Praxis. Was funktioniert, was nicht und warum.

One investor who has backed both companies...

Wir haben qwen2.5:14b auf 192GB RAM CPU-Server getestet. Das Ergebnis ist ernuechternd fuer produktiven Einsatz, aber lehrreich fuer die Architektur.

Wie wir 20 Minuten Wartezeit auf 0,7 Sekunden reduziert haben.

Private ChatGPT-Accounts sind ein Compliance-Risiko. So haben wir eine zentrale Alternative aufgebaut.

ChatGPT erzeugt tote Excel-Dateien. Wir lassen KI den VBA-Code schreiben, der die Datei von innen baut.

OeVE E 8101 als RAG-Wissensbasis auf CPU-only Infrastruktur.

Server-Side-Filtering senkt Antwortzeit von 30+ Sekunden auf unter 3 Sekunden.