Engineering-Blog.
Ehrliche Berichte aus der Praxis. Was funktioniert, was nicht und warum.
One investor who has backed both companies...
Wir haben qwen2.5:14b auf 192GB RAM CPU-Server getestet. Das Ergebnis ist ernuechternd fuer produktiven Einsatz, aber lehrreich fuer die Architektur.
Wie wir 20 Minuten Wartezeit auf 0,7 Sekunden reduziert haben.
Private ChatGPT-Accounts sind ein Compliance-Risiko. So haben wir eine zentrale Alternative aufgebaut.
ChatGPT erzeugt tote Excel-Dateien. Wir lassen KI den VBA-Code schreiben, der die Datei von innen baut.
OeVE E 8101 als RAG-Wissensbasis auf CPU-only Infrastruktur.
Server-Side-Filtering senkt Antwortzeit von 30+ Sekunden auf unter 3 Sekunden.