KI-Wildwuchs
53 Agenten. Niemand kennt sie alle. Kein Register. Kein Owner. Jedes „Experiment“ wird zum Produktionssystem — ohne Review.
Steve Baka · AI Infrastructure
Ich sorge dafür, dass Dienstleister, Agenturen und Berater nicht an ihrer eigenen KI-Landschaft scheitern — bevor Wildwuchs, Schatten-KI und unverbundene Agenten zur festen Betriebslast werden. Nicht noch ein Workflow. Nicht noch ein Tool. Infrastruktur, die in drei Jahren noch wartbar ist.
Das eigentliche Risiko
2025 scheitern viele noch an Prompts und Piloten. 2027 scheitern die gleichen Unternehmen an etwas Langweiligeres: zu viele Systeme, zu wenig Ordnung, niemand verantwortlich. Das ist kein Tech-Problem. Es ist ein Infrastruktur-Problem — und es baut sich gerade leise auf.
53 Agenten. Niemand kennt sie alle. Kein Register. Kein Owner. Jedes „Experiment“ wird zum Produktionssystem — ohne Review.
Jede Abteilung baut ihr eigenes Ding. IT sieht es nicht. Compliance sieht es zu spät. Das Wissen stirbt, wenn jemand kündigt.
Information existiert — in Chats, Notion, Mails, fünf Tools. Aber kein System liefert sie zur richtigen Entscheidung. Agenten raten. Menschen vertrauen nicht.
Agent A sagt X. Agent B sagt Y. Kein Audit-Trail. Keine Freigabe. Keine gemeinsame Wahrheit. Vertrauen bricht — bevor ROI sichtbar wird.
Erst wenn du diese vier Muster erkennst, lohnt sich die Frage nach Modellen, Tools oder Workflows. Darum beginne ich nicht mit Automatisierung — sondern mit Infrastruktur.
Das Framework
Ein einzelner Agent ist ein Feature. Eine Intelligence Infrastructure ist das, was bleibt, wenn Features wechseln: Schichten, die zusammen Gedächtnis, Kontext, Entscheidung, Kontrolle und Betrieb absichern. Context Engineering, Intent Engineering, Specification Engineering — das sind Methoden innerhalb dieser Infrastruktur. Nicht die Marke.
Was das System weiß — und was vergessen werden darf.
Das richtige Wissen zur richtigen Zeit — nicht alles auf einmal.
Wer entscheidet was — Agent, Regel oder Mensch.
Freigaben, Eskalation, Verantwortung — explizit, nicht implizit.
Welche Systeme ein Agent berühren darf — und wie.
Dokumentation, die Menschen und Agenten gleichermaßen lesen können.
Rollen, Logs, Compliance, Abschaltpfade.
Übergaben, Status, Erinnerungen — im Prozess, nicht im Postfach-Chaos.
Qualität messen, bevor es live geht — und danach.
Was Demo bleibt und was Produktion wird — versioniert, rollback-fähig.
Fehlt eine Schicht, wächst AI Technical Debt. Genau das verhindere ich — bevor aus Piloten die Legacy-Systeme der nächsten zehn Jahre werden.
Im Betrieb
Die Oberfläche ist ein Baustein, nicht das Produkt. Aber ohne sie bleibt Infrastruktur Theorie: Dein Team braucht einen Ort, an dem Zustand sichtbar ist, Übergaben sauber laufen und ein Mensch eingreifen kann. Das nenne ich Harness: kontrollierte Ausführung von Agentenarbeit in echten Prozessen.
Kontext, Status, nächste Aktion — nicht Chat-Fenster und Tab-Salat. KI taucht dort auf, wo dein Team wirklich arbeitet.
Lead, Mandant, Ticket = Objekt mit Historie — nicht Event-Kette. Zustand macht Agenten nachvollziehbar statt zufällig.
Was darf die KI? Wo prüft ein Mensch? Was wird geloggt? Kontrollierbar schlägt beeindruckend — besonders in drei Jahren.
Follow-up, Freigabe, Reminder — Teil des Workflows, nicht lose Automation. Genau da verschwindet bei Dienstleistern Geld.
Live-Beispiel · Inbound-Triage
läuftn8n-Tapete
Kein Zustand. Kein Kontext. Niemand prüft.
Arbeitsoberfläche
Zustand, Historie, Freigabe, Übergabe — nachvollziehbar.
Dieselbe Anfrage. Links eine Trigger-Kette ohne Gedächtnis. Rechts ein System mit Zustand, menschlicher Kontrolle und sauberer Übergabe.
KI hängt neben der Arbeit.
KI ist Teil des Systems.
Methoden — unter der Infrastruktur
Die Pyramide beschreibt nicht, was du kaufst — sondern wie reif dein Engineering ist. Die meisten Organisationen bleiben auf Stufe 1–2. Produktive Systemfähigkeit beginnt, wenn Context, Intent und Specification Teil der Infrastruktur sind — nicht Einzelprojekte.
Maschinenlesbare Standards und Qualitätsregeln — Voraussetzung für viele Agenten in einem Betrieb, nicht nur für einen Piloten.
Unternehmensziele in der Architektur — sonst optimiert KI ins Leere. Kontext ohne Intent ist Rauschen.
Das richtige Wissen zur richtigen Zeit — Just-in-Time statt Kontext-Firehose.
Einzelner Request-Response-Zyklus — nützlich, endet aber bei jeder echten Komplexität.
Zusammenarbeit
Ich coache Dienstleister, Agenturen und Berater — vom KI-Experiment zum betriebsfähigen System. Du lernst, Landschaften zu planen, nicht nur Workflows zu bauen. Optional unterstütze ich bei der Umsetzung; Befähigung bleibt der Kern.
Standortbestimmung: Wildwuchs, Schatten-KI, Datenflüsse, fehlende Schichten. Ergebnis: klare Prioritäten — keine Fantasie-Roadmap mit 19 Use Cases.
Du und dein Team planen und bauen die ersten tragfähigen Systeme — an echten Prozessen, mit Systemdenke statt Tool-Sucht. Ihr lernt die Logik, statt abhängig zu werden.
Ihr baut selbst; ich prüfe Architektur, Schichten, Agentenlogik, Datenmodell — bevor aus einem Pilot ein unwartbares Monster wird.
Methode
Pragmatisch. EU-fähig. Erst Infrastruktur und Systemdesign, dann das Tool — nicht umgekehrt.
30 Minuten, kostenlos. Ein Prozess, der nervt — oder eine KI-Landschaft, die außer Kontrolle gerät. Wir prüfen, ob hier Infrastruktur fehlt.
Prozesse, Tools, Agenten, Daten — ehrliche Landkarte: Was ist produktiv, was ist Schatten-KI, was ist Risiko.
Schichten, Rollen, Freigaben, Datenfluss — bevor ein Tool angefasst wird.
Erster lauffähiger Harness — ihr versteht danach das Warum, nicht nur den Button.
Use Cases
Inbound-Triage, Kunden-Onboarding, Reporting, interne Wissenssysteme — überall dort, wo Zustand, Übergabe und Human Layer zählen.
Agentur · 12 Personen
Register, Zustand, CRM-Übergabe — kein Postfach-Chaos. Ein Harness klassifiziert Anfragen, schlägt Antworten vor und schiebt qualifizierte Leads mit Score und Verlauf ins CRM.
Steuerberatung · 8 Personen
Vom Erstkontakt bis zur DATEV-Anlage: auditierbarer Workflow mit Human Layer — Dokumente, Status, Erinnerungen und klare Freigaben statt vergessener E-Mails.
Beweis — nicht Produkt
Next.js, Convex, Mirage, SurrealDB, Resend, Vercel — nicht weil das die Story ist, sondern weil produktive KI Oberfläche, Zustand, Kommunikation und Deployment braucht. Der Stack ist mein Arbeitsbeweis, nicht mein Verkaufsargument.
Coaching-Einstiege
Wenn du Websites baust oder SEO lieferst und deinen Stack sowie deine Methodik für KI-Sichtbarkeit und agentenfreundliche Sites erweitern willst.
Über mich

„Man kann das Denken an KI auslagern,
aber nicht das Verstehen.“
Ich beschäftige mich nicht damit, wie man den nächsten Agenten baut. Ich beschäftige mich damit, warum Unternehmen an ihren Agenten scheitern — und welche Infrastruktur das verhindert.
Acht Jahre Online Marketing. Heute: AI Infrastructure für Dienstleister im DACH-Raum. Direkt, hands-on, ohne Beraterbingo.
Schreiben
Keine „Noch-ein-ChatGPT-Tipp“-Artikel. Ich baue eine eigene Theorie der AI Infrastructure — damit du erkennst, ob deine Organisation auf dem Weg zu Legacy-Agenten ist.
Googles Whitepaper trennt Vibe Coding von Agentic Engineering: Harness, Context Engineering und Evals entscheiden über Qualität und Kosten. Zusammenfassung für DACH-Teams — inkl. PDF-Download.
Der KI-Check zeigt, ob ein Prozess wirklich KI verdient. Prüfe Arbeit, Daten, Risiken, Freigaben und Messung, bevor du noch ein Tool kaufst.
KI macht Texter nicht automatisch überflüssig. Aber reine Ausgabeproduktion wird dünn. Agenturen brauchen Operatoren, die Kontext bauen, Systeme führen und Qualität prüfen.
Bring mir einen Prozess, der nervt — oder eine KI-Landschaft, die außer Kontrolle gerät.
In 30 Minuten sage ich dir ehrlich: Infrastruktur-Problem, Pilot oder beides. Hat es Substanz, skizzieren wir die erste tragfähige Schicht.
Kontakt
FAQ