Lass uns herausfinden, warum Deine Softwareentwicklung zu langsam, zu teuer oder zu komplex geworden ist, und wie Du Gen-AI sinnvoll einsetzt.
Mehr erfahrenLass uns herausfinden, warum Deine Softwareentwicklung zu langsam, zu teuer oder zu komplex geworden ist, und wie Du Gen-AI sinnvoll einsetzt.
Mehr erfahrenStell Dir vor, Dein Software-Team liefert zuverlässig: top DORA-Metriken, kurze Lead Time, hohe Deployment-Frequenz, und trotzdem bleibt der geschäftliche Erfolg aus. In diesem Artikel zeige ich, warum Metriken ein Gesundheitscheck sind (kein Kompass), wie KI/GenAI als Verstärker Teams in mehr Output statt mehr Impact treibt und welche Rolle Discovery, Human Intent und Impact-Metriken spielen, damit Engineering wirklich Wert schafft.
von Ilja Bauer, Lesezeit: 6 Min.
Stell Dir ein Start-up vor, das auf dem Papier alles richtig macht: 43.000 registrierte User, über 300 namhafte Firmenkunden und ein Team, das technologisch auf höchstem Niveau agiert. Das war die Realität meines Start-ups. Wir liebten den Code, wir feierten jeden Erfolg, und wir bauten eine Gemeinschaft auf, über die sogar das südkoreanische Fernsehen berichtete.
Doch trotz dieses Erfolgs und exzellenter technischer Kennzahlen scheiterten wir letztendlich. Wir mussten Mitarbeitende entlassen und auch wir Gründer standen vor dem Nichts und schließlich vor der Frage, ob es sich überhaupt noch lohnt, unsere Plattform weiter zu betreiben.
Dieses Schicksal verdeutlicht ein zentrales Problem: Ein Team kann hochgradig effizient arbeiten und dennoch am Markt vorbei produzieren. In einer Ära, in der AI Prozesse massiv beschleunigt, wird die Differenzierung zwischen bloßem „Output“ und echtem „Impact“ zur Überlebensfrage.
In der Tech-Welt gelten DORA-Metriken als gutes Maß der Dinge. Sie versprechen, dass „Elite-Performer“ erfolgreicher sind. Doch die Geschichte meines Teams zeigt eine schmerzhafte Wahrheit: DORA-Werte sind Korrelationen, keine Kausalitäten. Unsere Werte waren fantastisch – und dennoch klappte es nicht.
Gute DORA-Werte zeigen lediglich an, wie reibungslos die „Maschine“ läuft. Sie sind vergleichbar mit der Wartung eines Fahrrads: Wie gut sind die Bremsen? Wie geölt ist die Kette? Wie gering ist die Reibung? Das ist essenziell, aber es sagt nichts darüber aus, ob man in die richtige Richtung steuert.
Tech-Leads verfallen oft dem Irrtum, „Shipping“, also das Ausliefern von Code, mit Markterfolg gleichzusetzen. Wer jedoch nur das Ausliefern optimiert, ohne die strategische Richtung zu prüfen, erhöht lediglich die Geschwindigkeit, mit der er gegen die Wand fährt.
Der DORA-Report 2025 bestätigt eine fundamentale Wahrheit: AI ist ein Verstärker. Gutes wird besser, aber Schlechtes wird durch AI noch schlechter. Ich nenne das gerne den Spiritus-Effekt. Mein Vater kippte aus der Hand Spiritus ins Feuer, um den Grill noch schneller zu entfachen. Macht das bitte nicht nach! Die Gefahr ist auch groß, dass am Ende nicht nur der Grill, sondern der ganze Garten brennt.
AI wirkt exakt so: als Multiplikator. Wenn das Fundament stimmt, beschleunigt sie den Erfolg. Wenn die Basis jedoch fehlerhaft ist – sei es in der Strategie oder der Architektur – sorgt die AI lediglich dafür, dass das gesamte Unternehmen schneller abfackelt.
Heute fließen 71 % der AI-Nutzung in die reine Code-Generierung. Das erhöht den Output massiv, führt aber oft dazu, dass Teams in einem "Review-Feuer" untergehen, weil die nachgelagerten Prozesse nicht auf diese Menge ausgelegt sind. Ohne strategische Klarheit beschleunigt AI lediglich die Produktion von technischem Abfall (Waste).
Wenn Deine Discovery-Phase hinkt oder Dein Review-Prozess bereits überlastet ist, wird AI diese Dysfunktionen lediglich maximieren. Du produzierst dann einfach nur schneller Waste, der Dein gesamtes System verstopft.
Die drei Phasen der Software-Produktentwicklung: Discovery, Forming und Shipping. Nur wenn alle drei „Ventile“ offen sind, wird effizient entwickelt. Mehr zu diesen Phasen erfährst Du in unserem Artikel über die Ventil-Metapher.
Heutige AI-Tools verleiten uns durch minimalistische Interfaces zum „Vibe Coding“: eine vage User Story in eine kleine Textbox werfen und auf ein Wunder hoffen. AI-Modelle beginnen sie bei Unklarheiten zu interpolieren und füllen Lücken mit statistischen Durchschnittswerten.
Wir verschieben das Problem zwar weg vom Code, hin zu den Anforderungen, schaffen aber eine neue, gewaltige Belastung: das Review von Bergen an generiertem Markdown-Text ist oft mental anstrengender als das eigentliche Denken und die Korrektur von interpoliertem Unsinn frisst den Zeitgewinn meist schnell wieder auf.
Die wahre Disruption liegt nicht in der Generierung, sondern in der Schärfung des menschlichen Willens („Human Intent“). AI sollte als sokratisches Werkzeug genutzt werden, das uns so lange befragt, bis wir absolute Klarheit in unserem eigenen Kopf geschaffen haben. Denselben Weg wählt auch Entire, das im Februar 2026 gegründete Startup des Ex-Github-CEOs Thomas Dohmke. Das Unternehmen sammelte in einer Seed-Finanzierungsrunde 60 Mio. $ ein.
Dieser Ansatz zwingt uns, Mehrdeutigkeiten aus unserer Sprache zu tilgen. In der Praxis zeigt sich der enorme Unterschied:
In diesem Modell ist das wertvollste Produkt nicht der Text, sondern das präzise mentale Modell im Kopf der Entwicklerin oder des Entwicklers.
Um echten Impact zu verstehen, hilft das Bild eines Fahrrads: Du trittst in die Pedale (Effort), die Räder drehen sich (Output), das Fahrrad bewegt sich (Outcome). Aber erst das Erreichen des Ziels ist der Impact.
Das System lässt sich auch als Wasserrohr beschreiben. Es gibt Ventile für Discovery, Forming und Shipping. Aber entscheidend ist die Pumpe – der Druck des eigentlichen Problems.
Unser Team scheiterte damals, weil wir ein „Vitamin“ (Employer Branding/Awareness) verkauften, während die Kunden ein „Schmerzmittel“ (Anstellungen) brauchten. Doch darauf haben wir nicht optimiert. Dieser falsche Fokus ist auch kein Einzelfall. Das sehe ich täglich bei Software-Teams. Oft wird outputorientiert optimiert (Lines of Code, Pull-Requests, Features, etc.) und der wahre Impact (die eigentlichen Business-Ziele) nicht gemessen oder gar aus den Augen verloren.
„Sobald eine Kennzahl zum Ziel erklärt wird, hört sie auf, eine gute Kennzahl zu sein“, sagt schon Goodharts Law. Effort- und Output-Metriken lassen sich zu leicht manipulieren. Sie sollten intern bleiben, um den Prozess zu optimieren, aber niemals als primäre Managementziele dienen.
Künstliche Intelligenz sollte primär dazu dienen, Verschwendung („Waste“) und Reibung zu reduzieren. Produktivitätsgewinne sind in unserer Branche notorisch schwer zu messen, aber unnötige Arbeit und „Waste“ sind meist offensichtlich.
Wahre Exzellenz bedeutet heute, die Geschwindigkeit der AI mit der sokratischen Präzision des menschlichen Geistes zu paaren. Wer die AI nutzt, um seine eigenen Gedanken zu schärfen und konsequent den Problemraum vor dem Lösungsraum priorisiert, baut die richtigen Dinge und nicht nur Dinge in Rekordzeit.
Der Hebel liegt deshalb weniger in „noch mehr Generierung“, sondern in Klarheit: klare Problemhypothesen, saubere Entscheidungslogik und gute Prozesse.
Wenn Du willst, schauen wir uns das gemeinsam an: Wo geht bei Euch Druck verloren, wo entsteht Waste, und welches Ventil begrenzt gerade den Durchfluss? In diesen Themen beraten und unterstützen wir Teams seit über 13 Jahren. In Zeiten von AI werden sie umso wichtiger. Mit einer soliden Grundlage wird AI zum echten Produktivitätshebel – ohne sie verstärkt sie vor allem Reibung.
Lass uns herausfinden, warum Deine Softwareentwicklung zu langsam, zu teuer oder zu komplex geworden ist, und wie Du Gen-AI sinnvoll einsetzt.
Mehr erfahren