Lass uns herausfinden, warum Deine Softwareentwicklung zu langsam, zu teuer oder zu komplex geworden ist, und wie Du Gen-AI sinnvoll einsetzt.

Warum DORA Dein Team nicht rettet: Die Wahrheit über Impact und AI in Software-Teams

Stell Dir vor, Dein Software-Team liefert zuverlässig: top DORA-Metriken, kurze Lead Time, hohe Deployment-Frequenz, und trotzdem bleibt der geschäftliche Erfolg aus. In diesem Artikel zeige ich, warum Metriken ein Gesundheitscheck sind (kein Kompass), wie KI/GenAI als Verstärker Teams in mehr Output statt mehr Impact treibt und welche Rolle Discovery, Human Intent und Impact-Metriken spielen, damit Engineering wirklich Wert schafft.

von Ilja Bauer, Lesezeit: 6 Min.

Ilja Bauer zeigt die Ventile der Software-Entwicklung: Discovery, Forming und Shipping.

Das Paradoxon des erfolgreichen Scheiterns

Stell Dir ein Start-up vor, das auf dem Papier alles richtig macht: 43.000 registrierte User, über 300 namhafte Firmenkunden und ein Team, das technologisch auf höchstem Niveau agiert. Das war die Realität meines Start-ups. Wir liebten den Code, wir feierten jeden Erfolg, und wir bauten eine Gemeinschaft auf, über die sogar das südkoreanische Fernsehen berichtete.

Das koreanische Fernsehen interviewt Startup Gründer Ilja Bauer

Doch trotz dieses Erfolgs und exzellenter technischer Kennzahlen scheiterten wir letztendlich. Wir mussten Mitarbeitende entlassen und auch wir Gründer standen vor dem Nichts und schließlich vor der Frage, ob es sich überhaupt noch lohnt, unsere Plattform weiter zu betreiben.

Dieses Schicksal verdeutlicht ein zentrales Problem: Ein Team kann hochgradig effizient arbeiten und dennoch am Markt vorbei produzieren. In einer Ära, in der AI Prozesse massiv beschleunigt, wird die Differenzierung zwischen bloßem „Output“ und echtem „Impact“ zur Überlebensfrage.

DORA ist ein Gesundheitscheck, kein Kompass

In der Tech-Welt gelten DORA-Metriken als gutes Maß der Dinge. Sie versprechen, dass „Elite-Performer“ erfolgreicher sind. Doch die Geschichte meines Teams zeigt eine schmerzhafte Wahrheit: DORA-Werte sind Korrelationen, keine Kausalitäten. Unsere Werte waren fantastisch – und dennoch klappte es nicht.

Gute DORA-Werte zeigen lediglich an, wie reibungslos die „Maschine“ läuft. Sie sind vergleichbar mit der Wartung eines Fahrrads: Wie gut sind die Bremsen? Wie geölt ist die Kette? Wie gering ist die Reibung? Das ist essenziell, aber es sagt nichts darüber aus, ob man in die richtige Richtung steuert.

Tech-Leads verfallen oft dem Irrtum, „Shipping“, also das Ausliefern von Code, mit Markterfolg gleichzusetzen. Wer jedoch nur das Ausliefern optimiert, ohne die strategische Richtung zu prüfen, erhöht lediglich die Geschwindigkeit, mit der er gegen die Wand fährt.

Das Spiritus-Prinzip – AI als Brandbeschleuniger

Der DORA-Report 2025 bestätigt eine fundamentale Wahrheit: AI ist ein Verstärker. Gutes wird besser, aber Schlechtes wird durch AI noch schlechter. Ich nenne das gerne den Spiritus-Effekt. Mein Vater kippte aus der Hand Spiritus ins Feuer, um den Grill noch schneller zu entfachen. Macht das bitte nicht nach! Die Gefahr ist auch groß, dass am Ende nicht nur der Grill, sondern der ganze Garten brennt.

AI wirkt exakt so: als Multiplikator. Wenn das Fundament stimmt, beschleunigt sie den Erfolg. Wenn die Basis jedoch fehlerhaft ist – sei es in der Strategie oder der Architektur – sorgt die AI lediglich dafür, dass das gesamte Unternehmen schneller abfackelt.

Heute fließen 71 % der AI-Nutzung in die reine Code-Generierung. Das erhöht den Output massiv, führt aber oft dazu, dass Teams in einem "Review-Feuer" untergehen, weil die nachgelagerten Prozesse nicht auf diese Menge ausgelegt sind. Ohne strategische Klarheit beschleunigt AI lediglich die Produktion von technischem Abfall (Waste).

Wenn Deine Discovery-Phase hinkt oder Dein Review-Prozess bereits überlastet ist, wird AI diese Dysfunktionen lediglich maximieren. Du produzierst dann einfach nur schneller Waste, der Dein gesamtes System verstopft.

Die drei Phasen der Software-Produktentwicklung: Discovery, Forming und Shipping. Nur wenn alle drei „Ventile“ offen sind, wird effizient entwickelt. Mehr zu diesen Phasen erfährst Du in unserem Artikel über die Ventil-Metapher.

Human Intent - Die sokratische Disruption

Heutige AI-Tools verleiten uns durch minimalistische Interfaces zum „Vibe Coding“: eine vage User Story in eine kleine Textbox werfen und auf ein Wunder hoffen. AI-Modelle beginnen sie bei Unklarheiten zu interpolieren und füllen Lücken mit statistischen Durchschnittswerten.

Wir verschieben das Problem zwar weg vom Code, hin zu den Anforderungen, schaffen aber eine neue, gewaltige Belastung: das Review von Bergen an generiertem Markdown-Text ist oft mental anstrengender als das eigentliche Denken und die Korrektur von interpoliertem Unsinn frisst den Zeitgewinn meist schnell wieder auf.

Die wahre Disruption liegt nicht in der Generierung, sondern in der Schärfung des menschlichen Willens („Human Intent“). AI sollte als sokratisches Werkzeug genutzt werden, das uns so lange befragt, bis wir absolute Klarheit in unserem eigenen Kopf geschaffen haben. Denselben Weg wählt auch Entire, das im Februar 2026 gegründete Startup des Ex-Github-CEOs Thomas Dohmke. Das Unternehmen sammelte in einer Seed-Finanzierungsrunde 60 Mio. $ ein.

Dieser Ansatz zwingt uns, Mehrdeutigkeiten aus unserer Sprache zu tilgen. In der Praxis zeigt sich der enorme Unterschied:

Ohne Steuerung werden ca. 75 % der Anforderungen von der AI frei erfunden
Selbst bei detaillierten Anforderungen fügt die AI oft noch 30 % ungewollte Details hinzu.
Erst durch ein sokratisches System, das einen „Diff“ zwischen Intent und Generierung bildet und den Entwickler explizit entscheiden lässt, sinkt die Interpolation auf 10 %.

In diesem Modell ist das wertvollste Produkt nicht der Text, sondern das präzise mentale Modell im Kopf der Entwicklerin oder des Entwicklers.

Ilja Bauer zeigt die Ventile der Software-Entwicklung: Discovery, Forming und Shipping.

Impact, statt Output

Um echten Impact zu verstehen, hilft das Bild eines Fahrrads: Du trittst in die Pedale (Effort), die Räder drehen sich (Output), das Fahrrad bewegt sich (Outcome). Aber erst das Erreichen des Ziels ist der Impact.

Das System lässt sich auch als Wasserrohr beschreiben. Es gibt Ventile für Discovery, Forming und Shipping. Aber entscheidend ist die Pumpe – der Druck des eigentlichen Problems.

Unser Team scheiterte damals, weil wir ein „Vitamin“ (Employer Branding/Awareness) verkauften, während die Kunden ein „Schmerzmittel“ (Anstellungen) brauchten. Doch darauf haben wir nicht optimiert. Dieser falsche Fokus ist auch kein Einzelfall. Das sehe ich täglich bei Software-Teams. Oft wird outputorientiert optimiert (Lines of Code, Pull-Requests, Features, etc.) und der wahre Impact (die eigentlichen Business-Ziele) nicht gemessen oder gar aus den Augen verloren.

„Sobald eine Kennzahl zum Ziel erklärt wird, hört sie auf, eine gute Kennzahl zu sein“, sagt schon Goodharts Law. Effort- und Output-Metriken lassen sich zu leicht manipulieren. Sie sollten intern bleiben, um den Prozess zu optimieren, aber niemals als primäre Managementziele dienen.

Fazit: Weniger Reibung, mehr Richtung

Künstliche Intelligenz sollte primär dazu dienen, Verschwendung („Waste“) und Reibung zu reduzieren. Produktivitätsgewinne sind in unserer Branche notorisch schwer zu messen, aber unnötige Arbeit und „Waste“ sind meist offensichtlich.

Wahre Exzellenz bedeutet heute, die Geschwindigkeit der AI mit der sokratischen Präzision des menschlichen Geistes zu paaren. Wer die AI nutzt, um seine eigenen Gedanken zu schärfen und konsequent den Problemraum vor dem Lösungsraum priorisiert, baut die richtigen Dinge und nicht nur Dinge in Rekordzeit.

Der Hebel liegt deshalb weniger in „noch mehr Generierung“, sondern in Klarheit: klare Problemhypothesen, saubere Entscheidungslogik und gute Prozesse.

Wie machen wir weiter?

Wenn Du willst, schauen wir uns das gemeinsam an: Wo geht bei Euch Druck verloren, wo entsteht Waste, und welches Ventil begrenzt gerade den Durchfluss? In diesen Themen beraten und unterstützen wir Teams seit über 13 Jahren. In Zeiten von AI werden sie umso wichtiger. Mit einer soliden Grundlage wird AI zum echten Produktivitätshebel – ohne sie verstärkt sie vor allem Reibung.

Mehr aus dem DevBoost Blog

Wie viel Geschwindigkeit der Einsatz von Gen-AI Software-Teams bringt, schwankt zwischen „massiv schneller“ und „macht uns sogar langsamer“. Beides lässt sich belegen. Was bedeutet das für Software-En...

Verbreitet statt bewährt: Die aktuellen GenAI-Use-Cases im Software Engineering

Felix Hanspach, Lesezeit: 6 Min.

AI ist wie ein Brennglas: Sie bündelt und verstärkt, was bereits vorhanden ist. Wo Schwächen existieren, werden diese unter dem Brennglas erst richtig sichtbar. Das ist in der Softwareentwicklung beso...

Gen-AI als Verstärker: AI macht sichtbar, was bereits da ist – im Guten wie im Schlechten.

Felix Hanspach, Lesezeit: 3 Min.

Eine Produktentwicklung, die einfach läuft, wünscht sich jedes Entwicklungsteam. Damit dies gelingt, bedarf es der Arbeit an 3 Ventilen. Sie zu kennen und immer weiter aufzudrehen ist Aufgabe jedes En...

Die 3 Ventile einer performanten Software-Produktentwicklung

Tobias Nestler, Lesezeit: 6 Min.

Impressum Datenschutz Kontakt

Folge DevBoost

/half-hearted-attempt-at-accessibility-sorry