Lass uns herausfinden, warum Deine Softwareentwicklung zu langsam, zu teuer oder zu komplex geworden ist, und wie Du Gen-AI sinnvoll einsetzt.
Mehr erfahrenLass uns herausfinden, warum Deine Softwareentwicklung zu langsam, zu teuer oder zu komplex geworden ist, und wie Du Gen-AI sinnvoll einsetzt.
Mehr erfahrenWie viel Geschwindigkeit der Einsatz von Gen-AI Software-Teams bringt, schwankt zwischen „massiv schneller“ und „macht uns sogar langsamer“. Beides lässt sich belegen. In einer Studie mit GitHub Copilot waren Teilnehmenden bei einer Coding-Aufgabe ~55,8% schneller. Gleichzeitig fand eine andere Studie heraus, dass AI-Tools Entwickler:innen verlangsamen können. Was bedeutet das für Software-Engineering-Teams? Der Start unserer Artikelreihe zum Thema Gen-AI im Software-Engineering.
von Felix Hanspach, Lesezeit: 6 Min.
Die Debatte darüber, wie viel Geschwindigkeit Gen-AI Software-Teams bringt, schwankt zwischen „massiv schneller“ und „macht uns sogar langsamer“. Beides lässt sich belegen. In einer kontrollierten Studie mit GitHub Copilot waren die Teilnehmenden bei einer konkreten Coding-Aufgabe im Durchschnitt ~55,8% schneller. Gleichzeitig fand eine randomisierte Studie mit erfahrenen Open-Source-Entwickler:innen (frühes 2025), dass AI-Tools in ihrem realen Repo-Kontext im Durchschnitt ~19% mehr Zeit gekostet haben.
Doch was bedeutet das für Software-Engineering-Teams? Welche AI-Use-Cases setzen sich durch und was machen Teams anders, bei denen GenAI die Produktivität nachweislich erhöht? Diesem Thema wollen wir uns in dieser Artikelreihe Schritt für Schritt annähern.
Um eine solide Datenbasis zu schaffen, haben wir in den vergangenen Monaten Interviews mit Tech-Leads (CTOs, Engineering-Leads, Teamleads etc.) aus deutschen Software-Produktunternehmen durchgeführt. In den bisher über 70 Interviews um die Einführung von AI in Unternehmen, konkrete Anwendungsfälle im Software-Engineering, die Einführung, die Zufriedenheit mit dieser und vieles mehr. Die Ergebnisse sind zwar nicht repräsentativ für alle Unternehmen in Deutschland, zeigen jedoch wiederkehrende Muster. In dieser Reihe stellen wir die ersten Ergebnisse vor. Den Anfang machen Anwendungsfälle von GenAI im Software-Engineering. In diesem ersten Teil betrachten wir die Erwartungen und Use Cases im Software-Engineering. Wie Du zu messbarer Wirkung kommst und welche Empfehlungen wir haben, zeigen wir in den nächsten Teilen.
An dieser Stelle großen Dank an alle teilnehmenden Unternehmen. Bist du ebenfalls Tech-Lead in einem deutschen Software-Produkt-Unternehmen? Du würdest uns mit deiner Erfahrung sehr weiterhelfen! Melde dich jetzt bei uns!
“Das Warum”: Welche Ziele sollen erfüllt werden?
Im Vordergrund steht die Erwartung einer höheren Produktivität. Diese soll nicht nur durch eine schnellere Umsetzung, sondern auch durch eine Reduktion der kognitiven Belastung im Arbeitsalltag erreicht werden, beispielsweise bei der Recherche, Dokumentation oder bei Routineentscheidungen. Gleichzeitig wird AI als Hebel gesehen, um mit denselben Ressourcen zu skalieren. Teams sollen einen höheren Output erzielen können, ohne proportional mehr Personal aufzubauen. Ein weiterer zentraler Aspekt ist die Stabilisierung der Qualität, indem KI als „zweites Paar Augen“ für Standards, Konsistenz und Fehlervermeidung genutzt wird. Über diese operativen Effekte hinaus nennen Tech Leads auch Wettbewerbsvorteile, beispielsweise kürzere Time-to-Market oder bessere Kundenerlebnisse. Schließlich wird betont, dass KI nicht nur Entwickler unterstützt, sondern auch nicht-technisches Personal explizit befähigt, Aufgaben effizienter und sicherer zu erledigen.
“Das Was” - Wo hilft mir AI im Software-Engineering
Die aktuellen Use Cases zeichnen sich insbesondere durch die Popularität der derzeit am häufigsten verwendeten AI-Tools aus. Aufgrund der großen Beliebtheit von GitHub Copilot steht bei den Anwendungsfällen die Code-Generierung klar an erster Stelle: Fast alle befragten Unternehmen (91 %) nannten die Generierung von Anwendungscode als aktuellen Anwendungsfall von Generative AI. Einige Gesprächspartner:innen gehen zudem von einer hohen Dunkelziffer aus, da Entwickler:innen unbemerkt KI zur Code-Generierung verwenden. Die hohe Verbreitung sagt jedoch wenig über die damit verbundene Zufriedenheit aus. Häufig wird die Code-Generierung in Verbindung mit Halluzinationen (insbesondere bei der Verwendung von Third-Party-Libraries und Frameworks), Qualitäts- und Sicherheitsbedenken sowie der Überlastung von Entwickler:innen beim Review der Pull-Requests negativ hervorgehoben. Als erfolgreich beschriebene Anwendungsfälle für die Code-Generierung werden häufig das Prototyping oder die Generierung von Unit-Tests genannt.
Die Code-Generierung ist der meistgenutzte Use Case, aber nicht automatisch der beliebteste. Der Gewinn an Geschwindigkeit wird oft durch zusätzlichen Review-Aufwand, Qualitätsfragen und Sicherheitsbedenken wieder zunichte gemacht: Pull Requests werden zum Flaschenhals und die Qualität zur Herausforderung.
Ebenfalls mit großem Vorsprung ist der Bereich Dokumentation und Wissensmanagement der zweitgrößte Cluster für Generative AI im Tech-Bereich. Dieser Cluster umfasst alle Anwendungen, bei denen KI genutzt wird, um Dokumentation zu erstellen oder zu pflegen (z. B. technische Dokumentation, How-tos, Projekt-/Systembeschreibungen) und/oder um Wissen auffindbar und nutzbar zu machen (z. B. interner Chatbot über Wissensdatenbanken, Q&A über Dokumente, „Wo steht das?“-Suche). Auch dieser zweite Platz lässt sich durch die weite Verbreitung von Tools wie ChatGPT oder Microsoft Copilot gut erklären.
Die weiteren Anwendungsfälle liegen deutlich hinter den ersten beiden Plätzen zurück. Was aber keinesfalls bedeuten muss, dass sie je nach Unternehmen weniger relevant sind. Ein Gesprächspartner berichtet, dass für die Erstellung von Reportings im Zusammenhang mit öffentlichen Fördergeldern früher regelmäßig 3 Arbeitstage aufgewendet werden mussten. Durch die Zuhilfenahme von KI sind es nun ca. 3 Stunden. Die freigewordene Zeit wird für den gern der Tätigkeit genutzt: das Programmieren selbst.
Zu anderen Use-Cases und zur Inspiration lohnt sich auch ein Blick in größere qualitative Umfragen wie den DORA AI Report (DORA – State of AI-assisted Software Development 2025), in dem ebenfalls AI-Use-Cases untersucht wurden. Dafür wurden über 5.000 Professionals befragt. Auffällig ist, dass die Code-Erzeugung in unseren Daten zwar verbreiteter war, alle anderen Use Cases in der DORA-Auswertung jedoch verbreiteter sind (man muss jedoch beachten, dass unsere Cluster anders gebildet sind und die Daten daher nicht hundertprozentig vergleichbar sind).
Quelle: DORA AI Report (DORA – State of AI-assisted Software Development 2025)
Was war zuerst da - Das Tool oder der Use-Case?
Die meisten aktuellen Use Cases sind vor allem eines: naheliegend. Sie sind weit verbreitet, da sie sich mit gängigen Tools sofort umsetzen lassen. Ob sie tatsächlich messbar helfen, zeigt sich jedoch erst, wenn klare Ziele, Kriterien und eine verlässliche Umsetzung definiert sind. Wir starten bewusst mit dem Status quo, also den verbreiteten Anwendungen. In den nächsten Teilen gehen wir einen Schritt weiter und behandeln die Fragen, welche Use Cases sich wirklich lohnen, wie Teams sie priorisieren und woran man Produktivitätseffekte belastbar erkennt.
Unsere Daten legen nahe, dass viele Teams nicht mit dem Use Case, sondern mit dem Tool starten. Erst kommt Copilot, dann wird Code generiert. Erst kommt ChatGPT, dann wird die Dokumentation erstellt. Das mag nach Fortschritt aussehen, ist aber häufig eher ein Tool-Rollout als eine durchdachte Strategie.
Wenn man beim Tool beginnt, überspringt man nämlich die wichtigste Frage: Was wollen wir eigentlich erreichen? Ohne Zielbild und messbare Kriterien wird KI schnell zu einem Projekt, das auf dem Bauchgefühl basiert: Man probiert ein bisschen aus, hofft auf das Beste – und am Ende bleibt unklar, was wirklich geholfen hat, was geschadet hat und was als Nächstes Sinn ergibt. Genau deshalb unterscheiden sich High-Performing-Teams oft nicht durch die Tools, die sie nutzen, sondern dadurch, dass sie zuerst Use Cases priorisieren und erst danach Tools auswählen.
Die wichtigste strategische Entscheidung ist selten „Welches Tool?“, sondern „Welcher Use Case zuerst?“. Und das gilt auch für die Einführung von Generativer AI. Wie Software-Engineering-Teams dies besser umsetzen, welche typischen Fehler es gibt und wie man diese vermeidet, vertiefen wir in dieser Artikelserie.
Wie funktioniert die Zusammenarbeit mit DevBoost?
Lass uns herausfinden, warum Deine Softwareentwicklung zu langsam, zu teuer oder zu komplex geworden ist, und wie Du Gen-AI sinnvoll einsetzt.
Mehr erfahren