Das MIT-Projekt NANDA untersuchte über 300 KI-Implementierungen und kam im Juli 2025 zu einem klaren Befund: 95 Prozent der Organisationen sahen aus ihren generativen KI-Pilotprojekten keinen messbaren finanziellen Ertrag. Nur 5 Prozent erzielten echten Wert. Die Studie nennt die Ursache nicht in der Modellqualität, sondern in der Art der Einführung.
Eine KI-Einführung ist eine Folge definierter Phasen mit prüfbaren Ergebnissen, kein Werkzeugkauf. Wer diese Abfolge überspringt, produziert Piloten ohne Anschluss an den Betrieb.
System: der Abstand zwischen Nutzung und Wirkung
Der McKinsey-Bericht State of AI 2025, basierend auf 1.993 Befragten in rund 105 Ländern, beziffert den Abstand präzise. Etwa 88 Prozent der Organisationen nutzen KI in mindestens einer Funktion, doch nur rund ein Drittel hat KI über Pilotprojekte hinaus skaliert. McKinsey ordnet etwa 6 Prozent als High Performer ein, die signifikanten unternehmensweiten Wert erzielen.
Der entscheidende Hebel ist organisatorisch, nicht technisch. McKinsey nennt die fundamentale Neugestaltung von Arbeitsabläufen als die Veränderung mit der höchsten Korrelation zum Ergebnisbeitrag. Zugleich haben erst rund 21 Prozent der Organisationen, die generative KI nutzen, tatsächlich Arbeitsabläufe neu gestaltet. Die übrigen legen KI über bestehende Prozesse, ohne diese zu verändern.
Für den Mittelstand bedeutet das eine Verschiebung der Ausgangsfrage. Sie lautet nicht, welches Werkzeug eingeführt wird, sondern welcher Prozess so verändert wird, dass KI in ihm einen messbaren Beitrag leistet.
Problem: warum gute Werkzeuge nicht genügen
Drei Hürden bestimmen das Scheitern. Sie wiederholen sich über Branchen und Unternehmensgrößen hinweg und sind in den genannten Studien konsistent dokumentiert.
- Datenqualität: Ohne saubere, integrierte und verwaltete Daten skalieren Piloten nicht. Gartner prognostiziert, dass bis 2026 etwa 60 Prozent der KI-Projekte ohne KI-fähige Daten aufgegeben werden.
- Prozessstarrheit: KI auf unveränderte Abläufe zu legen erzeugt bestenfalls marginale Verbesserungen.
- Operating-Model-Trägheit: Funktionssilos, unklare Verantwortlichkeiten und fehlende Steuerung verhindern den Übergang vom Pilot in den Betrieb.
- Regulatorik: Mit dem EU AI Act gelten seit dem 2. August 2025 Pflichten für Anbieter von Allzweck-KI-Modellen; die Anforderungen für Hochrisiko-Systeme greifen ab dem 2. August 2026.
Die Kosten unsystematischer Ansätze sind erheblich. Verschwendetes Budget für Piloten ohne Skalierung, sinkende Akzeptanz im Team und ein wachsender Abstand zu Wettbewerbern, die ihre Abläufe konsequent neu gestalten.
Ansatz: das Phasenmodell
Eine belastbare Einführung folgt fünf Phasen. Jede Phase liefert ein definiertes Ergebnis und bildet die Voraussetzung der nächsten. Der Zweck der Phasenlogik ist nicht Dokumentation, sondern die erzwungene Entscheidung an jedem Übergang.
Phase 1: Analyse und Vorbereitung
Bestandsaufnahme der Prozesse, Zieldefinition und Einbindung der Beteiligten. Diese Phase schafft Transparenz über Abläufe und Potenziale. Ergebnis: Analysebericht, Zielkatalog und Beteiligungsplan.
Phase 2: Strategie und Planung
Auswahl der Anwendungsfälle, Priorisierung und Ressourcenzuordnung. Ein strukturierter Fahrplan mit klar definierten Meilensteinen verhindert die Zersplitterung der Aufmerksamkeit. Ergebnis: priorisierte Use Cases mit Fahrplan und Budgetrahmen.
Phase 3: Umsetzung und Entwicklung
Datenaufbereitung und ein abgegrenzter Pilot. Die Validierung durch einen Proof of Concept sichert die Investitionsentscheidung ab, bevor breit investiert wird. Ergebnis: bereinigte Daten und ein funktionsfähiger Prototyp.
Phase 4: Skalierung und Einführung
Überführung der validierten Lösung in den Betrieb, verbunden mit der Neugestaltung des betroffenen Arbeitsablaufs. An dieser Stelle entscheidet sich, ob aus dem Piloten Wirkung wird. Ergebnis: produktives System mit Plan zur Risikosteuerung.
Phase 5: Betrieb und Optimierung
Laufende Beobachtung, Wartung und Verbesserung. KI-Systeme verändern sich mit den Daten, auf denen sie arbeiten, weshalb kontinuierliches Monitoring kein Zusatz, sondern Bestandteil des Betriebs ist. Ergebnis: Kennzahlenauswertung und Wartungsplan.
Praxis: zwei abgegrenzte Anwendungsfälle
In der Rechnungsverarbeitung ersetzt eine regelbasierte Automatisierung die manuelle Erfassung und Prüfung. Der Ablauf wird dabei nicht nur beschleunigt, sondern neu geschnitten: Die KI übernimmt Erfassung und Vorprüfung, die Freigabe bleibt eine menschliche Entscheidung mit klarem Owner. So sinkt die Bearbeitungszeit, ohne dass die Verantwortung diffundiert.
Im Kundenservice beantwortet ein dialogbasiertes System wiederkehrende Anfragen und entlastet das Team für komplexe Fälle. Auch hier liegt der Wert in der Neugestaltung: Das System bearbeitet definierte Anfragetypen vollständig, alle anderen werden eskaliert. Die Grenze zwischen automatisierter und menschlicher Bearbeitung ist explizit, nicht zufällig.
Wirkung: vom Experiment zum Standard
Der Unterschied zwischen Experiment und Wirkung ist der Abschluss. Eine phasenweise Einführung verankert KI als wiederholbaren Arbeitsschritt statt als einmaligen Versuch. Die MIT- und McKinsey-Daten zeigen dieselbe Richtung: Wer Abläufe neu gestaltet, Datenqualität sichert und über die Pilotphase hinaus investiert, erzielt Ertrag. Wer ohne Phasenlogik startet, zahlt mit Piloten, die nicht in den Betrieb gelangen.
Dieser Beitrag ordnet sich der abamix-Service-Linie KI-Werkstatt zu und verbindet sie mit dem PowerSkill Workflow Automation. Die methodische Grundlage bildet das MOTIVE Framework.
Warum der Mittelstand strukturell im Vorteil ist
Großorganisationen kämpfen bei der KI-Einführung mit Koordinationskosten, die der Mittelstand nicht hat. Ein mittelständisches Unternehmen mit 200 bis 1.500 Mitarbeitenden kann eine Entscheidung in der Führungsrunde treffen und innerhalb von Wochen in den Pilotbetrieb starten, ohne dass Konzernfreigaben, juristische Länderprüfungen und globale Rolloutpläne den Rhythmus bestimmen. McKinsey nennt agile Entscheidungsstrukturen explizit als Merkmal der High-Performer-Gruppe. Diese Strukturmerkmal ist im Mittelstand nicht aufzubauen, sondern bereits vorhanden.
Bitkom erhebt seit mehreren Jahren den Digitalisierungsgrad im deutschen Mittelstand und stellt fest, dass der Abstand zwischen frühen Anwendern und nachzüglerischen Betrieben wächst. Wer heute die Phasenlogik etabliert, baut einen Vorsprung auf, der sich über mehrere Zyklen kumuliert. Wer wartet, schaut auf steigende Einstiegskosten und auf Wettbewerber, die bereits in Phase vier oder fünf operieren.
Regulatorisches Umfeld: EU AI Act als Planungsgrundlage
Der EU AI Act ist nicht Bürokratie, sondern ein Planungsrahmen. Seit dem 2. Februar 2025 gilt die Pflicht zur KI-Kompetenz in Organisationen, die KI einsetzen. Das bedeutet konkret: Wer KI-Systeme betreibt, muss nachweisen können, dass die beteiligten Personen die Funktionsweise, die Grenzen und die Risiken dieser Systeme verstehen. Für die Einführungsplanung folgt daraus eine Ergänzung in Phase 1 und Phase 5: Analyse der betroffenen Systeme gegen die EU-AI-Act-Kategorien und laufendes Monitoring der Pflichten, die ab August 2026 für Hochrisiko-Systeme greifen.
Hochrisiko-Systeme im Sinne des EU AI Act umfassen unter anderem Systeme zur Bewerberbewertung, zur Kreditwürdigkeitsprüfung und zur Überwachung am Arbeitsplatz. Wer in einem mittelständischen Betrieb KI-gestützte HR-Prozesse oder Scoring-Modelle einführt, fällt unter diese Kategorie und muss Risikosteuerung, Datengovernance und menschliche Aufsicht nachweisen. Das Phasenmodell schafft diese Nachweisbarkeit als Nebeneffekt, nicht als Zusatzaufwand: Die definierten Phasenübergänge mit dokumentierten Ergebnissen sind genau die Audittrails, die der EU AI Act verlangt.
Das Operating Model: Struktur für die Skalierung
McKinsey identifiziert das fehlende Operating Model als eine der häufigsten Ursachen, warum Piloten nicht skalieren. Ein Operating Model für KI im Mittelstand muss drei Fragen beantworten: Wer entscheidet über neue Use Cases? Wer verantwortet den laufenden Betrieb? Und wie wird Wissen aus einem Use Case für den nächsten genutzt?
Die erste Frage betrifft die Governance: Eine klare Entscheidungsinstanz, oft ein kleines KI-Steuerungsgremium mit Vertreter aus Fachbereich, IT und Geschäftsführung, verhindert, dass jede Abteilung für sich Piloten startet und das Portfolio unkontrolliert wächst. Die zweite Frage betrifft die Betriebsverantwortung: Jeder produktive Use Case braucht einen benannten Owner, der für Qualität, Monitoring und Eskalation zuständig ist. Die dritte Frage betrifft den Lernmechanismus: Ohne dokumentierte Retrospektiven werden Fehler wiederholt und Erfolge nicht repliziert.
- KI-Steuerungsgremium: Entscheidungsinstanz für neue Use Cases mit Vertretern aus Fachbereich, IT und Geschäftsführung.
- Use-Case-Owner: benannte Person mit Verantwortung für Qualität, Monitoring und Eskalation im laufenden Betrieb.
- Retrospektiven: dokumentierter Lernmechanismus nach jedem Pilotabschluss, der Fehler und Erfolge explizit macht.
- Wissensbasis: strukturierte Ablage aller Use Cases mit Bewertungen, Entscheidungen und Ergebnissen.
Messung: welche Kennzahlen die Einführung steuern
Eine KI-Einführung ohne Messrahmen bleibt anekdotisch. Wer nicht misst, ob der Pilot tatsächlich Wirkung erzeugt, kann weder begründen, weshalb er weiter investiert, noch erkennen, wann er abbrechen sollte. Die Kennzahlen richten sich nach dem Use Case, aber ein Grundmuster gilt übergreifend: Jede Phase braucht eine Eingangskennzahl, die den Ausgangszustand beschreibt, und eine Ausgangskennzahl, die den erzielten Zustand dokumentiert.
Für die Rechnungsverarbeitung sind das Bearbeitungszeit und Fehlerquote vor und nach der Automatisierung. Für den Kundenservice sind es Erstlösungsquote, durchschnittliche Bearbeitungszeit und Eskalationsrate. Für interne Wissensabfragen misst man die Zeit von der Anfrage bis zur verwertbaren Antwort. Diese Kennzahlen werden vor dem Pilot erhoben, nicht danach. Wer erst nach der Einführung zu messen beginnt, hat keine Vergleichsbasis und keinen Nachweis.
Häufige Fehler in der Praxis und wie das Phasenmodell sie verhindert
Die fünf häufigsten Fehler bei der KI-Einführung im Mittelstand folgen einem erkennbaren Muster. Sie entstehen nicht aus Unwissenheit, sondern aus dem Druck, schnell sichtbare Ergebnisse zu liefern, und aus dem Fehlen einer Struktur, die diesen Druck kanalisiert.
- Werkzeug vor Problem: Ein Anbieter demonstriert ein beeindruckendes Tool, und das Unternehmen sucht dann eine Anwendung dafür. Das Phasenmodell beginnt mit der Prozessanalyse, nicht mit der Werkzeugauswahl.
- Pilot ohne Abschluss: Der Pilot startet, zeigt erste Ergebnisse und läuft dann ohne klare Entscheidung weiter. Phase 4 erzwingt den Übergang: Entweder in den Betrieb oder expliziter Abbruch mit dokumentiertem Grund.
- Fehlende Datenbasis: Die Einführung beginnt ohne Prüfung der Datenqualität. Phase 3 verlangt bereinigte Daten als Voraussetzung, nicht als Zubringer.
- Kein Prozess-Redesign: KI wird über den bestehenden Ablauf gelegt, ohne ihn zu verändern. Phase 4 beinhaltet explizit die Neugestaltung des betroffenen Prozesses.
- Kein Owner im Betrieb: Nach dem Piloten ist unklar, wer das System überwacht. Phase 5 beginnt mit der Benennung des Owners, nicht mit dem Monitoring-Tool.
Die Investitionslogik: wann KI im Mittelstand rechnet
Eine realistische Bewertung der KI-Investition folgt nicht dem Modell der einmaligen Implementierungskosten, die sich schnell amortisieren. KI-Systeme erfordern laufende Investitionen in Datenpflege, Monitoring, Modell-Updates und Prozessanpassung. Wer diese Folgekosten nicht einplant, unterschätzt den tatsächlichen Aufwand um typischerweise 40 bis 60 Prozent.
Die Kehrseite gilt ebenso: Der kumulierte Ertrag wächst mit jeder abgeschlossenen Phase. Ein Use Case, der in Phase 5 stabil läuft, erzeugt laufend Wert ohne proportionale Kostenerhöhung. Drei solcher Use Cases in Betrieb sind ökonomisch bedeutsam. Das Ziel der phasenweisen Einführung ist damit nicht der einzelne Pilot, sondern das Portfolio stabiler, produktiver Use Cases, das auf dem Operating Model aufbaut.
Verbindung zu Bitkom-Daten: Stand der KI im deutschen Mittelstand
Bitkom erhebt jährlich den Einsatz von KI in deutschen Unternehmen. Die Daten zeigen, dass der Anteil der Unternehmen, die KI produktiv einsetzen, seit 2023 deutlich gestiegen ist, zugleich aber ein großer Teil der Anwender KI nur in einzelnen, isolierten Anwendungen nutzt, ohne sie in Kernprozesse zu integrieren. Die Bitkom-Daten bestätigen damit den McKinsey-Befund: Breite Nutzung ohne Tiefe erzeugt keine signifikanten Erträge.
Für die Priorisierung der Einführungsphasen folgt daraus: Phase 4, die Skalierung mit Prozess-Redesign, ist die Engstelle, nicht Phase 1 oder 3. Die meisten Mittelständler stecken zwischen Phase 3 und Phase 4: Sie haben validierte Piloten, aber kein Operating Model, das den Übergang in den Betrieb strukturiert. Genau dort setzt das Phasenmodell mit dem definierten Übergangsentscheid an.
Kompetenzaufbau als Einführungsvoraussetzung
Seit dem 2. Februar 2025 verlangt der EU AI Act von Organisationen, die KI einsetzen, nachweisbare KI-Kompetenz. Diese Pflicht ist kein Schulungsprogramm für alle, sondern eine gezielte Qualifizierung der Personen, die KI-Systeme entwickeln, betreiben oder beaufsichtigen. Im Phasenmodell ist Kompetenzaufbau kein eigener Schritt, sondern eine begleitende Maßnahme in jeder Phase: In Phase 1 lernen Analysten, Prozessrisiken zu erkennen. In Phase 3 lernen Pilotteams, Modellgrenzen einzuschätzen. In Phase 5 lernen Owner, Monitoring-Kennzahlen zu interpretieren. Wer Kompetenz als einmaligen Workshop behandelt, investiert in Wissen ohne Anwendung.
Bitkom zeigt in seinem KI-Kompetenz-Barometer 2025, dass der Anteil der Unternehmen, die gezielte KI-Weiterbildung für Fachkräfte durchführen, gegenüber dem Vorjahr gestiegen ist, aber immer noch weniger als die Hälfte der befragten Mittelständler hat eine strukturierte Lernpfad-Initiative laufen. Der strategische Unterschied zu bloßen Tool-Einführungen ist erheblich: Mitarbeitende, die die Logik hinter einem KI-System verstehen, erkennen Fehler früher, eskalieren präziser und passen Prompts oder Regeln eigenständig an. Das reduziert die Abhängigkeit von externen Dienstleistern und macht das Operating Model resilienter.
McKinsey State of AI 2025 zeigt, dass High Performer signifikant häufiger in Mitarbeiterkompetenz investieren als der Durchschnitt. Diese Investition ist keine Wohlfühlmaßnahme, sondern eine operative Voraussetzung: Ohne die Fähigkeit der beteiligten Personen, ein KI-System sicher einzusetzen, zu hinterfragen und zu korrigieren, ist menschliche Aufsicht eine formale Anforderung ohne tatsächliche Schutzwirkung. Die Kompetenzpflicht des EU AI Act und die High-Performer-Logik von McKinsey zeigen in dieselbe Richtung: Wer in seine Mitarbeitenden investiert, baut nicht nur Compliance auf, sondern die Organisationskapazität, die KI-Einführungen über die Pilotphase hinaus trägt.
Nächster Schritt
Im Discovery Workshop priorisieren Sie Ihre Anwendungsfälle und erhalten eine umsetzbare Reihenfolge.
Discovery Workshop buchenQuellen
- McKinsey & Company: The State of AI in 2025 — Agents, Innovation, and Transformation (November 2025), https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai
- MIT Project NANDA: The GenAI Divide — State of AI in Business 2025 (Juli 2025), https://nanda.media.mit.edu
- Europäische Kommission: AI Act — Implementation Timeline, https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai
- Gartner: Prognose zur Aufgabe von KI-Projekten ohne KI-fähige Daten bis 2026, https://www.gartner.com
- Bitkom: KI im Mittelstand — Digitalisierungsindex, https://www.bitkom.org