Das MIT-Projekt NANDA führt die Misserfolgsquote generativer KI-Piloten auf den Ansatz zurück, nicht auf die Technologie. Erfolgreiche Organisationen wählen einen Schmerzpunkt, führen ihn sauber aus und integrieren ihn tief in den Arbeitsablauf. Gescheiterte Organisationen testen breit und integrieren flach.
Ein KI-Portfolio braucht eine Bewertung vor der Technologieauswahl, keine Ansammlung von Werkzeugen. Wer Werkzeuge vor Problemen wählt, sucht Anwendungen für Lösungen.
System: was einen tragfähigen Use Case ausmacht
Ein belastbarer Use Case verbindet ein konkretes Geschäftsproblem mit einem realistischen Datenfundament. Er definiert einen begrenzten Funktionsumfang, messbare Erfolgskriterien und die beteiligten Rollen. Fehlt eines dieser fünf Merkmale, bleibt die Bewertung spekulativ und der Use Case nicht entscheidbar.
- Geschäftsanker: ein konkretes Problem oder Chancenpotenzial mit messbarer Wirkung.
- Datenfundament: identifizierte Quellen mit realistischer Qualitätsbewertung.
- Abgegrenzter Umfang: begrenzte Funktionalität, die ein Ausufern vermeidet.
- Erfolgskriterien: quantifizierte Metriken, die eine objektive Bewertung ermöglichen.
- Rollen: benannte Auftraggeber, Nutzer und Betroffene.
Problem: drei wiederkehrende Fehler
Der erste Fehler ist das Werkzeug-zuerst-Denken. Die Auswahl beginnt mit der Plattform statt mit dem Problem, und Lösungen suchen sich Probleme von unpassender Form. Der zweite Fehler ist der fehlende Geschäftsbezug: technisch interessante Projekte ohne erkennbaren Nutzen erschöpfen Budget und erzeugen Skepsis bei Entscheidern. Der dritte Fehler ist die ignorierte Organisationsreife: Use Cases, die Fähigkeiten voraussetzen, die nicht vorhanden sind, scheitern in der Umsetzung und verstärken den Widerstand gegen Veränderung.
In vielen Organisationen laufen mehrere Werkzeuge parallel, einzelne Abteilungen starten unkoordinierte Piloten, und niemand überblickt das Gesamtportfolio. Die Folge sind konkurrierende Erwartungen und fragmentierte Ressourcen, nicht ein priorisierter Fahrplan.
Ansatz: Explorer und Discovery-Methodik
Der abamix KI Use Case Explorer stellt eine kuratierte Bibliothek dokumentierter Anwendungsfälle bereit, filterbar nach Funktionsbereichen wie Marketing, Vertrieb, Personal, Finanzen, IT, Kundenservice, Produktion und Einkauf. Der Explorer liefert die Ausgangsmenge und verhindert, dass eine Organisation bei null beginnt.
Das Agentic AI Discovery & Elaboration Framework (AADEF) strukturiert die anschließende Bewertung in drei Phasen: Identifikation, Bewertung und Ausarbeitung. Es bildet das methodische Rückgrat des Discovery Workshops und verbindet die strategische Priorisierung mit operativer Umsetzungsreife. Jeder Use Case wird gegen Wert, Risiko und Betriebsfähigkeit bewertet.
Praxis: von der Liste zur Reihenfolge
Die Impact-Achse erfasst den erwarteten Geschäftsnutzen, die Effort-Achse den Aufwand aus Daten, Integration und Change. Ein Use Case im Quadranten hoher Nutzen und geringer Aufwand wird zum Quick Win, der die Organisation früh lernen lässt. Ein Use Case mit hohem Nutzen und hohem Aufwand wird bewusst terminiert, nicht spontan gestartet. Use Cases mit geringem Nutzen werden gestrichen, unabhängig davon, wie technisch reizvoll sie wirken. Diese explizite Streichung ist der eigentliche Mechanismus der Priorisierung.
Eine unsortierte Ideenliste wird über Impact- und Effort-Kriterien zu einer priorisierten Reihenfolge. Jeder bewertete Use Case erhält eine Routing-Empfehlung. Use Cases mit Workflow- und Konfigurationsbedarf gehen in die AI Intervention — powered by TRIARDIS-Methode. Use Cases mit Bedarf an Custom-Entwicklung gehen in Foundation. Breitere Transformationsvorhaben gehen in Performing. Nicht reife Use Cases gehen zurück in die Kompetenzbildung.
Damit wird aus Aktivität eine Entscheidung. Die Organisation weiß nicht nur, was sie tun könnte, sondern in welcher Reihenfolge und mit welchem nachgelagerten Service.
Differenzierung: Priorisierung gegen Fokus
Priorisierung und Fokus werden oft verwechselt, sind aber verschieden. Priorisierung ordnet alle Use Cases in eine Reihenfolge und behält jeden auf der Liste. Fokus entfernt Use Cases dauerhaft. Eine Roadmap mit zwanzig priorisierten Use Cases erzeugt zwanzig parallele Erwartungen und teilt die Aufmerksamkeit so weit, dass keiner abgeschlossen wird.
Die Discovery-Methodik erzwingt Fokus, indem sie die Zahl der gleichzeitig verfolgten Use Cases begrenzt. Drei abgeschlossene Use Cases erzeugen drei belastbare Standards, an denen die Organisation lernt. Zwanzig begonnene Use Cases erzeugen Aktivität ohne Lerneffekt. Die Begrenzung ist damit kein Mangel an Ehrgeiz, sondern die Bedingung für Wirkung.
Wirkung: weniger Streuung, mehr Abschluss
Eine systematische Vorbereitung reduziert Investitionen in Piloten, die nicht skalieren, und verkürzt den Weg zum ersten produktiven Use Case. Validierte Use Cases haben eine höhere Erfolgswahrscheinlichkeit, weil ihre Voraussetzungen vor dem Bau geklärt sind. Die dokumentierte Governance steht von Beginn an, was die Auditfähigkeit gegenüber dem EU AI Act stützt.
Dieser Beitrag ordnet sich der abamix-Service-Linie Discovery Workshop zu und verbindet sie mit dem PowerSkill Use Case Evaluation. Die methodische Grundlage bildet das MOTIVE Framework.
Warum die Bewertung vor der Werkzeugauswahl kommen muss
Der McKinsey State of AI 2025 zeigt, dass High Performer beim Einstieg in KI-Vorhaben systematisch anders vorgehen als der Durchschnitt: Sie definieren das geschäftliche Ziel und die Erfolgskennzahl, bevor sie die Technologie auswählen. Diese Reihenfolge ist nicht intuitiv, weil Technologieanbieter regelmäßig mit Demonstrationen antreten, die beeindrucken und den Wunsch erzeugen, sofort zu starten. Das Problem ist strukturell: Wer ein Werkzeug demonstriert, zeigt, was die Technologie kann. Was die Organisation braucht, ist eine andere Frage.
Die Konsequenz im Bewertungsprozess: Die erste Stufe der AADEF-Methodik fragt ausschließlich nach dem Geschäftsproblem und dem Ertragspotenzial. Technologieoptionen werden erst in der zweiten Stufe diskutiert, nachdem das Problem und seine Messbarkeit feststehen. Wer diese Reihenfolge dreht, landet in der Situation, die das MIT-Projekt NANDA beschreibt: ein Pilot, der technisch funktioniert, aber keinen messbaren Geschäftsertrag erzeugt, weil das Problem, das er löst, nie klar spezifiziert war.
Datenfundament als Priorisierungsdimension
Gartner prognostiziert, dass bis 2026 rund 60 Prozent der KI-Projekte ohne KI-fähige Daten aufgegeben werden. Diese Zahl hat eine direkte Konsequenz für die Use-Case-Priorisierung: Zwei Use Cases können dasselbe Impact-Niveau haben, aber einer verfügt über ein belastbares Datenfundament, der andere nicht. Die Priorisierung nach Impact allein würde den datenschwachen Use Case an den Start setzen, obwohl die Erfolgswahrscheinlichkeit erheblich geringer ist.
Die AADEF-Methodik integriert die Datenbewertung deshalb als eigenständige Dimension, nicht als Unterkriterium des Aufwands. Für jeden Use Case wird erhoben, welche Datenquellen existieren, in welchem Zustand sie sich befinden und welcher Aufwand zur Bereinigung und Integration nötig ist. Ein Use Case mit mittlerem Impact und guter Datenbasis kann einen Use Case mit hohem Impact und schwacher Datenbasis in der Reihenfolge überholen, weil die Realisierungswahrscheinlichkeit den erwarteten Ertrag gewichtet.
Organisationsreife: der unterschätzte Priorisierungsfaktor
Use Cases scheitern nicht nur an Daten und Technologie, sondern an der Aufnahmekapazität der Organisation. Ein Use Case, der einen stabilen Change-Management-Prozess erfordert, kann in einer Organisation mit geringer Change-Erfahrung nicht erfolgreich eingeführt werden, selbst wenn alle technischen Voraussetzungen erfüllt sind. Diese Einschränkung zu ignorieren ist der dritte wiederkehrende Fehler in der Praxis.
Die Organisationsreife wird in der AADEF-Bewertung entlang von vier Feldern eingeschätzt: Datenkompetenz der betroffenen Teams, Change-Management-Erfahrung der Abteilung, Verfügbarkeit eines benennbaren Use-Case-Owners und Bereitschaft der Führungsebene, das Vorhaben aktiv zu unterstützen. Ein Use Case, der in drei dieser vier Felder Reife zeigt, hat eine deutlich höhere Erfolgschance als ein Use Case ohne Reife, selbst wenn sein Impact-Wert höher liegt. Diese Gewichtung ist nicht intuitiv, aber empirisch gestützt: MIT NANDA beschreibt den Reifegrad der Organisation als stärksten Einzelprediktor für den Übergang vom Pilot in den Betrieb.
Praxisbeispiel: von der Ideenliste zur Roadmap in einem Produktionsunternehmen
Ein mittelständischer Maschinenbauer mit rund 600 Mitarbeitenden sammelt in einem Workshop zwölf KI-Ideen aus verschiedenen Abteilungen. Die Vorschläge reichen von KI-gestützter Qualitätskontrolle in der Fertigung über automatisierte Angebotserstellung im Vertrieb bis zu einem internen Wissensassistenten für die technische Dokumentation. Alle zwölf Ideen haben Befürworter, alle zwölf erscheinen plausibel.
Die AADEF-Bewertung ergibt folgendes Bild: Die Qualitätskontrolle hat das höchste Impactpotenzial, aber die Sensordaten sind uneinheitlich erfasst, und das Fertigungsteam hat keine Erfahrung mit datengetriebenen Systemen. Die Angebotserstellung hat mittleres Impact-Potenzial, aber alle CRM-Daten sind strukturiert vorhanden, und der Vertriebsleiter ist bereit, Use-Case-Owner zu werden. Der Wissensassistent hat geringes Impact-Potenzial, wäre aber technisch einfach umsetzbar.
Die Priorisierung: Die Angebotserstellung wird als erster Use Case gestartet, weil Impact, Datenfundament und Organisationsreife zusammenpassen. Die Qualitätskontrolle wird als zweiter Use Case geplant, mit vorgelagerter Dateninvestition. Der Wissensassistent wird gestrichen, nicht weil er schlecht ist, sondern weil geringes Impact-Potenzial keine Priorität in einem begrenzten Portfolio verdient. Die Organisation lernt aus Use Case 1, bevor sie Use Case 2 startet.
EU AI Act: Governance-Anforderungen früh in die Bewertung einbauen
Seit dem 2. August 2025 gelten für Organisationen, die Allzweck-KI-Modelle einsetzen oder integrieren, spezifische Transparenzpflichten. Ab August 2026 greifen für Hochrisiko-Systeme vollständige Anforderungen an Risikosteuerung, Datengovernance und menschliche Aufsicht. Diese Anforderungen sind kein Nachsorgethema, sondern eine Priorisierungsdimension: Use Cases, die in die Hochrisiko-Kategorie fallen, erfordern einen erhöhten Governance-Aufwand, der die Effort-Achse verschiebt.
Für die Praxis bedeutet das: Jeder Use Case wird in der Bewertung gegen die EU-AI-Act-Klassifikation geprüft. Fällt er in die Hochrisiko-Kategorie, erhöht sich die Effort-Schätzung um den Governance-Aufwand. Fällt er nicht darunter, bleibt die Bewertung unverändert. Diese explizite Klassifikation verhindert, dass Governance-Kosten erst im Betrieb sichtbar werden und die Wirtschaftlichkeit des Use Case nachträglich in Frage stellen.
Das Routing-Prinzip: warum jeder Use Case einen klaren nächsten Schritt braucht
Eine Priorisierung, die nur eine Reihenfolge erzeugt, ist halb fertig. Der entscheidende Schritt ist das Routing: Jeder Use Case, der priorisiert wurde, erhält eine explizite Empfehlung, wie er umgesetzt wird. Ohne Routing bleibt die Organisation mit einer geordneten Liste, aber ohne konkreten nächsten Schritt.
Das Routing unterscheidet vier Pfade. Der erste Pfad ist die AI Intervention: Use Cases, die sich durch Workflow-Konfiguration und Prompt-Engineering lösen lassen, ohne Custom-Entwicklung. Der zweite Pfad ist Foundation: Use Cases, die eine technische Grundlage, also Datenintegration, API-Anbindung oder eigene Modellentwicklung, erfordern. Der dritte Pfad ist Performing: Use Cases, die Teil einer breiteren Transformationsinitiative sind und eine Organisationsentwicklung voraussetzen. Der vierte Pfad ist Lernen: Use Cases, die noch nicht reif sind und zunächst Kompetenzaufbau erfordern.
Portfolio-Steuerung: von der Einzelbewertung zur Gesamtsteuerung
Eine belastbare Priorisierung endet nicht mit der Reihenfolge der Use Cases, sondern beginnt dort. Wer fünf Use Cases priorisiert hat, braucht eine Steuerungslogik, die verhindert, dass alle fünf gleichzeitig starten. Die Begrenzung paralleler Vorhaben ist kein Ressourcenproblem, sondern ein Lernproblem: Jeder neue Use Case verbraucht die organisatorische Aufmerksamkeit, die für den Abschluss des vorherigen benötigt wird. McKinsey beschreibt dieses Muster als eine der häufigsten Ursachen für das Pilotfriedhof-Phänomen, bei dem viele Vorhaben beginnen, aber wenige in den Betrieb gelangen. Die Steuerungslogik lautet: Erst abschließen, dann starten.
Für die Portfolio-Steuerung empfiehlt sich ein einfaches WIP-Limit, abgeleitet aus der Lean-Methodik: Maximal zwei bis drei Use Cases befinden sich gleichzeitig in der aktiven Umsetzungsphase. Alle übrigen bewerteten Use Cases liegen im priorisierten Backlog und werden in einer Quartals-Review aktualisiert, weil sich sowohl Geschäftsprioritäten als auch Datenlage verändern. Dieser Rhythmus verhindert, dass eine einmal erstellte Roadmap veraltet, ohne dass jemand dies bemerkt. MIT NANDA zeigt, dass der Übergang vom Pilot in den Betrieb die engste Stelle ist; eine aktive Portfolio-Steuerung mit WIP-Limit schützt genau diesen Übergang.
Stakeholder-Management: wer in der Bewertung sitzen muss
Eine Priorisierung, die ausschließlich von der IT oder von einem KI-Team durchgeführt wird, erzeugt Reihenfolgen, die im Fachbereich keine Akzeptanz finden. Die AADEF-Methodik ist darauf ausgelegt, den Fachbereich in die Bewertung einzubeziehen: Der Auftraggeber eines Use Cases muss die Erfolgskriteriendefinition aktiv mittragen, nicht nur genehmigen. Wer nicht bereit ist, Erfolgskriterien zu benennen und die Verantwortung für die Basismessung zu übernehmen, signalisiert damit, dass der geschäftliche Bedarf nicht ausreichend konkret ist. Diese Hürde ist kein Bürokratieproblem, sondern ein Qualitätsmechanismus: Sie filtert Use Cases heraus, die zwar technisch interessant sind, aber keinen verantwortlichen Auftraggeber finden.
Gartner empfiehlt für KI-Vorhaben eine Beteiligungsstruktur, die Fachbereich, IT und Datenkompetenz gleichwertig einbindet. In mittelständischen Organisationen ist diese Struktur häufig informell vorhanden, muss aber für eine belastbare Priorisierung formalisiert werden. Das bedeutet: ein benannter Fachvertreter pro Use Case, der in der Bewertungssitzung anwesend ist und die Impact-Schätzung verantwortet, sowie ein benannter Datenverantwortlicher, der die Datenbewertung zeichnet. Beide Rollen dauern nicht länger als den Discovery Workshop; ihre Benennung vor dem Workshop ist die Voraussetzung für eine belastbare Entscheidung.
Wer die erste Wahl des Use Cases sorgfältig trifft, legt den Grundstein für alle weiteren Entscheidungen im KI-Portfolio.
Nächster Schritt
Im Discovery Workshop priorisieren Sie Ihre Use Cases und erhalten eine Routing-Empfehlung je Anwendungsfall.
Discovery Workshop buchenDer Mittelstand hat dabei einen strukturellen Vorteil gegenüber Großorganisationen. Kürzere Entscheidungswege erlauben es, eine priorisierte Reihenfolge schnell umzusetzen und die ersten Standards binnen weniger Wochen zu etablieren. Wer diesen Vorteil nutzt, gleicht den Rückstand bei Budget und Spezialisierung durch Geschwindigkeit und Fokus aus. Die Methodik liefert dafür den Rahmen, die Organisation liefert die Entschlossenheit.
Quellen
- MIT Project NANDA: The GenAI Divide — State of AI in Business 2025 (Juli 2025), https://nanda.media.mit.edu
- McKinsey & Company: The State of AI in 2025 (November 2025), https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai
- Gartner: Prognose zur Aufgabe von KI-Projekten ohne KI-fähige Daten bis 2026, https://www.gartner.com
- Europäische Kommission: AI Act — Regulatory Framework, https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai
- Bitkom: KI-Nutzung im deutschen Mittelstand, https://www.bitkom.org