Datenqualität als Erfolgsfaktor für KI-Projekte

Das MIT-Projekt NANDA benennt Datenbereitschaft, Workflow-Integration und das Fehlen eines definierten Ergebnisses als die Hauptgründe, warum 95 Prozent der generativen KI-Piloten keinen messbaren Ertrag liefern. Gartner prognostiziert, dass bis 2026 etwa 60 Prozent der KI-Projekte ohne KI-fähige Daten aufgegeben werden.

KI-Erfolg ist eine Funktion der Datenqualität, nicht der algorithmischen Komplexität. Wer in Modelle investiert, bevor die Daten stimmen, automatisiert Fehler.

System: das unterschätzte Fundament

Organisationen investieren in Algorithmen und übersehen die Datenqualität als primären Erfolgsfaktor. Laut MIT Sloan Management Review (2024) nennen Unternehmen datenbedingte Herausforderungen als zentrale Hürde bei der Technologieadoption. Die Datenarchitektur ist damit kein nachgelagertes Thema, sondern die Voraussetzung jeder KI-Initiative. Der McKinsey-Bericht State of AI 2025 ordnet Datenqualität und Architektur konsistent unter die Blocker, die das Skalieren über die Pilotphase hinaus verhindern.

Problem: vier Dimensionen mangelnder Qualität

Schlechte Datenqualität zeigt sich entlang messbarer Dimensionen. Jede Dimension lässt sich prüfen, beziffern und gezielt verbessern. Wer Datenqualität nicht misst, kann ihre Wirkung auf das Modell nicht steuern.

Vollständigkeit: Anteil vorhandener gegenüber erwarteten Datenpunkten.
Konsistenz: Widerspruchsfreiheit über Systeme hinweg.
Aktualität: zeitliche Nähe der Daten zum Geschäftsereignis.
Genauigkeit: Übereinstimmung mit dem realen Sachverhalt.
Eindeutigkeit: keine Duplikate oder Mehrfacherfassungen.

Ansatz: Modellierung, Taxonomie, Prozess

Der Reihenfolge dieser drei Schritte liegt eine Logik zugrunde. Ohne konsolidierte Architektur lässt sich keine konsistente Taxonomie anwenden, weil dieselben Felder in verschiedenen Systemen unterschiedlich strukturiert sind. Ohne Taxonomie greift der Qualitätsprozess ins Leere, weil unklar bleibt, welche Felder gegen welche Regel geprüft werden. Wer in umgekehrter Reihenfolge beginnt und zuerst Qualitätsregeln definiert, prüft Daten, die noch keine gemeinsame Bedeutung haben. Datenqualität ist deshalb ein Architekturthema, bevor sie ein Prüfthema wird.

Die Datenmodellierung konsolidiert verteilte Bestände in einer einheitlichen Architektur. Ein Lakehouse-Muster mit offenen Formaten verbindet kosteneffizienten Objektspeicher mit transaktionaler Zuverlässigkeit und bildet die technische Grundlage. Verteilte, über Jahre gewachsene Bestände werden so zu einer abfragbaren Basis.

Eine Datentaxonomie nach anerkanntem Standard etabliert eine gemeinsame Sprache über Abteilungsgrenzen hinweg. Eine hierarchische Struktur von der Geschäftsdomäne über den Prozess und die Aktivität bis zum einzelnen Datenpunkt verhindert, dass dieselbe Information in verschiedenen Abteilungen unterschiedlich benannt wird. Ein dediziertes Data-Steward-Team hält die Taxonomie konsistent.

Ein kontinuierlicher Qualitätsprozess hält das Niveau. Automatisierte Qualitätsprüfungen entlang der definierten Dimensionen reduzieren den manuellen Nachbearbeitungsaufwand und machen Abweichungen früh sichtbar. Qualität ist kein Zustand, sondern ein laufender Prozess.

Praxis: vom Projekt zur Skalierung

Das CRISP-DM-Framework strukturiert den Weg in klar getrennte Phasen. Die Reihenfolge sichert, dass nur validierte Lösungen in den Betrieb gelangen, und verhindert die Pilotfalle, die MIT und McKinsey gleichermaßen beschreiben.

Discovery: Prozessanalyse und Stakeholder-Mapping, um den Use Case zu erden.
Proof of Concept: schnelle Validierung der Machbarkeit vor breiter Investition.
Pilotierung: kontrollierte Einführung mit Feature Flags und Vergleichstests.
Skalierung: Überführung in eine containerisierte, versionierte Infrastruktur.
Optimierung: kontinuierliches Monitoring der Modell- und Datenqualität.

Praxis: ein Anwendungsbeispiel

Ein Dienstleister mit über Jahre gewachsenen Beständen aus mehreren Systemen konsolidiert seine Daten in einer einheitlichen Architektur. Durch Normalisierung, Anreicherung und die Anwendung einer konsistenten Taxonomie wird die Datenbasis abfragbar und prognosefähig. Erst auf dieser Grundlage liefert ein Prognosemodell verlässliche Ergebnisse, weil es nicht mehr auf widersprüchlichen Feldern arbeitet.

Das Beispiel zeigt die Reihenfolge: Nicht das Modell, sondern die Datenbasis war der begrenzende Faktor. Die Investition in Architektur und Taxonomie ging dem Modell voraus und machte es erst wirksam.

Die Wirkung lässt sich messen, indem die Prognosegenauigkeit vor und nach der Konsolidierung verglichen wird. Steigt sie deutlich, ohne dass das Modell verändert wurde, war die Datenbasis der begrenzende Faktor. Diese Vorher-Nachher-Messung macht den Beitrag der Datenarbeit sichtbar und liefert zugleich die Begründung für die Investition gegenüber der Geschäftsführung.

Wirkung: Datenexzellenz als Vorteil

Unternehmen, die systematisch in Datenarchitektur, Prozessdisziplin und Governance investieren, erzielen verlässlichere KI-Ergebnisse und weniger Nacharbeit. Der Befund von MIT und Gartner zeigt die Kehrseite: Ohne KI-fähige Daten scheitern Projekte unabhängig von der Modellwahl. Der Aufbau ist eine kontinuierliche Investition, kein einmaliges Projekt, und genau diese Konsistenz unterscheidet die wenigen erfolgreichen Initiativen von der Mehrheit.

Dieser Beitrag ordnet sich der abamix-Service-Linie Foundation zu und verbindet sie mit dem PowerSkill Output Quality Assurance. Die methodische Grundlage bildet das MOTIVE Framework.

Datenqualität messen: ein Bewertungsrahmen für den Mittelstand

Bevor eine Organisation in Datenbereinigung investiert, muss sie wissen, wo sie steht. Ein Datenqualitäts-Assessment bildet den Ausgangspunkt. Es erhebt für jede relevante Datenquelle die fünf Qualitätsdimensionen und erzeugt ein Profil, das Prioritäten setzt. Nicht alle Daten müssen auf dasselbe Qualitätsniveau gebracht werden: Daten, die für den geplanten Use Case irrelevant sind, können ignoriert werden. Daten, die kritisch sind, erhalten die Investitionspriorität.

Ein pragmatisches Assessment-Vorgehen folgt drei Schritten. Erstens: Inventarisierung aller Datenquellen, die für die geplanten Use Cases relevant sind, mit Beschreibung des Inhalts, der Eigentümerschaft und der Systeme, in denen sie liegen. Zweitens: Stichprobenmessung der Qualitätsdimensionen für jede Quelle, um Baseline-Werte zu ermitteln. Drittens: Priorisierung der Bereinigungsmaßnahmen nach dem Use-Case-Beitrag der jeweiligen Datenquelle. Dieser Prozess dauert in mittelständischen Organisationen typischerweise zwei bis vier Wochen und liefert eine handlungsfähige Grundlage.

Die Kosten schlechter Daten: was auf dem Spiel steht

Gartner schätzt, dass schlechte Datenqualität Organisationen durchschnittlich 12,9 Millionen US-Dollar pro Jahr kostet — dieser Wert gilt für Großorganisationen, ist im Mittelstand aber proportional nicht geringer, sondern häufig höher, weil die Folgekosten auf weniger Ressourcen treffen. Die direkten Kosten umfassen falsche Entscheidungen auf Basis unzuverlässiger Auswertungen, Nacharbeit bei automatisierten Prozessen, die auf fehlerhaften Daten arbeiten, und Korrekturaufwand, wenn KI-Systeme inkonsistente Ergebnisse liefern.

Die indirekten Kosten sind schwerer zu messen, aber ökonomisch bedeutsam: Vertrauensverlust in KI-gestützte Empfehlungen führt dazu, dass Teams die Systeme umgehen und auf manuelle Prozesse zurückfallen. Ein KI-System, dem die Nutzer nicht vertrauen, wird nicht genutzt, und die Investition bleibt ohne Ertrag. Datenqualität ist deshalb auch ein Change-Management-Thema: Nur wenn die Ergebnisse verlässlich sind, entsteht das Vertrauen, das die Nutzung antreibt.

Datengovernance unter dem EU AI Act: neue Pflichten, bekannte Prinzipien

Der EU AI Act verlangt für Hochrisiko-KI-Systeme ab August 2026 eine explizite Datengovernance: Datensätze, die für das Training, die Validierung und das Testen von Hochrisiko-Systemen verwendet werden, müssen relevante Eigenschaften erfüllen, Protokolle für das Datenmanagement führen und auf Repräsentativität, Fehler und Lücken geprüft worden sein. Diese Anforderungen sind für Organisationen, die bereits eine Datentaxonomie und einen Qualitätsprozess aufgebaut haben, keine zusätzliche Bürde. Sie sind Anforderungen, die der bestehende Prozess bereits erfüllt.

Für Organisationen ohne Datengovernance bedeuten diese Anforderungen hingegen, dass sie bis August 2026 rückwirkend dokumentieren müssen, was sie nie systematisch erhoben haben. Der Aufwand für diese rückwirkende Dokumentation übersteigt den Aufwand für ein prospektives Governance-System, das von Beginn an mitgeführt wird. Die Investition in Datengovernance lohnt sich damit auch aus regulatorischer Perspektive, unabhängig vom unmittelbaren KI-Projekt-Nutzen.

Technische Infrastruktur: von der Legacy zur KI-fähigen Datenarchitektur

Die meisten mittelständischen Organisationen haben Daten in einer Kombination aus ERP-Systemen, CRM-Lösungen, lokalen Excel-Dateien und abteilungsspezifischen Datenbanken verteilt. Diese Struktur ist nicht auf den Bruch ausgelegt, sondern historisch gewachsen. Der Weg zur KI-fähigen Datenarchitektur muss diese Realität anerkennen und einen pragmatischen Migrationspfad anbieten, der den laufenden Betrieb nicht unterbricht.

Das Lakehouse-Muster bietet diesen Pfad. Es ermöglicht die schrittweise Konsolidierung: Zuerst werden die Datenquellen, die für den priorisierten Use Case relevant sind, integriert. Die übrigen Quellen folgen nach Bedarf. Dieser Ansatz verhindert das Paralysierungsrisiko des Ansatzes, der erst dann startet, wenn alle Daten perfekt sind. Stattdessen beginnt die Organisation mit dem, was für den ersten Use Case benötigt wird, und baut die Architektur iterativ aus.

Data Stewardship: wer die Daten verantwortet

Datenqualität ist nicht allein ein IT-Thema. Sie entsteht an den Stellen, wo Daten erzeugt und erfasst werden: im Vertrieb, der Kundeneinträge anlegt; im Einkauf, der Lieferantenstammdaten pflegt; im Personalbereich, der Mitarbeiterdaten verwaltet. Die IT kann die Infrastruktur bereitstellen und die Qualitätsmessungen automatisieren, aber sie kann die Eingabedisziplin nicht erzwingen. Dafür braucht es Data Stewards in den Fachbereichen, die für die Qualität ihrer Daten verantwortlich sind.

Data Stewardship ist in mittelständischen Organisationen häufig nicht formell etabliert. Die Funktion existiert oft implizit: Es gibt in jedem Fachbereich eine Person, die weiß, wie die Daten tatsächlich strukturiert sind und wo die Probleme liegen. Diese Person explizit zu benennen, mit einer klaren Verantwortung auszustatten und in ein Data Council einzubinden ist der organisatorische Schritt, der die technischen Maßnahmen trägt.

Automatisierte Qualitätsprüfungen: von der manuellen Kontrolle zum laufenden Monitoring

Manuelle Datenqualitätsprüfungen skalieren nicht. In einer Organisation mit tausenden Datensätzen und täglichen Änderungen ist eine manuelle Überprüfung weder ökonomisch noch praktisch umsetzbar. Die Lösung liegt in automatisierten Qualitätsregeln, die als Teil der Datenpipeline ausgeführt werden: Jedes Mal, wenn neue Daten in die Architektur fließen, werden sie gegen die definierten Dimensionen geprüft. Abweichungen werden geloggt, kritische Abweichungen erzeugen Alerts.

Moderne Datenpipeline-Werkzeuge bieten dafür native Unterstützung. Die Implementierung folgt dem Muster der Datentaxonomie: Zuerst werden die kritischen Felder je Use Case identifiziert, dann werden Qualitätsregeln für diese Felder definiert, dann werden die Prüfungen in die Pipeline eingebaut. Das Ergebnis ist ein Qualitäts-Dashboard, das den aktuellen Stand der Datenbasis sichtbar macht und Trends über die Zeit zeigt.

Verbindung zu McKinsey: Datenfähigkeit als Differenzierungsmerkmal

McKinsey State of AI 2025 beschreibt die High-Performer-Gruppe als jene Organisationen, die in Datenfähigkeiten stärker investiert haben als der Durchschnitt. Diese Investition umfasst nicht nur Technologie, sondern explizit Prozesse und Rollen: Data Engineers, Data Stewards und Data Scientists, die zusammenarbeiten, um die Qualität der Datenbasis systematisch zu heben. Der Abstand zwischen dieser Gruppe und dem Durchschnitt wächst, weil die Datenfähigkeit sich kumuliert: Bessere Daten heute erzeugen bessere Modelle morgen, die bessere Entscheidungen übermorgen ermöglichen.

Für den Mittelstand folgt daraus eine strategische Implikation: Der Aufbau von Datenfähigkeit ist keine IT-Investition, sondern eine strategische Investition in die Wettbewerbsfähigkeit. Organisationen, die heute eine belastbare Datenarchitektur aufbauen, haben morgen einen strukturellen Vorteil beim Einsatz neuer KI-Modelle, weil sie die Datenbasis haben, die deren Leistung entfaltet. Wer wartet, bis ein konkretes KI-Projekt die Investition erzwingt, zahlt die Aufräumkosten unter Zeitdruck und startet von einer schlechteren Position.

Datenqualität und Modellvertrauen: warum Nutzer KI verlassen

McKinsey State of AI 2025 nennt Ungenauigkeit als das am häufigsten gemeldete Risiko in produktiven KI-Systemen. Hinter diesem Befund steckt ein Vertrauensmechanismus: Ein Nutzer, der zweimal eine falsche Empfehlung von einem KI-System erhält, wechselt zum manuellen Prozess zurück, auch wenn das System in 90 Prozent der Fälle korrekt liegt. Die Schwelle für Vertrauensverlust ist niedrig, die Kosten der Rückkehr zum Manuellen sind hoch. Dieser Mechanismus erklärt, warum Datenqualität nicht nur ein technisches, sondern ein Adoptionsproblem ist: Systeme mit inkonsistenten Eingabedaten erzeugen inkonsistente Ausgaben, die das Vertrauen der Nutzer zerstören, bevor der Nutzen sichtbar werden kann.

Die Konsequenz für die Einführungsreihenfolge ist eindeutig. Ein Qualitäts-Check der relevanten Datenquellen vor dem Pilotstart ist kein Vorbereitungsschritt, sondern eine Bedingung. Wer den Piloten startet und dann die Qualitätsprobleme entdeckt, muss den Piloten unterbrechen, die Daten bereinigen und erneut starten, was Ressourcen, Zeit und Glaubwürdigkeit kostet. Wer die Datenbasis vor dem Piloten bewertet und nur Use Cases mit ausreichender Datenreife startet, vermeidet diesen Kreislauf. Das CRISP-DM-Framework, das die Datenvorbereitung explizit vor die Modellierungsphase stellt, folgt genau dieser Logik: Datenqualität ist kein paralleler Track, sondern ein sequenzieller Vorschritt.

Praktischer Einstieg: das Datenqualitäts-Assessment in drei Schritten

Inventarisierung: Alle Datenquellen, die für den priorisierten Use Case benötigt werden, werden mit Eigentumsrecht, Systemzugehörigkeit und grober Inhaltsschätzung erfasst. Dauer: ein bis zwei Arbeitstage.
Stichprobenmessung: Für jede Quelle werden die fünf Qualitätsdimensionen (Vollständigkeit, Konsistenz, Aktualität, Genauigkeit, Eindeutigkeit) an einer repräsentativen Stichprobe gemessen. Ergebnis: ein Qualitätsprofil je Quelle. Dauer: zwei bis fünf Tage je nach Systemzugang.
Maßnahmen-Priorisierung: Bereinigungsmaßnahmen werden nach ihrem Beitrag zur Use-Case-Reife gewichtet. Nur Maßnahmen, die den geplanten Use Case direkt betreffen, erhalten sofortige Investition. Alle anderen werden dokumentiert, aber zurückgestellt. Dauer: ein Tag Workshop mit Fachbereich und Datenkompetenz.

Nächster Schritt

Im Discovery Workshop bewerten wir Ihre Datenquellen und identifizieren die ersten belastbaren Use Cases.

Discovery Workshop buchen

Für den Mittelstand folgt daraus eine klare Investitionslogik. Bevor Budget in Modelle und Werkzeuge fließt, gehört der erste und größere Teil in die Datenbasis. Diese Reihenfolge widerspricht dem Reiz, schnell mit einem sichtbaren Werkzeug zu starten, entspricht aber dem, was die Daten von MIT und Gartner zeigen: Ohne tragfähiges Fundament bleibt jede Modellinvestition ohne Ertrag.

Quellen

MIT Project NANDA: The GenAI Divide — State of AI in Business 2025 (Juli 2025), https://nanda.media.mit.edu
MIT Sloan Management Review: Studien zu datenbedingten Hürden der Technologieadoption (2024), https://sloanreview.mit.edu
McKinsey & Company: The State of AI in 2025 (November 2025), https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai
Gartner: Prognose zur Aufgabe von KI-Projekten ohne KI-fähige Daten bis 2026 sowie Studie zu Kosten schlechter Datenqualität, https://www.gartner.com
Europäische Kommission: AI Act — Datengovernance-Anforderungen für Hochrisiko-Systeme ab August 2026, https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai
Bitkom: Datenmanagement und KI-Bereitschaft im deutschen Mittelstand, https://www.bitkom.org

Datenqualität als Erfolgsfaktor für KI-Projekte

System: das unterschätzte Fundament

Problem: vier Dimensionen mangelnder Qualität

Ansatz: Modellierung, Taxonomie, Prozess

Praxis: vom Projekt zur Skalierung

Praxis: ein Anwendungsbeispiel

Wirkung: Datenexzellenz als Vorteil

Datenqualität messen: ein Bewertungsrahmen für den Mittelstand

Die Kosten schlechter Daten: was auf dem Spiel steht

Datengovernance unter dem EU AI Act: neue Pflichten, bekannte Prinzipien

Technische Infrastruktur: von der Legacy zur KI-fähigen Datenarchitektur

Data Stewardship: wer die Daten verantwortet

Automatisierte Qualitätsprüfungen: von der manuellen Kontrolle zum laufenden Monitoring

Verbindung zu McKinsey: Datenfähigkeit als Differenzierungsmerkmal

Datenqualität und Modellvertrauen: warum Nutzer KI verlassen

Praktischer Einstieg: das Datenqualitäts-Assessment in drei Schritten

Nächster Schritt

Quellen

Nächster Schritt

🍪 Cookie-Einstellungen